吃果冻不吐果冻皮 - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

专栏二维码

TodayRss-海外RSS稳定源

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › 吃果冻不吐果冻皮

专注于AI工程化（LLM、MLOps、LLMOps、RAG、Agent）落地。

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

我的2025小结：从RL到Agentic RL

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

很严重了，大家别轻易离职。。

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

【AgenticRL】一些2025 年弯路、暴论和下一步思考

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

Transformer已死？DeepMind正在押注另一条AGI路线

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

两万字长文！读懂大模型RL

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

DeepSeek 的 mHC

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

Agentic后训练 - SFT（监督微调）全流程详解

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

LLM视角下的RLHF核心算法演进：从REINFORCE到PPO

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

Scaling law 停滞不前？2026年，预训练又回来了！

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

准备充足的弹药，让我们进入Agent RL时代

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

大模型基建这三年：AI Infra通信演进之路

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

从PD分离到AF分离！聊聊 LLM 推理架构演进中的几个关键技术节点

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

今年看到最系统的AI Agents时代Memory综述～

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

你真的搞懂了LLM性能压测的各项指标吗？

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

关于端侧大模型的一些想法

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

用 RL 做 LLM 后训练：半年踩过的坑与心得

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

【万字长文】LLM 评估指南

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

Agent 元年复盘：从 Claude Code 到 Deep Agent，Agent 的架构之争已...

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

工业级 Agentic RL 训练对比选型指南

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

明显感觉大模型的面试已经变了。。

吃果冻不吐果冻皮 · 公众号 · · 4 月前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号