青稞AI - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

专栏二维码

TodayRss-海外RSS稳定源

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › 青稞AI

青年AI研究员idea加油站，AI开发者的新能源充电桩。

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

On-Policy Distillation 到底是什么？深度解读 On-Policy/Self-D...

青稞AI · 公众号 · AI · 4 月前 ·

Thinking with Images 为什么（不）work？

青稞AI · 公众号 · AI · 4 月前 ·

通往 AGI 的必经之路：Agent 自进化到底是在“进化”什么？

青稞AI · 公众号 · AI · 4 月前 ·

从零开始构建自进化智能体的心路历程

青稞AI · 公众号 · AI · 4 月前 ·

超详细！一张表串讲 LLM-RL 中 KL 散度正则的正确与错误用法

青稞AI · 公众号 · AI · 4 月前 ·

苦涩的教训！ROLL团队分享：Agentic RL 训练中的实践经验

青稞AI · 公众号 · AI · 4 月前 ·

On-policy distillation 基础理论与一些实践 insight

青稞AI · 公众号 · AI · 4 月前 ·

少用 sense 挑战 math！如何把 post train 做好，聊聊后训练方法论

青稞AI · 公众号 · AI · 4 月前 ·

比肩 GPT-5 的 Kernel Coding 模型！Dr. Kernel 用多轮 RL 训练大模...

青稞AI · 公众号 · AI · 4 月前 ·

简单明了！一张图看懂 GRPO 的十几种主流变体算法

青稞AI · 公众号 · AI · 4 月前 ·

减论APP终于上线了！科研人的福利，发论文也能有收益！

青稞AI · 公众号 · AI · 4 月前 ·

为什么 Policy Gradient 不能用 Replay Buffer？

青稞AI · 公众号 · AI · 4 月前 ·

On-Policy Distillation 是什么？如何做？

青稞AI · 公众号 · AI · 4 月前 ·

MoE 训练到底是开 TP 还是 EP？

青稞AI · 公众号 · AI · 4 月前 ·

Big Model Smell：Kimi K2.5 背后的 VLM 训练哲学与“N+1”范式

青稞AI · 公众号 · AI · 4 月前 ·

从 Pretrain 到 Agentic Vision：Kimi K2.5 的原生多模态训练之道

青稞AI · 公众号 · AI · 4 月前 ·

从 RL 到 Agentic RL 训练框架！一个 RLer 进入 LLM 训练领域后的一年三个月

青稞AI · 公众号 · AI · 4 月前 ·

从算法到系统工程！大模型训练系统的关键技术详解

青稞AI · 公众号 · AI · 4 月前 ·

2025 年最具影响力的 10 篇 AI Infra / MLSys论文（工程视角）

青稞AI · 公众号 · AI · 4 月前 ·

ICLR 2026 Workshop 征稿倒计时10天：迈向 Lifelong Agent 终身智能...

青稞AI · 公众号 · AI · 4 月前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号