专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  青稞AI
青年AI研究员idea加油站,AI开发者的新能源充电桩。
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
大模型中的 MoE、V-MoE 以及 DeepSeekMoE
青稞AI  ·  公众号  · AI  ·  3 月前  · 
替代FSDP集体通信!ODC参数服务器可提速36%
青稞AI  ·  公众号  · AI  ·  3 月前  · 
浅谈训推误差与 LLM RL 稳定性
青稞AI  ·  公众号  · AI  ·  3 月前  · 
近期 AgentRL 典型论文解读
青稞AI  ·  公众号  · AI  ·  3 月前  · 
通用 Agent 优化的关键: Scaling 和 Wild
青稞AI  ·  公众号  · AI  ·  3 月前  · 
聊聊 2025 LLM 的核心技术进展
青稞AI  ·  公众号  · AI  ·  3 月前  · 
JustRL: 当我们用"最笨"的方法刷新 1.5B 推理模型 SOTA
青稞AI  ·  公众号  · AI  ·  3 月前  · 
首篇综述!系统整理高效 dLLMs 的最新进展
青稞AI  ·  公众号  · AI  ·  3 月前  · 
强化学习策略约束和熵的统一视角
青稞AI  ·  公众号  · AI  ·  3 月前  · 
聊聊 On-Policy Distillation 与那该死的 Reverse KL
青稞AI  ·  公众号  · AI  ·  3 月前  · 
从一个 MXFP8 量化 Kernel,谈一谈如何在 B200 上实现高性能的 Memory Bou...
青稞AI  ·  公众号  · AI  ·  3 月前  · 
周五上午9点!一起聊聊 GDPO,解决 GRPO 在多奖励 RL 训练中的"优势崩溃"问题
青稞AI  ·  公众号  · AI  ·  3 月前  · 
强化学习最难的不是算法,是写环境!
青稞AI  ·  公众号  · AI  ·  3 月前  ·