专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  青稞AI
青年AI研究员idea加油站,AI开发者的新能源充电桩。
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
解读Parallel-R1:通过强化学习构建LLM原生并行推理框架
青稞AI  ·  公众号  · AI  ·  7 月前  · 
RL训练中,为什么熵减往往意味着训练收敛?
青稞AI  ·  公众号  · AI  ·  7 月前  · 
从现有主流 RL 库来聊聊RL Infra架构演进
青稞AI  ·  公众号  · AI  ·  7 月前  · 
LLM参数量计算与内存分析:从传统的MHA到Qwen0.6B与Deepseek 671B
青稞AI  ·  公众号  · AI  ·  7 月前  · 
一份来自未来的邀请,聊聊你心中的AI与个人主页!
青稞AI  ·  公众号  · AI  ·  7 月前  · 
跨机秒传RL模型参数更新的一些探索
青稞AI  ·  公众号  · AI  ·  7 月前  · 
学习一些 LLMs 中的基础概念
青稞AI  ·  公众号  · AI  ·  7 月前  · 
LLM开源模型最新整理:GPT-OSS/Seed-OSS/Kimi-K2/LongCat等
青稞AI  ·  公众号  · AI  ·  7 月前  · 
清华最新研究!如何从理论上统一SFT与RL,以及高效的自适应算法Hybrid Post-Traini...
青稞AI  ·  公众号  · AI  ·  8 月前  · 
MIT最新研究!RL为什么比SFT遗忘的更少?
青稞AI  ·  公众号  · AI  ·  8 月前  · 
苏剑林:重新思考学习率与Batch Size的关系(二):平均场
青稞AI  ·  公众号  · AI  ·  8 月前  · 
LLM Inference高效Debug方法汇总
青稞AI  ·  公众号  · AI  ·  8 月前  · 
周四晚8点!一起聊聊从 LLM-RL 到 Agentic RL:如何让语言模型成为自主智能体
青稞AI  ·  公众号  · AI  ·  8 月前  · 
Kimi最新开源了Checkpoint Engine!20秒更新1T参数模型权重
青稞AI  ·  公众号  · AI  ·  8 月前  · 
讨论一下单进程多 rank 下的通信方式:DeepEP、nvshmem 和 IBGDA
青稞AI  ·  公众号  · AI  ·  8 月前  ·