专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  青稞AI
青年AI研究员idea加油站,AI开发者的新能源充电桩。
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
MIT开源Satori-SWE:用 Evolutionary Test-Time Scaling 让...
青稞AI  ·  公众号  · AI  ·  1 月前  · 
探讨一下!RL 真的是 LLM 性能提升的“银弹”吗?
青稞AI  ·  公众号  · AI  ·  1 月前  · 
论 Agent 的“持久战”
青稞AI  ·  公众号  · AI  ·  1 月前  · 
Kimi Researcher 背后的一些技术思考
青稞AI  ·  公众号  · AI  ·  1 月前  · 
Slime 框架深度解析:面向大规模RL的训推一体化实践
青稞AI  ·  公众号  · AI  ·  1 月前  · 
万字长文图解Qwen2.5-VL实现细节
青稞AI  ·  公众号  · AI  ·  1 月前  · 
直播预告!大模型推理强化学习中的熵机制
青稞AI  ·  公众号  · AI  ·  1 月前  · 
无监督 RL 的粗略分析
青稞AI  ·  公众号  · AI  ·  1 月前  · 
聊聊VLM架构以及训练后的一些实验和思考
青稞AI  ·  公众号  · AI  ·  1 月前  · 
MiniMax-M1 技术报告解读
青稞AI  ·  公众号  · AI  ·  1 月前  · 
直播预告!世界模型版《模拟人生》:面向人、机器人与社会的开放世界模拟平台
青稞AI  ·  公众号  · AI  ·  1 月前  · 
学习一下!逆强化学习算法解析
青稞AI  ·  公众号  · AI  ·  1 月前  · 
多模型融合的系数到底应该是多少?
青稞AI  ·  公众号  · AI  ·  1 月前  · 
RL Scaling 时代,我们需要什么样的 RL 框架呢?
青稞AI  ·  公众号  · AI  ·  1 月前  · 
多模态 LLM RLVR 引入后训练框架!显著提升MLLM推理与泛化
青稞AI  ·  公众号  · AI  ·  1 月前  · 
深入解析多模态大模型推理技术的最新发展
青稞AI  ·  公众号  · AI  ·  1 月前  · 
通俗易懂的总结!RL for LLM本质理解
青稞AI  ·  公众号  · AI  ·  1 月前  ·