专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  青稞AI
青年AI研究员idea加油站,AI开发者的新能源充电桩。
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
思考一下!强化学习在LLM训练中的作用
青稞AI  ·  公众号  · AI  ·  4 月前  · 
简明教程!大模型 RL 中的策略梯度算法
青稞AI  ·  公众号  · AI  ·  4 月前  · 
深入分析 Llama 4 最新架构
青稞AI  ·  公众号  · AI  ·  4 月前  · 
Meta AI 开源全新原生多模态 Llama4!公开训练策略
青稞AI  ·  公众号  · AI  ·  4 月前  · 
PPO 算法的37个实现细节
青稞AI  ·  公众号  · AI  ·  4 月前  · 
对比Manus、OpenManus与OWL技术架构
青稞AI  ·  公众号  · AI  ·  4 月前  · 
深度好文!从LLM的视角看策略梯度、PPO、GRPO
青稞AI  ·  公众号  · AI  ·  4 月前  · 
Zero-RL训练中的几个关键问题解析
青稞AI  ·  公众号  · AI  ·  4 月前  · 
直播预告!UCSD张怡颖教授:面向下一代 AI Agent 工作流系统的构建
青稞AI  ·  公众号  · AI  ·  4 月前  · 
关于 R1 的一些认知,以及复现的四个误区
青稞AI  ·  公众号  · AI  ·  4 月前  · 
聊聊现有推理模型的基础技术及技术趋势
青稞AI  ·  公众号  · AI  ·  4 月前  · 
批判性视角看待 R1 训练(基础模型和强化学习)中的坑
青稞AI  ·  公众号  · AI  ·  4 月前  · 
Manus爆火后的思考:是否可以通过RL微调LLM来获得决策大模型
青稞AI  ·  公众号  · AI  ·  4 月前  · 
改进后训练!新版 DeepSeek-V3 模型来了
青稞AI  ·  公众号  · AI  ·  4 月前  · 
聊聊推理模型中的PRMs与MCTS
青稞AI  ·  公众号  · AI  ·  4 月前  · 
视频编辑最新SOTA!VideoGrain免训练实现多粒度视频编辑
青稞AI  ·  公众号  · AI  ·  4 月前  · 
从幻觉到o1-reasoning!万字长文总结多模态大模型后训练
青稞AI  ·  公众号  · AI  ·  4 月前  ·