专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  大模型之心Tech
专注自动驾驶与AI
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
GRPO v.s. DAPO v.s. GSPO 的个人理解
大模型之心Tech  ·  公众号  · 大模型  ·  19 小时前  · 
GRPO算法与 PPO 算法的本质区别是什么?该如何选择?
大模型之心Tech  ·  公众号  · 大模型  ·  昨天  · 
自动驾驶Agent来了!DriveAgent-R1:智能思维和主动感知Agent(上海期智&理想)
大模型之心Tech  ·  公众号  · 大模型  ·  昨天  · 
一文彻底搞懂视觉Transformer:ViT/DETR/SETR/CLIP等经典模型的深度优化
大模型之心Tech  ·  公众号  · 大模型  ·  昨天  · 
Qwen2.5-1.5B-distill 模型的 RL 优化(二):代码和数学训练的相互提升
大模型之心Tech  ·  公众号  · 大模型  ·  3 天前  · 
具身领域LLM结合强化学习与世界模型工作汇总
大模型之心Tech  ·  公众号  · 大模型  ·  3 天前  · 
跳出 Sora 的"像素陷阱"!LeCun 团队 DINO-world 诠释世界模型的正确方向
大模型之心Tech  ·  公众号  · 大模型  ·  3 天前  · 
重磅!清华×生数发布机器人通用大模型Vidar,高效泛化复杂物理操作达SOTA水平
大模型之心Tech  ·  公众号  · 大模型  ·  4 天前  · 
多模态大模型,真的「懂」世界吗?——揭秘 MLLM 的核心知识缺陷
大模型之心Tech  ·  公众号  · 大模型  ·  4 天前  · 
阶跃Step 3凭何引爆WAIC?技术解读:注意力解耦、MoE变局与国产芯片狂飙
大模型之心Tech  ·  公众号  · 大模型  ·  4 天前  · 
Qwen2.5-1.5B-distill 模型的 RL 优化(一):代码训练的数据准备和基础工程搭建
大模型之心Tech  ·  公众号  · 大模型  ·  5 天前  · 
开源!智元机器人正式发布首个具身智能操作系统参考框架:“智元灵渠OS”
大模型之心Tech  ·  公众号  · 大模型  ·  5 天前  · 
100行代码打造迷你编程Agent:能修复65%真实项目bug,适配所有大模型
大模型之心Tech  ·  公众号  · 大模型  ·  5 天前  ·