|
|
李飞飞再出手,空间智能的ImageNet来了 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
OPD到底在优化什么?三类典型失败以及修复路径 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
Gemini3.5来了!今夜,谷歌亲手淘汰谷歌 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
让大模型学会「自己教自己」!京东 & 中科院信工所连发三篇论文定义Self-TaughtRLVR 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
对比离线蒸馏!为什么选择OPD? 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
大语言模型为什么能像人一样说话和思考? 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
OpenAI翁家翌:“启发式学习”的强化学习新范式 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
Codex和ChatGPT合体!补上24小时干活的最后一块拼图 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
OPD深度解析:从数学推导到DeepSeekV4、SWIFT与verl实践 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
【综述】机器人学习中的世界模型:全面综述 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
Markdown要凉…卡帕西也站HTML了 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
OpenAI翁家翌:“启发式学习”的强化学习新范式 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py文件 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
细思极恐!Agent暗藏风险,清华团队打出组合拳,全链路一网打尽 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
李晓熙@中国人民大学:推理、搜索与行动:迈向真实世界的AI智能体 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
突发,OpenAI总裁当庭「认罪」!自曝零元购300亿,马斯克这回真要赢了? 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
DeepSeek-V4的并行策略和计算通信遮掩 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
MLNLP发布LLMBeginner:零基础通关LLM的项目式学习路线 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
DeepSeek-V4技术报告背后的TileLang:如何高效实现大模型中的小算子 大模型智能 · 公众号 · 大模型 · 1 月前 · |