|
|
据最新爆料:DeepSeekV4和姚顺雨的新混元模型,将同时于下月发布 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
LLM幻觉不只是「胡说八道」?新理论首次拆解幻觉的两大根源丨ICLR'2026 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
谷歌AGI底座降临!首个原生全模态嵌入模型上线,已实现全模态SOTA 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
一只金融龙虾!AlphaClaw来了 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
机器人全程自主收拾客厅!390亿美元估值机器人端到端新技能,英伟达持续加注 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
让Agent学会「先试再做」:微软提出Computer-UsingWorldModel,教智能体理解... 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
OpenClaw已经143KStar了,汇总了一系列保姆级教程! 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
鹅厂门口免费装龙虾,几百人排爆了!一代人有一代人的鸡蛋要领 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
AgenticRL:解耦Reasoning与Tool-use 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
从“手推策略梯度定理”开始:基于公式推导理解RL的创新本质 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
MLNLP学术Talk第七十一期 | 窦士涵@复旦大学:Learning from context ... 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
七篇论文!深度理解On-PolicyDistillation在算法和工程上的最新探索 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
硅谷全面“龙虾化”!Anthropic微软Meta和Notion等集体交卷自己的Claw 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
训练机器人方式对了吗?英伟达DreamZero双榜第一新反思 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
OpenClaw最佳工具榜来了!这6款龙虾最受欢迎 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
On-PolicyDistillation到底是什么?深度解读On-Policy/Self-Dist... 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
大厂实战中,如何判断SFT到什么程度开始做RL 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
GenTalk真知论坛学术分享第17期|王鹏伟@智源:具身基座模型RoboBrain-2.5 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
训练加速40倍、打破“不可能三角”:MiniMax Agent RL 架构解密 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
如何写出好的 Skill?拆解 skill-creator 背后的设计 大模型智能 · 公众号 · 大模型 · 2 月前 · |