|
|
OpenAI翁家翌:“启发式学习”的强化学习新范式 大模型智能 · 公众号 · 大模型 · 15 小时前 · |
|
|
Codex和ChatGPT合体!补上24小时干活的最后一块拼图 大模型智能 · 公众号 · 大模型 · 昨天 · |
|
|
OPD深度解析:从数学推导到DeepSeekV4、SWIFT与verl实践 大模型智能 · 公众号 · 大模型 · 2 天前 · |
|
|
【综述】机器人学习中的世界模型:全面综述 大模型智能 · 公众号 · 大模型 · 3 天前 · |
|
|
Markdown要凉…卡帕西也站HTML了 大模型智能 · 公众号 · 大模型 · 4 天前 · |
|
|
OpenAI翁家翌:“启发式学习”的强化学习新范式 大模型智能 · 公众号 · 大模型 · 5 天前 · |
|
|
不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py文件 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
细思极恐!Agent暗藏风险,清华团队打出组合拳,全链路一网打尽 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
李晓熙@中国人民大学:推理、搜索与行动:迈向真实世界的AI智能体 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
突发,OpenAI总裁当庭「认罪」!自曝零元购300亿,马斯克这回真要赢了? 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
DeepSeek-V4的并行策略和计算通信遮掩 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
MLNLP发布LLMBeginner:零基础通关LLM的项目式学习路线 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
DeepSeek-V4技术报告背后的TileLang:如何高效实现大模型中的小算子 大模型智能 · 公众号 · 大模型 · 1 周前 · |
|
|
分享一个Image2的提示词库,Github已8KStar 大模型智能 · 公众号 · 大模型 · 2 周前 · |
|
|
解读DeepSeek最新多模态技术报告,要用视觉基本单元思考,看这一篇就够了 大模型智能 · 公众号 · 大模型 · 2 周前 · |
|
|
《强化学习数学基础》 大模型智能 · 公众号 · 大模型 · 2 周前 · |
|
|
智能体化世界建模:基础、能力、规律及展望 大模型智能 · 公众号 · 大模型 · 2 周前 · |
|
|
ICLR2026获奖论文揭晓:两篇杰出论文,大神AlecRadford经典工作获时间检验奖 大模型智能 · 公众号 · 大模型 · 2 周前 · |
|
|
系统解读Anthropic/OpenAI如何监测前沿智能体行为? 大模型智能 · 公众号 · 大模型 · 2 周前 · |