|
|
周五上午10点!和 MIT 博士后周恺辰,一起聊聊:从 VGGT 到 PAGE-4D:动态世界中的 ... 青稞AI · 公众号 · AI · 1 月前 · |
|
|
一张图串讲dpsk-math-v2的十几种强化学习提分思路 青稞AI · 公众号 · AI · 1 月前 · |
|
|
聊聊如何在大模型 RL 中灵活地控制熵增熵减 青稞AI · 公众号 · AI · 1 月前 · |
|
|
3月22日下午!从 OpenClaw ,一起聊聊 Vibe Coding 与下一代 Agent 架构 青稞AI · 公众号 · AI · 1 月前 · |
|
|
在线 RL 与离线 RL 的本质区别是什么,在 LLM 训练中又如何权衡? 青稞AI · 公众号 · AI · 2 月前 · |
|
|
北大 & 腾讯微信AI联合提出Conan:像侦探一样推理,多尺度视觉证据的多步视频推理框架 青稞AI · 公众号 · AI · 2 月前 · |
|
|
聊聊 CaveAgent!面向对象的 Agent Infra 新范式:有状态运行时管理的设计与工程实... 青稞AI · 公众号 · AI · 2 月前 · |
|
|
ICLR 2026 | 大模型的无监督强化学习能走多远? 青稞AI · 公众号 · AI · 2 月前 · |
|
|
当记忆从“历史”变成“经验”!UIUC、清华、微软研究院最新提出 PlugMem,让 Agent 告... 青稞AI · 公众号 · AI · 2 月前 · |
|
|
北航等最新提出!让 LLM 互相「审稿」:极简大语言模型协作/集成方法实现 7% 性能提升 青稞AI · 公众号 · AI · 2 月前 · |
|
|
VLA的预训练范式是不是从根上就错了?深度解析 World Action Model 三大路线 青稞AI · 公众号 · AI · 2 月前 · |
|
|
聊聊 RL 训练中的 Entropy Dynamics,以及现有各种的算法 Trick 青稞AI · 公众号 · AI · 2 月前 · |
|
|
从 Text-in-Text-out 到 Object-in-Object-out:LLM Agen... 青稞AI · 公众号 · AI · 2 月前 · |
|
|
直播预告!对话CCF优博、南京大学副教授蒋炎岩:读博那些事儿 青稞AI · 公众号 · AI · 2 月前 · |
|
|
阿里巴巴通义实验室开源 Mobile-Agent-v3.5:一套真正“多平台可用”的原生 GUI A... 青稞AI · 公众号 · AI · 2 月前 · |
|
|
当 AI 学会“审美”!聊聊 EditReward 和可控多模态生成的下一代范式 青稞AI · 公众号 · AI · 2 月前 · |
|
|
大量Token全浪费?港科大最新开源CaveAgent 青稞AI · 公众号 · AI · 2 月前 · |
|
|
MIT 最新提出 PAGE-4D:让 3D 模型"看懂"动态世界的统一框架 青稞AI · 公众号 · AI · 2 月前 · |
|
|
从 ROLL、ForgeRL、Seer 和 ThunderAgent,看 26 年 Agentic ... 青稞AI · 公众号 · AI · 2 月前 · |
|
|
ICLR 2026!腾讯混元联合 KCL 提出 WildToolBench,评估 Agent 对用户... 青稞AI · 公众号 · AI · 2 月前 · |