|
|
NeurIPS 2025 | M3W: 基于MoE的多任务多智能体世界模型 深度强化学习 CASIA · 公众号 · · 5 月前 · |
|
|
深度强化学习团队RLChina 2025报告预览 深度强化学习 CASIA · 公众号 · 科技自媒体 · 7 月前 · |
|
|
[视频回顾] 2025年6月14日-15日,第四届智能决策论坛,朱圆恒:开放环境的多智能体决策智能 深度强化学习 CASIA · 公众号 · · 7 月前 · |
|
|
多模态人工智能系统学术讲座 | ROLL: 一种面向 Agentic 场景的生产级大规模强化学习训练... 深度强化学习 CASIA · 公众号 · · 8 月前 · |
|
|
VLA最新综述 | 中科院详解:面向具身操作的模型架构与演进 深度强化学习 CASIA · 公众号 · · 8 月前 · |
|
|
最新综述:多任务场景下的协作多智能体强化学习研究进展 深度强化学习 CASIA · 公众号 · · 9 月前 · |
|
|
深度强化学习杰出讲座2025-01期--CESARE ALIPPI教授 深度强化学习 CASIA · 公众号 · · 9 月前 · |
|
|
同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等 深度强化学习 CASIA · 公众号 · · 10 月前 · |
|
|
第四届智能决策论坛预告 | 专题分论坛:具身智能前沿技术 深度强化学习 CASIA · 公众号 · · 11 月前 · |
|
|
一个省略号提示+强化学习搞定大模型“过度思考”,中科院自动化所新方法:从强制推理到自主选择 深度强化学习 CASIA · 公众号 · · 11 月前 · |