|
|
LFS: 通过合成观测学习未来表征以实现高效强化学习 深度强化学习 CASIA · 公众号 · AI媒体 科技自媒体 · 1 年前 · |
|
|
RSS 2025|ConRFT: 真实环境下基于强化学习的 VLA 模型微调方法 深度强化学习 CASIA · 公众号 · · 1 年前 · |
|
|
ICLR 2025 | DVFB: 面向在线无监督强化学习零样本泛化的双价值前向后向表示模型 深度强化学习 CASIA · 公众号 · · 1 年前 · |