专栏名称: 深度强化学习 CASIA
分享深度强化学习,机器人,博弈对抗,自动驾驶,游戏AI 相关论文/代码/资讯。源自CASIA的深度强化学习团队。
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  深度强化学习 CASIA

【转载】重探 On-Policy Distillation(OPD):三类典型失败以及修复路径

深度强化学习 CASIA  · 公众号  ·  · 2026-04-25 11:48
    

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照