专栏名称: LLMQuant
起源于剑桥大学的量化社区,每日分享人工智能与量化金融前沿: www.llmquant.com
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  LLMQuant

刚出炉,后训练真的不需要强化学习?九坤最新研究,用EM让大模型推理力暴涨25分

LLMQuant  · 公众号  ·  · 2025-05-31 21:22
    

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照