专栏名称: NLP PaperWeekly
论文学习,主要关注nlp,对话系统,大模型,多模态等领域的论文
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  NLP PaperWeekly

震惊!强化学习训练后,大模型推理“天花板”反而降低了?清华研究揭示RLVR局限性

NLP PaperWeekly  · 公众号  ·  · 2025-04-24 15:23
    

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照