不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  大模型自然语言处理

推理大模型后训练方案:"评分标准"变成训练信号的Rubric引导的自蒸馏

大模型自然语言处理  · 公众号  · 大模型  · 2026-06-18 20:33
    

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照