专栏名称: 智猩猩GenAI
智猩猩旗下账号,专注于生成式人工智能,主要分享技术文章、论文成果与产品信息。
目录
今天看啥  ›  专栏  ›  智猩猩GenAI

LLM后训练理论新突破!复旦邱锡鹏团队发现SFT与DPO同为隐式奖励学习的不同表现形式

智猩猩GenAI  · 公众号  ·  · 2025-07-10 18:00
    

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照