今天看啥  ›  专栏  ›  机器学习算法与自然语言处理

就从来没人质疑过OPD的reward设计吗?我们发现了log本身就是问题,也许就不该用!

机器学习算法与自然语言处理  · 公众号  · 算法  · 2026-06-29 00:00
    

原文地址: 访问原文地址 (快捷配置)
总结与预览地址:访问文章预览/总结
文章地址: 访问文章快照