今天看啥  ›  专栏  ›  青稞AI

从 RL 到 Agentic RL 训练框架!一个 RLer 进入 LLM 训练领域后的一年三个月

青稞AI  · 公众号  · AI  · 2026-02-08 00:00
    

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照