| 
                         | 
                    量化噪声竟是RL秘钥?QeRL:高效强化学习新范式,一场噪声引发的性能革命 深度学习自然语言处理 · 公众号 · · 6 天前 · | 
| 
                         | 
                    越来越感觉 Agent 是未来的方向了 深度学习自然语言处理 · 公众号 · · 6 天前 · | 
| 
                         | 
                    当下不得不看的RL领域经典论文与开源代码合集! 深度学习自然语言处理 · 公众号 · · 1 周前 · | 
| 
                         | 
                    RL在Agentic Reasoning中的作用:拨开迷雾,看清本质 深度学习自然语言处理 · 公众号 · · 1 周前 · |