|
更多thinking≠更好结果,精准thinking可砍掉一半长度 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
明天直播预约 | 可解释性论文分享 @ICML&ACL2025 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
RL Scaling 时代,我们需要什么样的 RL 框架呢? 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
ACL 2025 | MathFusion:“拼好题”,让数学题目实现1+1>2 - 上海AI La... 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
传统RAG只会翻书不会用?RAG+让Reasoning能力上一个新高度! 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
0%通过率!Code神话泡沫!LiveCodeBench Pro发布! 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
ICLR 2025 | 中国团队颠覆AI视频分析!纯文本模型+工具包吊打GPT-4o 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
AI 协作的未来?Anthropic 多智能体系统的实战设计 深度学习自然语言处理 · 公众号 · · 1 月前 · |
|
无需标注和奖励模型!仅靠自信度RL,16个样本训练20步,效果飙升21%! 深度学习自然语言处理 · 公众号 · · 1 月前 · |