|
|
超越GRPO和GSPO!阿里千问提出升级版RL算法SAPO,已应用于Qwen3-VL 智猩猩AI · 公众号 · · 5 月前 · |
|
|
1.7倍无损RL训练加速!英伟达韩松提出自适应推测解码系统TLT,挖掘rollout空闲算力 智猩猩AI · 公众号 · · 5 月前 · |
|
|
阿里Qwen斩获NeurIPS 2025最佳论文奖!门控注意力改进版已集成至Qwen3-Next 智猩猩AI · 公众号 · · 5 月前 · |
|
|
AI"视频x音乐"利器三箭齐发!巨人网络提出MV生成模型,还有AI歌声转换与合成工具 智猩猩AI · 公众号 · · 5 月前 · |
|
|
首次打通具身智能与自动驾驶!小米开源跨域具身基础模型MiMo-Embodied,技术报告来了 智猩猩AI · 公众号 · · 5 月前 · |