今天看啥  ›  专栏  ›  阿里云开发者

你们催更的模型,云栖大会一口气全发了!

阿里云开发者  · 公众号  · 科技公司  · 2025-09-24 16:24
    

主要观点总结

文章介绍了多款新发布的模型,包括Qwen MAX、Qwen3-Omni、Qwen3-VL等,它们覆盖了文本、视觉、语音、视频、代码、图像等全场景,各有不同的功能和特点。文章还提到了通义百聆这个企业级语音基座大模型,以及它解决语音识别和语音合成中的一些问题。所有的模型已经同步上线,可以在魔搭、GitHub、Hugging Face上搜索模型名进行一键部署,也可以在阿里云百炼平台调用API进行体验。

关键观点总结

关键观点1: 多款全新模型发布,覆盖不同场景

包括Qwen MAX、Qwen3-Omni、Qwen3-VL等,分别针对文本、视觉、语音、视频、代码、图像等全场景,具有不同的功能和特点。

关键观点2: 模型的功能和亮点

各模型具有不同的功能和特点,例如Qwen MAX在SWE-Bench Verified评测中得分69.6,工具调用能力在BFCL和TAU2评测中达到国际前沿水平;Qwen3-Omni支持19种语言及方言输入,10种语言输出,可处理长达30分钟的会议录音等。

关键观点3: 通义百聆企业级语音基座大模型的介绍

该模型整合了领先的语音识别大模型和语音合成大模型,解决了语音识别和语音合成中的一些问题,如幻觉输出、串语种、热词失效等。

关键观点4: 模型已上线并可以部署体验

所有的模型已经同步上线,可以在魔搭、GitHub、Hugging Face上搜索模型名进行一键部署,也可以在阿里云百炼平台调用API进行体验。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照