专栏名称: 通往AGI之路

WaytoAGI.com，让每个人的AI学习过程少走弯路，让更多的人因AI而强大。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

清言上线情感语音模型GLM-4-Voice，AI 的 phone use 也来了

通往AGI之路 · 公众号 · 科技创业科技自媒体 · 2024-10-26 23:42

主要观点总结

本文介绍了GLM-4-Voice的发布，它是智谱多模态大模型家族的新成员，具备完整的感官系统，实现了机器与人交互的自然与流畅。GLM-4-Voice具有直接理解和生成中英文语音的能力，能够根据用户指令调整语音的情感、语调、语速和方言等特征，且具有更低的延迟，支持实时打断，进一步提升交互体验。该模型已经上线清言app，同时开源供用户使用。文章还介绍了GLM-4-Voice的技术细节，包括其组成部分、预训练方式、使用方式等。此外，还介绍了智谱在迈向AGI过程中的其他进展，如AutoGLM的手机使用能力，以及智谱的技术升级曲线等。

关键观点总结

关键观点1: GLM-4-Voice的发布

它是智谱多模态大模型家族的新成员，具备完整的感官系统，实现了机器与人交互的自然与流畅。

关键观点2: GLM-4-Voice的能力特点

具备直接理解和生成中英文语音的能力，能够根据用户指令调整语音的情感、语调、语速和方言等特征。具有更低的延迟，支持实时打断，进一步提升交互体验。

关键观点3: GLM-4-Voice的技术细节

包括其组成部分、预训练方式、使用方式等。

关键观点4: 智谱的其他进展

如AutoGLM的手机使用能力，包括在Phone Use和Web Browser Use上的性能提升，以及智谱的技术升级曲线等。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

全球风口 · AI学习机成为超级爆款！3000块的产品教不会下一代用AI！

昨天

都市频道 · “保证能抓到娃娃”！胖东来回应：主打一个开心，不存在破坏商业规则

昨天

上海科创服务 · 公示|2025年度金山区产学研科技成果转化项目拟立项名单

2 天前

科技美学官方 · 这些功能，怎么不等微信下架再告诉我

2 天前

清博智能 · 智媒云创AI智能生产中心：AI赋能融媒体高质量发展综合解决方案

2 天前

体外诊断观察 · 安图的涅槃重生，董事长谈三大愿景！

1 年前

胸外科豆腐包 · 【高危肺结节的影像学特征】胸膜凹陷、血管牵拉、分叶与毛刺、内含空泡

2 年前

副业搞钱有术 · 龙创悦动出海策略类游戏《Rise of Castles: Ice and Fire》（附市场线索SDR），复杂的战斗系统

11 月前

滑州百事通 · 喜讯！滑县一诗人在南京获双项大奖！

7 月前

深度强化学习实验室 · ICLR 2025 Spotlight | SmODE: 神经常微分网络让深度强化学习的控制更加丝滑！

4 月前