今天看啥  ›  专栏  ›  通往AGI之路

清言上线情感语音模型GLM-4-Voice,AI 的 phone use 也来了

通往AGI之路  · 公众号  · 科技创业 科技自媒体  · 2024-10-26 23:42
    

主要观点总结

本文介绍了GLM-4-Voice的发布,它是智谱多模态大模型家族的新成员,具备完整的感官系统,实现了机器与人交互的自然与流畅。GLM-4-Voice具有直接理解和生成中英文语音的能力,能够根据用户指令调整语音的情感、语调、语速和方言等特征,且具有更低的延迟,支持实时打断,进一步提升交互体验。该模型已经上线清言app,同时开源供用户使用。文章还介绍了GLM-4-Voice的技术细节,包括其组成部分、预训练方式、使用方式等。此外,还介绍了智谱在迈向AGI过程中的其他进展,如AutoGLM的手机使用能力,以及智谱的技术升级曲线等。

关键观点总结

关键观点1: GLM-4-Voice的发布

它是智谱多模态大模型家族的新成员,具备完整的感官系统,实现了机器与人交互的自然与流畅。

关键观点2: GLM-4-Voice的能力特点

具备直接理解和生成中英文语音的能力,能够根据用户指令调整语音的情感、语调、语速和方言等特征。具有更低的延迟,支持实时打断,进一步提升交互体验。

关键观点3: GLM-4-Voice的技术细节

包括其组成部分、预训练方式、使用方式等。

关键观点4: 智谱的其他进展

如AutoGLM的手机使用能力,包括在Phone Use和Web Browser Use上的性能提升,以及智谱的技术升级曲线等。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照