豆包正式上线AI播客，它为什么那么重视音频？｜大公司

新皮层NewNewThing · 公众号 · · 2025-06-18 21:10

主要观点总结

本文主要介绍了豆包推出的AI播客功能及其背后的技术，以及字节在语音技术方面的应用和发展。文章还提到了播客市场的趋势以及AI播客与传统播客的区别。此外，文章还涉及了字节在AI领域的布局和其他语音生成产品的相关技术。

豆包上线了AI播客功能，用户只需上传文档或输入文章链接，即可生成一段由AI双人对话构成的播客音频。该功能实现了业界最好的音色自然度，但目前在内容概括和下载功能方面还存在一些限制。

字节推出了专门的“豆包·语音播客模型”，并已经在多个场景中应用了其语音技术。字节的语音能力包括音频生成与创作、音频理解与生成、音乐理解与生成三大能力，已应用于超30个行业。

传统播客是单向输出，而AI播客则是互动式内容，更符合用户需求。播客市场预计在不久的将来会有较大增长，AI播客技术的出现将进一步推动这一趋势。

除了豆包的AI播客功能，字节还在其他场景加载了AI语音能力。目前，多个语音生成产品仍采用ASR+LLM+TTS方案。字节的语音技术已经引起了行业的关注。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博