一键生成歌曲，腾讯AI Lab开源音乐生成大模型 SongGeneration

arXiv每日学术速递 · 公众号 · 科技创业科技自媒体 · 2025-07-01 14:50

主要观点总结

腾讯AI Lab推出并开源了音乐生成大模型SongGeneration，旨在解决音乐生成中音质、音乐性与生成速度等问题。该模型基于LLM-DiT融合架构，在保持生成速度的同时，显著提升了音质表现。此外，SongGeneration还支持文本控制、多轨合成和风格跟随等功能，既满足面向C端创作者的可玩性，又兼具B端的稳定性与拓展性。

关键观点总结

关键观点1: 模型性能及特点

SongGeneration模型具备多项创新技术，包括低比特率音乐编解码、多类别token并行预测、多维度人类偏好对齐和全新的三阶段训练范式等。这些技术突破提高了模型在音乐生成方面的效率和效果，使生成的音乐具有高质量、高保真度和良好的音乐性。

关键观点2: 模型评测结果

在联合中国传媒大学音乐与录音艺术学院萧萍副教授AI音乐科研团队进行的基于客观分析和主观感知的评测中，SongGeneration表现出优异的性能。在客观测评中，SongGeneration在多个维度均位列榜首；在主观评测中，SongGeneration在歌词准确度、旋律、伴奏、音质和整体表现等方面均处于领先位置，具备媲美主流商业模型的综合生成能力。

关键观点3: 模型的开放性和体验

SongGeneration模型已全面开源，并登陆Hugging Face和GitHub，方便大家下载、复现、微调。同时，也诚邀算法人才的加入。此外，还提供了体验地址，欢迎在线体验SongGeneration模型。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博