今天看啥  ›  专栏  ›  arXiv每日学术速递

一键生成歌曲,腾讯AI Lab开源音乐生成大模型 SongGeneration

arXiv每日学术速递  · 公众号  · 科技创业 科技自媒体  · 2025-07-01 14:50
    

主要观点总结

腾讯AI Lab推出并开源了音乐生成大模型SongGeneration,旨在解决音乐生成中音质、音乐性与生成速度等问题。该模型基于LLM-DiT融合架构,在保持生成速度的同时,显著提升了音质表现。此外,SongGeneration还支持文本控制、多轨合成和风格跟随等功能,既满足面向C端创作者的可玩性,又兼具B端的稳定性与拓展性。

关键观点总结

关键观点1: 模型性能及特点

SongGeneration模型具备多项创新技术,包括低比特率音乐编解码、多类别token并行预测、多维度人类偏好对齐和全新的三阶段训练范式等。这些技术突破提高了模型在音乐生成方面的效率和效果,使生成的音乐具有高质量、高保真度和良好的音乐性。

关键观点2: 模型评测结果

在联合中国传媒大学音乐与录音艺术学院萧萍副教授AI音乐科研团队进行的基于客观分析和主观感知的评测中,SongGeneration表现出优异的性能。在客观测评中,SongGeneration在多个维度均位列榜首;在主观评测中,SongGeneration在歌词准确度、旋律、伴奏、音质和整体表现等方面均处于领先位置,具备媲美主流商业模型的综合生成能力。

关键观点3: 模型的开放性和体验

SongGeneration模型已全面开源,并登陆Hugging Face和GitHub,方便大家下载、复现、微调。同时,也诚邀算法人才的加入。此外,还提供了体验地址,欢迎在线体验SongGeneration模型。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照