专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

腾讯研究院AI速递 20250122

腾讯研究院 · 公众号 · 科技媒体 · 2025-01-22 00:15

主要观点总结

本文报道了关于生成式AI的多个进展，包括语音模型、思考模型、3D生成大模型等的应用和更新。文章介绍了各领域的AI技术的新特性、功能及优势。

关键观点总结

关键观点1: WaveForms开发端到端音频大模型，实现实时交互

WaveForms直接将音频输入处理，不经过语音转文本再转语音的步骤，提高了交互的实时性。

关键观点2: Kimi发布k1.5思考模型提升token使用效率

Kimi k1.5通过long2short强化学习技术，将长CoT模型的推理能力转移到短CoT模型，提高了token的使用效率。

关键观点3: 腾讯3D生成大模型2.0支持自动绑骨，实现分钟级生成游戏3D资产

腾讯的混元3D 2.0模型采用几何与纹理解耦生成技术，可生成高精度白模，并支持自动骨骼绑定功能。

关键观点4: T2A-01语音模型展现强语义理解能力

T2A-01语音模型支持多种语言合成，具备多层次情感表达能力，在处理大量同声词时展现出强语义理解能力。

关键观点5: 美图WHEE「AI海报」功能提供一键生成海报

美图推出的WHEE AI海报功能支持一键生成海报，并提供模板和素材生成功能。

关键观点6: 谷歌Gemini完成10万字商业战略书籍的写作

谷歌Gemini通过处理请求token和生成响应token，完成了一本商业战略书籍的写作。

关键观点7: Adobe推出的音乐模型DITTO-2可精准控制音乐强度、旋律

DITTO-2集成两种蒸馏技术和ITO推理时优化技术，可实现实时控制调整音乐的强度、旋律等。

关键观点8: 智谱清影AI视频工具升级支持画面主体大幅度运动

智谱清影AI视频工具通过升级模型结构和训练方法，支持画面主体进行大幅度运动。

关键观点9: 哥大团队细胞「基础」模型揭示人类细胞调控语法

哥大团队通过GET基础模型利用人类细胞染色质数据实现了实验级转录预测精度，揭示了细胞调控语法。

关键观点10: Pytorch负责人强调复合AI的推理能力

随着行业对AI推理能力的重视，Pytorch负责人介绍了Fireworks通过FireOptimizer实现的三维平衡以及多LoRA技术和分布式推理引擎的应用。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

苹果黑科技 · 搜狗输入法用了8年，装上豆包输入法Mac版第二天我就卸载了

23 小时前

智东西 · Meta汪滔爆猛料：剧透更强新模型，认同乔布斯理念，曝天价抢人真相

昨天

钛媒体 · 马斯克黄仁勋跟着特朗普来华，有何商业考量？

昨天

IT之家 · 微信大手笔！App团队投入一半人支持国产

昨天

新浪科技 · 【#曝苹果加码广告业务#，组建新团队主动拉拢开发者投放】科技媒体-20260514082113

昨天

CPECC北京分公司 · 张吉明到青海格尔木燃机电站项目现场检查慰问

1 年前

媒哥媒体招聘 · 湖南卫视《第32届中国电视金鹰奖颁奖晚会》实习生招聘！（长沙）

1 年前

广西华图 · 2025国家公务员考试将启动！考霸笔记分享！

1 年前

联新移动医疗 · 致敬每一位中国医务工作者，祝您医师节快乐

8 月前

电池工业网 · 新进展！山东50亿元圆柱锂电池项目

7 月前