注册登录

专栏名称: 蚂蚁技术AntTech

分享蚂蚁集团的技术能力和技术文化。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

目录

相关文章推荐

51CTO技术栈 · Claude性价比之王Sonnet ... · 4 小时前

程序猿 · 去年7月被裁员的，到现在快一年了。突然前领导 ... · 17 小时前

程序员的那些事 · 存储三巨头被告了 + 腾讯与长鑫存储签 ... · 昨天

码农翻身 · 他写的软件支撑着整个互联网，如今却因为 ... · 昨天

京东零售技术 · CVPR ... · 昨天

今天看啥 › 专栏 › 蚂蚁技术AntTech

基于大模型的AI多模态评测

蚂蚁技术AntTech · 公众号 · 程序员 · 2025-07-03 18:31

主要观点总结

本文主要介绍了蚂蚁集团在AI多模态领域的落地应用，特别是罗军在2025全球软件质量&效能大会（QECon）深圳场上关于基于大模型的AI多模态评测的演讲内容。演讲涵盖了AIGC生图、语音、视频等方面的评测工作，从评测指标、评测数据、评测能力和效果四个维度展开分享。针对AIGC生图评测，介绍了对新情况的定义、指标体系完善以及大模型评测方案VQA-GPT的应用。在AI商品图评测方面，描述了生成链路问题和人审环节存在的问题，并介绍了构建的AI商品图评测方案。此外，还涉及语音评测、TTS评测、视频评测等方面的内容，包括评测指标、数据集构建、模型应用等。最后，总结了多模态评测benchmark的构建和蚂蚁在AI多模态领域的贡献。

关键观点总结

关键观点1: 蚂蚁集团在AI多模态领域的落地应用

蚂蚁集团在AI多模态领域有很多应用，包括图像、语音、视频等方面的评测工作。蚂蚁积极参与了国家标准制定工作，并将一些好的实践撰写成了论文，入选了AAAI2025。

关键观点2: 基于大模型的AI多模态评测

蚂蚁集团采用大模型技术来进行AI多模态评测，包括AIGC生图、语音、视频等。例如，在AIGC生图评测中，采用了CLIP模型来计算文本和图像之间的相似度，并使用大模型工具进行一致性评测。在语音评测方面，引入了TN处理机制和ITN准确率等新技术来提高评测准确性。

关键观点3: AI商品图生成链路和人审环节的问题

在AI商品图生成链路中，存在生成图的质量问题、抠图模型精确度问题以及生成模型自身幻觉问题等。同时，在人审环节存在审核压力、审核偏差和结果不稳定等问题。为了解决这些问题，蚂蚁集团构建了一套AI商品图评测方案，包括两个模块：Efficient-SAM based Module和Reward Model。

关键观点4: 多模态评测的未来展望

蚂蚁集团构建了图像、语音、视频等多模态评测benchmark，并积极参与与业界的共建。在评测过程中，也参与国家标准制定工作，并将一些好的实践贡献到标准里。未来，蚂蚁集团期待在AI多模态评测领域跟广大业界同行多多交流，共建共享共同发展。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址 (快捷配置)
总结与预览地址：访问文章预览/总结
文章地址：访问文章快照

分享到微博

推荐文章

51CTO技术栈 · Claude性价比之王Sonnet 5来了！Claude Code终于补上最缺的“执行者”

4 小时前

程序猿 · 去年7月被裁员的，到现在快一年了。突然前领导给我打电话，说一起聚聚，一同吃饭的还有当时我们小组的主管。我感觉很奇怪，可能什么事？

17 小时前

程序员的那些事 · 存储三巨头被告了 + 腾讯与长鑫存储签 200 亿大单

昨天

码农翻身 · 他写的软件支撑着整个互联网，如今却因为 AI 被骂惨了 !

昨天

京东零售技术 · CVPR 2026｜京东零售广告创意：基于统一自回归模型的个性化图文联合生成

昨天

下厨房 · 大厨的煲汤秘诀，连吃3天都不腻！紧实柔嫩，丝丝缕缕都是丰饶海味。

1 年前

爆炸吧知识 · 那3个未成年杀人犯，判了！最高无期！

1 年前

学术经纬 · 为什么越睡越累？别以为是没睡够，也可能是没做好这7件事

1 年前

牛津-小裁缝 · 如何从经济地理学的角度来理解—消费不是刺激出来的？ -20250301090651

1 年前

广东消委会 · 突发公告：将关闭线上线下全部门店！事关会员最新提醒 ️

6 月前

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号