专栏名称: AIWalker

关注计算机视觉、图像处理、深度学习等领域的干货分享与前沿paper解读。AIWalker由具有多年算法研究与产品化落地经验的Happy运营，原创为主、同时会转载优秀解读文章。欢迎志同道合的小伙伴们加入一同学习进步。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

CVPR2025 | DeQA-Score: 让大语言模型学会图像质量分数的分布

AIWalker · 公众号 · 科技自媒体 · 2025-04-11 21:59

主要观点总结

本文介绍了一项CVPR25的工作，名为DeQA-Score，这是一个基于多模态大语言模型的图像质量评估系统。DeQA-Score实现了无需安装环境即可方便使用，仅需要安装transformers库，并通过两行代码即可调用。文章探讨了项目的背景、最大的难点、模型训练方法和实验结果。

关键观点总结

关键观点1: 项目背景

项目基于DepictQA项目，使用语言描述图像质量。反馈指出，虽然语言描述具有灵活性，但在图像质量评价（IQA）中不能直接作为度量标准。因此，需要开发一个既方便易用又能产生准确分数的多模态IQA方法。

关键观点2: 主要挑战

使用大语言模型回归分数的主要难点在于将连续的分数转化为离散的token。为此，文章提出了将连续的分数离散化为不同级别的token的方法，并通过实验验证了该方法的优越性。

关键观点3: 模型训练方法

除了对level token使用KL divergence loss进行训练外，还引入了fidelity loss来监督模型，以促进模型关注图像之间的优劣关系。

关键观点4: 实验结果

实验结果表明，DeQA-Score预测的level token分布与真实的高斯分布非常吻合，可以计算平均分数和分数的方差，达到目前图像质量评估的领先水平。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

科技美学官方 · 苹果发布会新品汇总不止iPhone17

21 小时前

938重庆私家车广播 · 学生用录取通知书做饭？高校回应

昨天

面包板社区 · 拆解一个28块钱捡漏来的九号电瓶车控制器，这做工真实在！

昨天

科技美学官方 · 全球手机出货量公布谁排第一？

昨天

柴狗夫斯基 · 亏怕了？蔚来李斌：如果能穿越的话先做增程搞点钱……

2 天前

富国基金 · 景气上升的资源品，迎来布局的新工具——富国资源精选今日首发

1 年前

常岩CY · Z9 GT 首发亮相了圆规调头，今年年底估计要出现各种调头方式大-20240820211011

11 月前

环评互联网 · 2024年《国家污染防治技术指导目录（鼓励类）》

7 月前

今日闵行 · 市级奖项+2！

7 月前

无锡市场监管 · 这款饮品爆火，但有些人要慎喝！

4 月前