专栏名称: 刘聪NLP

AIGC前沿知识分享&落地经验总结

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

QVQ-72B，如期而至！继QWQ后，通义千问又开源视觉推理大模型！

刘聪NLP · 公众号 · 科技自媒体 · 2024-12-25 08:00

主要观点总结

本文介绍了千问团队新开源的视觉推理大模型QVQ，基于Qwen2-VL-72B模型进一步训练得来。文章提到了QVQ的参数量对模型性能的影响，以及在MMMU榜单上的表现。同时，文章也指出了QVQ存在的一些问题，包括语言混乱、循环推理、安全性问题等。最后，文章给出了使用QVQ的代码示例，包括模型的加载、处理以及推理过程。

关键观点总结

关键观点1: 千问团队开源了新的视觉推理大模型QVQ。

QVQ是基于Qwen2-VL-72B模型进一步训练得来的，参数量对模型性能有重要影响。

关键观点2: QVQ在MMMU榜单上的表现良好。

相较于Qwen2-VL-72B模型，QVQ在某些方面取得了更好的效果。

关键观点3: QVQ存在一些问题。

最明显的问题是中英文夹杂的语言混乱现象，还有模型容易陷入循环推理和安全性问题等。

关键观点4: 给出了使用QVQ的代码示例。

通过示例代码展示了如何加载模型、处理输入以及进行推理。

关键观点5: 呼吁读者关注公众号并支持。

鼓励读者点赞、在看、关注公众号「NLP工作站」，并加入交流群。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

sven_shi · 之前我接触选调生的一些感受，可以做个参考。-20260619133148

20 小时前

金错刀 · 苹果安全神话破灭，亿级用户速查

昨天

金错刀 · 喜欢把“谢谢”挂嘴边的，往往就5种人，第4种要谨慎

昨天

sven_shi · 宣传了几十年中国人太多，所以大家要少生孩子，才有美好的未来。这一-20260617175537

2 天前

酷玩实验室 · 科技快讯｜京东方8.6代OLED量产；中国两轮电动车进入存量；内存涨288%持续冲高、HDD已翻倍......

2 天前

保险一哥 · 工银安盛董事长履新，报行合一时代工银能开启新篇章吗？

2 年前

瑞典方式 · 留学瑞典学生大使2024招新啦！我们等你来！

2 年前

人民日报 · “没苦硬吃”与“没福硬享”之间，有没有余地？

1 年前

绿色青浦 · 抓住黄金4分钟，小伙的急救有多关键？这些救命技能要学会→

1 年前