专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

豆包升级了“眼睛”，看APP截图就能写代码了！超低价让多模态AI普惠

量子位 · 公众号 · AI · 2024-12-19 17:45

主要观点总结

本文主要介绍了豆包大模型的最新升级，包括视觉理解模型、语言模型和语音大模型的能力提升，以及在实际应用中的表现和数据。文章通过多个场景化的比试，展示了豆包大模型在视觉、理解和推理方面的优势，并介绍了其在实际应用中的表现，如生成代码、识别图像、处理数学题目、提取表格数据等。此外，文章还介绍了豆包大模型的“说”、“唱”能力的升级和在实际应用中的应用情况。

关键观点总结

关键观点1: 豆包大模型的升级包括视觉理解模型、语言模型和语音大模型的能力提升。

视觉理解模型能够支持图像识别、描述和创作；语言模型在综合能力、数学能力、专业知识和代码能力上有所提升；语音大模型现在可以生成三分钟完整音乐，支持用图片作曲。

关键观点2: 豆包大模型在实际应用中的表现优异。

豆包大模型已经应用于多个行业，如科教、金融、医疗、企业服务和汽车等。其日均tokens使用量已经突破4万亿大关，显示出市场和用户的广泛接受程度。

关键观点3: 豆包大模型的“说”、“唱”能力得到升级。

大语言模型方面，豆包的通用模型pro综合能力有所提升；语音大模型方面，现在可以生成三分钟音乐，支持用图片作曲。

关键观点4: HiAgent和扣子为豆包大模型的快速落地提供支持。

HiAgent提供超100个行业应用模板和GraphRAG技术，扣子拥有百万开发者和丰富生态，两者都能缩短开发与部署时间，使豆包大模型能够轻松实现AI能力的无缝嵌入。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

机器之心 · 告别盲盒筛选！分子之心发布MMDesign，抗体发现迈入可编程生物工程时代

21 小时前

AI前线 · Agent正把基础设施逼到极限！GitLab盈利大涨后裁员350人，下一代Git重构已启动

22 小时前

量子位 · 连GitLab都开始裁程序员了

22 小时前

机器之心 · 一个月烧掉5亿美元账单之后：这项研究在问，Agent到底知不知道自己花了多少?

昨天

深度学习与NLP · 黄仁勋评价华为“韬(τ)定律”：极高的创新！

昨天

澳洲红领君 · 澳洲药房华人员工站成墙！硬刚少女贼，全网都在夸

11 月前

吉林生态环境 · 辽源 | 市长程宇一线督导：筑牢生态屏障，绘就宜居乡村，夯实粮安根基！

11 月前

浑河云Go · 用充电宝可得多留意！

9 月前

岐黄圣贤智慧 · 倪海厦先生：仲景心法传讲字幕版视频及文稿(5)

8 月前