专栏名称: 凤凰网科技
这里可以看到新鲜出炉的科技产业新闻、深入浅出的企业市场分析,可以看到直击真相的科技事件图解、轻松逗比的科技人物吐槽,干货满满绝无水分。
TodayRss-海外RSS稳定源
目录
相关文章推荐
i黑马  ·  大疆对手要被卖了 ·  11 小时前  
IT之家  ·  【华为余承东:问界 M9 ... ·  12 小时前  
IT之家  ·  【6 亿韩元对比 600 ... ·  21 小时前  
今天看啥  ›  专栏  ›  凤凰网科技

在DeepSeek老家发新模型,豆包怎么想的?

凤凰网科技  · 公众号  · 科技媒体  · 2025-04-17 21:15
    

主要观点总结

本文介绍了字节跳动旗下AI助手豆包大模型的最新进展,包括其深度思考模型的上线、多模态能力以及API价格等方面的信息。文章指出,虽然DeepSeek在某些方面表现突出,但豆包大模型在用户量级、投入产出比等方面面临挑战。同时,豆包还在不断加强模型研发投入,并推出视觉版模型来解决DeepSeek只能处理文字输入的局限性。业内认为,大模型的竞争将逐渐集中在几家主要厂商之间。

关键观点总结

关键观点1: 豆包大模型的深度思考模型上线,具有多模态能力,可以处理图像和文字等多元信息。

豆包大模型的深度思考模型已经正式上线,并且推出了视觉版模型,具有原生多模态深度思考能力,可以处理图像和文字等多种信息。这一功能通过一键拍图识别地点、识别外文菜单等应用场景得到了展示。

关键观点2: 豆包大模型的研发进展和竞争优势。

火山引擎总裁谭待分享了豆包大模型的研发进展,包括其人类评估表现超出DeepSeek R1 8%,单位推理成本降低了50%,在数学推理、编程竞赛、科学推理等专业任务领域性能优异。此外,豆包大模型还具备“边想边搜”的能力,并解决了DeepSeek R1只能做文字输入的最大难点。

关键观点3: 豆包大模型的API价格和竞争态势。

豆包推理模型的API价格相较于同等级模型如阿里qwen-plus和DeepSeek R1具有一定竞争力。此外,豆包深度思考模型采用MoE架构,总参数为200B,每次推理时激活的参数为20B,可以更低延迟。业内认为,大模型的竞争将逐渐集中在几家主要厂商之间,包括DeepSeek、阿里和字节跳动。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照