专栏名称: InfoQ

有内容的技术社区媒体。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

刚刚，DeepSeek 突然公布成本利润率高达545%！做 AI Infra 的该慌了？！

InfoQ · 公众号 · 科技媒体 · 2025-03-01 15:14

主要观点总结

DeepSeek开源项目发布最新动态，披露大规模部署成本和收益。其V3/R1架构通过大规模跨节点专家并行优化推理系统，实现更高的吞吐和更低的延迟。项目开源部分模块，降低社区复现难度。DeepSeek宣布调整API调用价格，并强调其成本定价原则。官方详解文章涉及大规模跨节点专家并行、计算通信重叠、负载均衡等方面内容，并分享线上系统实际统计数据。文章还提到DeepSeek V3和R1服务的GPU使用情况和成本收益情况。

关键观点总结

关键观点1: DeepSeek V3/R1架构特点

由大量小Expert组成，与主流模型结构有显著差异，需遵循DeepSeek报告描述的方法以达到最佳效率。DeepSeek开源部分模块降低了复现难度。

关键观点2: 大规模跨节点专家并行（Expert Parallelism / EP）

是实现DeepSeek V3/R1推理系统优化目标的关键技术，通过增加 overall batch size来为每个专家提供足够的expert batch size，实现更大吞吐、更低延时。

关键观点3: 计算通信重叠和负载均衡

多机多卡的专家并行引入较大通信开销，通过双batch重叠掩盖通信开销提高整体吞吐。同时，实现计算负载均衡和通信负载均衡以提高系统效率。

关键观点4: DeepSeek的API调用价格调整

DeepSeek调整API调用价格，强调其根据成本定价的原则。实际收入和成本情况也有所提及。

关键观点5: 线上系统实际统计数据

分享了关于DeepSeek V3和R1服务的GPU使用情况、成本收益、token处理量等实际统计数据。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址 (快捷配置)
总结与预览地址：访问文章预览/总结
文章地址：访问文章快照

分享到微博

推荐文章

智东西 · 杭州AI智能体大会终极议程揭晓，60+嘉宾齐聚中国硅谷

21 小时前

极客公园 · AGI Playground 2026，首批嘉宾官宣！

昨天

虎嗅APP · 世界不平了，TCL 为什么还押注全球化？

昨天

新浪科技 · 【#苹果涨价后还值得买吗#？#苹果拟在涨价下周开启返校促销#】彭-20260626072805

2 天前

苹果黑科技 · Mac 涨价只是开始？苹果声明暗示后续还有新一轮调价

2 天前

高分子科技 · 北林杨俊/山理工郝三伟 AFM：具有超循环响应寿命的可持续性压力传感阵列

1 年前

催化计 · 四川大学ACS Catal.：大孔分子筛助力抗积碳生物油氢化脱氧

1 年前

好地讯 · 好地日报10.22：宁波城投联合江山万里81.5亿包揽宁波东部新城2宗商住地

1 年前

达州关注官方号 · 春节期间，达州这些路段实施临时交通管制！

1 年前

百姓关注 · @贵州人！今日立春，查收这份“春日养生指南”

1 年前