注册登录

专栏名称: 雷峰网

中国智能硬件第一媒体

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

目录

相关文章推荐

i黑马 · 500亿，梁文锋“不学”华为了？ · 9 小时前

虎嗅APP · 徕卡不稀缺了，小米17T Pro还贵在哪？ · 昨天

IT之家 · 【初探苹果 watchOS 27：升级 ... · 昨天

IT之家 · 【苹果 iOS 27 ... · 昨天

雷峰网 · 某车厂野路子：造车必须上车办公，蹲办公室算违 ... · 2 天前

今天看啥 › 专栏 › 雷峰网

华为盘古首次露出，昇腾原生72B MoE架构，SuperCLUE千亿内模型并列国内第一

雷峰网 · 公众号 · 科技媒体 · 2025-05-28 20:06

主要观点总结

华为盘古团队提出了分组混合专家模型（MoGE）架构，解决了传统MoE模型专家激活频次高度不均衡的问题。新架构通过分组均衡路由技术实现跨设备的计算负载均衡，并在昇腾大规模集群上进行了高效训练。盘古Pro MoE大模型在多个领域取得了优异成绩，相比其他大模型，它以更小的参数量达到了相当或更好的性能。此外，该模型还解决了专家负载不均衡的问题，提高了硬件资源利用率和推理速度。该模型的成功应用标志着大模型从“参数军备竞赛”转向“实效主义”，为AI产业应用领域开辟了新的蓝海。

关键观点总结

关键观点1: 分组混合专家模型（MoGE）架构的提出

解决了传统MoE模型专家激活频次高度不均衡的问题，通过分组均衡路由技术实现跨设备的计算负载均衡。

关键观点2: 盘古Pro MoE大模型的性能优势

在多个领域取得了优异成绩，相比其他大模型，以更小的参数量达到了相当或更好的性能。

关键观点3: 解决专家负载不均衡问题

通过分组均衡路由技术和辅助损失函数解决专家负载不均衡问题，提高了硬件资源利用率和推理速度。

关键观点4: 行业价值

盘古Pro MoE的诞生标志着大模型从“参数军备竞赛”转向“实效主义”，为AI产业应用领域开辟了新的蓝海。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

i黑马 · 500亿，梁文锋“不学”华为了？

9 小时前

虎嗅APP · 徕卡不稀缺了，小米17T Pro还贵在哪？

昨天

IT之家 · 【初探苹果 watchOS 27：升级 Siri AI、增强健康-20260609040748

昨天

IT之家 · 【苹果 iOS 27 状态栏显示优化：图标更加圆润、电量改用无边-20260609041429

昨天

雷峰网 · 某车厂野路子：造车必须上车办公，蹲办公室算违纪；「玩乐队」成某大模型公司招聘加分项；具身新锐跨界借壳上市计划遭股东否决丨AI情报局

2 天前

物业管理资讯平台 · 不交物业费，全靠搭便车，凭什么说物业服务不到位

1 年前

知识管理中心KMCenter · 各行业高手,都是框架思维

1 年前

浦东企业政策在线 · 公示 | 关于上海市2024年度“科技创新行动计划”计算生物学领域等拟立项项目的公示

1 年前

经济观察报 · 云南咖啡：从大山里打出来的“翻身仗”

1 年前

粉体网 · 气力输送设备供应商：江苏纽普兰能源环境科技有限公司入驻粉享通

9 月前

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号