专栏名称: DASOU

一名算法工程师，分享工作日常和AI干货，专注深度学习。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

华为盘古大模型首次开源！！

DASOU · 公众号 · · 2025-07-02 21:55

主要观点总结

华为盘古大模型首次开源，模型名为盘古Pro MoE，参数量72B，中英文理解和推理能力不输给32B密集模型。盘古Pro MoE提出了全新的MoGE架构，针对昇腾芯片做了适配，实现了高效的推理吞吐性能。文章还介绍了盘古Pro MoE在各项任务中的表现，包括知识密集型评测、逻辑推理能力等。此外，盘古Pro MoE还采用了分组混合专家模型（MoGE）架构，实现了设备间负载均衡，提高了计算资源利用效率。其训推设施也针对昇腾集群做了专门适配，实现了模型算力的高效利用。

关键观点总结

关键观点1: 盘古Pro MoE模型的特点和性能

盘古Pro MoE参数量72B，中英文理解和推理能力不输给32B密集模型。具有高效推理吞吐性能，并采用全新的MoGE架构，针对昇腾芯片进行适配。

关键观点2: 盘古Pro MoE在各项任务中的表现

盘古Pro MoE在知识密集型评测、逻辑推理能力等方面表现出色，包括阅读理解、数学推理、代码生成等任务。

关键观点3: 盘古Pro MoE的MoGE架构和负载均衡策略

盘古Pro MoE采用分组混合专家模型（MoGE）架构，通过专家分组和分组均衡路由策略实现设备间负载均衡，提高计算资源利用效率。

关键观点4: 盘古Pro MoE的训推设施优化

盘古Pro MoE的训推设施针对昇腾集群进行适配，通过分层混合并行、量化压缩、算子融合等技术优化，实现模型算力的高效利用。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

FM93交通之声 · 消息传来！网红景点失联5人，均已遇难

5 小时前

FM93交通之声 · 花87万办了300年健身卡！杭州一男子直呼：当时昏头了…

昨天

FM93交通之声 · 网友称“奔驰女司机亮证逼迫让路”！广西通报

昨天

澳洲求职 · 澳洲春招 | Fulton Hogan开放2026 Graduate岗位申请

2 天前

FM93交通之声 · 中国篮协通报辽宁山东U21群殴事件

2 天前

专知 · 2024必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/CV AI+X》集合

11 月前

海峡导报 · 极氪官方回应“车主开启智驾后撞上护栏”：驾驶员操作不当

4 月前

硕博就业出国 · “做科研不会Origin，实在说不过去！”

3 月前

BetterRead · 新初二二三事（九）

4 周前

贵州国资 · 新华视点｜“高效办成一件事”，改革成效怎么样？

2 周前