华为盘古大模型开源，推理方案、基础代码全公开！

AI前线 · 公众号 · AI · 2025-06-30 13:00

主要观点总结

华为今日宣布开源盘古70亿参数稠密模型、盘古Pro MoE 720亿参数混合专家模型和基于昇腾的模型推理技术。此举旨在推动大模型技术的研究与创新发展，加速人工智能在各行各业的应用与价值创造。华为还介绍了盘古Pro MoE模型的特点和优势，包括其分组混合专家模型架构、以较低计算成本支持更大规模参数的优势，以及针对昇腾硬件的系统优化。此外，华为还公开了相关开源代码的昇腾超大规模MoE模型推理部署方案，包括多个核心技术的介绍。同时，针对大语言模型的推理挑战，华为提出了盘古Embedded高效大语言模型推理器，具备快慢思考能力的双系统框架等。

关键观点总结

关键观点1: 华为开源盘古系列模型和基于昇腾的模型推理技术

这是华为推动大模型技术研究与创新发展的重要举措，旨在加速人工智能在各行各业的应用与价值创造。

关键观点2: 盘古Pro MoE模型的特点和优势

包括其分组混合专家模型架构、以较低计算成本支持更大规模参数的优势，以及针对昇腾硬件的系统优化。

关键观点3: 昇腾超大规模MoE模型推理部署方案

华为公开了相关开源代码，包括多个核心技术，如OmniPlacement高效负载均衡算法、投机推理框架FusionSpec等。

关键观点4: 盘古Embedded高效大语言模型推理器

华为提出了具备快慢思考能力的双系统框架，以及通过创新的两阶段训练框架构建此模型的方法。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

量子位 · Hinton能重新坐下了，什么时候开始的？

10 小时前

量子位 · AI Coding如何重构开发，模型×IDE×Agent深度对话｜量子位AI沙龙

昨天

爱可可-爱生活 · 构建融合 Text2SQL 与 RAG 的混合智能代理工作流，开-20250802070914

昨天

量子位 · AI答IMO难题坦承“不会”，OpenAI：这就是自我意识

2 天前

AI前线 · Manus数月憋大招， 100个Agent并发只为选双鞋？肖弘放话：第一阶段就得先做超贵的AI！

2 天前

CCI心血管医生创新俱乐部 · CCI创新快讯 | 全球首个冠脉恢复植入器械DynamX 获FDA 突破性器械称号

1 年前

消金界 · 这家上市小贷拟增持旗下公司

1 年前

黎贝卡的异想世界 · 前几天写换季搭配，很多小伙伴说如果能一键购买就好了。说来就来，今天我们自有品牌miss fantasy在做反季促销，很难得邓肯羊绒衫、羽绒服都参加这次的活动。小伙伴们正在直播间试穿活动单品，点上方【直播中】就能进直播间啦～晚安：）

11 月前

经济日报 · 多家券商官宣→

8 月前