专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
目录
相关文章推荐
今天看啥  ›  专栏  ›  智东西

720亿参数!华为首个开源大模型发布,用4000颗昇腾训练的

智东西  · 公众号  · 科技媒体  · 2025-06-30 12:05
    

主要观点总结

华为开源盘古大模型系列,包括盘古Pro MoE和盘古Embedded 7B,以及基于昇腾NPU的模型推理技术。其中盘古Pro MoE是一个混合专家模型,性能超越Qwen3-32B等主流开源模型;盘古Embedded 7B则是一个引入“快思考”和“慢思考”双系统的大模型架构,可自动切换以应对不同任务复杂度。两者均已在昇腾平台上进行深度系统优化并实现了高效推理。

关键观点总结

关键观点1: 盘古Pro MoE模型介绍

盘古Pro MoE是一个混合专家模型,具有720亿个参数和基于昇腾NPU的模型推理技术。它采用MoGE架构设计,实现了专家负载均衡,提高了在昇腾平台的部署效率。该模型在多项基准测试中性能领先,并在昇腾800I A2上实现了高效的推理吞吐性能。

关键观点2: 盘古Embedded 7B模型特点

盘古Embedded 7B模型是一个具备“快思慢想”能力的双系统框架,可在延迟和推理深度之间实现平衡。该模型通过两阶段训练框架构建,具备元认知能力,能根据任务复杂度自动选择最优模式。它在多个权威基准测试中的表现优于其他规模相近的模型。

关键观点3: 昇腾NPU的作用

昇腾NPU在华为的大模型中扮演着重要角色。它支持大规模并行训练,提高了模型的推理性能。昇腾NPU与盘古大模型的协同设计,实现了高效的大语言模型推理。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照