今天看啥  ›  专栏  ›  DASOU

刚刚,DeepSeek 开源新模型

DASOU  · 公众号  · 科技创业 科技自媒体  · 2025-04-30 18:37
    

主要观点总结

DeepSeek开源了新模型:DeepSeek-Prover-V2-671B,使用了更高效的safetensors文件格式,支持多种计算精度,方便模型更快、更省资源地训练和部署。该模型可能是去年发布的数学AI模型Prover-V1.5的升级版,参数量高达6710亿,基础模型架构为Deepseek-V3。

关键观点总结

关键观点1: DeepSeek开源新模型DeepSeek-Prover-V2-671B

这是DeepSeek最新开源的模型,可能是Prover-V1.5的升级版。

关键观点2: 使用了高效的safetensors文件格式

新模型采用了safetensors文件格式,这种格式有助于提高模型的效率。

关键观点3: 支持多种计算精度

新模型能够支持多种计算精度,这有助于模型在训练和部署时更加节省资源。

关键观点4: 基础模型架构为Deepseek-V3

该模型的基础架构与Deepseek-V3相同,具有特定的配置,如MoE中间层大小、moe_layer_freq等。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照