专栏名称: DataLearner

关注数据科学关注科技行业关注人工智能关注一切促进人类生活美好的新技术

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

微软发布第四代Phi系列大模型，140亿参数的Phi-4 14B模型数学推理方面评测结果超过GPT ...

DataLearner · 公众号 · 科技媒体 · 2024-12-13 22:39

主要观点总结

本文主要介绍了微软发布的Phi大语言模型系列中的Phi-4-14B模型。该模型参数规模仅140亿，但数学推理能力大幅增强，在多个评测基准上表现出色，尤其是数学推理和生成问答等方面。文章还介绍了Phi-4-14B模型的关键技术，包括合成数据用于预训练和中期训练、精选和过滤高质量有机数据以及后训练等。最后提到了该模型的开源情况和在某些任务中的表现。

关键观点总结

关键观点1: Phi-4-14B模型简介

微软发布的Phi大语言模型系列中的最新成员，参数规模仅140亿，但数学推理能力大幅增强。

关键观点2: Phi-4-14B模型的关键技术

包括合成数据用于预训练和中期训练、精选和过滤高质量有机数据以及后训练等，共同支撑了模型在保持参数数量相对较少的同时，实现了与更大模型相媲美的性能。

关键观点3: Phi-4-14B模型的评测效果

在多个评测基准中展现了显著优势，尤其是在数学推理、生成问答、以及代码生成任务中。然而，在某些任务（如SimpleQA）上的表现较弱。

关键观点4: Phi-4-14B模型的开源情况和使用限制

目前该模型已经可以在微软官网使用，下周将会开源，但开源协议是不允许商用的。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

新浪科技 · 【#微信输入法内测隔空传送功能#】近日，微信输入法开始测试全新“-20260503164600

昨天

鞭牛士 · 零跑4月交付超7万台：新势力第一次有了「巨头规模感」

昨天

新浪科技 · 【Marissa Warren：女性主导的风险投资，平均收益率比-20260503120846

昨天

虎嗅APP · 再见，信息时代：电焊工将比大学生的前途更光明

2 天前

IT之家 · 【最低配不涨价？消息称苹果计划对 iPhone 18 Pro 系-20260502150829

2 天前

每天发现一家店 · 五颜六色的帆布包，一口气来 30 个！

1 年前

有连云 · 交出史上最大亏损单，天齐锂业(002466.SZ)2024年巨亏近80亿元

1 年前

北大纵横 · 日债崩了，美债也不妙！金融危机的前奏？

11 月前

长江日报 · 荔枝价格，暴跌70%

10 月前

阜阳交通广播 · 成龙发文悼念

7 月前