当前位置: 保成网 >  新闻资讯 >  Phi-4:微软新AI模型挑战GPT,打破参数迷信惊艳亮相

Phi-4:微软新AI模型挑战GPT,打破参数迷信惊艳亮相

更新时间:2025-05-01 18:32:34作者:zsbaocheng
微软放大招,Phi-4专攻推理

4 月 30 日,微软重磅发布了三款针对复杂推理任务优化的小型 AI 模型,统称为“Phi-4 reasoning”系列。该系列基于微软此前发布的 Phi-4 模型,通过监督微调并结合 o3-mini 提供的高质量推理训练数据,强化了“教会 AI 如何思考”的能力。

这三款模型包括标准版 Phi-4-reasoning、强化学习升级版 Phi-4-reasoning-plus,以及轻量级版本 Phi-4-mini-reasoning,均为开源模型,覆盖从高效执行到低资源场景的不同需求。

Phi-4:微软新AI模型挑战GPT,打破参数迷信惊艳亮相

图片信息来源于网络

多步骤推理,AI也能“慢慢想”

Phi-4 reasoning 最大的亮点之一是引入了“推理时间扩展”(inference-time scaling)机制,允许模型在遇到复杂问题时“多想一步”,有效提升了多步骤、递进式任务的表现,特别适用于数学、逻辑推理和智能代理场景。

在训练过程中,这些模型借助 OpenAI o3-mini 提供的推理演示,学会了如何一步步拆解问题、形成有条理的“思维链条”,就像一个数学老师在黑板前写步骤一样,讲得清清楚楚。

Phi-4:微软新AI模型挑战GPT,打破参数迷信惊艳亮相

图片信息来源于网络

标准版 vs 加强版:性能再进化

标准版 Phi-4-reasoning 拥有 140 亿参数,已经在多个基准测试中超越了 OpenAI o1-mini 和 DeepSeek-R1-Distill-Llama-70B 等竞品。而“加强版”Phi-4-reasoning-plus 则在此基础上加入了强化学习训练,token 消耗提升 1.5 倍,换来了更高的精准度和更强的泛化能力。

最惊艳的是,两款模型在美国 AIME 奥数资格赛上表现居然优于 DeepSeek-R1 的 6710 亿参数版本,打了个漂亮的“小模型逆袭大模型”的翻身仗。

Phi-4:微软新AI模型挑战GPT,打破参数迷信惊艳亮相

图片信息来源于网络

mini 版发力边缘场景,教育辅导新利器

针对算力紧张场景,微软还推出了仅 3.8 亿参数的 Phi-4-mini-reasoning,专为边缘设备、教育应用等轻量部署而生。别看它小,模型专攻数学推理,在多个测试集上打败了 OpenThinker-7B 和 Llama-3.2-3B-instruct,性能极具性价比。

这款模型还能覆盖中学到博士级难度的百万级问题库,非常适合做题辅助、作业批改、线上辅导等应用场景,也为 AI 进入教育场景铺平了道路。

相关教程

copyright ©  2012-2025 保成网 m.zsbaocheng.net 版权声明