Phi-4：微软新AI模型挑战GPT，打破参数迷信惊艳亮相

更新时间：2025-05-01 18:32:34作者：zsbaocheng

微软放大招，Phi-4专攻推理

4 月 30 日，微软重磅发布了三款针对复杂推理任务优化的小型 AI 模型，统称为“Phi-4 reasoning”系列。该系列基于微软此前发布的 Phi-4 模型，通过监督微调并结合 o3-mini 提供的高质量推理训练数据，强化了“教会 AI 如何思考”的能力。

这三款模型包括标准版 Phi-4-reasoning、强化学习升级版 Phi-4-reasoning-plus，以及轻量级版本 Phi-4-mini-reasoning，均为开源模型，覆盖从高效执行到低资源场景的不同需求。

图片信息来源于网络

多步骤推理，AI也能“慢慢想”

Phi-4 reasoning 最大的亮点之一是引入了“推理时间扩展”（inference-time scaling）机制，允许模型在遇到复杂问题时“多想一步”，有效提升了多步骤、递进式任务的表现，特别适用于数学、逻辑推理和智能代理场景。

在训练过程中，这些模型借助 OpenAI o3-mini 提供的推理演示，学会了如何一步步拆解问题、形成有条理的“思维链条”，就像一个数学老师在黑板前写步骤一样，讲得清清楚楚。

图片信息来源于网络

标准版 vs 加强版：性能再进化

标准版 Phi-4-reasoning 拥有 140 亿参数，已经在多个基准测试中超越了 OpenAI o1-mini 和 DeepSeek-R1-Distill-Llama-70B 等竞品。而“加强版”Phi-4-reasoning-plus 则在此基础上加入了强化学习训练，token 消耗提升 1.5 倍，换来了更高的精准度和更强的泛化能力。

最惊艳的是，两款模型在美国 AIME 奥数资格赛上表现居然优于 DeepSeek-R1 的 6710 亿参数版本，打了个漂亮的“小模型逆袭大模型”的翻身仗。