OpenAI 推出 GPT-4.1

小哪吒

OpenAI 于 2025 年 4 月 14 日宣布在 API 中推出 GPT-4.1 系列模型，包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。这些新模型在编码、指令遵循和长上下文理解等方面取得了显著进步，同时在成本和延迟上实现了优化。
GPT-4.1 系列在多项行业标准指标上表现出色。在 SWE-bench Verified 编码测试中，GPT-4.1 的得分达到 54.6%，比 GPT-4o 提高了 21.4%，成为领先的编码模型。在 Scale 的 MultiChallenge 基准测试中，GPT-4.1 的得分为 38.3%，比 GPT-4o 提高了 10.5%。此外，GPT-4.1 在长上下文理解方面也取得了突破，能够在 100 万个上下文标记中准确提取信息，适用于处理大型代码库和长文档。

      GPT-4.1 mini 和 GPT-4.1 nano 的推出进一步丰富了模型选择。GPT-4.1 mini 在多项基准测试中超越了 GPT-4o，延迟降低了近一半，成本降低了 83%。GPT-4.1 nano 则是目前速度最快、成本最低的模型，适用于分类和自动完成等任务。
      OpenAI 还宣布将逐步淘汰 GPT-4.5 预览版，因为 GPT-4.1 在关键功能上提供了更好的性能和更低的成本。GPT-4.5 预览版将于 2025 年 7 月 14 日关闭，以便开发者有时间过渡。
      在实际应用中，GPT-4.1 系列模型已经展现出强大的能力。例如，Windsurf 的内部编码基准测试显示，GPT-4.1 的表现比 GPT-4o 高出 60%。Qodo 的测试表明，GPT-4.1 在生成高质量代码审查方面优于其他领先模型。Thomson Reuters 和 Carlyle 的测试也证明了 GPT-4.1 在处理复杂法律文档和提取财务数据方面的卓越性能。
      OpenAI 还发布了多个评估数据集，包括 OpenAI-MRCR 和 Graphwalks，以推动长上下文理解和多跳推理的研究。GPT-4.1 在这些基准测试中均取得了优异成绩。
      GPT-4.1 系列模型现已向所有开发者开放，其定价也更具竞争力。GPT-4.1 的输入成本为每 100 万 token 2 美元，输出成本为 8 美元，而 GPT-4.1 nano 的输入成本仅为 0.1 美元，输出成本为 0.4 美元。此外，OpenAI 提供了更高的缓存折扣，进一步降低了使用成本。

OpenAI 的这一更新标志着 AI 应用在实际场景中的重大进步，为开发者提供了更高效、更可靠的工具，推动了智能系统和复杂代理应用的开发。