OpenAI 于 2025 年 4 月 14 日宣布在 API 中推出 GPT-4.1 系列模型,包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。这些新模型在编码、指令遵循和长上下文理解等方面取得了显著进步,同时在成本和延迟上实现了优化。
GPT-4.1 系列在多项行业标准指标上表现出色。在 SWE-bench Verified 编码测试中,GPT-4.1 的得分达到 54.6%,比 GPT-4o 提高了 21.4%,成为领先的编码模型。在 Scale 的 MultiChallenge 基准测试中,GPT-4.1 的得分为 38.3%,比 GPT-4o 提高了 10.5%。此外,GPT-4.1 在长上下文理解方面也取得了突破,能够在 100 万个上下文标记中准确提取信息,适用于处理大型代码库和长文档。
GPT-4.1 mini 和 GPT-4.1 nano 的推出进一步丰富了模型选择。GPT-4.1 mini 在多项基准测试中超越了 GPT-4o,延迟降低了近一半,成本降低了 83%。GPT-4.1 nano 则是目前速度最快、成本最低的模型,适用于分类和自动完成等任务。
OpenAI 还宣布将逐步淘汰 GPT-4.5 预览版,因为 GPT-4.1 在关键功能上提供了更好的性能和更低的成本。GPT-4.5 预览版将于 2025 年 7 月 14 日关闭,以便开发者有时间过渡。
在实际应用中,GPT-4.1 系列模型已经展现出强大的能力。例如,Windsurf 的内部编码基准测试显示,GPT-4.1 的表现比 GPT-4o 高出 60%。Qodo 的测试表明,GPT-4.1 在生成高质量代码审查方面优于其他领先模型。Thomson Reuters 和 Carlyle 的测试也证明了 GPT-4.1 在处理复杂法律文档和提取财务数据方面的卓越性能。
OpenAI 还发布了多个评估数据集,包括 OpenAI-MRCR 和 Graphwalks,以推动长上下文理解和多跳推理的研究。GPT-4.1 在这些基准测试中均取得了优异成绩。
GPT-4.1 系列模型现已向所有开发者开放,其定价也更具竞争力。GPT-4.1 的输入成本为每 100 万 token 2 美元,输出成本为 8 美元,而 GPT-4.1 nano 的输入成本仅为 0.1 美元,输出成本为 0.4 美元。此外,OpenAI 提供了更高的缓存折扣,进一步降低了使用成本。
OpenAI 的这一更新标志着 AI 应用在实际场景中的重大进步,为开发者提供了更高效、更可靠的工具,推动了智能系统和复杂代理应用的开发。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!