OpenAI 最强 AI 小模型:GPT-5.4 mini 与 nano 登场,低延迟、性能逼近满血版
3 月 18 日消息,OpenAI 公司昨日(3 月 17 日)发布公告,宣布推出迄今最强大的小型模型 GPT-5.4 mini 与 GPT-5.4 nano,专为高频且对延迟敏感的任务设计。
IT之家援引博文介绍,官方强调,在代码助手、系统截图解析以及实时图像推理等对延迟要求极高的场景中,响应迅速且能可靠调用工具的小型模型往往比大型模型更具优势。
这两款模型不仅继承了 GPT-5.4 的诸多优势,还专门针对高频工作负载优化,目的通过更快的响应速度和更高的效率,来提升产品体验。
GPT-5.4 mini 在编写代码、逻辑推理、多模态理解以及工具调用方面的表现远超 GPT-5 mini,同时运行速度提升了 2 倍以上。

此外,它在 SWE-Bench Pro 和 OSWorld-Verified 等多项基准测试中,成绩已经逼近体积更大的 GPT-5.4 模型。


凭借极低的延迟,GPT-5.4 mini 特别适合需要快速迭代的代码工作流,能够高效处理精准编辑、代码库导航及前端生成等任务。在多模态领域,它也能迅速解析密集的电脑用户界面截图,出色完成各类计算机操作任务。
GPT-5.4 nano 则是目前体积最小、价格最亲民的版本。作为 GPT-5 nano 的重大升级版,它专为将速度和成本视为首要考量的任务而生。开发者可以将其广泛应用于文本分类、数据提取、内容排序,以及处理简单辅助任务的代码子代理(Subagents)中。


两款模型目前已正式开放使用。GPT-5.4 mini 已全面接入 API、Codex 及 ChatGPT。
其 API 版本支持 400k 上下文窗口,输入与输出成本分别为每百万 Token 0.75 美元和 4.50 美元;在 Codex 中调用仅消耗 GPT-5.4 额度的 30%;在 ChatGPT 中,Free 和 Go 用户可通过“思考(Thinking)”功能体验。
相比之下,GPT-5.4 nano 目前仅通过 API 提供,其输入与输出成本极低,分别为每百万 Token 0.20 美元和 1.25 美元。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
2026十大科技趋势
2026 十大科技趋势,定义新一年的每一次突破。祝大家马年大吉,马到成功!初八启新程,万事皆顺遂!
[详细]
黄仁勋:需要更多Token与工程师,这是AI革命的开工典礼
3月17日,在美国加州圣何塞开幕的GTC 2026大会上,英伟达创始人兼CEO黄仁勋开始了备受瞩目的主题演讲。来看他演讲的观众需要排队,现场人山人海。这场演讲不仅有黄仁勋对过去二十年技术积累..[详细]
我国算力规模与质量协同跃升,行业赋能效益加速释放
当前,以大模型为代表的人工智能应用驱动全球计算技术进入新一轮创新爆发期,先进计算硬件、软件、算法之间深度融合、协同演进,量子计算、类脑计算等前沿计算架构加快突破,算力需求呈现指..[详细]
如何推进算电协同,筑牢绿色高效硬底座?
随着AI浪潮的快速发展推进,全社会对算力的需求持续扩大,今年的《政府工作报告》也重点提出,要深化拓展“人工智能+”,实施超大规模智算集群、算电协同等新基建工程。在AI算力需求井喷的..[详细]
平时不戴眼镜的高通卡图赞,谈可穿戴设备杀手级AI应用
“我本人不戴眼镜,只在户外戴太阳镜。所以对我来说,可能挂坠或项链这类形态会更舒服,我可以戴在胸前,随时都能完成视觉交互。”卡图赞随后又以个人视角表..[详细]
聚焦两会|以AI赋能新质生产力,人工智能的责任是为人民服务
在“十五五”规划开局的2026年,人工智能作为科技创新与新质生产力的关键支撑,被全民热议、全社会所关注,并在两会上被提升至战略高度。委员代表们集体围绕AI治理、产业创新、民生应用、人..[详细]
MWC2026 爆火关键词:U6GHz 到底是什么?一文看懂
近日巴塞罗那MWC2026大会火热召开,全球最新的ICT科技集体亮相,令人目不暇接。各大厂商在介绍新技术、新产品时,不约而同地强调了对AI的支持能力和价值。[详细]
聚焦两会|具身智能落地场景全面扩容,产业堵点待打通
2026年开年,具身智能成为科技与产业领域的高频热词。从央视春晚舞台上人机共武,到 MWC2026 巴塞罗那展上中国机器人企业集体亮相的全球秀场,舞台与展会的高光背后,是国产具身智能从技术演..[详细]
我国系统推进自动驾驶政策法规体系建设,加速产业发展
近日,中国信息通信研究院(简称“中国信通院”)政策与经济研究所、人工智能与经济社会研究中心联合发布《自动驾驶战略与政策观察(2025年)——推动自动驾驶全场景落地,抢占科技发展制高..[详细]
专题|2026世界移动通信大会
2026年3月2日至5日,世界移动通信大会(MWC)在西班牙巴塞罗那Fira Gran Via会展中心拉开帷幕。本届展会以“The IQ Era”(众智启新)为主题,向世界展示AI与通信深度融合的无限可能。..[详细]













