OpenAI 于 2026 年 4 月 23 日发布 GPT-5.5,这是其最新的 AI 模型,在推理、Agent 任务执行和计算机使用能力方面有显著提升。OpenAI 将其描述为迄今为止最智能、最直觉的模型,Greg Brockman 表示它代表了迈向更 Agent 化计算的一步。
GPT-5.5 带来的变化
GPT-5.5 最值得注意的进步是其计算机使用能力——即像人类一样导航和交互软件界面的能力。OpenAI 首席研究官 Mark Chen 表示,GPT-5.5 在计算机工作方面比之前的模型有"有意义的提升",使其能够完成以前需要人类在每一步都进行干预的多步骤软件任务。
该模型还带来了以下改进:
- Agent 任务执行 — GPT-5.5 可以在更长的任务序列中保持上下文并主动行动,而不会失去对原始目标的追踪
- 减少幻觉 — 在处理代码和结构化数据时,将响应扎根于提供的上下文中,特别是在给定的参考资料中
- 多模态推理 — 同时跨越文本、图像和结构化数据进行推理的能力
"超级应用"愿景
Brockman 将 GPT-5.5 描述为迈向"超级应用"的又一步——一个将多种专业工具能力结合在一起的多用途程序。超级应用不再需要使用不同应用程序处理不同任务,而是由 GPT-5.5 在单一连贯的上下文中处理研究、写作、编码和执行。
OpenAI 现在以快速的节奏发布模型:2025年11月、12月、2026年3月和4月。该公司正在一个 Google、Anthropic 和开源实验室都在发布有能力的模型的竞争中运营,使持续的能力提升对保持市场份额至关重要。
Agent 编程和企业
OpenAI 将 GPT-5.5 定位为覆盖"包括 Agent 编程和知识工作等基础企业领域"以及更广泛的消费者应用。该模型正在向 ChatGPT Plus、Pro、Business 和 Enterprise 用户推出,API 访问预计将在近期跟进。
与 Anthropic 的竞争始终是叙事中的焦点。当被问及 Claude 的优势时,OpenAI 高管指向了 GPT-5.5 在基准测试中的表现,以及模型同时跨消费者和企业渠道部署的广度。
可用性
GPT-5.5 现已向 ChatGPT Plus、Pro、Business 和 Enterprise 用户推出。API 访问预计将在本周内完成,定价层级与之前模型的定价结构类似。