GPT-5.5 Instant 成为 ChatGPT 默认模型：幻觉率大幅降低，上下文管理能力显著提升

5月6日，OpenAI 正式将 GPT-5.5 Instant 推送为 ChatGPT 的默认模型，取代此前的 GPT-5.3 Instant。这是该公司在大模型可靠性上的又一次重要升级。 **核心改进：幻觉率大幅下降** OpenAI 此次着重强调了在法律、医学、金融等高风险领域的可靠性提升。与前任相比，GPT-5.5 Instant 在保持低延迟的同时，显著减少了错误回答的出现频率。这对于需要精确信息的专业场景意义重大。 **性能数据亮眼** 在 AIME 2025 数学测试中，GPT-5.5 Instant 得分 81.2，远超 GPT-5.3 的 65.4。在 MMMU-Pro 多模态推理基准中，分数也从 69.2 提升至 76。这组数据表明，OpenAI 在保持响应速度的前提下，实现了能力的全面提升。 **上下文管理成为最大亮点** 新版模型支持跨对话、文件、Gmail 等来源检索上下文，给出更具个性化的回答。该功能目前面向 Plus 和 Pro 用户网页端，移动端将在近期推出。免费用户、企业版用户预计在数周内陆续获得访问权限。此外，ChatGPT 将在所有模型中展示记忆来源，帮助用户追踪答案出处，增强透明度。 **对开发者的影响** 通过 API 访问时，开发者可使用 "chat-latest" 指向 GPT-5.5，而 GPT-5.3 将在三个月后从付费层级中移除。 **评论** GPT-5.5 Instant 体现了一个明确的方向：在大模型能力逼近瓶颈的当下，提升可靠性和用户体验正在成为新的竞争维度。幻觉问题曾是外界质疑 LLM 最频繁的角度之一，此次针对性优化，或将重新定义行业对「可信赖 AI」的标准。OpenAI 此次没有一味追求 benchmark 数字，而是把改进落在真实使用场景上，这种策略转向值得关注。