GPT-5.5 Instant 成为 ChatGPT 默认模型:幻觉率大幅降低,上下文管理能力显著提升

5月6日,OpenAI 正式将 GPT-5.5 Instant 推送为 ChatGPT 的默认模型,取代此前的 GPT-5.3 Instant。这是该公司在大模型可靠性上的又一次重要升级。 **核心改进:幻觉率大幅下降** OpenAI 此次着重强调了在法律、医学、金融等高风险领域的可靠性提升。与前任相比,GPT-5.5 Instant 在保持低延迟的同时,显著减少了错误回答的出现频率。这对于需要精确信息的专业场景意义重大。 **性能数据亮眼** 在 AIME 2025 数学测试中,GPT-5.5 Instant 得分 81.2,远超 GPT-5.3 的 65.4。在 MMMU-Pro 多模态推理基准中,分数也从 69.2 提升至 76。这组数据表明,OpenAI 在保持响应速度的前提下,实现了能力的全面提升。 **上下文管理成为最大亮点** 新版模型支持跨对话、文件、Gmail 等来源检索上下文,给出更具个性化的回答。该功能目前面向 Plus 和 Pro 用户网页端,移动端将在近期推出。免费用户、企业版用户预计在数周内陆续获得访问权限。 此外,ChatGPT 将在所有模型中展示记忆来源,帮助用户追踪答案出处,增强透明度。 **对开发者的影响** 通过 API 访问时,开发者可使用 "chat-latest" 指向 GPT-5.5,而 GPT-5.3 将在三个月后从付费层级中移除。 **评论** GPT-5.5 Instant 体现了一个明确的方向:在大模型能力逼近瓶颈的当下,提升可靠性和用户体验正在成为新的竞争维度。幻觉问题曾是外界质疑 LLM 最频繁的角度之一,此次针对性优化,或将重新定义行业对「可信赖 AI」的标准。OpenAI 此次没有一味追求 benchmark 数字,而是把改进落在真实使用场景上,这种策略转向值得关注。