OpenAI 联合 Broadcom 推出 Jalapeño：专为 LLM 推理自研，9 个月从设计到流片

6 月 24 日，OpenAI 与 Broadcom 联合发布 Jalapeño——OpenAI 首款从零设计的 AI 加速器。工程样片已在实验室以目标频率与功耗运行 ML 工作负载，包括最新的 GPT-5.3-Codex-Spark。Jalapeño 最大的亮点是"为 LLM 推理而生"，不是从训练或通用负载改造，而是基于对模型内核、显存搬运、网络与服务系统的深度理解重新设计。硬件负责人 Richard Ho 表示，团队围绕"对前沿模型最关键的内核、内存搬运、网络与服务模式"做端到端优化。另一项纪录是 9 个月的 tape-out 周期。OpenAI 称速度来自三方面：软硬件协同设计、Broadcom 的硅实现能力，以及 OpenAI 自家模型被用于加速芯片设计本身——意味着"服务于用户的同一批模型，正在帮助改进未来模型的运行基础设施"。性能上 OpenAI 称早期测试显示 Jalapeño 的"每瓦性能将显著优于当前业界最先进方案"，详细技术报告将在未来数月发布。Jalapeño 不绑定 OpenAI 自家模型，可服务"行业内当前与未来所有 LLM"。