OpenAI 联合 Broadcom 推出 Jalapeño:专为 LLM 推理自研,9 个月从设计到流片

6 月 24 日,OpenAI 与 Broadcom 联合发布 Jalapeño——OpenAI 首款从零设计的 AI 加速器。工程样片已在实验室以目标频率与功耗运行 ML 工作负载,包括最新的 GPT-5.3-Codex-Spark。Jalapeño 最大的亮点是"为 LLM 推理而生",不是从训练或通用负载改造,而是基于对模型内核、显存搬运、网络与服务系统的深度理解重新设计。硬件负责人 Richard Ho 表示,团队围绕"对前沿模型最关键的内核、内存搬运、网络与服务模式"做端到端优化。另一项纪录是 9 个月的 tape-out 周期。OpenAI 称速度来自三方面:软硬件协同设计、Broadcom 的硅实现能力,以及 OpenAI 自家模型被用于加速芯片设计本身——意味着"服务于用户的同一批模型,正在帮助改进未来模型的运行基础设施"。性能上 OpenAI 称早期测试显示 Jalapeño 的"每瓦性能将显著优于当前业界最先进方案",详细技术报告将在未来数月发布。Jalapeño 不绑定 OpenAI 自家模型,可服务"行业内当前与未来所有 LLM"。