Magenta RealTime 2 开源：Google 把实时音乐生成装进 MacBook

2026 年 6 月 4 日，Google DeepMind 的 Magenta 团队正式开源了 Magenta RealTime 2（MRT2）。它和"prompt→成曲"的传统工具截然不同：模型只有 2.4B 参数，却能以约 200ms 的端到端控制延迟持续输出 48kHz 立体声音频，并同时接受文本、音频示例与 MIDI 三种信号"领航"——创作者按住一个和弦，模型就在背后实时补出整支乐队，这恰恰是过去所有文本生成音乐模型都做不到的事。 ## 工程上做了三件实事 - **全量开源**：权重 CC BY 4.0、代码 Apache 2.0； - **原生 Apple Silicon**：借助 MLX 后端与 C++ 推理引擎在 MacBook 上跑出实时流；其中 mrt2_small（230M 参数）从 M1 Air 起即可实时，mrt2_base 需要 M2 Pro 及以上； - **可即插即用**：官方 AUv3 插件与 Jam、Collider 等独立应用，让模型直接嵌入主流 DAW 工作流，把"会演奏的模型"第一次以乐器的形态交到音乐人手里。 ## 双轨策略值得玩味 Google 同时维持"开源权重 + 闭源 Lyria RealTime API"：本地权重服务音乐人和研究者，云端 API 服务消费级产品 MusicFX DJ Mode 等。这种"研究开放、商业封闭"的组合，本质上把模型本身变成了社区生态的底盘，把 API 当作货币化的入口。 Hugging Face 和 GitHub 仓库上线不到 24 小时，社区已经做出手势控制 MIDI 的即兴 demo——DeepMind 研究员 Jesse Engel 在飞机上无网络、靠 MacBook 摄像头手势指挥 MRT2 演奏，被同行称为"Oh, I'm living in the future"。当下真正稀缺的不是"模型能不能写歌"，而是"模型能不能和你一起演奏"。音乐生成的"工具时代"，确实要过去了。