Magenta RealTime 2 开源:Google 把实时音乐生成装进 MacBook

2026 年 6 月 4 日,Google DeepMind 的 Magenta 团队正式开源了 Magenta RealTime 2(MRT2)。它和"prompt→成曲"的传统工具截然不同:模型只有 2.4B 参数,却能以约 200ms 的端到端控制延迟持续输出 48kHz 立体声音频,并同时接受文本、音频示例与 MIDI 三种信号"领航"——创作者按住一个和弦,模型就在背后实时补出整支乐队,这恰恰是过去所有文本生成音乐模型都做不到的事。 ## 工程上做了三件实事 - **全量开源**:权重 CC BY 4.0、代码 Apache 2.0; - **原生 Apple Silicon**:借助 MLX 后端与 C++ 推理引擎在 MacBook 上跑出实时流;其中 mrt2_small(230M 参数)从 M1 Air 起即可实时,mrt2_base 需要 M2 Pro 及以上; - **可即插即用**:官方 AUv3 插件与 Jam、Collider 等独立应用,让模型直接嵌入主流 DAW 工作流,把"会演奏的模型"第一次以乐器的形态交到音乐人手里。 ## 双轨策略值得玩味 Google 同时维持"开源权重 + 闭源 Lyria RealTime API":本地权重服务音乐人和研究者,云端 API 服务消费级产品 MusicFX DJ Mode 等。这种"研究开放、商业封闭"的组合,本质上把模型本身变成了社区生态的底盘,把 API 当作货币化的入口。 Hugging Face 和 GitHub 仓库上线不到 24 小时,社区已经做出手势控制 MIDI 的即兴 demo——DeepMind 研究员 Jesse Engel 在飞机上无网络、靠 MacBook 摄像头手势指挥 MRT2 演奏,被同行称为"Oh, I'm living in the future"。 当下真正稀缺的不是"模型能不能写歌",而是"模型能不能和你一起演奏"。音乐生成的"工具时代",确实要过去了。