Meta 监控员工数据训练 AI:效率优先还是隐私越界?

Meta 近日被曝正通过一款名为模型能力计划(Model Capability Initiative, MCI)的工具,持续监控员工的鼠标点击和按键数据。据劳工保护组织 More Perfect Union 公开的录音,扎克伯格在内部回应员工质疑时,为这一做法进行了辩护,将其描述为加速模型编程能力提升的最有效路径。 技术背景:让模型观察人类操作。扎克伯格的逻辑并不复杂——如果要训练模型掌握操作电脑的能力,最高效的办法就是让它观察顶尖工程师如何操作电脑。Meta 拥有数万名内部工程师,他们日常产出的代码和操作行为本身就是高质量的行为数据集。与其依赖公开数据集,让模型直接学习内部精英的工作方式,确实能带来能力上的飞跃。这种思路本质上是将人类专家作为模型训练的数据源——不只是他们的产出(代码),还包括他们的过程(操作行为)。从这个角度看,监控鼠标轨迹和按键节奏,是在捕获传统训练数据无法覆盖的技能操作层信息。 隐私与效率的天平。这种做法触及了员工隐私的边界。监控行为数据的颗粒度、是否提前充分告知、员工是否有选择权——这些都影响着事件的伦理评判。扎克伯格强调不会监控工作行为,仅收集模型能力提升所需的操作数据,但这个边界本身就很模糊。更值得思考的是,这是否会成为行业趋势?如果拥有大量内部工程师资源的公司都能通过类似方式获取训练优势,资源有限的中小公司将在竞争力上进一步落后——这本质上是一种数据垄断的新形式。 行业启示。从技术角度看,Meta 的做法指向了一个重要方向:高质量、专业化的行为数据,可能是下一代 AI 能力突破的关键。相比于 scaling laws 对算力和通用数据的依赖,专家行为数据提供了一种更垂直、更高效的提升路径。但这条路的边界在哪里,行业或许需要更明确的规则。