Contagion Networks 把 LLM 多智能体评测偏差拉成「传染矩阵」:k=3 委员会把传染强度压低 72%

当 LLM 在多智能体系统中担任评审者,它的偏好偏差会沿 agent 之间的交互链路向外扩散,而不是停留在自身。arXiv 2606.20493 提出 Contagion Networks 框架,把这种偏差扩散抽象成 Cross-Agent Contagion Matrix Γ₃,并用谱半径 ρ(Γₙ) 划出三个传播区域——这是一个把"软偏差"硬化的形式化尝试。在 3 个 DeepSeek-chat 评审者(结构化/平衡/证据导向)的对照实验中,同质模型下 γ 落在 [0.157, 0.352]—— 即便底层模型完全一致,偏差仍会在 agent 之间稳定扩散。异质模型组合反而进入"加强区",MM-EPC 工作中观测的 γ≈0.85-1.3 就是典型,意味着不同模型叠加往往把偏差放大而非抵消,这与多数人"用多模型去偏"的直觉完全相反。最有工程价值的是那个 72.4%:评审委员会从 k=1 扩到 k=3,有效传染强度砍掉七成。对所有依赖 self-consistency / multi-agent debate 的评测 pipeline 来说,这是几乎零成本的"快速补丁"——多挂两个 evaluator 走投票,比重训评审模型便宜得多,也不需要新增任何训练数据。 Zewen Liu 同步开源了 Contagion Network 实验框架,可直接接到现有评测管线跑偏度诊断。当行业都在堆 GPU 重训评审 prompt 时,这篇论文给了一个反方向的回答:不一定要更大的模型,只要更合理的委员会。