LLM何时会将关键信息「视而不见」？三年研究揭示上下文位置的惊人影响力

一个被忽视了三年的问题近日终于有了系统性的答案：信息在prompt中的位置，会对LLM输出产生比内容本身更大的影响。LLM Stats于5月27日发布的研究汇总了50个前沿模型在三年间的表现，发现了一个令人不安的规律——模型对上下文中不同位置信息的利用程度存在系统性偏差，而这个偏差的幅度在不同任务类型间差异巨大。具体来说，当关键信息被放在prompt的中间位置时，模型的表现往往明显差于将相同信息放在开头或结尾。这不是偶发的bug，而是与注意力机制本身的工作方式密切相关。标准Transformer对所有token赋予注意力权重，但实际推理过程中，模型对首尾位置存在系统性偏好——这被称为「位置编码效应」。这项研究的实践意义在于，它提示了一个被大多数prompt工程师忽视的风险：同样的信息，仅因为放置位置不同，就可能导致截然不同的输出质量。对于需要模型准确处理多个关键事实的场景，这种位置敏感性可能带来难以察觉的错误。研究中测试的50个模型无一例外地存在这种位置偏差，只是程度不同。这说明这不是某一版模型的缺陷，而是当前架构层面的共性问题。未来的模型改进需要在注意力机制层面解决这一偏差，而不是简单地在数据层面做增强平衡。对于从业者而言，现阶段的建议是：明确关键信息应放在prompt的显著位置（开头或结尾），避免将其置于中间地带。对于复杂的、多事实的查询，分割成多个独立问题可能比单次长prompt更可靠。