LLM何时会将关键信息「视而不见」?三年研究揭示上下文位置的惊人影响力

一个被忽视了三年的问题近日终于有了系统性的答案:信息在prompt中的位置,会对LLM输出产生比内容本身更大的影响。LLM Stats于5月27日发布的研究汇总了50个前沿模型在三年间的表现,发现了一个令人不安的规律——模型对上下文中不同位置信息的利用程度存在系统性偏差,而这个偏差的幅度在不同任务类型间差异巨大。 具体来说,当关键信息被放在prompt的中间位置时,模型的表现往往明显差于将相同信息放在开头或结尾。这不是偶发的bug,而是与注意力机制本身的工作方式密切相关。标准Transformer对所有token赋予注意力权重,但实际推理过程中,模型对首尾位置存在系统性偏好——这被称为「位置编码效应」。 这项研究的实践意义在于,它提示了一个被大多数prompt工程师忽视的风险:同样的信息,仅因为放置位置不同,就可能导致截然不同的输出质量。对于需要模型准确处理多个关键事实的场景,这种位置敏感性可能带来难以察觉的错误。 研究中测试的50个模型无一例外地存在这种位置偏差,只是程度不同。这说明这不是某一版模型的缺陷,而是当前架构层面的共性问题。未来的模型改进需要在注意力机制层面解决这一偏差,而不是简单地在数据层面做增强平衡。 对于从业者而言,现阶段的建议是:明确关键信息应放在prompt的显著位置(开头或结尾),避免将其置于中间地带。对于复杂的、多事实的查询,分割成多个独立问题可能比单次长prompt更可靠。