SIREN-RoPE:让位置编码学会「旋转」

当行业在追逐更大的参数规模时,4月27日 arXiv 上的一篇新论文将 RoPE 的旋转流形变成了主角。 **被忽视的维度** RoPE 自提出以来,其旋转流形一直被视为固定手工结构,填充的只是离散序号索引。token embedding 编码词元「是什么」,而词元之间的时间、位置、上下文关系却从未被系统挖掘。 这篇论文的核心洞察是:类比复数引入虚数轴的正交维度,将旋转流形视为可学习、信号条件化的空间,可在注意力机制中开辟一个正交的全新表达维度。 **SIREN-RoPE:双分支旋转注入** 论文提出 SIREN-RoPE,通过双分支正弦表示网络,将连续时间戳、周期模式、分类元数据注入旋转维度。在某主流社交网络推荐系统上的生产评估显示,激活这一隐藏维度后校准和排序指标均获一致提升,计算开销几乎为零。 **启示** RoPE 旋转空间一直是 Transformer 中「已有定论」的细节。论文证明它实际上是一座未被开采的金矿——不仅有理论价值,更已在真实产品场景被验证。这为大模型研究者指明新方向:除了堆叠层数,还可通过旋转空间信号注入来增强模型的关系推理能力。