Beyond LoRA 不只是口号：HF 给 40+ PEFT 方法拍下公平基准，OFT 在图像任务上反超 LoRA

当社区对「要不要上 LoRA」形成肌肉记忆时，Hugging Face 团队在 6 月 18 日发布的 *Beyond LoRA* 基准，把它拉回桌面重新讨论。他们把 `peft` 库中收录的 40 多种参数高效微调（PEFT）方法拉到「同硬件、同数据集、同训练代码」环境下横向对比，覆盖 LLM 数学推理（Llama-3.2-3B + MetaMathQA）与 FLUX.2-klein-base-4B 图像概念学习两条线，并开放了可交互的帕累托前沿 Space 供开发者自行探索。三条结论值得画重点： - **LLM 数学任务上 LoRA 仍在前沿**，但前提是开 rank-stabilized 初始化（53.2% / 22.6 GB）；裸 LoRA 只有 48.1%，LoRA-FA 用 20.2 GB 就能拿到相近质量，BEFT 32.9% / 20.2 GB 也是高性价比点。 - **图像任务 LoRA 直接被反超**：FLUX.2-klein-base-4B + 猫玩偶学习，OFT 以 0.708 vs 0.697 的 dino 相似度、9.01 vs 9.97 GB 显存「严格占优」LoRA。 - **生态壁垒正在被打破**：`peft` 新增非 LoRA adapter 转 LoRA 接口，GraLoRA 转换后质量几乎无损（0.702 → 0.694），vLLM 等只支持 LoRA 的推理栈不再挡住方法选择。 HF 还公开了「PEFT Shop」与实验配置，邀请社区用 PR 贡献新方法、新超参——这把被 LoRA 教程惯性锁死的选型流程硬生生变成可量化决策。对从业者：**别再无脑 LoRA**。面对显存吃紧的微调任务，先用 `peft` 统一 API 试一遍 OFT、LoRA-FA、rs-LoRA、DoRA，把帕累托图当跑分板用，再决定部署形态。