Beyond LoRA 不只是口号:HF 给 40+ PEFT 方法拍下公平基准,OFT 在图像任务上反超 LoRA

当社区对「要不要上 LoRA」形成肌肉记忆时,Hugging Face 团队在 6 月 18 日发布的 *Beyond LoRA* 基准,把它拉回桌面重新讨论。 他们把 `peft` 库中收录的 40 多种参数高效微调(PEFT)方法拉到「同硬件、同数据集、同训练代码」环境下横向对比,覆盖 LLM 数学推理(Llama-3.2-3B + MetaMathQA)与 FLUX.2-klein-base-4B 图像概念学习两条线,并开放了可交互的帕累托前沿 Space 供开发者自行探索。 三条结论值得画重点: - **LLM 数学任务上 LoRA 仍在前沿**,但前提是开 rank-stabilized 初始化(53.2% / 22.6 GB);裸 LoRA 只有 48.1%,LoRA-FA 用 20.2 GB 就能拿到相近质量,BEFT 32.9% / 20.2 GB 也是高性价比点。 - **图像任务 LoRA 直接被反超**:FLUX.2-klein-base-4B + 猫玩偶学习,OFT 以 0.708 vs 0.697 的 dino 相似度、9.01 vs 9.97 GB 显存「严格占优」LoRA。 - **生态壁垒正在被打破**:`peft` 新增非 LoRA adapter 转 LoRA 接口,GraLoRA 转换后质量几乎无损(0.702 → 0.694),vLLM 等只支持 LoRA 的推理栈不再挡住方法选择。 HF 还公开了「PEFT Shop」与实验配置,邀请社区用 PR 贡献新方法、新超参——这把被 LoRA 教程惯性锁死的选型流程硬生生变成可量化决策。 对从业者:**别再无脑 LoRA**。面对显存吃紧的微调任务,先用 `peft` 统一 API 试一遍 OFT、LoRA-FA、rs-LoRA、DoRA,把帕累托图当跑分板用,再决定部署形态。