OpenCV 5.0 重写 DNN 引擎:ONNX 覆盖率从 22% 跃升至 80%,原生支持 LLM/VLM 推理

6 月 8 日,开源计算机视觉库 OpenCV 在 CVPR 2026 开幕当天发布 5.0 版本。DNN 推理引擎被彻底重写:原本仅覆盖约 22% ONNX 操作符的旧引擎替换为基于类型化图的新引擎,覆盖率跃至 80% 以上,补齐动态 shape、If/Loop 子图、常量折叠与 QDQ、BatchNorm、Attention 等算子融合。 更值得关注的是,新引擎首次把 LLM 与 VLM 搬进 DNN 模块:内置 tokenizer、attention 与 KV-cache,使 Qwen 2.5、Gemma 3、PaliGemma 与 GPT-2 家族模型可与 YOLO 共用同一 Net API。在 Intel Core i9-14900KS 上对比 ONNX Runtime,XFeat 快 31%、BiRefNet 快 32.4%、OWLv2 快 36.6%。 限制同样明确:新引擎目前仅支持 CPU,CUDA/OpenVINO 用户仍需经典引擎或 ONNX Runtime;C++17 成最低标准,Caffe/Darknet 解析器与遗留 C API 清退。 OpenCV 5.0 真正的价值不在跑分刷新,而是把"经典视觉算法 + 现代多模态模型"统一到同一运行时:以往需拼 OpenCV + ONNX Runtime + Transformers 才能搭的视觉问答、图像描述管线,如今一个 cv::dnn::readNet 就能跑完。对工业质检、机器人、AR/VR 等端侧场景,"少一个依赖"的意义往往比几个百分点吞吐更重要。