OpenCV 5.0 重写 DNN 引擎：ONNX 覆盖率从 22% 跃升至 80%，原生支持 LLM/VLM 推理

6 月 8 日，开源计算机视觉库 OpenCV 在 CVPR 2026 开幕当天发布 5.0 版本。DNN 推理引擎被彻底重写：原本仅覆盖约 22% ONNX 操作符的旧引擎替换为基于类型化图的新引擎，覆盖率跃至 80% 以上，补齐动态 shape、If/Loop 子图、常量折叠与 QDQ、BatchNorm、Attention 等算子融合。更值得关注的是，新引擎首次把 LLM 与 VLM 搬进 DNN 模块：内置 tokenizer、attention 与 KV-cache，使 Qwen 2.5、Gemma 3、PaliGemma 与 GPT-2 家族模型可与 YOLO 共用同一 Net API。在 Intel Core i9-14900KS 上对比 ONNX Runtime，XFeat 快 31%、BiRefNet 快 32.4%、OWLv2 快 36.6%。限制同样明确：新引擎目前仅支持 CPU，CUDA/OpenVINO 用户仍需经典引擎或 ONNX Runtime；C++17 成最低标准，Caffe/Darknet 解析器与遗留 C API 清退。 OpenCV 5.0 真正的价值不在跑分刷新，而是把"经典视觉算法 + 现代多模态模型"统一到同一运行时：以往需拼 OpenCV + ONNX Runtime + Transformers 才能搭的视觉问答、图像描述管线，如今一个 cv::dnn::readNet 就能跑完。对工业质检、机器人、AR/VR 等端侧场景，"少一个依赖"的意义往往比几个百分点吞吐更重要。