首页 > 分享 > 鸟类领域超大规模检测实践，基于YOLOv8轻量级检测模型开发构建超大规模生活场景下500种鸟类检测识别分析系统

鸟类领域超大规模检测实践，基于YOLOv8轻量级检测模型开发构建超大规模生活场景下500种鸟类检测识别分析系统

萌宠菠菠乐园
2024-11-26 10:50

关于鸟类的检测、识别相关的开发实践在前面的系列博文中也有不少的实践记录，感兴趣的话可以自行移步阅读即可：

【检测类】

《AI识鸟，基于YOLOv5【n/s/m/l/x】全系列参数模型开发构建工业野外场景下鸟类检测识别分析系统》

《基于轻量级YOLOv5模型开发构建200种鸟类细粒度检测识别分析系统》

《基于轻量级YOLOv5模型开发构建鸟巢检测识别分析系统》

《基于YOLOv8全系列【n/s/m/l/x】参数模型开发构建200种鸟类细粒度检测识别分析系统》

《基于轻量级YOLOv5开发构建鸟类检测识别分析系统》

【识别类】

《基于卷积神经网络模型开发构建国内大规模鸟类图像识别分析系统》

《基于轻量级神经网络GhostNet开发构建的200种鸟类细粒度识别分析系统》

在前面系列博文中，我们大都停留在200-300种类别的鸟类检测和识别的尝试，未能继续突破，一方面是受限于鸟类专业的领域背景，另一方面是受限于所需数据集，在本文中，我们构建了超过500种的鸟类数据，想要最先基于轻量级的检测模型来开发构建对应的检测模型，首先看下实例效果：

简单看下实例数据集：

如果对YOLOv8开发构建自己的目标检测项目有疑问的可以看下面的文章，如下所示：

《基于YOLOv8开发构建目标检测模型超详细教程【以焊缝质量检测数据场景为例】》

非常详细的开发实践教程。本文这里就不再展开了，因为从YOLOv8开始变成了一个安装包的形式，整体跟v5和v7的使用差异还是比较大的。

YOLOv8核心特性和改动如下：
1、提供了一个全新的SOTA模型（state-of-the-art model），包括 P5 640 和 P6 1280 分辨率的目标检测网络和基于YOLACT的实例分割模型。和 YOLOv5 一样，基于缩放系数也提供了 N/S/M/L/X 尺度的不同大小模型，用于满足不同场景需求
2、骨干网络和 Neck 部分可能参考了 YOLOv7 ELAN 设计思想，将 YOLOv5 的 C3 结构换成了梯度流更丰富的 C2f 结构，并对不同尺度模型调整了不同的通道数，属于对模型结构精心微调，不再是一套参数应用所有模型，大幅提升了模型性能。
3、Head 部分相比 YOLOv5 改动较大，换成了目前主流的解耦头结构，将分类和检测头分离，同时也从Anchor-Based 换成了 Anchor-Free
4、Loss 计算方面采用了TaskAlignedAssigner正样本分配策略，并引入了Distribution Focal Loss
5、训练的数据增强部分引入了 YOLOX 中的最后 10 epoch 关闭 Mosiac 增强的操作，可以有效地提升精度
官方项目地址在这里，如下所示：

目前已经收获将近2.6w的star量了。

官方提供的基于COCO数据集的预训练模型如下所示：

Modelsize
(pixels)mAPval
50-95Speed
CPU ONNX
(ms)Speed
A100 TensorRT
(ms)params
(M)FLOPs
(B)YOLOv8n64037.380.40.993.28.7YOLOv8s64044.9128.41.2011.228.6YOLOv8m64050.2234.71.8325.978.9YOLOv8l64052.9375.22.3943.7165.2YOLOv8x64053.9479.13.5368.2257.8

另外一套预训练模型如下：

Modelsize
(pixels)mAPval
50-95Speed
CPU ONNX
(ms)Speed
A100 TensorRT
(ms)params
(M)FLOPs
(B)YOLOv8n64018.4142.41.213.510.5YOLOv8s64027.7183.11.4011.429.7YOLOv8m64033.6408.52.2626.280.6YOLOv8l64034.9596.92.4344.1167.4YOLOv8x64036.3860.63.5668.7260.6

是基于Open Image V7数据集构建的，可以根据自己的需求进行选择使用即可。

除了常规的目标检测任务之外，还有旋转目标检测，如下：

Modelsize
(pixels)mAPtest
50Speed
CPU ONNX
(ms)Speed
A100 TensorRT
(ms)params
(M)FLOPs
(B)YOLOv8n-obb102478.0204.773.573.123.3YOLOv8s-obb102479.5424.884.0711.476.3YOLOv8m-obb102480.5763.487.6126.4208.6YOLOv8l-obb102480.71278.4211.8344.5433.8YOLOv8x-obb102481.361759.1013.2369.5676.7

是基于DOTAv1数据集训练得到的。

YOLOv8的定位不仅仅是目标检测，而是性能强大全面的工具库，故而在任务类型上同时支持：姿态估计、检测、分类、分割、跟踪多种类型，可以根据自己的需要进行选择使用，这里就不再详细展开了。

简单的实例实现如下所示：

from ultralytics import YOLO

model = YOLO('yolov8n.yaml').load('yolov8n.pt')