首页 > 分享 > 一种宠物识别方法与流程

一种宠物识别方法与流程

一种宠物识别方法与流程

1.本发明涉及图像识别技术领域,具体来说,涉及一种宠物识别方法。

背景技术:

2.现有的宠物图像识别中,由于宠物离探头的距离范围值较大,即宠物可能离探头比较近,也可能离探头比较远,因此,识别目标的尺度范围会比较大。再者,识别实际画面比较复杂,例如,存在遮挡、目标姿态众多以及模型性能、大小的问题,这些都给宠物的准确识别带来了难度。

技术实现要素:

3.本发明的目的在于提出一种宠物识别方法,以克服现有技术中存在的上述不足。
4.为实现上述技术目的,本发明的技术方案是这样实现的:一种宠物识别方法,所述方法包括以下步骤:1)使用yolov5作为宠物识别模型;2)采集若干含有宠物图像的图片;3)使用语义分割模型将图片中的宠物和背景分割开来,按照分割的结果把含有宠物的图片另存为具有透明通道的png图片,将背景的部分变为透明,使图片只保留宠物部分;4)对图片进行数据增强处理,具体为:读取原图片中宠物打标的框的尺寸,按照所述尺寸以及项目要求设定增强后的图片的尺寸,并使用对应场景图作为背景,再将宠物原图贴在背景上;5)使用程序按照一定随机的系数微调数据增强后的图片,具体为调整图片的色度、亮度和对比度;6)将调整后的图片输入宠物识别模型并使用generalized focal loss损失函数来训练宠物识别模型,得到训练好的宠物识别模型;7)采集含有宠物图像的图片并输入训练好的宠物识别模型中;8)获取采集的图片中宠物图像的特征,计算与训练好的宠物识别模型内存储的宠物的特征的相似度,输出宠物识别结果。
5.进一步的,步骤5)中使用python的pillow实现对图片色度、亮度和对比度的调整。
6.本发明的有益效果:对于含有宠物的视频图像中,本发明能够实现对较大范围尺寸的宠物的准确识别,避免实际中宠物遮挡和姿态众多对识别的影响。
附图说明
7.图1是本发明实施例所述方法的流程图。
具体实施方式
8.下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
9.如图1所示,根据本发明的实施例所述的一种宠物识别方法,所述方法包括以下步骤:步骤1:使用yolov5作为宠物识别模型,用于包括对猫狗等宠物实现分类检测。yolov5是一种目标检测模型,对不同尺度上的目标有较好的检测能力,本方案采用yolov5s的网络结构,该网络结构在yolov5系列中,参数量最少,速度最快,能够贴合本方案的要求。yolov5的网络在训练阶段采用了mosaic的数据增强方法,对图片采用随机缩放、随机裁剪、随机排布的方式进行拼接,该策略增强了模型对小目标的检测性能。在骨干网络中,采用了focus结构,利用切片的原理,对图像下采样,生成更多的特征图。采用csp模块,进行特征提取,该模块先将基础层的特征映射划分为两部分,然后通过跨层次结构将它们合并,在减少了计算量和内存访问量的同时可以保证准确率。在网络结构的末端,采用了spp模块,使用k={1*1,5*5,9*9,13*13}的最大池化方式,再将不同尺度的特征图进行concat操作,该模块可有效的增加主干特征的接收范围,显著的分离了最重要的上下文特征。采用fpn的结构对不同分支的特征进行融合,fpn是自顶向下的,将高层的特征信息通过上采样的方式进行传递融合,得到预测的特征图。还包含了一个自底向上的特征金字塔,该金字塔结构自底向上传达强定位特征,两两联手,从不同的主干层对不同的检测层进行参数聚合,使检测效果更佳。
10.步骤2:采集若干含有宠物图像的图片。
11.步骤3:由于实际场景的猫狗素材比较少,需要进行相应的的数据扩增来达到贴近实际场景的目的。为了让数据扩增更加贴近实际,使用语义分割模型将图片中的宠物和背景分割开来,按照分割的结果把含有宠物的图片另存为具有透明通道的png图片,将背景的部分变为透明,使图片只保留宠物部分。这样的图再拼接到实际场景作为背景的图,能够更好地贴近实际场景。
12.步骤4:对图片进行数据增强处理,具体为:读取原图片中宠物打标的框的尺寸,按照所述尺寸以及项目要求设定增强后的图片的尺寸,并使用对应场景图作为背景,再将宠物原图贴在背景上。项目要求具体为模型训练中要求宠物图占整个图片的尺寸范围,例如要求宠物画面只占短边的几分之一。
13.步骤5:为了增强模型的泛化能力,使模型能够在更复杂的场景准确检测到画面中的宠物。使用程序按照一定随机的系数微调数据增强后的图片,具体为调整图片的色度、亮度和对比度。具体的,可以使用python的pillow实现。为实现调整图片的色度、亮度和对比度,可以使用interpolation and extrapolation的方式来进行调控,公式为:out = image1 * (1.0
ꢀ‑ꢀ
alpha) + image2 * alpha。其原理为:设定一个退化到极点的对象,以及原图,根据alpha来控制两张图合并的比例,从而实现程度变化。比如对比度变化,完全没对比度的图就是画面完全没有变化的图,即全图所有元素均为均值,以此作为退化到极点的对象。而当alpha大于1的时候,就可以对原图进行对比度增强。
14.步骤6:由于训练数据在经过增强之后比原来要更加复杂,即学习难度会有较大的提升,直接使用普通的损失函数可能学习效果会不太好。为了能够让模型更好的拟合较为
复杂的图片数据,将调整后的图片输入宠物识别模型并使用(gfl)generalized focal loss损失函数来训练宠物识别模型,得到训练好的宠物识别模型,gfl公式如下所示:gfl去掉了难以训练的centerness,而且省去了这一分支上的大量卷积,减少了检测头的计算开销,非常适合移动端的轻量化部署。
15.步骤7:采集含有宠物图像的图片并输入训练好的宠物识别模型中;步骤8:获取采集的图片中宠物图像的特征,计算与训练好的宠物识别模型内存储的宠物的特征的相似度,输出宠物识别结果。
16.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种宠物识别方法,其特征在于,所述方法包括以下步骤:1)使用yolov5作为宠物识别模型;2)采集若干含有宠物图像的图片;3)使用语义分割模型将图片中的宠物和背景分割开来,按照分割的结果把含有宠物的图片另存为具有透明通道的png图片,将背景的部分变为透明,使图片只保留宠物部分;4)对图片进行数据增强处理,具体为:读取原图片中宠物打标的框的尺寸,按照所述尺寸以及项目要求设定增强后的图片的尺寸,并使用对应场景图作为背景,再将宠物原图贴在背景上;5)使用程序按照一定随机的系数微调数据增强后的图片,具体为调整图片的色度、亮度和对比度;6)将调整后的图片输入宠物识别模型并使用generalized focal loss损失函数来训练宠物识别模型,得到训练好的宠物识别模型;7)采集含有宠物图像的图片并输入训练好的宠物识别模型中;8)获取采集的图片中宠物图像的特征,计算与训练好的宠物识别模型内存储的宠物的特征的相似度,输出宠物识别结果。2.根据权利要求1所述的方法,其特征在于,步骤5)中使用python的pillow实现对图片色度、亮度和对比度的调整。

技术总结
本发明公开了一种宠物识别方法,使用yolov5作为宠物识别模型,使用语义分割模型的方式实现宠物素材的扩增,对扩增后的图片进行数据增强,对数据增强后的图片进行色度、亮度和对比度的调整,将调整后的图片输入宠物识别模型并使用Generalized Focal Loss损失函数来训练宠物识别模型,得到训练好的宠物识别模型,利用训练好的模型实现对宠物的识别。本发明能够实现对较大范围尺寸的宠物的准确识别,避免实际中宠物遮挡和姿态众多对识别的影响。避免实际中宠物遮挡和姿态众多对识别的影响。避免实际中宠物遮挡和姿态众多对识别的影响。

技术研发人员:蔡子轩 盛鹏 乔国坤
受保护的技术使用者:新疆爱华盈通信息技术有限公司
技术研发日:2021.06.16
技术公布日:2021/9/14

相关知识

一种宠物情绪识别方法及装置与流程
一种宠物吠叫的识别方法及装置与流程
一种基于宠物姿态的心情识别方法与流程
一种宠物情绪识别方法及系统与流程
一种基于深度卷积神经网络的禽类动物行为识别方法与流程
一种基于深度残差网络的宠物图像情绪识别方法与流程
一种基于深度学习的狗叫情感识别方法及装置与流程
一种宠物行为识别方法、装置和可读存储介质与流程
一种应用在服务机器人上的宠物叫声识别方法与系统与流程
宠物情绪识别方法及装置与流程

网址: 一种宠物识别方法与流程 https://m.mcbbbk.com/newsview594163.html

所属分类:萌宠日常
上一篇: 鸟语花香烘护一体智能风干箱 10
下一篇: PET MARVEL 鸟语花香