本发明专利技术提供了一种基于神经网络的宠物声音识别方法,对宠物声音波形的振幅进行归一化,计算归一化后的波形图的波形包络和振幅平均值,求出波形包络所有的极大值,根据极大值、振幅平均值以及预设时间确定峰值,根据峰值将波形图分为多个片段;计算片段平均值,若片段平均值大于左右相邻片段的平均值,则将片段标记为待识别片段,否则标记为噪声片段;利用待识别片段左右相邻两侧的噪声片段对待识别片段降噪;将降噪后的每个待识别片段的频谱分别输入训练好的神经网络中得到类别及类别对应的概率,根据每个待识别片段的类别、概率和待识别片段之间的时间间距得到宠物的情感信息。本发明专利技术不仅有效对声音去噪,而且能够识别宠物情感的强烈程度。情感的强烈程度。情感的强烈程度。
【技术实现步骤摘要】
一种基于神经网络的宠物声音识别方法及系统
[0001]本专利技术涉及人工智能领域,尤其涉及基于声音的宠物声音识别方法及系统。
技术介绍
[0002]宠物能够给主人带来欢乐,缓解焦虑情绪,现代的家庭饲养宠物的越来越多。在众多的宠物中,宠物猫和宠物狗是饲养最多的,尤其是宠物猫,喜欢安静的环境,和现代生活非常匹配。宠物帮助人们排除寂寞、消除烦恼,人们也越来越重视宠物的感受,人们对宠物的情绪的变化主要集中在宠物的动作和叫声上,通过宠物的动作和叫声判断宠物的感情。但是人耳能够辨别的声音有限,尤其是宠物声音细微的差别是人类无法区分的,就像人类说同样的话,语气的不同,表达的情感也不同。
[0003]计算机技术的快速发展给利用计算机识别宠物声音带来了可能,通过机器学习对猫的声音识别,以获得猫的情感信息,克服了人耳灵敏度不够以及无法区分宠物叫声细微差别的困难。声音识别的一般过程是采集声音信号,进行预处理以及特征提取,最后利用机器学习进行识别。机器学习可以分为有监督学习和无监督学习,有监督学习是根据有标注的训练集中学习,无监督学习中数据没有预先设置好的标签,让计算机自己发现规律,神经网络作为一种有监督学习方法,在语音识别中具有很好的效果,但是宠物的声音和人类的语音不同,其识别方法也有较大区别,用人类的语音识别方法识别宠物的声音会存在较大的误差。
[0004]动物不像人类有丰富的词汇,现有的动物声音识别只能识别动物的叫声,根据叫声判断出动物的需求或者要表达的内容,但是无法识别动物情感的强烈程度,例如宠物猫喵喵的叫声,其可能...
【技术保护点】
【技术特征摘要】
1.一种基于神经网络的宠物声音识别方法,其特征在于,所述方法包括以下步骤:S1,获取宠物声音文件,对所述宠物声音波形的振幅进行归一化,计算归一化后的波形图的波形包络和振幅平均值,求出所述波形包络所有的极大值,根据所述极大值、所述振幅平均值以及预设时间确定峰值,根据峰值将所述波形图分为多个片段;S2,对于每个片段,计算片段平均值,若所述片段平均值大于左右相邻片段的平均值,则将片段标记为待识别片段,否则标记为噪声片段;利用所述待识别片段左右相邻两侧的噪声片段对所述待识别片段降噪;S3,将降噪后的每个所述待识别片段的频谱分别输入训练好的神经网络中得到类别及类别对应的概率,根据每个待识别片段的所述类别、所述概率和待识别片段之间的时间间距得到宠物的情感信息。2.如权利要求1所述的宠物声音识别方法,其特征在于,所述根据所述极大值、所述平均值以及预设时间确定峰值,根据峰值将所述波形图分为多个片段,具体包括:当极大值大于所述平均值的预设倍数时,获取以所述极大值为中间点,预设时间范围内的最大值点,若所述极大值和所述最大值为同一点,则将所述最大值作为峰值,若所述极大值和所述最大值不为同一点,则将所述最大值作为中间点,获取以所述中间点为中心,预设时间范围内的最大值点,直到最大值点和中间点为同一点,将所述中间点作为峰值;获取距离所述峰值大于预设时间且距离所述峰值最近的n个采样点,所述n个采样点的平均振幅小于所述振幅平均值且n个采样点振幅的平均差小于阈值,以所述n个采样点的中间位置作为分割点,将所述波形图分为多个片段。3.如权利要求1所述的宠物声音识别方法,其特征在于,所述利用所述待识别片段左右相邻两侧的噪声片段对所述待识别片段降噪,具体为:分别将所述待识别片段和左右两侧的噪声片段从时域转换到频域,计算左右相邻两侧的噪声片段频域中相同的频率及相同频率的幅度的平均值;在所述待识别片段的频域中减去所述相同频率的幅度的平均值,得到降噪后的待识别片段频域。4.如权利要求1所述的宠物声音识别方法,其特征在于,所述根据每个待识别片段的所述类别、所述概率和待识别片段之间的时间间距得到宠物的情感信息,具体为:对于每个待识别片段,判断所述待识别片段前面是否有待识别片段,若没有则将所述待识别片段去除,计算与前一个待识别片段的时间间距,根据所述时间间距得到权重,利用所述权重计算得到神经网络输出的每个类别的新概率值;计算所有待识别片段相同的分类对应的新概率值的平均值,将平均值最大的分类作为宠物情感,根据平均值标识所述宠物情感的强烈度。5.如权利要求1所述的宠物声音识别方法,其特征在于,所述根据所述时间间距得到权重,利用所述权重计算得到神经网络输出的每个类别的新概率值,具体为:根据公式计算第j个所述待识别片段的权重,其中,t
j
为第j个待识别片段与前一个待识别片段的时间间距大小,n为所述待识别片段个数,j为正整数,且1≤j≤n;根据公式计算第j个所述待识别片段第k个类别的新概率值为神经网络输出的第j个所述待识别片段第k个类别的概率值,其中,j为正整数,且1≤j≤n。
6.一种基于神经...
【专利技术属性】
技术研发人员:刘红波,吕培茹,尹珊,
申请(专利权)人:河南灵锻创生生物科技有限公司,
类型:发明
国别省市:
相关知识
基于卷积神经网络通过声音识别动物情绪的方法及系统
基于卷积神经网络通过声音识别动物情绪的方法及系统与流程
一种基于声音特征优化选择的鸟声识别方法
一种基于深度学习的宠物行为识别方法及系统
一种宠物情绪识别方法及系统与流程
一种宠物情绪识别方法及系统
一种基于深度学习的宠物行为识别方法及系统与流程
基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法
一种宠物情绪识别方法及装置与流程
一种宠物吠叫的识别方法及装置与流程
网址: 一种基于神经网络的宠物声音识别方法及系统技术方案 https://m.mcbbbk.com/newsview171196.html
上一篇: 一种基于神经网络的宠物声音识别方 |
下一篇: 猛男把400+条猫咪叫声做成数据 |