本发明涉及语音处理,具体涉及一种野生鸟类生态识别监测方法。
背景技术:
1、在野外自然环境中,鸟类分布广泛,对生态环境的变化十分敏感,是生态环境健康的指示物种之一。同时,鸟类多样性可以很好地反映生物多样性。因此,可以通过分析鸟类生物多样性来分析生物的多样性。即通过分析鸟类的声音数据与图像数据,实现对鸟类的监测,进而实现对生态环境的监测与生物多样性的评估等多项生态任务。其中,通过鸟类的声音数据与图像数据实现对鸟类的监测,可提高对鸟类识别监测的准确性与效率。
2、传统的对野生鸟类进行识别监测的方法为声纹识别算法。声纹识别算法能够提取鸟类声音特征,并通过与鸟类数据库对鸟类声音特征进行匹配,实现对野生鸟类的识别。但野外环境中提取的鸟类声音特征往往被噪声、环境等多种因素干扰,使鸟类声音特征提取不准确,进而导致鸟类识别精度较低,无法对野生鸟类进行准确监测。
技术实现思路
1、本发明提供一种野生鸟类生态识别监测方法,以解决鸟类特征提取精度低,导致野生鸟类识别精度低、监测不准确的问题,所采用的技术方案具体如下:
2、本发明一个实施例提供了一种野生鸟类生态识别监测方法,该方法包括以下步骤:
3、建立鸟类数据库,采集音频数据和声像数据,对音频数据和声像数据进行预处理,获取音频活动区间;
4、获取音频活动区间中每一帧的近邻帧,获取每一帧的近邻帧中包含的所有帧的能量峰值和基频频率,根据音频活动区间中每一帧的近邻帧中包含的所有帧的能量峰值和基频频率,获取音频活动区间中每一帧的近邻发声指数;
5、对同一音频活动区间中所有帧的近邻发声指数进行聚类,获取近邻发声指数的聚类簇,根据聚类簇内包含的近邻发声指数确定聚类簇的编号,根据聚类簇的编号确定连通帧域,确定连通帧域的标签,根据连通帧域获取连通帧域的相邻帧域的指数均值,根据连通帧域内包含的帧的数量、连通帧域的标签和连通帧域的相邻帧域的指数均值,获取连通帧域的鸟鸣回应匹配指数,根据音频活动区间内包含的连通帧域的相邻帧域和鸟鸣回应匹配指数,获取音频活动区间的鸣音变异指数;
6、获取去基频后的连通帧域,根据去基频后的连通帧域,获取音频活动区间的能量标准差,根据音频活动区间的鸣音变异指数和能量标准差,获取音频活动区间的鸣音变异系数;
7、提取声像数据中的关键帧,根据音频活动区间对应的声像数据中的图像帧和声像数据中的关键帧,确定关键帧集合,根据音频活动区间、鸣音变异系数、关键帧集合与鸟类数据库,确定每个音频活动区间中识别出的鸟类名称,根据识别出的鸟类名称,实现通过声像数据对野生鸟类的识别监测。
8、进一步,所述音频活动区间中每一帧的近邻帧,获取的具体方法为:
9、将音频活动区间中每一帧分别作为待分析帧,将与待分析帧距离最近的近邻预设阈值个帧记为待分析帧的近邻帧。
10、进一步,所述根据音频活动区间中每一帧的近邻帧中包含的所有帧的能量峰值和基频频率,获取音频活动区间中每一帧的近邻发声指数,包括的具体方法为:
11、将待分析帧的近邻帧中每一帧分别作为一类帧,将待分析帧的近邻帧中所有帧的能量峰值的最大值与一类帧的能量峰值的差值,记为一类帧的第一差值,将一类帧的第一差值与协调因子的和,记为一类帧的第一分母;
12、将一类帧的基频频率与一类帧的第一分母的比值记为一类帧的发生指数;
13、将待分析帧的近邻帧中包含的所有帧的发生指数的和记为待分析帧的近邻发声指数。
14、进一步,所述根据聚类簇的编号确定连通帧域,确定连通帧域的标签,包括的具体方法为:
15、将近邻发声指数所在的聚类簇的编号记为近邻发声指数对应的帧的标签,按照帧在音频活动区间中的顺序,将音频活动区间中标签数值连续的帧作为连通帧域,将连通帧域内包含的所有帧的标签对应的数值的众数记为连通帧域的标签。
16、进一步,所述根据连通帧域获取连通帧域的相邻帧域的指数均值,包括的具体方法为:
17、将与连通帧域相邻的连通帧域,记为连通帧域的相邻帧域,将相邻帧域内包含的所有帧的近邻发声指数的均值记为相邻帧域的指数均值。
18、进一步,所述鸟鸣回应匹配指数,获取的具体方法为:
19、将连通帧域内包含的帧的数量与标签的乘积记为连通帧域的第一乘积,将连通帧域的第一乘积与连通帧域的相邻帧域的指数均值的最小值的比值记为连通帧域的鸟鸣回应匹配指数。
20、进一步,所述鸣音变异指数,获取的具体方法为:
21、将连通帧域的鸟鸣回应匹配指数与连通帧域的相邻帧域的指数均值的最小值的乘积记为连通帧域的第二乘积,将连通帧域的相邻帧域的指数均值的标准差与协调因子的和记为连通帧域的第一和值,将连通帧域的第二乘积与第一和值的比值记为连通帧域的变异指数,将音频活动区间内包含的所有连通帧域的变异指数的和记为音频活动区间的鸣音变异指数。
22、进一步,所述音频活动区间的能量标准差,获取的具体方法为:
23、将音频活动区间内包含的各连通帧域的能量峰值的均值的标准差,记为音频活动区间的能量标准差。
24、进一步,所述鸣音变异系数,获取的具体方法为:
25、将音频活动区间的鸣音变异指数与能量标准差的乘积记为音频活动区间的鸣音变异系数。
26、进一步,所述根据音频活动区间、鸣音变异系数、关键帧集合与鸟类数据库,确定每个音频活动区间中识别出的鸟类名称,根据识别出的鸟类名称,实现通过声像数据对野生鸟类的识别监测,包括的具体方法为:
27、将音频活动区间对应的音频信号、音频活动区间的鸣音变异系数、关键帧集合与鸟类数据库中的图像数据作为cnn卷积神经网络的输入,以adam为优化算法,以均方根误差mse为损失函数,通过cnn卷积神经网络获取每个音频活动区间中识别出的鸟类名称;
28、将所有音频活动区间中识别出的鸟类名称组成的集合作为对该地区的野生鸟类识别监测结果,实现通过声像数据对野生鸟类的识别监测。
29、本发明的有益效果是:
30、本发明根据不同种类的鸟的发音器官的构造的相似性,使鸟类鸣叫声音的能量较强的特征,获取音频活动区间的每一帧的近邻发声指数,近邻发声指数衡量了每一个声音帧呈现出的鸟类鸣叫特征的程度,根据近邻发声指数确定连通帧域,连通帧域即为呈现出的鸟类鸣叫特征的程度相近的各声音帧组成的声音片段;然后,结合鸟类鸣叫声音实现的功能特征,使鸟类鸣叫之间存在间隔的特征,连通帧域的鸟鸣回应匹配指数,进而分析每个连通帧域内包含的鸟类声音的复杂程度,获取音频活动区间的鸣音变异指数,提升音频活动区间呈现出的鸟类声音特征评价的准确性;进而结合鸟类的泛音差异导致鸟类鸣叫的差异的特点,获取音频活动区间的鸣音变异系数,继续提升提取音频活动区间对应的鸟类音频特征的准确性;最后,为提高鸟类识别结果的准确率,结合提取的声像数据和鸟类音频特征,确定每个音频活动区间中识别出的鸟类名称,根据识别出的鸟类名称,实现通过声像数据对野生鸟类的识别监测,解决鸟类特征提取精度低,导致野生鸟类识别精度低、监测不准确的问题,提升野生鸟类的识别精度。
相关知识
一种基于物联网的鸟类鸣声识别监测系统及方法.pdf
AI鸟类监测识别
精准识别珍稀鸟类新方法
北京监测鸟类用上人工智能
鸟类识别,推动鸟类生态保护
鸟类AI监测识别分析系统作用
鸟类监测设备
宠物状态监测方法和装置与流程
一种动物运动量监测方法及系统与流程
声纹智能监测黑科技可识别800种鸟鸣
网址: 一种野生鸟类生态识别监测方法与流程 https://m.mcbbbk.com/newsview699958.html
上一篇: 实拍数千只野生鸟类黄河源头嬉戏 |
下一篇: 观察你身边常见的动植物(各5种) |