【说明书】:
本发明公开了一种基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法,该方法:首先,通过通道并行注意力模块表征任意时刻发声的时间帧和所有振动声音频率之间的相关性,构造鸟鸣声全局时频依赖关系,其次,通过挤压激励注意力模块自适应地校准特征图中不同通道所携带鸟鸣声信息的重要程度,最后将两个模块并行融合构成双并行注意力机制用于构造全局特征依赖关系。本发明提出的双并行注意力机制灵活地嵌入浅层卷积神经网络中,并且以较低的计算量在鸟鸣声数据集BirdsData上取得了98.1%的识别精度。
技术领域
本发明涉及一种基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法。
背景技术
鸟类物种多样性是评估生态环境质量的重要生物指标,同时也反映了其栖息地的物种丰富程度,识别鸟类种群是评估鸟类物种多样性的关键步骤。采集鸟类鸣叫声,通过鸟鸣声识别鸟类种群具有,设备部署简单,不受树木等环境因素遮挡等优点。因此,鸟鸣声识别具有不可替代的作用。
目前鸟鸣声识别大多基于深度学习方法。先通过短时傅里叶变化等操作将鸟鸣声可视化为频谱图等特征,其次,采用卷积神经网络捕获频谱图中局部区域上时频变化信息来对鸟鸣声进行分类。也有研究人员,采用循环神经网络构造鸟鸣声连续时序信息变换建模时间维度特性识别鸟鸣声。目前最新研究中,采用注意力机制对鸟鸣声时序位置信息进行权重再分配,重新建模时序特征关联度。然而,上述方法中,仅从局部位置信息感知鸟鸣声,并未考虑到鸟鸣声时序信息和发声频率间的关系以及各个通道中鸟鸣声特征的关联度,因而识别的准确率较低。
因此,有必要设计一种新的鸟鸣声识别方法。
发明内容
本发明所要解决的技术问题是提供一种基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法,该基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法具有识别准确率高的特点。
发明的技术解决方案如下:
一种基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法,包括以下步骤:
步骤1:采用通道并行注意力模块对鸟鸣声特征图X进行操作,表示为FPCA(X);步骤2:采用挤压激励注意力模块对鸟鸣声特征图X进行操作,表示为FSEA(X);步骤3:将通道并行注意力模块和挤压激励注意力模块并行地融合到一个整体中,表示为FDPA(X)=FPCA(X)+FSEA(X)+X;
得到融合处理后的鸟鸣声特征图;基于融合处理后的的鸟鸣声特征图对鸟鸣声进行识别。
FPCA(X)=W((σ((φ(X))Tψ(X))(θ(X))T)T)+X;
其中鸟鸣声特征图X有m个通道,X=(X1,X2,...,Xm-1,Xm),其中Xi∈RC,i∈{1,2,...,m};C表示通道维度,R本身是一个三维特征(三个维度分别是通道,时序信息,声音频率。)RC表示通道维度中的一个二维特征。
φ,ψ,θ表示感受野为1×1的二维卷积;
表示感受野为3×3的二维卷积,σ表示Sigmoid函数。
FSEA=(Fscale(σ(W2(δ(W1(Fsq(X)))))⊙X;
其中,Fsq表示挤压函数,和表示两个全连接层(FC表示全连接层,m和表示全连接层中输入和输出节点的数量。)
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南林业科技大学,未经中南林业科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210972741.0/2.html,转载请声明来源钻瓜专利网。
上一篇:一种高速飞行器追逃微分博弈的邻近凸优化方法下一篇:风力发电机组相关知识
基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法
一种宠物情绪识别方法及系统
一种基于声音特征优化选择的鸟声识别方法
一种基于深度学习的宠物行为识别方法及系统与流程
一种基于深度学习的宠物行为识别方法及系统
“职务与职级并行”强化正向激励
用于宠物规范行为检测的目标检测模型及方法.pdf
对狗过度依赖怎么办?
基于java的宠物管理系统设计与实现(项目报告+答辩PPT+源代码+数据库+截图+部署视频)
我对自己养的狗过度依赖,怎么办?
网址: 基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法 https://m.mcbbbk.com/newsview50657.html
上一篇: 解锁进货渠道!义乌花鸟市场宠物批 |
下一篇: 第十五章 跟着这群人真是一刻不得 |