深度学习与鸟类声音识别的结合广泛应用于鸟类物种保护监测。复杂的网络结构不利于鸟声识别设备的部署,导致推理时间长、效率低等问题。使用 AlexNet 作为骨干模型,我们探索了无需复杂连接技术或注意机制的浅层直接模型(名为 SIALex)的潜力,用于识别和分类 20 个鸟类声音数据集,这些数据集同时在 10 类 UrbanSound8k 数据集上进行验证。采用结构重参数化方法,减少了模型层数,提高了计算效率,显着减少了推理时间,实现了结构上训练和推理时间的解耦。为了增加模型的非线性,采用级联的方法来增加激活函数的数量,从而显着提高模型的泛化性能。同时,在分类器部分,卷积层替代了原来的全连接层,从而减少了推理时间并增加了模型的特征提取能力,提高了准确率,有效识别鸟类语音。实验数据表明,SIALex 网络在 Birdsdata 数据集上的准确率提高到 93.66%,一条数据的推理时间仅为 2.466 ms。 UrbanSound8k数据集的准确率达到96.04%,一条数据的推理时间为3.031毫秒。 大量实验对比表明,本文提出的方法在减少模型的推理时间方面取得了良好的效果,为浅层、简单模型的应用带来了突破。
"点击查看英文标题和摘要"
相关知识
SIALex:基于鸟类声音特征的物种识别和监测,Ecological Informatics
“声音身份证”来识别鸟类
鸟类声音识别技术综述:从传统方法到深度学习
基于深度学习的鸟类声音识别系统
基于深度学习的鸟类声音识别的研究与应用
北京监测鸟类用上人工智能
鸟类及动物声音辨识方法原理进展境况转自知乎
动物所在鸟类声音识别研究中取得新进展
科学网—鸟类种内声音识别研究获新进展
声纹智能监测黑科技可识别800种鸟鸣
网址: SIALex:基于鸟类声音特征的物种识别和监测,Ecological Informatics https://m.mcbbbk.com/newsview235530.html
上一篇: 狗狗牙膏哪种最安全最好用 |
下一篇: 十种最会模仿人类说话的鸟 |