本研究提出了一种基于深度学习的鸟鸣检测算法,名为ToucaNet,通过迁移学习实现了更快的训练速度和更高的检测准确性,同时减少了计算复杂性和内存需求,为实时环境中的鸟鸣检测提供了一种高效且低成本的解决方案。
过去方案: 尽管已经存在基于信号处理和机器学习的鸟鸣检测解决方案,但它们在速度、计算复杂性、内存使用以及在实际环境中的检测/分类能力方面存在一定的限制。论文的Motivation: 鉴于人类观察的时间和空间限制,需要开发技术来实现鸟鸣和鸟类叫声的检测和分类。本文旨在通过引入一种基于深度学习的鸟鸣检测算法,解决现有解决方案在IoT系统中的技术限制方面存在的问题,为实时环境中的鸟鸣数据收集和分析提供一种成本效益高的解决方案。技术路线:ToucaNet是一种基于迁移学习的鸟鸣检测的深度神经网络,提高了检测准确性,同时降低了计算复杂性和内存需求。BarbNet是ToucaNet的近似版本,专为物联网(IoT)设备设
实验设置:ToucaNet鸟类检测器采用ResNet-18架构,使用频谱图作为输入,并经过数据集训练和随机梯度下降优化。ToucaNet的内存占用和计算负载经过仔细评估。
实验结果:ToucaNet在鸟类检测方面取得了最高的准确性和AUC,BarbNet是满足STM32H743ZI单元要求的唯一解决方案,其准确性和AUC与具有类似内存占用的其他解决方案相当或更高。BarbNet在STM32H743ZI上的执行时间为3.285秒,能够在获取音频信号所需时间之前完成分类。