简介与目的
我的毕设项目主要是关于用鸟的声音来判断鸟的种类。研究鸟类鸣声有利于人们掌握其繁殖行为和生活习性等生命活动规律,从而更好地开发和利用经济鸟类,更有效保护濒危珍稀类。同时,鸟鸣声在野生动物监测、农林渔业驱赶害鸟、航空鸟撞以及旅游等方面也具有十分广阔的前景。此外,鸣声的研究还能用来解决鸟类的分类学问题,如对同一种的不同类群及不同种的亲缘关系进行分析和比较,并探讨新种形成的种系发生历史。(鸟类鸣声初探_吕琳娜)
鸟声识别的难点主要在于:一,音频中干扰过多,比如风雨声和其他鸟类的声音等;二,鸟与鸟种类之间的鸣声差别极其微小,人耳尚不能分别,对于计算机来说就更加困难了。
我做这个项目主要是想要比较神经网络的各种参数对鸟声识别准确度的影响,并不仅仅着眼于提高准确度,而在于分析为什么准确度会随着参数而改变,试图发觉神经网络的“潜力”。
项目计划
我将课题分为两部分,音频处理和神经网络。音频处理主要负责1.统一数据格式,2.降噪,尽可能的将音频中的无关信息剔除,如设备产生的噪音和背景噪音等,将无鸟声的部分从音频中减掉,并分片,统计从网站上下载下来的音频时长,确定初步训练集的大小, 3.提取音频特征,将音频转换为最大程度保留鸟声特征的图像,如频谱图(spectrogram)等,人工分析估计图像的效果。
一.音频处理
收集数据这里是我的数据来源: Xeno-canto.这是一个收集全球各地的鸟鸣声的网站,因为有提供api所以不需要爬虫。(数据是可以免费使用的)当