摘要

针对基于鸟鸣声的鸟类识别问题,提出一种基于自适应最优核时频分布(adaptive optimal kernal, AOK)与卷积神经网络(convolutional neural network, CNN)的鸟类识别方法。首先对采集的鸟鸣声信号进行预处理,获取对应鸟类的音节后对样本进行数据增强处理,然后通过AOK时频分析方法,得到鸟鸣声音信号的自适应频谱图,分析鸟鸣声信号不同时间和不同频率下的能量分布,通过时频谱图对卷积网络模型进行训练,并进行实时预测。对20种常见鸟类的实验表明,在少量初始样本的情况下,总体识别率也可达到95.5%,并且通过对同一科目和不同科目下的鸟类鸣声分析发现,采用时频图结合卷积神经网络的方法对鸟类鸣声进行识别,提取的特征参数代表性更强,识别准确较好,具有较好泛化性。