摘要

声音作为人们日常生活中信息表达和接收的重要方式之一,包含了大量的有用信息,其应用范围涵盖了生活的方方面面。因此对于声源定位的深入研究依旧具有广泛的现实意义。本文研究了基于神经网络的声源定位技术,首先介绍了三种传统的声源定位算法,并主要研究了基于相位变换的广义互相关的定位算法(GCC-PHAT),随后根据一种新的单声道和多声道录音数据库(SMARD)建立了房间冲激响应(RIR)模型,并通过麦克风阵列对空间随机生成的声源进行采集,结合全连接神经网络模型进行训练,利用训练好的模型对信号进行分类,最终得到声源的方位。实验结果表明,在不同混响条件和信噪比的环境下,基于神经网络的声源定位算法具有较高的定位准确率。

全文