利用波束形成和神经网络进行语音增强

作者:龚杰; 冯海泓*; 陈友元; 方义; 牟宏宇
来源:声学技术, 2020, 39(03): 323-328.
DOI:10.16300/j.cnki.1000-3630.2020.03.012

摘要

语音增强在语音信号处理的前端非常重要,直接影响后端语音识别等效果。目前用神经网络进行单通道语音分离对于解决鸡尾酒会问题取得了很大的进步,但是用于复杂混合语音时分离效果仍不令人满意。针对单通道情形下的不足,使用多通道结构形成4个方向的超指向波束,结合神经网络算法实现对于指定方向的目标语音增强。仿真和实验结果表明,该算法相较于超指向波束形成算法和谱减法在多种评价指标上均有了明显的提升。