摘要

在构建混响语声数据集时,由于缺乏真实长混响房间脉冲响应且模拟的房间脉冲响应与真实不符,因而导致数据驱动的混响时间盲估计模型性能下降。提出了一种基于条件生成对抗网络的房间脉冲响应模拟法,该方法利用真实的房间脉冲响应训练条件生成对抗网络,可以根据指定的混响时间模拟更加真实的房间脉冲响应。使用不同方法模拟的房间脉冲响应构建训练集用于训练盲估计模型,通过声学实验评估模型性能。实验结果表明,由该方法模拟的房间脉冲响应训练的估计模型在不同信噪比下均具有最小的均方根误差且在长混响情况下显著优于其他模型。