摘要

司法实践中,案件语音数据的来源场景丰富多样,而不同场景的语音数据对法庭说话人识别的影响程度也有所差别。为了量化评估网络媒体场景下语音对法庭说话人识别的影响,验证该场景下法庭说话人自动识别系统的性能,采集了150名男性的网络媒体语音音频,基于深度神经网络模型的法庭说话人自动识别系统和似然比框架方法,进行了系列说话人识别测试和系统性能验证实验。通过对不同采样率、不同规模校准集、不同音频数量及不同音频时长条件下识别结果的分析与比较,测试验证了法庭说话人识别系统在该类场景下的良好识别性能,并量化评估了上述因素对系统识别性能的影响程度,进而为法庭说话人识别的研究与实践提供参考依据。

  • 单位
    西南政法大学

全文