摘要
本发明公开了一种基于改进动态时间规整算法的语音样本筛选方法,包括步骤:使用基于同一文本录制多个语音样本,去除背景音并标注语音样本的元音和辅音,构建样本的语音特征序列表达;根据去除背景音后语音短时帧中元音和辅音的标注类型,通过语音短时帧内信号最大幅值的变化信息来确定过渡音,并对过渡音进行标注;分别对改进DTW算法的局部距离和整体距离进行加权计算,获得两两样本间的距离,构建所有样本的距离矩阵;根据距离矩阵对语音样本进行筛选。本发明解决了在样本数据量大、不能保证样本质量的情况下,对同一文本的语音样本的筛选问题,降低筛选成本,并为后续处理(如语料库的构建、深度神经网络的学习等)提供了更为可靠的样本数据。
- 单位