朝鲜语语音音节自动切分算法的研究

作者:李洺宇; 金小峰*
来源:延边大学学报(自然科学版), 2019, 45(02): 128-135.
DOI:10.16379/j.cnki.issn.1004-4353.2019.02.007

摘要

针对目前语音语料人工标注效率低的问题,提出了一种朝鲜语连续语音语料的音节自动切分方法.该方法首先采用Seneff听觉模型提取音频的包络检测响应和广义同步检测响应等特征参数,其次结合朝鲜语发音特点确定音节的候选边界位置,最后通过静音段和摩擦音检测消除虚假边界,以提高边界检测的准确率.实验结果表明,该朝鲜语语音语料音节自动切分方法的准确率(93.56%)比传统的基于Seneff听觉模型的分割算法提高了14.59%,召回率(86.43%)比传统的基于Seneff听觉模型的分割算法降低了1.69%;因此,本文算法总体优于传统的基于Seneff听觉模型的分割算法.

全文