摘要

目的 以量化的气息音为特征,对嗓音疾病进行分类预测。方法 对声带麻痹、器质性嗓音疾病、功能性嗓音疾病患者及正常受试者各30例的嗓音进行音频片段抽取,去除音频头尾各0.25秒,以100毫秒为1帧,每例抽取20帧,将每帧保存为独立语音片段。使用voicesauce对语音片段进行分析,提取气息音特征参数(H1-H2,H1-A1,H1-A3,CPP)数值,清洗后建立数据集。使用随机森林方法分别在不同决策树规模和不同特征数量下建立分类器模型,并检验分类正确率。结果 不同决策树规模下(100棵和200棵),单一特征和组合特征的准确率无显著区别。相同决策树规模下,单一特征的分类准确率分别为H1-H2:27.56%,H1-A1:30.16%,H1-A3:29.58%,CPP:38.24%;组合特征(H1-H2&H1-A1&H1-A3&CPP)的分类准确率为71.14%。在组合特征中,最重要的特征是CPP,约占28.06%。结论 通过客观声学测量获得气息音组合特征可作为区分功能性嗓音疾病、器质性嗓音疾病、声带麻痹和正常嗓音的分类特征,可以获得较好的分类效果。

  • 单位
    解放军总医院