369例口腔癌患者汉语普通话语音数据库的建立与初步评价

作者:肖育栋; 郭凯欣; 杨乐; 邓威; 曾滨; 张思恩; 劳小媚; 廖贵清; 梁玉洁*
来源:中国口腔颌面外科杂志, 2022, 20(02): 151-157.
DOI:10.19438/j.cjoms.2022.02.009

摘要

目的 :收集口腔癌患者手术前、后语音样本,建立口腔癌患者汉语普通话语音数据库,为口腔癌的临床诊治和康复提供数据平台。方法:收集在中山大学附属口腔医院口腔颌面外科就诊及术后定期复诊的口腔癌患者,利用多种语音测试工具对患者进行语音评估,在安静环境下录音,纳入非恶性肿瘤病变患者和健康人作为对照组。所有音频样本经统一预处理、分割、标注、匿名化处理,生成标准化语音数据集。结果:2017年7月—2021年4月纳入481位独立发音人,男274例(57.0%),女207例(43.0%),平均年龄(46.98±16.34)岁。口腔癌患者369例(76.7%),健康人79例(16.4%),非恶性肿瘤患者33例(6.9%)。口腔癌患者中,病变位于舌及口底258例,术前进入评估队列202例,T1、T2、T3、T4分别为35例(17.3%)、68例(33.7%)、41例(20.3%)、58例(28.7%)。所有发音人的中位随访(评估)时间为术后219 d(IQR:87.5~587 d),共计1 100人次。共得到73 008份独立语料音频,所涉及的语料种类包括元音(6,1.30%)、下颌轮替运动音节(7,1.51%)、单字(238,51.63%)、词语(169,36.66%)、句子(38,8.24%)共461种。结论:本研究建立了国内外首个以口腔癌为主要病种的语音数据库,丰富了口腔癌临床诊治的功能学维度,为临床生物信息标志物的深入研究及个体化语言康复提供了重要的数据支持。

全文