数据增强基础上使用卷积神经网络进行闻诊(英文)

作者:江益靓; 张旭龙; 邓晋; 张文强; 李伟*
来源:复旦学报(自然科学版), 2019, 58(03): 328-334.
DOI:10.15943/j.cnki.fdxb-jns.2019.03.004

摘要

声学分析具有客观、非侵入、成本低等优点,在临床嗓音分析方面有着很大的应用潜力.闻诊是传统的中医四诊之一.我们尝试使用分析声学信号的方式将受试者的症状判别为体实或体虚,也就是较为初级的闻诊,因此提出了一种在数据增强基础上使用卷积神经网络(DACNN)进行闻诊的方法.该方法的思想是使用数据增强的方式缓解闻诊数据中常出现的数据不平衡的问题,以及借助卷积神经网络从输入音频上"自动"提取一些能区分体质的抽象特征.实验数据集包含959个发声片段(346个男声片段与613个女声片段),由两名经验丰富的中医进行虚实标记.实验结果证明了数据增强的有效性.此外,我们还将提出的模型与传统方法做了对比,使用DACNN,女性和男性受试者分别达到了97.25%和95.12%的体质判别准确率,这个结果相对于传统方法,有1%~10%的提升.实验结果表明,DACNN对于客观化闻诊是有帮助的.