摘要
基于语音数据挖掘实现帕金森病诊断的方法近年来已被证明有效。然而,受数据采集对象患病程度以及采集设备和环境等因素影响,所获取数据集的样本空间中存在不同类别样本混叠现象。混叠区域的样本难以有效识别,严重影响了算法的分类准确度。为了解决这一问题,本文提出了分包融合集成算法,通过设计类心距离比值来衡量样本的混叠程度并将训练集划分成多个子集,再利用错误分类样本传递式训练的方法调整子集划分结果,最后通过优化子分类权重对各个子分类器的测试结果进行加权融合。实验结果表明,本文方法分类准确度在两个公共数据集上都得到明显提高,平均准确度最大提高可达25.44%。该方法不仅有效提高了帕金森病语音数据集分类准确度,还增加了样本利用率,为帕金森病语音诊断提供了一种新思路。
-
单位第三军医大学西南医院; 神经内科; 重庆医科大学附属第一医院; 重庆大学