摘要

随着计算机技术的渗透与发展, 信息的规模和丰富性显著增强, 为基于多视角数据的医疗自动诊断提供了有利的发展契机. 然而, 多视角数据的复杂结构一方面会带来额外的计算开销, 另一方面容易造成模型的过拟合. 针对上述问题, 本文基于l_(1)范数易于优化, 且具有良好稀疏性等特点, 提出了稀疏多视角支持向量机(sparse multi-view support vector machine, SMSVM)模型. 与经典的两视角分类模型SVM-2K相比, SMSVM提供了更多视角(>2)下模型的通用表达形式, 并能够同时实现多视角的分类与特征的自动选择. 在公开数据集上的大量实验表明, SMSVM模型能够在保证性能不下降的同时, 剔除多视角数据中的大量冗余特征, 与基准模型相比具有显著的竞争优势; 最后, 考虑现实中对医疗自动诊断的迫切需求以及多视角数据在医疗领域存在的普遍性, 本文在X医院的真实糖尿病数据集上进行了实验, 进一步验证了SMSVM 模型在疾病自动诊断中的有效作用.