<正>近几年,随着大数据概念的不断升温,学术界及产业界对不平衡数据处理问题的研究热情仍未消退,且呈现逐渐升温的趋势,医疗数据成为其重要处理对象。医疗数据的特征是高度不平衡性、变量相关性程度高且维度高。该文首先对数据集进行相关性分析,得出变量间存在严重的相关性,变量之间存在相关性会对分类结果产生影响。