摘要
癌症是一种严重威胁人类健康和生命的疾病。文章以TCGA公开数据库中的乳腺癌数据作为研究样本,基于机器学习中T-test检验和卡方检验方法对乳腺癌数据进行特征筛选和特征提取,保留有效的特征信息,剔除冗余信息。采用5种分类器对乳腺癌的分类进行研究,筛选出排在前10位的乳腺癌生物标志物进行深入研究,实验结果有助于探索遗传信息和自然因素在乳腺癌致病机理中的角色,并为预后评估的精准医疗提供科学依据。
-
单位吉林化工学院; 吉林大学