摘要
乳腺癌基因识别技术可以筛选出基因芯片中与乳腺癌相关的特异基因,为乳腺癌的早期的诊断提供参考。传统的分类方法难以解决基因谱数据高维、高噪、数据量庞大的问题。提出基于模糊支持向量机(FSVM)技术的乳腺癌基因识别,通过对乳腺癌患者的特征基因进行提取,剔除与病变无关的基因、删除突变基因中的冗余信息、构造KNN几何平均隶属度函数的模糊支持向量机,并嵌入新的内核函数L-KMOD,对不同的样本点赋予不同的惩罚参数,克服样本数据少维数高的影响,提高了乳腺癌基因辨识的正确率。选用美国国立生物信息中心共享数据库下载的乳腺癌基因芯片进行识别试验,结果的平均错分率为3. 89%,最高正确率达到了98. 9%,训练时间和识别时间均在合理范围内。
- 单位