摘要

DNA微阵列产生巨量的表达谱数据,用以挖掘特定的生物信息,而对表达谱数据的分析离不开有效而可靠的聚类算法。现有的聚类方法都是把具有相似表达模式的基因或样本归为一类,而微阵列数据的高维小样本特点,致使基于DNA微阵列的聚类算法是在超高维的空间中进行的,从而产生了维数灾难问题。本文从另一个侧面入手,注重基因之间或样本之间的关系,提出了一种新颖的聚类方法。该方法把经典的基于相关的DNA微阵列数据聚类分析方法和图论知识相结合,能更好地揭示基因或样本之间的相似性,且避免了维数灾难问题。把本文方法运用到真实的DNA微阵列数据(Yeast数据和NCI数据),并与其他的聚类方法进行了实验比较,实验结果显示,本文方法获得了较好的聚类效果。