伴随着人类基因组计划的逐步深入,大量未标记的序列涌现,急需找到有效的方法来计算序列之间的"进化距离",判别蛋白质序列间的远近关系.基于此,应用粒计算理论提出了一种新的蛋白质序列的表示方法,将蛋白质序列的比对转化到氨基酸和二肽出现次数的统计,运用完全图的聚类方法挑选出代表蛋白,进行进化树的构建;同时提出了基于Gaussian型函数的距离度量的模糊聚类方法,分析了不同病毒蛋白间的距离关系.