摘要

目的探讨直系同源蛋白质聚类分析的方法,为高效、快速的直系同源蛋白质聚类分析研究提供有效帮助。方法基于蛋白质序列的相似性和结构域的相似性,提出一种直系同源蛋白质聚类方法,实现了直系同源蛋白质的快速、精确聚类。结果对人类、酵母、蠕虫、果蝇、拟南芥和斑马鱼等六种真核生物序列直系同源蛋白质的聚类分析,结果明显优于NCBI和TIGR的聚类结果。结论利用蛋白质序列的相似性和结构域的相似性,可以有效筛选出假的同源关系,进而显著提高直系同源蛋白聚类的精确性和紧密性。