摘要
为了解决生物信息学中基因多序列比对的计算速度慢和软件陈旧的问题,提出了基于Yarn (Yet Another Resource Negotiator)云平台的生物基因多序列比对并行计算方法 YarnclustalW。分析了clustalW算法的数学模型及其面向MapReduce的任务划分方式,YarnclustalW中综合考虑了基因的长度和数目,采用一种基于阈值刻度的任务划分方式。利用NCBI的GenBank生物基因数据作为案例程序进行了测试。实验结果表明:YarnclustalW比起多序列比对clustalW串行计算方法具有更快的运行时间与加速比,可以使生物科研人员节省很多时间与精力,方便对于药物靶标的发现,缩短生物药物的开发周期。
-
单位北部湾大学; 江苏食品药品职业技术学院