摘要

在对生物DNA的研究中,我们有时会发现一小段固定的序列反复出现在不同的基因里。这些小序列被称作motif,它们很可能是转录控制子的结合位点,拥有相同motif的基因在功能上一般都有所关联。然而,motif在每段基因里基本只出现一次,其位置也是不固定的,给定一组基因,想要确定它们是否有共同的motif是一件比较困难的事。本文测试了一种方法,利用计算机对基因进行吉布斯采样,以识别出可能存在的motif。与朴素的贪心算法相比,本文使用的方法能大幅度提高识别率。