基因序列匹配是生物信息学中一个重要的问题,基因序列在计算机处理中通常被看作是由有限的字符集组成的文本字符串,故可将基因序列匹配问题归结为字符串匹配问题。本文在对传统的BMHS字符串匹配算法的分析的基础上,提出了一种更为高效的基因序列匹配算法——BMHSM算法。该算法充分利用已匹配部分的信息、移动窗口末尾的字符下一位字符与首字符的关系,并采取预判机制进行融合跳跃,最大移动步数可达到2m+2。实验结果表明,改进后的BMHSM算法有效提高了基因序列的匹配速度。