基于RNA-Seq数据集的转录组从头拼接算法

作者:武思文; 李静; 张少强*
来源:计算机科学, 2018, 45(12): 308-312.
DOI:10.11896/j.issn.1002-137X.2018.12.049

摘要

转录组拼接是基因组测序与功能注解问题的一个重要组成部分。为了提高转录组拼接的精度和效率,文中提出了一种新的转录组从头拼接算法StepLink。该算法的主要创新点是提出了最左k-mer(长度为k的短序)和右k-mer的概念,并运用双重哈希表来存储相邻的每对k-mer,使得拼接更加迅速、准确。应用该算法对SRA数据库中人、狗和老鼠的测序数据分别进行拼接,结果表明该算法比其他已有算法更高效。

全文