摘要
为了开发基于嗜冷黄杆菌CRISPR/Cas系统的基因组编辑技术,本研究对嗜冷黄杆菌的CRISPR/Cas系统结构及其作用机制进行生物信息学分析。从GenBank数据库中获得8株嗜冷黄杆菌的全基因组序列,利用CRISPRCasFinder软件查找成簇规律间隔短回文重复序列(clustered regularly interspaced short palindromic repeats, CRISPR)结构和CRISPR相关(Cas)蛋白在嗜冷黄杆菌基因组上的数量和分布;利用CRISPRFinder软件分析CRISPR结构的重复序列和间隔序列,并使用Mega X软件对cas基因核苷酸序列做相似性对比;通过与重复序列配对,获得反式激活crRNA(trans-activating CRISPR RNA,tracrRNA)与重复序列配对序列,使用ARNold软件预测tracrRNA基因的终止子;使用BPROM软件预测tracrRNA基因和crRNA前体(pre-CRISPR RNA,pre-crRNA)的启动子;使用Clustal X软件对所有的间隔序列做相似性对比,并使用CRISPRTarget软件对独特的间隔序列配对从而获得原间隔序列(protospacers)及原间隔序列邻近基序(protospacer adjacent motif, PAM)序列;使用WebLogo软件使PAM序列可视化。结果显示,8株嗜冷黄杆菌均含有1个完整的CRISPR/Cas9系统,由1个CRISPR结构和3个Cas蛋白组成。CRISPR结构由短而重复的序列即重复序列和短而可变的序列即间隔序列相间排列组成;重复序列大小为46 bp,核苷酸序列高度保守;间隔序列大小在29~31 bp之间,数量在20~41个之间。Cas蛋白含有Cas9、Cas1和Cas2,并且cas基因核苷酸序列高度保守。8株嗜冷黄杆菌的tracrRNA基因均位于cas9基因上游并且核苷酸序列相似性为100%。tracrRNA上有一段大小为24 bp的核苷酸序列,其中23个核苷酸与重复序列完全配对。每个重复序列均含有一个较短的启动子,可单独启动pre-crRNA的转录。不同菌株的间隔序列比对结果表明,新获得的间隔序列可以插入到嗜冷黄杆菌CRISPR结构的5′端或内部。在65个独特的间隔序列中,13个间隔序列能够配对上原间隔序列,这些原间隔序列均来源于噬菌体或质粒。原间隔序列上游侧翼序列分析结果表明,嗜冷黄杆菌Cas9识别的PAM序列是5′-GANTTTT-3′。以上结果表明嗜冷黄杆菌的CRISPR/Cas9系统理论上可以开发适用于嗜冷黄杆菌的基因组编辑技术。
- 单位