家蚕全基因组微卫星分布规律及其生物信息学分析

作者:甘丽萍*; 谭爽; 戚文华; 石汝杰
来源:基因组学与应用生物学, 2018, 37(10): 4278-4288.
DOI:10.13417/j.gab.037.004278

摘要

本研究利用MSDB v2.4软件以及生物信息学方法获取了家蚕全基因组的完整型SSRs序列,并对其分布规律进行比较分析。家蚕全基因组中SSRs总数量为141 311个,相对丰度为209.01 No/Mb,总长度为2.41 Mb,全基因组SSRs六种碱基重复类型的数量和密度分布模式为:单碱基>四碱基>三碱基>二碱基>五碱基>六碱基,说明全基因以单碱基为主要碱基类型,六种碱基类型中五碱基SSRs G-C含量最高。对全基因组3’非翻译区(3’UTR)、5’非翻译区(5’UTR)、编码区(CDs)、内含子区(Introns)和基因间隔区(Intergenics)等不同区域SSRs分析表明,Introns区SSRs数量最高,为125 178个,最小的是5’UTR,为278个,其数量大小顺序为Introns>Intergenics>3’UTR>CDs>5’UTR。5个不同区域的SSRs的碱基的总计数差异较大,编码区总计数最大的是三碱基,而其他4个区域最多的是单碱基。分别对5个区域SSRs中六种重复拷贝类别进行统计分析,碱基总计数(或频率)最多的分别是A;AC、AG、AT;AAT、CCG;AAAT、AAAC;AAATC、AAACT和TAAGTT、GAATTT、AATTAA,Introns和Intergenics区的重复类型总计数显著高于3’UTR、CDs和5’UTR。各重复类型拷贝数分布范围为4~100,主要集中在4~30之间。这为进一步系统分析家蚕SSRs分子标记筛选和遗传分析打下基础。

  • 单位
    重庆三峡学院

全文