摘要
利用Illumina Hiseq 4000平台,对花叶海棠不同海拔下的样品进行了转录组测序,对其SNPs的数目和分布特征进行了分析和比较。测序后共得到316 759 896条序列,共有47 513 984 400的碱基量。序列组装后得到109 578个平均读长为594.83的unigenes,共有65 180 558个碱基,同时有134 443个平均读长为710.62的transcrips,共涉及95 537 959个碱基。将原始的测序数据对比到组装好的参考序列上后检测SNP位点。两个海拔样品中SNP的位点数目在低海拔地区(MH,33312)中高于高海拔地区(MKH,32886)样品。所有样品的转换类型SNP中,均是A/G类型的数量高于C/T类型的数量。颠换类型中,数量最多的是A/T,其次是C/G、T/G和A/C。SNP变异的Ts/Tv值均是MH样品值均大于MKH样品值。发生在第三个密码子的位置的变异位点在六个样品中均占最大比例,3'UTR产生变异的位点在MH和MKH基本一致,5'UTR的变异位点均低于3'UTR的变异位点数量。高海拔地区的强辐射,尤其是UV-B能被DNA和蛋白分子吸收,引起DNA的损伤和突变。MKH中SNP突变发生在第一和第二位密码子上的平均数目均高于MH,其原因可能是由于其所处的高海拔环境因素导致。
- 单位