摘要
为了简单重复序列(simple sequence repeats,SSR)和单核苷酸多态性标记(single nucleotide polymorphism,SNP)开发等研究,以李府贡枣不同处理枣果实的转录组序列为基础,分析了转录组数据中SSR和SNP位点的分布。结果表明:转录组数据共获得了226 488条contig序列,其中有42 570条unigene在数据库中得到注释。利用鉴定简单重复序列的软件(MIcroSAtellite identification tool,MISA)进行SSR位点的搜索,共得到18 016个SSR位点,SSR位点的出现频率为0.43个/kb。SSR位点共包含164种重复基元,其中以A/T类型为主的单核苷酸重复所占的比例最高(6 942个,38.44%),其次是AG/CT类型为主的二核苷酸重复(6 113个,33.85%)和以AAG/CTT为主的三核苷酸重复(4 242个,23.49%),四核苷酸重复、五核苷酸重复和六核苷酸重复基本相同。在转录组得到的unigene中共发现SNP位点163 360个,发生频率为1/254 bp,6种单核普酸变异中以Transition类型的A/G和C/T发生频率最高,分别为总数的30.80%和30.49%;其他4种Transversion类型的SNP为C/G、G/T、A/C和A/T,分别占到总数的9.83%、9.78%、9.78%和9.32%。其中Transition类型显著高于Transversion类型,在转换类型中A/G和C/T发生频率基本一致,但以A/G发生频率略高。
- 单位