摘要
利用Illumina HiSeq 2000高通量测序技术对巴哈雀稗叶片进行转录组测序,共计获得42 844 132个序列读取片段,包含碱基序列信息6 426 619 800个。对读取片段进行序列组装,得到99 235个单基因簇。围绕GC含量、测序质量、长度分布的单基因簇评估测序数据均显示质量好、可信度较高。与Nr数据进行序列同源性比对结果显示,有53 886个单基因簇与其他植物的已知基因具有不同程度的同源性。结合GO数据库对巴哈雀稗的单基因簇进行功能分类,大致可分成为细胞组分、分子功能和生物学过程3大类共计70个分支,其中大量的单基因簇主要与细胞进程、结合活性及细胞成分有关。将单基因簇与COG数据库进行比对分析,依据其功能可大致分为25类。以KEGG数据库为参考,依据代谢途径将单基因簇定位到31个代谢途径分支上,具体包含核糖体代谢途径、碳代谢途径、氨基酸生物合成途径、内质网蛋白加工、剪接体和甜菜红色素生物合成等。通过SSR位点查找在巴哈雀稗99 235个单基因簇中共找到12 062个SSR位点。其SSR不同重复基序类型中,A/T出现频率最高,其次是AT/GA和AG/CT。
-
单位动物科学学院; 贵州省农业科学院; 贵州大学