摘要
越来越多证据表明RNA在生物系统中扮演着重要的角色,而这些发现支持了生命起源于RNA的假设。在人类基因组中,大部分的基因并不编码蛋白质,被称为非编码RNA基因。长非编码RNA(lncRNA)是其中最大的一类,其转录本长度大于200个核苷酸。虽然一些lncRNA已被证明是调控基因表达和3D基因组结构的重要元件,但是大部分lncRNA还未被研究和注释。本课题组利用大量基因组数据,提出一些基于数据挖掘和机器学习的方法,对人类lncRNA进行功能注释。我们与其他同领域课题组的近期研究结果表明,基因组数据挖掘可帮助加深对lnc RNA功能的理解,并为与疾病相关lncRNA的实验研究提供重要信息。