摘要

空间转录组携带的位置信息有助于结合解剖学形态结构探索基因表达差异,从而鉴定生物结构标志物,但基于单细胞测序的差异分析方法未能充分利用空间转录组的位置信息。因此,本研究借鉴自然语言处理中加权技术TF-IDF(term frequency-inverse document frequency)的思想,并通过构造基因空间表达符号网络引入位置信息,设计了空间转录组差异分析算法MarkerTIF,接着开发了Python工具包,并应用于小鼠(Mus musculus)大脑结构特异性标记基因提取,发现了未被报道过的小鼠海马CA1区标记基因Abracl、 CA3区标记基因Chgb与DG区标记基因Tubgcp2。与单细胞差异分析方法相比,MarkerTIF提取的标记基因与空间结构具有更高的相关性。本研究为结合生物解剖结构探索标记基因以及构建分子转录图谱提供了新见解。

全文