摘要
嗅觉受体属于G蛋白偶联受体家族,在脊索动物的整个生命周期中都扮演着至关重要的角色。与其他多数基因家族不同,嗅觉受体家族是一个成员数量庞大的超基因家族,为它们合乎逻辑的命名可以更好地对该家族进行描述、分析和讨论,也可以为机器学习程序从庞大的嗅觉受体数据库自动构建相应的蛋白结构和功能知识库提供语义信息。由于脊索动物嗅觉受体演化速度很快、基因数量庞大、假基因比率高、在物种及染色体上分布差异巨大等多方面的原因,给嗅觉受体基因合理的命名较为困难。三十多年来,伴随着嗅觉受体研究领域的发展,嗅觉受体基因命名法也经历了多次迭代,在每个阶段都发挥着积极的作用。随着测序技术和生物信息学算法工具的发展,随之而来的是新注释的海量的嗅觉受体基因,这使已有的嗅觉受体基因命名法变得越来越难以适应大数据挖掘和知识工程的系统开发,因此迫切需要一个能满足当下需求的嗅觉受体基因命名法。
-
单位之江实验室; 上海科技大学