基于多信息融合识别核定位蛋白

作者:李明俊; 李凤敏
来源:内蒙古农业大学学报(自然科学版), 2020, 41(01): 87-92.
DOI:10.16853/j.cnki.1009-3575.2020.01.016

摘要

细胞核是真核细胞内最重要的细胞器,它是基因复制、RNA转录的中心,是细胞活动的控制中心。蛋白质的功能与蛋白质在细胞内的位置密切相关,因此,如何从大量蛋白质中精确地识别出核定位蛋白非常重要。本文构建了核定位蛋白和非核定位蛋白数据集,选取氨基酸序列N端单肽组分信息、蛋白质骨架二肽组分信息、氨基酸指数信息、蛋白质相互作用信息及基因本体注释信息为特征信息,并对特征信息进行融合,利用支持向量机算法对构建的数据集进行预测,在5-折交叉检验下总预测成功率达到89.11%。