摘要
目的 构建包含遗传变异肽(genetically variant peptide,GVP)的参考蛋白质序列数据库,开发用于鉴定蛋白质组学数据中GVP信息的工具。方法 采集某个体毛干蛋白质组学数据,以dbSNP数据库中的遗传变异信息和SwissProt数据库中的参考蛋白质数据库,先构建包含全部蛋白质的GVP序列的数据库ComVarDB,再构建仅包含SwissProt数据库搜库结果中部分蛋白质GVP序列的数据库,对鉴定出的GVP结果进行分析和比较。结果开发出基于Python的工具包2Steps_GVPtool,用于识别鸟枪蛋白质组学数据中的变异位点。在ComVarDB数据库中鉴定出14个GVP。在构建数据库时仅加入500个高表达蛋白质的GVP时,鉴定出的GVP最多,为18个。结论通过迭代的搜索步骤,即基于第一步的常规蛋白质组学分析结果来优化所构建的数据库,只在数据库中包含一些高表达蛋白的GVP序列有助于识别更多的GVP。
-
单位复旦大学附属妇产科医院; 复旦大学附属中山医院; 复旦大学