摘要

近年来,紫外交联免疫沉淀结合高通量测序(UV cross-linking immunoprecipitation followed by high-throughput sequencing, CLIP-seq)成为鉴定RNA结合蛋白(RNA-binding proteins, RBP)的靶标序列和结合位点的新技术,为研究RNA结合蛋白功能、解析其分子机制提供了强有力的工具.尽管国际上已有应用CLIP技术的报道,但是实验方法周期长、技术性强,尤其是后续的数据处理和生物信息学分析令没有计算机基础和专职生物信息分析人员的实验室望而却步.基于2016年Van Nostrand等人优化的CLIP方法,本团队建立并完成了多个RBP在组织和细胞中的CLIP测序及数据的生物信息学分析流程,并验证了其可行性.本研究整合了多家实验室已公开发表的分析软件和脚本,对人前列腺癌DU145细胞系中的PUMILIO1(PUM1)蛋白CLIP-seq数据进行分析,总结出对于蛋白功能分析更有效的命令和参数,并建立了完整的生物信息学分析流程.运用该流程寻找PUM1蛋白在人前列腺癌发展中的潜在机制,本团队识别出PUM1在DU145细胞系中的1189个靶标,并发现PUM1主要结合其靶标mRNA的3′非翻译区(untranslated region, UTR)和转录终止位点(transcription termination sites, TTS)区域, UGUAHAUA(H代表A/U/C)基序(motif)为PUM1蛋白识别的特征性序列. PUM1可能通过结合靶标mRNA的3′UTR对靶标进行转录后调控,参与癌细胞的生长、分化等过程以及相关的癌症通路中.本团队还发现, PUM1在人前列腺癌细胞系中能够与其他物种或组织中类似的靶标结合,并且结合方式高度一致,这与该家族蛋白在RNA结合功能域和功能上的高度保守性相符合.因此,本文报道的技术方法和生物信息学分析流程可以为有兴趣开展RBP的靶标鉴定的研究人员提供一个一站式的方法学服务平台,也有助于推动转录后调控在疾病和发育中的机制研究和RBP的RNA调控等新兴领域的发展.