摘要

本文将前列腺癌(Prostate Cancer,PCa)PC-3M-1E8细胞为标靶的核酸适配体序列翻译成氨基酸序列,计算氨基酸序列的分子参数,然后用这些分子参数建立核酸适配体亲和性的构-效关系模型。所用的候选核酸适配体序列是采用以细胞为靶标的指数富集配体系统进化(Cell-SELEX)技术筛选得到。模型训练集、测试集分别包含150、50条核酸序列,均由第3轮和11轮的候选核酸适配体组成。将第3轮的核酸序列类标签值设置为"1",代表低亲和性、低特异性的候选核酸适配序列;将第11轮筛选所得核酸序列类标签值设置为"2",代表高亲和性、高特异性候选核酸适配序列。基于二值分类问题的支持向量机分类(SVC)算法用于建模。SVC模型对训练集、测试集的预测准确度分别为87.3%、86%。另外,采用SVC模型对第5、7、9轮的序列也进行了预测。第3、5、7、9、11轮的高亲和性与高特异性核酸适配体的分率分别是0.23、0.41、0.61、0.64、0.87,预测结果符合SELEX筛选的适配体进行规律。

全文