摘要

目的 利用生物信息学及机器学习方法研究潜在的诊断绝经后骨质疏松症(postmenopausal osteoporosis, PMOP)的生物标志物,为诊断和治疗绝经后骨质疏松症提供新的思路。方法 使用GEO数据库下载绝经后骨质疏松症相关的芯片数据集GSE56815和数据集GSE7429,借助R软件Limma包进行数据的差异表达分析,通过R软件ClusterProfiler包对差异基因进行GO功能分析,借助STRING数据库构建调控网络中靶基因的蛋白互作网络,用SVM-RFE分析和LASSO回归模型筛选可能的标志物,利用CIBERSORT软件测定PMOP 22种免疫细胞组成,作关键基因与免疫细胞的相关性分析。结果 (1)数据差异表达分析共获得差异表达基因30个(9个上调,21个下调);(2)基于蛋白互作网络、LASSO分析、SVM-REF分析得到潜在基因S100A12;(3)ROC分析得到S100A12的表达具有诊断意义;(4)S100A12与PMOP中免疫细胞的相关性分析显示显示S100A12与免疫细胞T cells CD8、T cells CD4 memory resting、T cells CD4 memory activated、Plasma cells、Monocytes、Mast cells resting、Macrophages M0、Macrophages M1、Macrophages M2、Eosinophils、Dendritic cells resting等相关。结论 S100A12在PMOP中的差异表达具有诊断意义,且可能通过调节多个免疫细胞参与了PMOP的进展,其可能成为潜在的诊断绝经后骨质疏松症的生物学标志物及治疗靶点。