摘要
本发明公开了一种基于多组学与临床数据的统计分析方法、系统和存储介质,其中方法包括以下步骤:读取CSV数据;对所述CSV数据中的缺失值进行填补,对所述CSV数据行特征缩放,使不同量纲的特征处于同一数值量级;采用预设方法对所述CSV数据中的单因素和多因素进行特征筛选;对进行特征筛选后的所述CSV数据进行聚类,获得分子亚型的分类;根据所述分子亚型的分类进行生存分析,获得生存分析结果。本发明通过对数据预处理、特征筛选、将筛选后的特征进行聚类、将聚类后的结果作为数据的真实标签进行生存分析,实现一个完备的多组学数据融合流程,从而实现肿瘤患者全面的分子分型,可广泛应用于生物信息学的多组学信息领域。
- 单位