摘要

为提高不完整高维大数据的挖掘和检索能力,需要进行相似度度量研究,提出基于信息融合和模糊聚类的不完整高维大数据的相似度度量方法。构建不完整高维大数据的统计序列模型,采用大数据空间区域结构重组方法进行不完整高维大数据的相似度度量,提取不完整高维大数据的相似度的描述性统计特征量,结合量化回归分析方法,对提取的不完整高维大数据的关联特征集进行分类融合,构建基于模糊C均值聚类的不完整高维大数据信息融合模型,采用分段检验方法进行数据聚类中心寻优控制,实现不完整高维大数据的相似度度量与建模。仿真结果表明,采用该方法进行不完整高维大数据的相似度度量的准确性较好,特征匹配能力较强,提高了大数据的挖掘准确性和完整性。