摘要
为了提高物联网通信大数据库的运行速度与处理效率,提出一种物联网通信大数据库半结构化数据识别方法,通过计算大数据库内数据的稀疏度系数与划分系数子空间,获得不同种类数据的关联特性,根据半结构化数据结构得到该其储存节点坐标,使用主成分分析和德尔菲算法融合集成转换为综合加权法,赋予识别半结构化数据得到指标权重,根据Tanimoto系数度量半1结构化数据的相似性并优化参数,实现识别大数据库内的半结构化数据。实验证明,通过所提识别方法处理后的数据重写率大幅度降低,且识别结果与真实结果差值较小,具有一定实际应用价值。
- 单位