摘要

由于分布式网络中存在多条链路,易产生数据堆积现象,影响数据分类捕获效果,现有方法不能对不同类型数据进行有效分类,为此提出分布式网络混合云数据分类捕获方法。给出混合云数据分类捕获总体架构,构建海量动态数据的传输链路模型,实现对数据的自适应调度,并采集不同链路中的数据。将线性树与浓密树方法结合,查询数据采集结果中的有效数据,形成训练集,降低数据分类捕获的复杂度。采用粒度计算方法对训练集中的信息进行切分,直到得到可接受的粒度,并从上至下搜索粒度值,将相似度较高的粒度进行聚类,从而实现对不同类型混合云数据的分类捕获。实验结果表明,该方法可以最大程度地抑制多链路对数据分类的影响,快速获取较为精准的数据分类结果。

  • 单位
    安徽工业经济职业技术学院