摘要
当前分布式数据融合算法存在网络能耗高、数据融合后网络节点生存期较短等问题,提出基于估计机制的分布式大数据智能融合算法。对于连续不确定的数据流,通过滑动时间窗口细分数据。并在滑动时间窗口中依据网格法将数据划分至各网格中,于各网格中通过信息熵对正常数据进行筛选,采用局部异常因子对于剩余可能是异常的数据进行判断,根据判断结果将异常数据剔除。利用分布式网络参数以及数据特性和变化规律判断最优分簇规模。利用最优分簇结果对数据簇头的生成区域进行限定,将数据节点剩余能量估计当作簇头选取的依据,选择某区域内剩余能量较大的数据节点作为簇头。将在异常数据剔除结果中采集到的正常数据传输至簇头节点,完成分布式数据智能融合。实验表明,上述算法平均网络能耗为32nJ/bit,网络节点存活期较长。所提算法具有较强的可实践性,是一种可靠且科学的数据融合算法。
-
单位西南财经大学天府学院