摘要

随着信息技术的快速发展,每天都有数以万计的图像产生,如何从中挖掘重要的图像信息是当前研究的热点问题之一,对此提出了一种关于视觉特征与CapsNet的图像大数据分类方法。为了解决大量图像数据的计算复杂度过高,以及灰度颜色直方图中没有对图像位置的问题,将图像灰度进行压缩,并采用共生矩阵和分形维数对视觉特征进行提取。采用胶囊网络中神经元的输出来表达图像中所包含的各种属性信息,为了更新胶囊网络的耦合系数,通过动态路由算法表示胶囊与子胶囊间的关系,在训练和测试中对动态路由不断进行计算得出胶囊网络的输出。把图像大数据分类算法部署到云计算节点上,采用批量更新的数据模型,将图像的训练集划分为众多数据块进行Map并行训练,利用训练样本向前、后传播得出权值梯度,并采用Reduce计算出所有训练样本权值梯度的平均值,同时对样本权值进行更新。实验结果表明,提出的方法可以有效地防止图像过拟合现象发生,图像分类的准确率和效率均有明显地提高,在图像大数据分类方面表现出显著的性能优势。