摘要

针对大数据图像分类耗时长、实时性差等问题,利用云计算技术的优点,以获得理想的大数据图像分类结果为目标,提出一种基于Hadoop平台的大数据图像分类机制.首先收集大量的图像,构建图像数据库,并提取图像分类的有效特征;然后基于Hadoop平台,采用Map函数对大数据图像分类问题进行细分,用多节点并行、分布式地对子问题进行图像分类求解,得到相应的图像分类结果;最后利用Reduce函数对子问题的图像分类结果进行组合,并用VC++6.0编程实现大数据图像分类的仿真模拟测试.测试结果表明,该分类机制较好地克服了当前图像分类机制存在的弊端,大幅度缩短了图像分类的时间,分类速度可适应大数据图像分类的在线要求,且图像分类的整体效果明显优于当前其他图像分类机制.

全文