摘要
医学图像检索是有效利用医学资源的基础,而医学图像的海量性和增量性为图像检索带来了新的挑战和要求;为了提高医学图像检索过程的效率,设计并实现一种基于Flink的海量医学图像检索系统;首先,系统通过Web应用作为用户操作入口,在后端搭建数据平台和业务集群;其次,系统通过HBase对医学图像数据进行分布式存储,利用深度卷积神经网络模型提取医学图像特征;然后,将所提取的医学图像特征数据进行乘积量化编码,并通过HBase进行存储;最后,通过基于Flink的内存计算对接Kafka进行实时图像检索,以及对批量导入图像的特征索引编码;系统在4个节点的服务器上部署分布式集群,使用真实医学图像数据集进行测试,通过在MapReduce和Spark两种不同技术模块下的对比实验表明本系统具有更好的检索效率表现。
- 单位