摘要
为减少医疗数据挖掘的运算时间,提高医院数据整合效率,提出一个基于人工智能的医院数据整合方案。首先,在等价类转换Eclat算法的基础上,对其进行优化后得到R-Eclat算法;然后采用Spark RDD计算框架对优化算法进行并行化处理,以提升算法运行效率和计算速度。结果表明,对比于改进前的算法,改进后的R-Eclat算法运行时间更短,运行效率提升了20%。且相较于相同框架下的其他算法,在Mushroom数据集和T2016D300K数据集中,本算法的效率分别提升了23.1%和40%,由此证明本算法计算速度快,运行时间短,在Spark框架环境中可以获得较好的计算节点可拓展性,可实现医院海量数据的有效整合。
- 单位