摘要

目的 :为了提高数据挖掘的工作效率,保证数据挖掘出的知识或结论的准确性,提出基于Apriori算法的中医数据预处理方法。方法:通过分析数据预处理在数据挖掘中的重要地位、中医数据的特点以及Apriori算法对挖掘数据的要求,结合实例创建多个函数,从术语规范化、清理不合格数据、药方数据结构化、数据有序化等方面阐述了数据预处理方法。结果:构造的新函数清晰明确、便于调用,预处理过的数据大大提高了中医数据的挖掘效率。结论:基于Apriori算法的中医数据预处理方法简单易操作,从很大程度上解决了中医数据挖掘的先行问题。