摘要
不确定数据出现在越来越多的应用中,如WSN、RFID等领域,分析不确定数据能为用户决策提供重要参考,因此不确定数据的数据挖掘工作受到越来越多的关注。不确定数据库的概率频繁项集挖掘是不确定数据挖掘的一个重要研究内容,它是很多数据挖掘技术的基础,如关联规则和聚类分析等。但是,在不确定数据中挖掘到的概率频繁项集数量非常多,不利于分析和应用,为了解决该问题,笔者在不确定数据中挖掘最大概率频繁项集,以缩减挖掘到的模式数量。笔者分析了不确定数据中的最大概率频繁项集的特点,提出了在记录级不确定数据库中挖掘最大概率频繁项集的算法,并在不确定数据库中进行实验,实验结果验证了算法的性能。
-
单位辽宁对外经贸学院