摘要

随着数据挖掘应用的不断增加,高效用项集挖掘(HUIM)已成为近几十年来的一个关键问题。在传统的HUIM中,项目集的效用被定义为其项目实用程序的总和。由于较大项目集的效用通常大于较小项目集的效用,因此传统的HUIM算法倾向于查找一组大项目集。因此,这个定义并不是对效用的公平衡量。为了更好地评估每个项目集的效用,本文中采用高平均效用项集挖掘(HAUIM)的算法,它引入了平均效用度量,既考虑了项目集的长度,又考虑了效用,因此具有较好适用性。