摘要

针对Apriori算法多次扫描产生大量候选集,挖掘大数据库关联规则效率较低等问题,提出了一种融合布尔矩阵和项目特性的关联规则挖掘算法。算法将事务集看作行向量,项目集看作列向量,通过扫描事务数据集构建反映事务集和项目集关系的布尔矩阵,根据事务数据集布尔矩阵得到关联规则;同时将用户对某一商品的兴趣扩展为对商品特性的兴趣,并根据挖掘出特性间的置信度和用户预测评分对数据项目进行评分,然后采用Top-N推荐算法对关联规则进行推荐。实例分析推演了本算法关联挖掘的流程,仿真实验分析了本算法支持度阈值和置信度阈值与F1-Score值间的关系,确定了最优阈值。对比实验表明,本算法在关联规则推荐中的准确率、召回率和F1-Score值都均高于其他两种同类算法。

  • 单位
    安顺学院

全文