摘要
当前超文本查询算法存在查询关键词和超文本用词不匹配的问题,导致查询精度低,效率低下。为此,提出一种新的基于关联规则的大型关系数据库超文本查询算法,对权重计算过程、关联规则算法和信息检索模型进行分析。利用起始查询结果的前几篇超文本对关联规则进行挖掘,选取包含起始查询项的关联规则建立规则数据库,挑选出和查询词相关度最高的几个词作为扩展词,和起始查询结合成新的查询后重新查询,通过K-means聚类算法对新的查询结果进行聚类解析,求出各篇超文本的最后相关度,按照降序顺序对相关度进行排列,输出查询结果。实验结果表明,所提算法精度和效率高。
- 单位