摘要
现有的空间关键字查询方法通常根据查询关键字在空间对象文本信息中的出现频率进行文本相关度评估,没有考虑用户对不同查询关键字的偏好程度,并且也没有考虑语义相关性.为解决上述问题,本文提出一种基于用户相关反馈的空间关键字个性化语义查询方法.该方法分为离线处理和在线处理两个阶段,在离线处理阶段,采用Gibbs算法估计空间对象文本信息的主题概率分布,进而利用LDA模型对空间数据集进行语义扩展.在线查询处理阶段,对于用户的初始查询条件,首先利用IR-tree混合索引结构从扩展后的空间数据库中获得候选查询结果;然后,用户根据个人偏好在候选集中明确标注出相关的查询结果(即相关反馈),根据用户的反馈信息,采用Rocchio算法对用户初始查询条件进行更新,使得新的查询条件更贴近用户实际需求和偏好;利用更新后的查询条件再进行检索,从而得到新的候选集,重复执行反馈过程,直到查询结果令用户满意为止.实验结果表明,本文提出的基于用户相关反馈的空间关键字语义查询方法可以有效捕获用户隐式偏好并体现语义相关性,在一定程度上提高了空间关键字查询结果的个性化程度和准确率.
- 单位