摘要

研究互联网搜索结果的最优多样性问题.给定用户搜索关键词较少,以及关键词本身的多义性,同时由于搜索系统一次呈现结果存在数量上的限制,系统常不能准确定位用户的真实搜索需求.为了最大化覆盖用户的搜索需求,搜索系统显示的结果不仅需要最大化同关键词的相关性,而且需要最大化结果之间的差异性.考虑了最大和搜索结果多样性问题,给出了贪婪算法,并针对实际中的差异性度量常常不满足三角不等式的情况下,分析证明了该贪婪算法具有的近似性能比.结果表明贪婪算法具有很好的理论近似性能.