数据融合是一种利用多种检索系统优势来增强检索结果的技术,当候选成员系统数量过多时,融合结果性能并未随之提升。论文提出了一种基于变色龙层次聚类和序列前向的选择算法(RFS),该方法首先评估所有检索结果列表的相关性进行聚类,之后使用序列向前算法从不同的簇中挑选成员系统组用于数据融合,实验结果表明该算法能有效地筛选出较优的成员系统组,从而显著改善融合性能。