适应性阈值优化的微博消息索引模式

作者:张莉; 李卫平
来源:计算机工程与设计, 2015, 36(05): 1362-1367.
DOI:10.16208/j.issn1000-7024.2015.05.047

摘要

为提高微博搜索的准确性,提出一种适应性的微博消息索引模式。将微博消息的转发和回复表示为树形结构并进行编码;提出一种基于内容和排名的索引模式,根据新消息的到来适应性地调整内存中的索引数据;为避免检索过程扫描整个微博数据集,提出一种Top-k阈值优化方法。Twitter数据实验结果表明,该模式降低了微博数据索引时的时间和空间开销,其性能随着时间的推移比较稳定。

全文