摘要

随着论坛中的用户不断增多,论坛中积存了大量的信息资源,为了能从论坛中提取出有效的主题信息,提出了一种通过分析页面结构的定位论坛主题信息的方法。该方法利用所有跟帖所在的节点在结构上相似的特点,计算各个节点的相似度,并利用总结的启发式规则提取特征,最后定位得到主题信息。实验表明,该方法具有较高的通用性和准确性。