摘要

[目的]为了解决社交短文本碎片化、网络用语化的问题,利用社交网络中的异质关系实现对社交短文本的扩展。[方法]基于离散度度量社交信息中热点词的不均匀度,以此改进TF-IDF方法,获取初始特征;依据社交网络中的异质关系,构建包括三个子网络的两层异质社交网络,量化网络中用户的重要程度、文本相似度以及用户对社交文本的认可度,获得多源扩展源,实现对社交短文本的扩展。[结果]与已有社交短文本扩展方法相比,本文提出的方法在准确率、召回率、F1值上最高分别提升了约13%、19%、18%。[局限]未考虑间接关系对异质社交网络构建的影响。[结论]利用社交网络中的异质关系能获得更为合理的扩展源,有效扩展社交短文本。