摘要

为解决现有文档表示方法中不包含结构特征以及难以融入外部知识的问题,提出基于三元组的文档表示方法,并结合分布式向量语义表示。基于三元组的文档表示方法的另一个优势是可以非常方便地融入词向量特征,扩展三元组的语义表示。该方法在完全相同且不使用外部知识的实验设置下,能显著提升文本分类的性能;当词向量特征被利用后,文本分类性能增强了约0.8%;当融入自动抽取的外部背景三元组知识后,进一步带来了1.2%的性能提升。

全文