摘要

[目的/意义]语句层共被引的关系内容抽取与分类有助于揭示共被引论文间的主题关联。[方法/过程]文章从共被引主题的相似性和相关性出发,利用引用标注位置、作者、语义角色分析、句法分析等信息,将语句层共被引关系划分为同系列、同主题、发展关联、运用关联、并列关联,然后抽取相应的引用主题,构建双层三元组,实现共被引关系内容结构化表达,并在Neo4j图数据库中呈现。[结果/结论]实验采用Athar引用语料库;结果表明,本文研究方法可提高语句层共被引网络中关系的可读性和共被引论文的语义搜索、问答与推荐的效率。[局限]实验方法针对英文文献而设计,未来将在更多领域的英文语料上进行验证,并从名词性关系识别、术语选择等方面完善关系内容抽取与分类。

全文