摘要

[目的/意义]对非物质文化遗产(以下简称非遗)文本展开属性抽取研究,有利于非遗的知识图谱建设和非遗文化传播。[方法/过程]首先,基于非遗属性表,借助远程监督方法,构建大规模非遗文本属性标注语料。其次,基于深度学习方法构建CNN-BiLSTM-Att-CRF模型,对标注的非遗属性语料库中的属性值进行抽取,并同相关基线模型进行比较。[结果/结论]通过对标注语料库进行抽样检测,发现基于远程监督的非遗属性抽取标注语料库质量较高;本文提出的模型在多个非遗属性中属性抽取表现最优,同时平均的非遗属性抽取性能最佳。

全文