摘要

为准确抽取出细粒度非遗知识元,实现非遗知识的深度揭示与有效利用,提出了一种基于依存句法关系与主题差异的知识元抽取方法。该方法分为3个阶段:第一阶段根据统计特征识别出非遗术语;第二阶段根据非遗术语及其依存关系实现非遗知识元知识项的半自动抽取;第三阶段基于知识元的主题结构实现对冗余、噪声数据的过滤。该方法在非遗项目“摆手舞”文档集上进行了实验验证,表明了其可行性与有效性。