摘要

[目的 /意义]如何详尽地为受众挖掘文化遗产信息资源文本中蕴含的有关知识,成为了中华历史文化传承与推广中的重要问题。[方法 /过程]文章提出基于文本分类和主题模型的文化遗产信息资源知识发现框架:针对文本特征将文化遗产信息资源分类,使用关键词抽取方法获取信息资源内容有关的关键词,而后与知识图谱进行知识耦合,根据信息资源内容特征融合不同关键词抽取方法进行知识发现。文章以《清明上河图》信息资源文本为例,对知识发现方法进行实验。[结果 /结论]融合后的知识发现方法较单一方法在知识实体的发现数量以及实体关系的发现数量上均有提升。实验表明,依照信息资源内容特征的不同对其进行分类,在此基础上使用有针对性的关键词抽取方法,能够显著提高文化遗产文本知识发现效率。

全文