摘要
研究非遗藏族舞蹈艺术知识是优秀藏族舞蹈文化的传承需要,是中华民族艺术鉴赏保存的发展需求。文章使用python深层网络爬虫方法将国家非遗网站的西藏舞蹈数据爬取下来作为语料库;然后通过数据清洗、数据标准化、数据分类、数据审核进行了数据的预处理;之后使用jieba分词器获得了词性分类的结果,并且基于该分类结果进行了命名实体识别的实体抽取,同时采用基于规则的方法通过定义的模式抽取得到实体间的关系,以此获得了西藏非遗舞蹈知识图谱的三元组模型,并构建了实体-关系-实体的三元组;最后利用目前常用的两种可视化技术实现了西藏非遗舞蹈知识图谱可视化。从实现效果可见,通过数据驱动文档库D3.js建立的前端数据可视化图视觉效果较好,凭借NoSQL图数据库Neo4j实现的知识图谱可视化可以更方便地呈现西藏非遗舞蹈知识实体及实体间关系。
-
单位西藏民族大学