摘要
[目的/意义]为方便民众和政府工作人员快速了解产业政策中的重要内容,本研究提出了一套自动化的产业政策知识图谱构建框架,用于梳理有关政策文本。[方法/过程]具体地,考虑到中文语料的缺乏,本研究利用基于句法分析的三元组抽取模型DSNF从产业政策中抽取政策实体和关系,并结合政策分析场景的特点对结果进行调整。由于原始三元组的表达较为分散,本研究利用三元组表示模型TransP和层次聚类模型BIRCH对原始三元组进行表示和归并。[局限]当前模型的性能尚需要在更大规模的数据集上进行检验,并与已有的方法进行比较。[结果/结论]本研究调用并调整了一系列模型用于解决产业政策知识图谱构建过程中的问题,并探索了基于知识图谱的政策分析模式,具有重要的理论和实践意义。
- 单位