摘要

针对以分散形式存储学科信息导致资源难以统计的问题,基于计算机学科领域本体模型,融合多源异质的学科数据构建高校计算机学科知识图谱.首先通过网络爬虫等技术从相关网站和已有文档中获取领域知识,并基于BERT模型对数据进行清洗;然后利用Word2Vec判断人物研究方向之间的相似度,解决实体对齐问题;最终将数据导入Neo4j图数据库中实现知识的存储.根据构建好的知识图谱建立计算机学科可视化系统,能够提供信息检索与图形显示等多种功能,实现计算机学科基础数据的快捷查询和资源统计,以期促进后续的学科评估工作更加高效地完成.