摘要
目前高速列车本体多采用人工构建的方法,这种方法存在成本高、效率低且缺乏灵活性的不足。针对这种问题,提出了一种高速列车本体半自动构建方法,先使用分词工具Jieba对高速列车领域文档进行分词、去除停用词等预处理,然后使用TF-IDF、C-value等算法进行概念抽取,再使用层次聚类及Dice测度等算法挖掘领域层次关系及非层次关系,最后使用protégé工具构建结构化的OWL本体并进行可视化管理。通过高速列车本体半自动构建实例,实现概念及语义关系的自动获取,验证该方法的有效性及可行性。
- 单位