摘要

建筑施工安全事故分析是施工安全管理的重要环节,但分散在事故报告中的施工安全知识不能得到良好的复用,无法为施工安全管理提供充分的借鉴作用。知识图谱是结构化存储和复用知识的工具,可以用于事故案例快速检索、事故关联路径分析及统计分析等,从而更好地提高施工安全管理水平。命名实体识别(Named Entity Recognition, NER)是自动构建知识图谱的关键工作,其研究目前主要集中在医疗、金融、军事等领域,而在建筑施工安全领域,尚未见到NER的相关研究。根据建筑施工安全领域知识图谱的应用需求,定义了该领域5类概念,并明确了实体标注规范。采用改进的BERT(Bidirectional Encoder Representations from Transformers)预训练语言模型获取动态字向量,并采用双向长短期记忆-条件随机场(Bidirectional Long Short Term Memory-Conditional Random Field, BiLSTM-CRF)模型获取实体最优标签序列,提出了适用于建筑施工安全领域的NER模型。为了训练所提出模型并验证其实体识别效果,收集、整理和标注了1000篇施工安全事故报告作为实验语料。实验表明,相比于传统模型,所提出模型在建筑施工安全事故文本中具有更优的识别效果。