摘要
关系抽取是指从文本中提取出两个实体以及实体之间的关系,构成一个三元组。对企业文本进行关系抽取,提取出结构化信息,有助于构建企业知识图谱。通过远程监督的方式获得大量企业文本。根据企业文本语法信息复杂的特点,通过Transformer中的多头自注意力结构和BLSTM来提取句子的语义信息,并有效地利用了实体的信息。为了解决远程监督的噪声问题,引入了关系嵌入来作为关系特征表示,得到每个句子与关系的联系程度。实验表明,该方法与其它经典方法相比,F值有比较大的提高。
-
单位上海大学; 通信与信息工程学院