摘要
介绍从中文专利摘要文本中抽取本体非分类关系的方法。首先对摘要文本的句法格式进行分析,按照"领域句式"、"特征句式"、"组件\工艺句式"和"效果句式"等构建子句抽取规则,再利用B、I、E和O等标注符号对子句中的术语进行人工标注,形成一定规模的训练语料集合,并利用CRFs实现训练语料的学习和新语料的抽取。最后给出应用实例并进行分析,验证方法的有效性。
- 单位
介绍从中文专利摘要文本中抽取本体非分类关系的方法。首先对摘要文本的句法格式进行分析,按照"领域句式"、"特征句式"、"组件\工艺句式"和"效果句式"等构建子句抽取规则,再利用B、I、E和O等标注符号对子句中的术语进行人工标注,形成一定规模的训练语料集合,并利用CRFs实现训练语料的学习和新语料的抽取。最后给出应用实例并进行分析,验证方法的有效性。