基于知识图谱的Web信息抽取系统

王辉; 郁波; 洪宇; 肖仰华

doi:10.3969/j.issn.1000-3428.2017.06.020

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于知识图谱的Web信息抽取系统

作者：王辉; 郁波; 洪宇; 肖仰华

来源：计算机工程, 2017, 43(06): 118-124.

DOI：10.3969/j.issn.1000-3428.2017.06.020

摘要

为实现多领域海量网页信息的有效抽取,以中文知识图谱CN-DBpedia为基础设计Web信息抽取系统。基于知识图谱对网页数据项进行自动标注,建立具有容错能力的包装器归纳框架,从包含错误的标注集中归纳学习出正确的包装器。实验结果表明,该系统的准确率和召回率均高于传统人工标注方法,可显著降低网页信息抽取过程中的人力成本,灵活运用于大规模、多领域的网页信息抽取任务。

单位
上海电力大学; 东华大学; 复旦大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-05-25 04:36

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号