基于Web的新闻信息抽取

朱永盛; 武港山

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于Web的新闻信息抽取

作者：朱永盛; 武港山

来源：计算机工程, 2006, (10): 74-76.

摘要

随着互联网的普及,信息技术的发展,形成了大量的新闻信息资源。从海量的新闻信息中抽取出有用的资源,是当前迫切需要解决的问题。该文在分析新闻网页结构的基础上,结合了基于DOM的结构抽取和基于文本特征模式抽取两种处理技术的优点,提出了基于Web新闻网页的半自动化抽取技术,自动下载了有用的Web页面,抽取了所需的新闻信息。最后,该文描述了一个面向奥运新闻的信息抽取系统,并给出了该系统的实验结果。

收藏分享被引浏览

更新时间：2020-06-16 18:56

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号