NEMTF:基于多维度文本特征的新闻网页信息提取方法

翁彬月; 秦永彬<sup>*</sup>; 黄瑞章; 任丽娜; 田悦霖

doi:10.19734/j.issn.1001-3695.2021.10.0407

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

NEMTF:基于多维度文本特征的新闻网页信息提取方法

作者：翁彬月; 秦永彬^*; 黄瑞章; 任丽娜; 田悦霖

来源：计算机应用研究, 2022, 39(04): 1043-1048.

DOI：10.19734/j.issn.1001-3695.2021.10.0407

摘要

目前主流的网页抽取方法存在两大问题：提取信息类型单一，难以获取多种类新闻信息；多依赖HTML标签，难以扩展至不同来源。为此提出一种基于多维度文本特征的新闻网页信息提取方法，利用新闻文本的写作特点划分出写作、语义和位置特征，通过多通道卷积神经网络融合为多维度文本特征，用于提取多种类新闻网页信息；仅需少量数据集训练，就可提取新来源的新闻网页信息。实验结果表明，该方法在性能上高于当前最优方法。

单位
贵州轻工职业技术学院; 贵州大学

全文

访问全文

收藏分享被引(4) 浏览

更新时间：2024-03-20 20:07

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号