基于层级特征和DPCNN的文本数据治理方法

丁行硕; 鞠通

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于层级特征和DPCNN的文本数据治理方法

作者：丁行硕; 鞠通

来源：青岛远洋船员职业学院学报, 2023, 44(03): 18-53.

摘要

大规模文本的数据划分是数据治理中的关键问题，而传统的中文文档建模方法容易忽视上下文语义关系和文档层级结构。针对以上问题提出一种基于层级特征和DPCNN的文本数据治理方法。该方法首先通过BERT模型抽取文本的层次特征信息，然后将结合全文信息的向量传入DPCNN模型中；经过金字塔型池化层后，最终通过全连接层进行数据划分。该方法能够有效提高特征稀疏文本数据的预测准确率。

单位
青岛远洋船员职业学院

收藏分享被引浏览

更新时间：2024-03-19 02:39

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号