考虑文本空间结构的单篇文本特征词排序方法

魏伟; 孟祥主; 郭崇慧<sup>*</sup>

doi:10.12011/1000-6788-2018-2222-11

摘要

特征选择是文本挖掘领域中重要的基础性工作,能够为后续文本挖掘任务的顺利实施提供良好的数据处理方法和技术支持,而特征词排序是特征选择的关键环节.结合文本统计信息和结构信息以及流形排序思想,提出了一种新的特征词排序方法.通过构造原始文本中潜在的能够反映文本语义和结构信息的条件共现度词网络作为特征词间的流形结构,并以特征词的词频统计信息作为特征词初始权重,结合流形排序思想以及图学习理论进行特征词间的相似性学习,进而实现对特征词重要性排序.分别在公共语料集和补充语料集上与其它多种特征词排序方法进行数值实验对比,实验结果验证了方法的有效性.该方法拓宽了流形排序思想和图学习理论在文本挖掘领域的应用,也给单篇文本特征词排序提供了新的方法和策略.

单位
大连理工大学; 郑州大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-05-24 15:32

考虑文本空间结构的单篇文本特征词排序方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友