摘要
眼动数据记录了浏览者在浏览信息时的眼球轨迹,已有研究依据眼动数据度量阅读者在不同单词上的注意力强弱,并进一步将该特征加入微博关键词抽取模型中,从而提高抽取模型的性能。然而,目前的微博关键词抽取模型仅考虑通用领域眼动数据的总注视时长这一特征,尚未全面探究眼动数据对微博关键词抽取任务性能的影响。因此,本文将从眼动特征的选择、眼动特征与文本特征的组合这两个方面,全面考察通用语料的眼动数据对微博关键词抽取任务性能的影响。同时,由于眼动数据集与测试数据集在数据规模上相差较大,使得眼动特征过于稀疏,进而影响其作用的发挥,本文提出了一个眼动数据的扩充方案用于解决这一问题。
-
单位南京理工大学; 经济管理学院