摘要
针对用户未来行为意图快速识别的问题,探讨融合词性特征的Fasttext模型的有效性以及采用不同特征融合的识别准确率,为以后的研究提供一定的借鉴。利用词性特征标记具有时间含义的词。在此基础上,利用伪标签数据集,采用监督学习的方法,分别对词、词性以及对应的n-gram特征进行融合,探究不同特征组合的有效性和准确率。结果表明:融合词性的Fasttext模型可以提高时态意图识别准确率。通过分别对这几类特征融合,使用词、词的n-gram和词性特征的Fasttext模型分类的准确率最高,平均识别的准确率为81.2%。
-
单位中国刑事警察学院