摘要
[目的]通过选取新分类特征,提高探索式与查找式意图自动识别的准确度。[方法]首先在AOL查询日志中选取1805个查询并对其进行人工标注;再在采莓模型的启示下分别从查询性质、搜索过程与信息来源三个层面提出了分类特征;并进一步比较了所提出特征在朴素贝叶斯、SVM、决策树、随机森林与神经网络五种分类模型中的分类效果;最后探讨了不同特征集合以及每个特征的分类效果。[结果]三种分类特征均能对探索式与查找式意图进行有效区分,其中查询性质相关特征的识别效果最佳;在五种分类模型中,采用神经网络算法的分类模型性能最佳(accuracy=0.8172,precision=0.8494,recall=0.7747,F1=0.8103)。[局限]第一,未在多个数据集中验证新提出的分类特征的性能;第二,未充分挖掘用户搜索行为以此来形成更多有效的分类特征;最后,由于人工标注存在高耗时、高人力成本等问题,使得最终应用于探索式/查找式意图识别的数据集有限。[结论]基于采莓模型启示下提出的特征能对探索式与查找式意图进行有效区分。
- 单位