摘要
文本分析领域内传统的分类模型大多基于情感词典和概率统计模型,没有同文本语义建立联系。隐马尔可夫模型(Hidden Markov Model,HMM)能够体现不同类别文档的语法和语义特征,在文本处理领域表现优异,因此逐渐取代传统分类模型,成为新的研究方向。该文采用不同情感类别的训练文本来构建HMM分类器,并通过自适应增强(Adaptive Boosting,AdaBoost)算法进一步提高HMM分类器的性能。实验结果表明,使用两者结合形成的Ada-HMM模型对评价类文本进行情感分类,分类准确率达到93.3%,优于传统情感分类模型。
- 单位