摘要
随着社会生活网络化的日趋成熟,在很多研究和商业领域里都遇到了中文文本处理问题。不断深化的文本分类研究需要从文本的各个方面来解析文本信息,语义解析是文本挖掘的关键技术,语境识别可以应用在许多文本挖掘技术中,比如情感分析、舆情分析等。基于句法决策树、N-gram模型的特征要素提取方法和SVM分类器,提出一种语境分类模型,解决字词在不同语境下的多义性问题。该模型具有良好的泛化能力,在批量处理时具有很好的通用效果,能比较有效地解决文本挖掘中语境识别难题。
-
单位武汉邮电科学研究院; 烽火通信科技股份有限公司