摘要
本文以中亚跨境民族语言乌兹别克语为研究对象,搭建了包含形容词、名词、动词、程度及否定副词、否定词、转折及递进连接词、复杂短语在内的情感词典(共6 451条);设计了情感标注体系,对包含6 000条网络评论的语料库进行情感类别、表达手段和情感倾向等信息的人工标注。针对乌兹别克语普通句、副词修饰句、非动词否定句、双重否定句、转折句、递进句设计了情感分析算法,使用情感语料库和软件应用网评作为测试集开展了短文本情感分析实验。结果表明了情感词典、情感语料库和情感分析算法的有效性,但也暴露出情感词典在数据规模、覆盖面、精细度以及文本预加工手段方面的弱点和不足。
-
单位信息工程大学