摘要
基于深度学习的特征抽取是目前数据降维问题研究的热点,堆叠自编码器是一种较为常用的模型。然而堆叠自编码器模型仅简单学习样本特征,无法对混有噪声的数据进行出色的特征表达。面向微博情感分类,使用堆叠降噪自编码器进行特征抽取,解决样本数据含有噪声的特征抽取问题。同时为解决模型训练时间开销较大的问题,通过基于分布式内存的并行计算方法,提升堆叠降噪自编码器的训练效率。通过使用COAE评测数据集进行情感分类实验,分类准确率和召回率都有所提高。
-
单位中国联合网络通信有限公司