摘要

对数据进行分类处理是当前的研究热点,采用传统机器学习算法对英语文本进行分类有文本特征不明显、训练周期长、词序丢失等诸多缺点。针对传统机器学习算法的不足,文中对Word2vec算法和TF-IDF算法进行融合,生成改进的TF-Word算法。同时应用卷积神经网络组成混合神经网络模型实现文本分类,该方法可以有效提高传统文本分类方法的精度。实验表明,文中所构建算法模型的F1值相比于传统机器学习算法均有12%以上的提升,证明所提出的基于融合句法特征的自然语言处理方法,对英语长句的翻译质量有一定程度的提升。