摘要

随着内容人工智能分发系统的不断成熟,各社交新媒体平台采用千人千面的分发机制,满足了广大用户的线下兴趣阅读需求,让不同年龄和阶层的人群都成为自媒体文章的消费者。在经济效益的驱动下,越来越多的团队和个人在内容创作上的持续增加投入,产生了巨量的自媒体文章。对自媒体文章的文本分类研究,在舆情监控、广告投放、情感分析和商业推荐上都有很重要的意义。用经典的文本分类方案来做自媒体文章分类,存在很多挑战。因此有必要对自媒体文章分类进行针对性的探究,为自媒体文章提供更好的文本分类器以满足进一步的应用。该文比较了经典的贝叶斯算法和基于深度学习的CNN算法在自媒体文章分类上的性能差异,并引入了word2vec/FastText/Glove等词向量工具来优化CNN算法,通过实验验证了这种优化带来的效果优势。