摘要
[目的]为了反制社交网络中的恶意信息、引导正确的舆论走向,提出了一种时序序列生成式对抗网络(T-SeqGAN),实现网评贴文自动生成。 [方法]通过将序列生成式对抗网络(SeqGAN)的生成器修改为Seq2Seq结构,分别以双向门控循环单元(BiGRU)和时序卷积神经网络(TCN)作为其编码器与解码器的骨架网络的方式,以提高生成贴文与真实网评贴文的语序结构,及语义特征的相似性;通过将SeqGAN的判别器,修改为TCN与注意力机制层相结合的模型的方式,以提高生成贴文的语句通顺度。 [结果]由实验得,利用T-SeqGAN生成的网评贴文,较之基线模型,其BLEU-2(0.79935)、BLEU-3(0.60396)、BLEU-4(0.47642)、KenLM(-27.67029)指标值为最高,PPL(0.75247)指标值为最低。 [局限] 生成贴文的词汇量及语言风格受制于已有的真实贴文,网评贴文自动生成方法的适用情景受限。 [结论]本文模型生成的网评贴文,具有更高的语序正确性、语法正确性,及与真实贴文具有更高的内容相似性,在社交网络中能够起到引导正确的舆论走向的作用。
-
单位北京信息科技大学; 教育学院; 北京开放大学