摘要

当前,诗歌生成模型大多数通过用户所提供的关键词来生成符合韵律规则和音调起伏的诗歌。由于关键词蕴含的语义信息较少,很难保证生成诗歌的质量,容易出现上下文主题偏移的现象。针对这一问题,本文提出了一种基于条件变分自编码器的生成模型,该模型能够在更加丰富的语义信息指导下,生成更符合关键字描述和用户满意度的诗歌。该模型通过采样人类创作的诗歌,引入额外和关键词相关的语义信息,有效估计条件变分自编码器的先验概率分布,生成更贴合真实分布的先验概率。由于该模型自动扩充了关键词信息,缩小了输入和输出语义信息的差距,缓解了以往模型中普遍存在的过翻译问题。实验结果证明我们的模型无论在自动评估还是人类评估方面相比于其他模型都有更好的效果,并成功减少了过翻译问题出现的频率,提高了生成诗歌的流畅性。通过变化采样的范围,成功实现了对生成诗歌写作风格的控制,进一步证明了本文提出算法的有效性。