摘要

在大数据时代,随着机器创作者越来越有创意,今后媒体上将会产生越来越多的机器创作者自动生产的内容。在复杂的新闻报道、文学作品、用户评论中有效识别人类作者的作品以及机器作者的作品非常重要。所以本文提出作者身份识别方法,通过深入观察和分析,发现机器作者在词汇特征、句法特征、语义特征和发布设备等4个方面存在显著差异,并对这4个维度的特征进行深入分析,进行特征选择,使用筛选出来的特征构建作者身份识别模型。

  • 单位
    大连外国语大学

全文