摘要
文章解决了人文学科中人工智能研究中的一个重要挑战,该挑战阻碍了有监督方法的进展。它介绍了一种从较少的数据集中创建测试集的新方法。这种方法基于“远程监督”,并将允许通过包含有监督学习的新方法来改进数字人文研究中的计算建模。首先使用循环神经网络,生成了一个训练语料库,并能够训练一个高度准确的模型,该模型在质和量上改进了基线模型。其次,为了证明这一新方法,采用了一个基于现有人文馆藏的现实研究问题作为对象,即使用基于神经网络的情感分析来解读大屠杀记忆,并提出一种结合有监督和无监督情感分析的方法来分析美国大屠杀纪念馆的口述历史档案。最后,采用了三种先进的计算机语义方法,帮助解读神经网络的结果,并理解比如证词中围绕家庭记忆的复杂情绪。