摘要

基于结构化数据的文本生成是自然语言生成领域重要的研究方向,其可以将传感器采集或计算机统计分析得到的结构化数据转化为适宜人阅读理解的自然语言文本,因此也成为了实现报告自动生成的重要技术.研究基于结构化数据到文本生成的模型为报告中的各类数值型数据生成分析性文本具有重要的实际应用价值.本文针对数值型数据的特点,提出了一种融合coarse-to-fine aligner选择机制和linked-based attention注意力机制的编码器-解码器文本生成模型,考虑了生成数值型数据的分析性文本过程中内容过度分散、无法突出描述的问题,另外也将数值型数据具体所属的域进行了关系建模,以提高生成文本中语序的正确性.实验结果表明,本文提出的融合两种机制的模型,比仅使用传统的基于内容的注意力机制和在前者基础上增加使用linked-based attention注意力机制的模型,以及基于GPT2的模型在指标上都具有更好的表现,证明了本文提出的模型在生成数值型数据的分析性文本任务中具有一定的效果.

全文