摘要
文本生成是自然语言处理的热门领域,随着信息收集能力的不断增长,人们收集到越来越多的结构化数据,如表格。如何解决信息过载问题,理解表格含义并描述表格内容是人工智能面临的重要问题,因此有了表格到文本生成任务。表格到文本生成是指语言模型输入表格数据后生成表格的对应文本描述。模型生成的文本描述应该语句流畅,充分表达表格信息且不能偏离表格事实。描述了表格到文本生成任务背景并做出了详细定义,分析了当前任务主要难点并介绍了主流研究方法。表格到文本生成共有两大问题:描述什么,如何描述。梳理了不同研究人员针对这两大问题所提出的解决方法,同时总结了所提出模型的特点、优势以及劣势。对比分析了这些优秀模型在主流数据集上的表现,同时根据模型类型进行归类,并进行横向比较分析。介绍了表格到文本生成领域较为通用的评价方法,总结了不同评价方法的特点、优势以及劣势。最后展望了表格到文本生成任务未来发展趋势。
- 单位