摘要
多模态语篇分析发展到今天,面临的主要挑战是缺乏基于大量语料的实证研究,尤其是对平面媒体图文语篇的语料库研究。究其原因是图文语篇的多维特性导致多模态语料库的标注难度极大。而以修辞结构理论为重要基础的GeM模型是现有标注图文语料最系统的理论框架。本文以流程图的方式展示了GeM模型的应用步骤,以公共卫生海报语料库为例演示了修辞结构的XML标注,并介绍借助计算工具gem-tools实现自动生成修辞结构图、统计语料库数据、检索修辞关系等多模态语料库研究的基本方法,以期为国内学者进行多模态语料库建设与实证研究提供有效的理论与方法。