摘要

英国Lancaster大学语料库研究中心Paul Rayson等人开发的语料分析工具Wmatrix和其它语料分析工具一样具备生成、搭配、词表生成、主题词表等生成功能,其独特优越之处在于其内嵌的工具USAS(Semantic Annotation System),可自动为文本进行语义域(Semantic domain/field)赋码。原始语料为陈熙尔小学四年级至六年级(2004-2007年)43篇英语日记,共7515词。本研究尝试采用Wmatrix软件对语料从词频分布、语法、语义范畴三个维度标准进行分析。通过高频词检索、词性对比以及语义范畴的数据分析,一般过去时(was),"I","my"第一人称的高频使用,以及语义域E(情感)的6个次语义域的研究,窥探到一位高年级小学生如何叙述以自我为中心探索周围的人与事物,如何发现世界的美好与幽默。英语日记语料通过精准的数据分析,确定其简洁明了、幽默风趣的叙事风格。