摘要
文章利用2005—2009年这5年的《人民日报》和广播电视语料,重点考察了《汉语国际教育用音节汉字词汇等级划分》中的名词在大规模真实语料中的分布,通过设计统计时点连续分布的标准,成功过滤出过时的词汇,同时赋予《等级划分》中的名词以常用度等各种统计特征,提供词语孰先孰后的证据,最后也提供了大规模语料中教学新词语的备选。文章的研究可为《等级划分》的旧词过滤、新词扩充、词语的等级划分提供新依据。
-
单位北京大学; 北京语言大学