摘要

在数字人文和图书情报领域相融共生的背景下[1],本文基于计算机技术对古今汉语词汇长度进行了探究。首先人工录入《春秋经传引得(上册)》《春秋经传引得(下册)》《三国志》《汉书》《后汉书》《史记》六本先秦时期古文献词头,利用C语言程序对六本文献进行半自动分词。借助Excel统计分析软件,得出古籍文献词汇长度的分布情况,从而分析古人的用词习惯。再基于对现代汉语文本《人民日报》词频、词汇长度分布的统计,分析出古文本与现代汉语文本词汇长度的不同之处,比较古人与现代人在撰写文献时的用词习惯。