摘要

基于字的分词方法已成为了目前自动分词的主流方法,对该方法所使用模型的优化和发展也层出不穷,但至今都没有较完备的理论支撑。本文将从语素位置和语素义入手,分析该方法的语言学理论基础。通过对《现代汉语词典》中51258个二三字词进行统计分析,发现语素位置在一定程度上影响着构词方式,而对高频语素"人"统计后发现词内语素义联系紧密,使语素组合成词成为可能。并且仅通过语素义的简单组合也可以初步推测出词义。语素位置和语素义作为构词的两大因素,为基于字的自动分词方法提供了语言学理论基础。