摘要

中文自动分词是中文信息处理的基础,交集型歧义字段的消解又是中文自动分词中的重点。本文将CRFs模型用于交集型歧义字段的歧义消解中。该算法将交集型歧义字段的消解任务由二值分类的问题转化为序列标注的问题,这样不仅能处理任意链长的交集型歧义字串,而且能够充分利用上下文环境的信息,在不同的上下文环境中对真歧义字串进行正确的切分。