摘要

语言特征工程研究是实现汉语自动分析的关键所在,其中包括描述单词本身固有特点的"静态特征",以及描述具体句子中单词之间关联的"动态特征"。如何从静态特征自动推导出动态特征是计算机进行自动分析的一个难点。以大规模标注语料库为数据基础,通过对汉语自动分析过程中涉及到的复杂语言特征集进行系统的梳理,总结关于句法成分、语义角色以及词汇语义之间的制约规则,用以指导计算机实现从静态特征到动态特征的自动推导,从而为实现汉语的自动分析提供理论指导和实践支持。