摘要

运用信息论的理论基础,给出了一个结构歧义的信息熵模型,用此模型分析了利用上下文信息对歧义结构进行消解的数学原理,建立了度量歧义结构歧义强度的定量方法和消歧策略的收益率模型。在基于规则的上下文排歧中,引进了基于统计的信息熵和互信息方法,把基于规则的理性主义方法与基于统计的经验主义方法巧妙地结合起来,分析了基于信息论的汉语结构歧义自动消解的最优策略法和上下文信息最优策略法中所依据的语言学知识及数学原理,并通过"v+n"结构的具体实例验证了提出的理论和方法的有效性。最终展示了语言学本体知识对于突破当前计算机消歧算法中瓶颈问题的重要作用。