基于信息论的汉语结构歧义自动消解研究

杨泉; 冯志伟

摘要

运用信息论的理论基础,给出了一个结构歧义的信息熵模型,用此模型分析了利用上下文信息对歧义结构进行消解的数学原理,建立了度量歧义结构歧义强度的定量方法和消歧策略的收益率模型。在基于规则的上下文排歧中,引进了基于统计的信息熵和互信息方法,把基于规则的理性主义方法与基于统计的经验主义方法巧妙地结合起来,分析了基于信息论的汉语结构歧义自动消解的最优策略法和上下文信息最优策略法中所依据的语言学知识及数学原理,并通过"v+n"结构的具体实例验证了提出的理论和方法的有效性。最终展示了语言学本体知识对于突破当前计算机消歧算法中瓶颈问题的重要作用。

单位
教育部语言文字应用研究所; 北京师范大学

收藏分享被引浏览

更新时间：2020-11-18 00:50

基于信息论的汉语结构歧义自动消解研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友