摘要

自然语言知识挖掘与分析处理是大数据与人工智能领域的研究热点,其中理解模糊语言概念是挖掘与分析处理自然语言知识的关键核心。语言变量中的模糊语言值是模糊语言概念的理论基础,模糊语言值由模糊语言值的名称(也称为模糊语言项)和论域上的模糊集构成,模糊语言项用来描述论域上的模糊集,论域上的模糊集用来表示模糊语言项的语义或含义。模糊数学中确定"模糊语言项与论域上模糊集之间描述与表示的关系"一直依赖于人的主观意愿,导致模糊语言值不是一个明晰的概念,即模糊语言项与论域上模糊集之间的对应关系无法相互明确确定。文章分析了模糊语言项的自然语言特性以及"模糊语言项描述论域上模糊集"的本质与关键,提出了模糊语言项集在论域上的标签映射及模糊语言项在论域上的标签表示,构建了模糊语言项与论域上对象之间的关联关系;基于模糊语言项在论域上的标签表示,提出了模糊语言项描述论域上模糊集的信任度,据此给出了模糊语言项语义的确定方法,构建模糊语言项与论域上模糊集之间的相互对应关系,使模糊语言值成为一个明晰的概念,模糊语言项与其语义共同形成了一种新的模糊语言值表示模型。文章将新的模糊语言值表示模型与已有基于论域上模糊集的模糊语言值计算模型和符号化的模糊语言值计算模型进行了比较分析,结果表明,新的模糊语言值表示模型改进或克服了已有模糊语言值计算模型的不足,是解决大数据环境下混合语言决策问题的可选有效工具,明晰的模糊语言值可广泛应用于自然语言知识挖掘与分析处理中。