摘要

由于知识网络与互联网应用的高速发展,RDF (Resource Description Framework, 资源描述框架)被广泛应用到关联数据的存储以及知识图谱的创建当中。基于自然语言处理的 RDF 问答系统是普通用户查询 RDF 数据的高效方法。在处理自然语言的过程中一般分为用户意图理解和查询验证两个阶段。而现存的研究方法是在用户意图理解阶段使用联合消歧的方式消除歧义,并且在查询验证阶段进行穷举验证,无效语句的运行延长了响应时间。本文基于 N-gram 模型建立语义概率模型,利用语义概率模型在用户意图理解阶段解决结构歧义与映射歧义的问题,且最终将查询意图转化为 top-k 个最优的查询语句进行查询并获取结果。通过与现存的方法在真实基准数据集中测试对比,本方法提高了在解决隐式关系问题方面的准确率,并且提升了查询性能。