摘要
提出了一种基于语义的跨语种信息检索中的文本比较及结果生成的算法,算法从语义入手,以形式化的语境单元框架结构来表示被检索的内容和检索请求,它从文本语义表示的三个方面:领域(静态范畴)、情景(动态范畴)、背景(参照)来对检索请求和被检索文档数据之间的语义相关度进行计算和排序,根据建立在语境单元框架上的语义符号间的匹配和生成机制来实现文本检索。与传统CLIR技术相比,它可以避免以语言空间中的词语作为检索的中间量而带来的语义模糊。实验证明,这一算法在解决基于语义的跨语种信息检索中的文本比较和结果生成上具有良好的处理能力。
-
单位中国科学院研究生院; 中国科学院声学研究所