融合语义特征与偏序关系的生物医学文档检索

何伟东; 杨志豪<sup>*</sup>; 王治政; 林鸿飞

doi:10.13451/j.sxu.ns.2023004

摘要

近年来，基于深层语义信息表征的pointwise重排序策略存在忽略被检索文档之间的偏序关系的问题，并且，患者病例查询的内容表征也需要满足生物医学领域的特定需求。针对以上问题，本文提出了一种基于生物医学预训练语言模型（BioBERT）的偏序文档检索方法，该方法基于BM25召回文档，对待排序文档依次使用pointwise与pairwise提取特征，其中，pointwise方法能够获取待排序文档的全局位置特征，而引入查询特征的pairwise方法可以学习待排序文档之间的相对偏序关系。在TREC 2019 Precision Medicine Track数据集上的实验表明，该方法在p@10指标中，相比于最优的基准方法提升了3.3%。

单位
大连理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 17:25

融合语义特征与偏序关系的生物医学文档检索

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友