基于边界框提取和语义一致性约束的文本-行人检索方法

王笛; 李渊博; 田玉敏; 王泉; 万波; 罗雪梅; 王义峰; 赵辉; 潘蓉

摘要

本发明公开了一种基于边界框提取和语义一致性约束的跨模态文本-行人检索方法,包括下述步骤：提取图像细粒度边界框；提取文本细粒度名词短语；生成训练集；构建细粒度聚合网络；训练细粒度聚合网络；使用文本对行人进行检索。本发明构建了基于边界框提取和语义一致性约束的文本-行人检索模型,利用现有的大型预训练模型(GLIP和CLIP)中的视觉语言知识,使用文本提示和GLIP精准提取识别行人身份的关键性局部特征,提高行人检索的准确度；使用CLIP提取视觉和语言特征,获取更为全面的语义表征；设计保持特征语义一致性的约束方法,减少噪声干扰,提高行人检索的稳定性。

单位
西安电子科技大学

收藏分享被引浏览

更新时间：2024-07-18 04:16

基于边界框提取和语义一致性约束的文本-行人检索方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友