基于点击数据的图像识别

吴炜晨; 许衍

doi:10.14022/j.issn1674-6236.2023.08.021

摘要

随着细粒度图像分类研究的不断深入，用户点击数据逐渐被人们当成可靠的语义特征。由于用户点击数据集规模巨大且存在大量冗余，直接使用点击特征进行识别也存在诸多挑战。该文提出利用文本聚类降低文本空间并优化原始点击特征，从而建立精简的文本空间来表征图像，该方法能更好地合并语义相近的文本。在微软发布的Clickture-Dog大数据集上进行的大量实验表明，点击向量特征优于传统图像的视觉特征，图像识别任务中的准确率也更高；基于视觉相似度的传播算法能帮助提高点击特征的表征能力；在大规模文本聚类中，基于稀疏编码的聚类方式识别率达到了58.24%。

单位
中国电子科技集团公司第三十六研究所

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 14:11

基于点击数据的图像识别

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友