摘要

在基于视频的图像集分类中,类内样本多样性问题是影响算法分类性能的一个主要原因.为了尝试解决该问题,提出了一种图像集分类算法,其目标体现在2个方面:(1)使得算法在时间效率上相较于协方差判别学习(CDL)等具有代表性的图像集分类算法有进一步的提升;(2)使得算法在分类精度上也仍然具有可比性.首先利用双向二维主成分分析对原始的协方差特征进行降维,使其变得更加紧凑.同时,为了抽取到更具判别性的特征信息,对每一个低维紧凑的协方差矩阵应用QR分解,使其变换成一个正交基矩阵和一个非奇异的上三角矩阵.考虑数据分布空间的黎曼流形特性,通过定义函数的方式使得上三角矩阵仍然分布在由对称正定(SPD)矩阵张成的SPD流形之上.此时,原始的样本空间就转化成了一个由正交基矩阵张成的Grassmann流形和一个特征分布更加紧凑的新的SPD流形.为了更好地整合这2种黎曼流形特征,首先利用Stein散度以及对数欧氏距离导出一个黎曼流形测地线距离度量;然后,利用该度量设计一个正定的核函数将上述特征映射到一个高维Hilbert核空间;最后,利用核判别分析算法进行判别子空间特征学习.文中算法在5个基准视频集YTC, Honda, ETH-80, MDSD以及AFEW上均取得了较好的分类结果,同时在计算效率上也优于CDL等对比算法,从而表明了其可行性和有效性.

  • 单位
    阜阳师范大学