摘要
大范围视频中人的行为识别主要面临视频场景大、目标小、分辨率低、特征不明显等难点。充分利用视频图像中包含的图像特征和空-时上下文信息是解决这些难点问题的有效途径。隐条件随机场模型(HCRF)包含的隐变量层使其具有丰富的表示能力,同时自身还具有统一对观察图像和标记中的上下文信息建模的能力。因此将HCRF模型引入大范围视频中人的行为识别,重点研究通过l2和l1正则化训练方法得到的HCRF模型在解决过拟合和实现稀疏化时的性能。在此基础上,引入l1/2正则化训练方法,提出新的面向人的行为识别的HCRF模型,进一步提高模型的稀疏化和识别性能。利用典型的大范围视频数据库UT-TOWER对研究的方法进行了全面测试,实验结果验证了提出的l1/2正则化HCRF模型在提高识别正确率、模型稀疏性和计算效率方面的优势。
-
单位国防科学技术大学