您的位置:首页 > 运维架构

Top-push Video-based Person Re-identification

2017-05-11 17:10 323 查看
 
Top-push Video-based Person Re-identification
该篇文章讲的是行人重检测。现在街头有很多摄像头,如何在后面的视频中找出前面摄像视频中的人,就是行人重检测,比如警察看视频追踪犯罪分子。最简单的方法就是图像识别,提取特征,分类识别。可是在不同视频中寻人存在很多问题:遮挡,摄像头的角度不同,明暗变化,还有人的姿势不同,等等。使得通过静态帧图片进行检测效果太低。于是用动态视频,同时提取静态特征,如LBP,灰度直方图,和动态特征,如HOG3D。针对上面的问题:遮挡,摄像头的角度不同,明暗变化,还有人的姿势不同。由于视频中有了运动特征HOG3D,静态图像分类的那四个问题当然得到缓解。但是人体运动其实很相似。我们每个人走路大都差不多。那么带来的问题是,新特征空间下,类间距离变小,有时类间距离甚至小于某些样本点的类内距离。类和类之间变得模糊了。比如两个人都是大摇大摆走路,看起来都差不多嘛

看这个图,解决方法就是建立马氏距离

如果M是单位阵,就简化为欧式距离。通过调整优化M,使得样本点如图中的箭头移动。减少类内距离,增大类间距离。好,关键M如何优化?

这就是优化目标函数,要最小化。第一项是让类内距离最小化。第二项是让异常情况最小化,异常情况就是类内距离大于类间距离

这是优化算法,首先计算最小的类间距离,找到最可能出现异常的节点对。然后构造异常的情况(i,j,k),一个异常有三个点,第i,j,k点,其中ij来自同一类,k来自另一类。根据当前的Mt,ij的距离大于ik。于是调整M,用梯度下降方法消除异常,先计算梯度

就是目标函数对Mt求导数。这是第二项只限于异常情况的点(ijk)

然后梯度下降然后保持Mt的半正定性

不断循环,直到M收敛。

如何保持半正定?

将M进行特征分解,去掉小于零的特征值,然后再计算,得到M

over

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐