您的位置：首页 > 运维架构

Top-push Video-based Person Re-identification

2017-05-11 17:10 323 查看

Top-push Video-based Person Re-identification
该篇文章讲的是行人重检测。现在街头有很多摄像头，如何在后面的视频中找出前面摄像视频中的人，就是行人重检测，比如警察看视频追踪犯罪分子。最简单的方法就是图像识别，提取特征，分类识别。可是在不同视频中寻人存在很多问题：遮挡，摄像头的角度不同，明暗变化，还有人的姿势不同，等等。使得通过静态帧图片进行检测效果太低。于是用动态视频，同时提取静态特征，如LBP，灰度直方图，和动态特征，如HOG3D。针对上面的问题：遮挡，摄像头的角度不同，明暗变化，还有人的姿势不同。由于视频中有了运动特征HOG3D，静态图像分类的那四个问题当然得到缓解。但是人体运动其实很相似。我们每个人走路大都差不多。那么带来的问题是，新特征空间下，类间距离变小，有时类间距离甚至小于某些样本点的类内距离。类和类之间变得模糊了。比如两个人都是大摇大摆走路，看起来都差不多嘛

看这个图，解决方法就是建立马氏距离

如果M是单位阵，就简化为欧式距离。通过调整优化M，使得样本点如图中的箭头移动。减少类内距离，增大类间距离。好，关键M如何优化？

这就是优化目标函数，要最小化。第一项是让类内距离最小化。第二项是让异常情况最小化，异常情况就是类内距离大于类间距离

这是优化算法，首先计算最小的类间距离，找到最可能出现异常的节点对。然后构造异常的情况(i,j,k),一个异常有三个点，第i，j,k点，其中ij来自同一类，k来自另一类。根据当前的Mt，ij的距离大于ik。于是调整M，用梯度下降方法消除异常，先计算梯度

就是目标函数对Mt求导数。这是第二项只限于异常情况的点(ijk)

然后梯度下降然后保持Mt的半正定性

不断循环，直到M收敛。

如何保持半正定？

将M进行特征分解，去掉小于零的特征值，然后再计算，得到M

over

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航