您的位置:首页 > 产品设计 > UI/UE

关于论文Silhouteete-based human action recognition using sequences of key poses

2015-11-03 17:00 429 查看
    最近读了一篇关于Alexandros Andre Chaaraoui的论文。题目如上。简单的写个关于此论文的阅读报告。

    本文的摘要如下:

    在本篇论文中,一个人体动作识别的方法被提出来,在这个方法中动作识别是基于人体剪影的轮廓点的而且动作时通过使对用多视角关键姿势的序列的学习来实现的。我们的共享是双重的,首先,我们的方法获得了使用了最先进技术的成功率而并没有在识别过程中对速度进行折中,因此对在线的识别和实时的场景展示了适用性。第二,在不同的执行人执行相同的动作的差异通过考虑形状(把测试数据移动到关键姿势的已知域)和速度(考虑了在分类上不一致的时间尺度)的变化予以解决。在公共可用的数据集Weizman,
MuHAVi,IXMAS数据集上返回高而且稳定的成功率。实现了,就我们所知到目前为止在MuHaVi新执行人测试的最佳成功率。

    本文的相关背景如下:

    当分析基于视觉的人体动作识别的方法的时候,分类可以就不同的语义级别进行。通常的标准是:(1)识别方法的结构布局(Aggarwal and Ryoo

, 2011);(2)学习方法,举个例子来说,基于范例的,基于模型的,其中我们发现了像HMM的产生式模型和像条件随机场的区别式模型;(3)用于分类的输入特征。

    我们能够获得图像的全局的表示和局部的表示。全局又可以称为稠密的,整体的。局部可以称为稀疏的。首先需要获取感兴趣区域因此人体需要从图像中进行检测。通常可以使用背景差分法和块检测技术。尽管这个预处理操作是一个缺点,但是它通常可以使用显著的降低图像的大小和内容的内在复杂度而被克服。Bobick和Davis2010提出了运动能量图和运动历史图,它可以在图像序列上编码图像中动作的时间烟花和空间位置。之后Weiland又对此进行了扩展提出了3DMHV.Bobick使用的是弧距来描述和分类而Weiland则使用圆柱坐标内的傅里叶分析。之后又有关于时空卷的方法提出。全局表示的主要缺陷是对于视角变化和部分遮挡缺乏抵抗能力;在这行环境下,全局表示遭受高的类间变化因此难于精确的学习。对于局部的表示,我们是通过使用图像的局部特征来进行检测,跟踪和识别的。图像可以被视为块或者点的集合。常见不同类型的显著点是通过基于形状和梯度的变化而获得的。诸如Harris,SUSAN,SIFT,
SURF.当考虑这些点位置和外观的时候,使用时空角点。尽管局部表示获得很好的识别率,更大的障碍存在于杂乱的环境中获得稳定和不变的特征。

    问题是什么?

    对于一些我们司空见惯的动作类型,要让计算机智能的识别这些动作,传统的方法诸如HMM需要进行大量的训练,这浪费大量的计算也使得使用这类识别的方法到实时的应用中变得非常困难。而关键姿势是图像中一组帧中能独特的区别一个动作。我们人类可以通过因此,使用关键姿势来建模一个动作是通过它在时间上最具有代表性的姿势实现的。这使得显著的监视基于范例的识别方法中问题规模成为了可能,同时也避免了冗余的和不必要的学习。基础思想是如果人能够通过几幅单个的图像来识别一个人正在做什么,为什么动作识别的方法不能仅仅保持关键的姿势呢?

    之前也有相关的研究者使用关键姿势来进行动作识别,这些人有

   Baysal et al. 2010; Cheema et al.2011; Eweiwi et al. 2011; Thurau et al.2007;这篇论文提出的方法与他们做出了比较并把结果呈现在第六部分。

   作者核心思想 ,创新点是在哪里?

   首先通过诸如背景差分获得人体的剪影,然后对人体剪影获得人体剪影的轮廓点P = (p1, p2, ...,pn),为了这个目的,我们需要获得轮廓提取技术。

   第二需要计算这个剪影轮廓点的质心。通过公式:

                                                

第三,计算距离信号DS = {d1, d2, ..., dn},从每个点到质心的距离。轮廓点需要始终按照相同的顺序被考虑。我们可以考虑从具有相同y轴的最左点顺时针开始进行计算。

    di = ||Cm - pi||, 任意的i从[1..n]

  最后为了获得尺度不变性,我们固定距离信号的长度,降采样特征尺度到一个固定的长度L,并把它的值归一化到单位和。

                                                                               

   这种类型的全局姿势表示具有显著的优点。尽管空间信息被详细的保持住了,比基于直方图和基于网格的表示,特征仍然具有低维的特征而且它的处理呈现了非常小的计算消耗。

    关于模型的学习

    现在优点饿了,等改天再写这个东西。

                              

      这个是大体的流程,关于具体的模型学习的东西,我并没有看太明白,先放在这儿吧。等改天我明白了以后再写在这里

             


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: