您的位置:首页 > 运维架构

CamShift算法,OpenCV实现1--Back Projection

2012-08-23 18:55 513 查看
转载地址:http://blog.csdn.net/houdy/article/details/175739

CamShift算法,即"Continuously Apative Mean-Shift"算法,是一种运动跟踪算法。它主要通过视频图像中运动物体的颜色信息来达到跟踪的目的。我把这个算法分解成三个部分,便于理解:

1) Back Projection计算

2) Mean Shift算法

3) CamShift算法

在这里主要讨论Back Projection,在随后的文章中继续讨论后面两个算法。

Back Projection

计算Back Projection的步骤是这样的:

1. 计算被跟踪目标的色彩直方图。在各种色彩空间中,只有HSI空间(或与HSI类似的色彩空间)中的H分量可以表示颜色信息。所以在具体的计算过程中,首先将其他的色彩空间的值转化到HSI空间,然后会其中的H分量做1D直方图计算。

2. 根据获得的色彩直方图将原始图像转化成色彩概率分布图像,这个过程就被称作"Back Projection"。

在OpenCV中的直方图函数中,包含Back Projection的函数,函数原型是:

   void cvCalcBackProject(IplImage** img, CvArr** backproject, const CvHistogram* hist);

传递给这个函数的参数有三个:

1. IplImage** img:存放原始图像,输入。

2. CvArr** backproject:存放Back Projection结果,输出。

3. CvHistogram* hist:存放直方图,输入

下面就给出计算Back Projection的OpenCV代码。

1.准备一张只包含被跟踪目标的图片,将色彩空间转化到HSI空间,获得其中的H分量:

  IplImage* target=cvLoadImage("target.bmp",-1);  //装载图片

  IplImage* target_hsv=cvCreateImage( cvGetSize(target), IPL_DEPTH_8U, 3 );

  IplImage* target_hue=cvCreateImage( cvGetSize(target), IPL_DEPTH_8U, 3 );

  cvCvtColor(target,target_hsv,CV_BGR2HSV);       //转化到HSV空间

  cvSplit( target_hsv, target_hue, NULL, NULL, NULL );    //获得H分量

2.计算H分量的直方图,即1D直方图:

  IplImage* h_plane=cvCreateImage( cvGetSize(target_hsv),IPL_DEPTH_8U,1 );

  int hist_size[]={255};          //将H分量的值量化到[0,255]

  float* ranges[]={ {0,360} };    //H分量的取值范围是[0,360)

  CvHistogram* hist=cvCreateHist(1, hist_size, ranges, 1);

  cvCalcHist(&target_hue, hist, 0, NULL);

在这里需要考虑H分量的取值范围的问题,H分量的取值范围是[0,360),这个取值范围的值不能用一个byte来表示,为了能用一个byte表示,需要将H值做适当的量化处理,在这里我们将H分量的范围量化到[0,255].

4.计算Back Projection:

  IplImage* rawImage;

  //----------------------------------------------

  //get from video frame,unsigned byte,one channel

  //----------------------------------------------

  IplImage* result=cvCreateImage(cvGetSize(rawImage),IPL_DEPTH_8U,1);

  cvCalcBackProject(&rawImage,result,hist);

5.结果:result即为我们需要的.

算法分析

用在cvCalcBackProject处理中的模板是目标图像色调(HUE)的直方图,而直方图可以看作是一种概率分布图。在处理前,目标图像中的每一个象素的值描述的在这一点的颜色信息,而处理后,图像中每一个象素的值就变成了这个颜色信息出现在此处的可能性的一种离散化的度量,出现的可能性大,象素的值就大,反之则小。这样就为后面的匹配和跟踪提供了线索。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  算法 null byte 360 float video