您的位置：首页 > 其它

DCT编码原理分析

2015-11-30 20:37 246 查看

二维DCT变换

2012年11月30日分类：学习笔记x264图像处理

目录
1.一维DCT变换
2.二维DCT变换
3.二维DCT反变换
4.整数DCT变换

写这篇文章的目的主要是为了给x264打好基础，x264用的是整数DCT变换，所以就先来说说DCT变换吧。

DCT(DiscreteCosineTransform)，又叫离散余弦变换，它的第二种类型，经常用于信号和图像数据的压缩。经过DCT变换后的数据能量非常集中，一般只有左上角的数值是非零的，也就是能量都集中在离散余弦变换后的直流和低频部分，下面我会用matlab来演示整个过程。

1.一维DCT变换

我们首先来看看一维的DCT变换，这是二维的基础。一维的DCT变换共有8种，其中最实用的是第二种形式，公式如下：

其中c(u)是加上去一个系数，为了能使DCT变换矩阵成为正交矩阵，在后面二维变换将看到他的作用。N是f(x)的总数。相比其他几种形式，他的运算还是比较简单的，因此也用的比较广。

2.二维DCT变换

二维DCT变换是在一维的基础上再进行一次DCT变换，这个比较好理解，直接看公式：

这里我只讨论两个N相等的情况，也就是数据是方阵的形式，在实际应用中对不是方阵的数据都是先补齐再进行变换的。为了matlab仿真方便点，写成矩阵形式：

下面就用matlab来模拟一下，使用随机生成的4x4矩阵作为输入，程序如下：

clear;

clc;

X=round(rand(4)*100);%随机生成的数据

A=zeros(4);%变换矩阵

fori=0:3

forj=0:3

ifi==0

a=sqrt(1/4);

else

a=sqrt(2/4);

end

A(i+1,j+1)=a*cos(<
e9eb
spanclass="pln"style="color:rgb(0,0,0);">pi*(j+0.5)*i/4);

end

end

Y=A*X*A';%DCT变换

YY=dct2(X);%用matlab中的函数进行DCT变换

Y是使用上面的公式进行变换，YY是用matlab自带的dct2函数变换，结果是是：

X=

61195020

82266145

89908243

93595397

Y=

242.500032.161322.500033.2212

-61.82637.9246-10.734430.6881

-16.5000-14.754922.5000-6.8770

8.832216.6881-35.0610-6.9246

YY=

242.500032.161322.500033.2212

-61.82637.9246-10.734430.6881

-16.5000-14.754922.5000-6.8770

8.832216.6881-35.0610-6.9246

可以看出Y和YY的结果是一样的，这也进一步验证了上面的公式是正确的。由于X是我随机生成的，相关性很小，变换后的结果比较乱；如果是信号或图像这样相关性比较大的数据的话，数值会集中在左上角，右下角一般都是零，再使用“之”字型扫描得到数据流会包含很多连续的零，编码后数据量会非常小，这就是DCT变换带来的好处。

3.二维DCT反变换

DCT逆变换的公式如下：

矩阵形式可以由正变换的公式直接推出来，因为在A中加了c(i)这个系数，使得A成为了正交矩阵，所以我们就可以这样做：

在用matlab来验证是否能反变换出原来的数据：

clear;

clc;

X=[

61195020

82266145

89908243

93595397];

A=zeros(4);

fori=0:3

forj=0:3

ifi==0

a=sqrt(1/4);

else

a=sqrt(2/4);

end

A(i+1,j+1)=a*cos(pi*(j+0.5)*i/4);

end

end

Y=A*X*A';

X1=A'*Y*A;

X使用的是上面正变换用的数据，运行后得到的X1为：

X1=

61.000019.000050.000020.0000

82.000026.000061.000045.0000

89.000090.000082.000043.0000

93.000059.000053.000097.0000

和X完全相等。在实际进行编码的时候，比如JPEG压缩的时候，只会对Y左上角的数据进行传输，所以解码出来的内容不会完全和原来的相同。

4.整数DCT变换

说道DCT就顺便提一下x264中的整数DCT变换，整数DCT变换是以DCT变换为基础的，为了减少计算量做的一些调整，下面我写一下整数DCT变换公式的大致推导过程：

然后根据A是正交矩阵，把c=bd带入A中，使行向量为单位向量可以得到d=0.4142。令d=0.5，得到b*b=0.4,代入上面的式子中，把0.5提取出来放到右边的点乘中就得到了：

这样在对大括号部分进行计算时就都是加法和减法了，而且在精度上没有太大降低。在x264实际编码中，变换和量化是一起进行的，使得编码速度有了很大的提高。

转载：作者：wuyuan本文来自Wuyuan'sBlog转载请注明，谢谢！文章地址:
http://wuyuans.com/2012/11/dct2

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航