DCT编码原理分析
2015-11-30 20:37
246 查看
二维DCT变换
2012年11月30日 分类:目录
写这篇文章的目的主要是为了给x264打好基础,x264用的是整数DCT变换,所以就先来说说DCT变换吧。
DCT(DiscreteCosineTransform),又叫离散余弦变换,它的第二种类型,经常用于信号和图像数据的压缩。经过DCT变换后的数据能量非常集中,一般只有左上角的数值是非零的,也就是能量都集中在离散余弦变换后的直流和低频部分,下面我会用matlab来演示整个过程。
1.一维DCT变换
我们首先来看看一维的DCT变换,这是二维的基础。一维的DCT变换共有8种,其中最实用的是第二种形式,公式如下:其中c(u)是加上去一个系数,为了能使DCT变换矩阵成为正交矩阵,在后面二维变换将看到他的作用。N是f(x)的总数。相比其他几种形式,他的运算还是比较简单的,因此也用的比较广。
2.二维DCT变换
二维DCT变换是在一维的基础上再进行一次DCT变换,这个比较好理解,直接看公式:这里我只讨论两个N相等的情况,也就是数据是方阵的形式,在实际应用中对不是方阵的数据都是先补齐再进行变换的。为了matlab仿真方便点,写成矩阵形式:
下面就用matlab来模拟一下,使用随机生成的4x4矩阵作为输入,程序如下:
clear;
clc;
X=round(rand(4)*100);%随机生成的数据
A=zeros(4);%变换矩阵
fori=0:3
forj=0:3
ifi==0
a=sqrt(1/4);
else
a=sqrt(2/4);
end
A(i+1,j+1)=a*cos(< e9eb spanclass="pln"style="color:rgb(0,0,0);">pi*(j+0.5)*i/4);
end
end
Y=A*X*A';%DCT变换
YY=dct2(X);%用matlab中的函数进行DCT变换
Y是使用上面的公式进行变换,YY是用matlab自带的dct2函数变换,结果是是:
X=
61195020
82266145
89908243
93595397
Y=
242.500032.161322.500033.2212
-61.82637.9246-10.734430.6881
-16.5000-14.754922.5000-6.8770
8.832216.6881-35.0610-6.9246
YY=
242.500032.161322.500033.2212
-61.82637.9246-10.734430.6881
-16.5000-14.754922.5000-6.8770
8.832216.6881-35.0610-6.9246
可以看出Y和YY的结果是一样的,这也进一步验证了上面的公式是正确的。由于X是我随机生成的,相关性很小,变换后的结果比较乱;如果是信号或图像这样相关性比较大的数据的话,数值会集中在左上角,右下角一般都是零,再使用“之”字型扫描得到数据流会包含很多连续的零,编码后数据量会非常小,这就是DCT变换带来的好处。
3.二维DCT反变换
DCT逆变换的公式如下:矩阵形式可以由正变换的公式直接推出来,因为在A中加了c(i)这个系数,使得A成为了正交矩阵,所以我们就可以这样做:
在用matlab来验证是否能反变换出原来的数据:
clear;
clc;
X=[
61195020
82266145
89908243
93595397];
A=zeros(4);
fori=0:3
forj=0:3
ifi==0
a=sqrt(1/4);
else
a=sqrt(2/4);
end
A(i+1,j+1)=a*cos(pi*(j+0.5)*i/4);
end
end
Y=A*X*A';
X1=A'*Y*A;
X使用的是上面正变换用的数据,运行后得到的X1为:
X1=
61.000019.000050.000020.0000
82.000026.000061.000045.0000
89.000090.000082.000043.0000
93.000059.000053.000097.0000
和X完全相等。在实际进行编码的时候,比如JPEG压缩的时候,只会对Y左上角的数据进行传输,所以解码出来的内容不会完全和原来的相同。
4.整数DCT变换
说道DCT就顺便提一下x264中的整数DCT变换,整数DCT变换是以DCT变换为基础的,为了减少计算量做的一些调整,下面我写一下整数DCT变换公式的大致推导过程:然后根据A是正交矩阵,把c=bd带入A中,使行向量为单位向量可以得到d=0.4142。令d=0.5,得到b*b=0.4,代入上面的式子中,把0.5提取出来放到右边的点乘中就得到了:
这样在对大括号部分进行计算时就都是加法和减法了,而且在精度上没有太大降低。在x264实际编码中,变换和量化是一起进行的,使得编码速度有了很大的提高。
转载:作者:wuyuan本文来自
相关文章推荐
- 21
- POJ 2096 Collecting Bugs [概率DP]
- 解决Xcode 7打包的应用与iOS 9的兼容问题
- iOS笔记17
- OFDM学习理解。
- 基于AFNetworking封装的网络请求工具类【转载】
- binary_serach_tree
- Java WebService 简单实例
- hdu3394--Railway(点的双连通分量)
- js实现函数重载
- iOS笔记16
- VIM 操作大全
- Android ListView批量选择(全选、反选、全不选)
- Android之开源框架NineOldAndroids动画库
- Android ListView批量选择(全选、反选、全不选)
- C学习体会
- ReactiveCocoa概念解释篇
- PHP魔术变量
- Android禁止锁屏,保持常亮方法
- OC学生成绩管理类(一 综述)