您的位置:首页 > 其它

常用多媒体文件格式压缩标准解析学习---图像表示与声音基本

2016-12-15 01:06 615 查看
多媒体数据表示理论

前言

图像是一类非常重要的多媒体数据,人类获取的信息70%来自视觉系统,所以在所有的多媒体数据中,图像提供的信息最多!但是,在图像数字化之后的数据量是非常大的,由于存储介质和传输的限制,我们必须对图像数据进行压缩!

而图像压缩是基于下面两个事实:

1.图像数据中有许多重复数据,可以使用数学方法表示这些重复数据

2.人眼的视觉系统对图像细节和颜色的辨认是有一定范围的,超过这个返回人眼就感受不出来了,所以可以吧超出的部分去掉

主要概念

1.分辨率

分辨率分为显示分辨率与图像分辨率

显示分辨率表示显示器能显示出的像素个数,是显示器的一个衡量指标。在我们显示器上调节的分辨率就是这个分辨率,比如现在常见的1280*720,表示显示器分成720行,每行含有1280个像素点,那么整个屏幕就含有1280*720=921600和像素点

图像分辨率是指组成一幅图像的像素密度的度量方法,图像大小固定,像素分辨率越高,图像包含的像素点就越多,图像就越逼真。dpi dots per inch在扫描彩色图像时,指定图像的分辨率,用每英寸多少个像素点表示 例如300dpi,8*10英寸的图像 有2400*3000个像素。

显示分辨率表示确定图像大小,图像分辨率表示图像像素浓度

2.像素深度

像素深度又叫色深,指定存储每个像素所用位数(bit)它决定每个像素可能有的颜色数,或者灰度级数(对灰度图像而言)

计算机常用的像素深度有1位,8位,24位,还有32位的,选用哪一种色深与应用领域有关

在用二进制数据表示像素时,往往还会加上属性位。RGB 5:5:5 用16位2个字节来表示一个像素数据,其中有一位就是属性位,就是最高位的bit,作用就是控制原图是否可见

32位表示一个像素时,RGB分别用8bit表示,剩下8bit为Alpha通道位,讲数值归一化后有一个预乘通道位的作用

3.真伪彩色

真彩色就是像素值直接表示RGB值

全彩色图像就是RGB8:8:8 因为这种数据量太大,一般都用RGB5:5:5

伪彩色的像素值是一个颜色地址,通过Color Look-Up Table CLUT 表来查找,这样产生的图像通常称为调色板图像,在调色板图像中有两个矩阵,一个是图形矩阵像素->CLUT表项入口地址,我理解为一个颜色索引,另一个矩阵为调色板矩阵,矩阵中每一个元素代表一个颜色

4.位图bit mapper image与矢量图vector based image

请记住:他们是计算机上图像的不同的表示方法,要深入理解这个表示方法一次,说明它们只是不同的显示图的一套理念

矢量图法用一系列的计算机指令来表示图像。

位图法是将一幅图分为许多个像素,每个像素用若干二进制位表示该像素的颜色,亮度和属性

矢量图侧重于绘制,创造,位图侧重于获取,去复制。

现实图像适用位图,人工图像例如地图适用矢量图

位图文件显示比矢量图快

5.灰度图像与彩色图像

灰度图像仅保留像素的亮度信息

彩色图像:

真彩色图像是24位像素表示,8位像素表示通常称为调色板图像

6.图像的颜色模型

发光的有源物体用RGB相加混色模型

不发光的无源物体用CMY相减混色模型

RGB相加混色模型与CMY相减混色模型有互补色,数值上互补, RGB111表示白,CMY000是白

HSL颜色模型 H色调 S饱和度 L亮度

windows定义了16种标准颜色,叫做16色VGA(Video Graphics Array)

7.彩色空间的线性变换

为了使用人的视觉特性,达到降低数据量的目的,

通常把RGB空间转换到其他空间去

目前采用的空间主要有三种YIQ,YUV,YCC

记录下RGB转换为YUV的转换关系

Y=0.299R+0.587G+0.114B

U=0.147R-0.289G+0.436B

V=0.615R-0.515G-0,.100B
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  音视频理论知识