您的位置：首页 > 其它

常用多媒体文件格式压缩标准解析学习---图像表示与声音基本

2016-12-15 01:06 615 查看

多媒体数据表示理论

前言

图像是一类非常重要的多媒体数据，人类获取的信息70%来自视觉系统，所以在所有的多媒体数据中，图像提供的信息最多！但是，在图像数字化之后的数据量是非常大的，由于存储介质和传输的限制,我们必须对图像数据进行压缩！

而图像压缩是基于下面两个事实：

1.图像数据中有许多重复数据，可以使用数学方法表示这些重复数据

2.人眼的视觉系统对图像细节和颜色的辨认是有一定范围的，超过这个返回人眼就感受不出来了，所以可以吧超出的部分去掉

主要概念

1.分辨率

分辨率分为显示分辨率与图像分辨率

显示分辨率表示显示器能显示出的像素个数，是显示器的一个衡量指标。在我们显示器上调节的分辨率就是这个分辨率，比如现在常见的1280*720,表示显示器分成720行，每行含有1280个像素点，那么整个屏幕就含有1280*720=921600和像素点

图像分辨率是指组成一幅图像的像素密度的度量方法，图像大小固定，像素分辨率越高，图像包含的像素点就越多，图像就越逼真。dpi dots per inch在扫描彩色图像时，指定图像的分辨率，用每英寸多少个像素点表示例如300dpi，8*10英寸的图像有2400*3000个像素。

显示分辨率表示确定图像大小，图像分辨率表示图像像素浓度

2.像素深度

像素深度又叫色深，指定存储每个像素所用位数（bit）它决定每个像素可能有的颜色数，或者灰度级数(对灰度图像而言)

计算机常用的像素深度有1位，8位，24位，还有32位的，选用哪一种色深与应用领域有关

在用二进制数据表示像素时，往往还会加上属性位。RGB 5:5:5 用16位2个字节来表示一个像素数据，其中有一位就是属性位，就是最高位的bit，作用就是控制原图是否可见

32位表示一个像素时，RGB分别用8bit表示，剩下8bit为Alpha通道位，讲数值归一化后有一个预乘通道位的作用

3.真伪彩色

真彩色就是像素值直接表示RGB值

全彩色图像就是RGB8:8:8 因为这种数据量太大，一般都用RGB5:5:5

伪彩色的像素值是一个颜色地址，通过Color Look-Up Table CLUT 表来查找，这样产生的图像通常称为调色板图像，在调色板图像中有两个矩阵，一个是图形矩阵像素->CLUT表项入口地址，我理解为一个颜色索引，另一个矩阵为调色板矩阵，矩阵中每一个元素代表一个颜色

4.位图bit mapper image与矢量图vector based image

请记住：他们是计算机上图像的不同的表示方法，要深入理解这个表示方法一次，说明它们只是不同的显示图的一套理念

矢量图法用一系列的计算机指令来表示图像。

位图法是将一幅图分为许多个像素，每个像素用若干二进制位表示该像素的颜色，亮度和属性

矢量图侧重于绘制，创造，位图侧重于获取，去复制。

现实图像适用位图，人工图像例如地图适用矢量图

位图文件显示比矢量图快

5.灰度图像与彩色图像

灰度图像仅保留像素的亮度信息

彩色图像：

真彩色图像是24位像素表示，8位像素表示通常称为调色板图像

6.图像的颜色模型

发光的有源物体用RGB相加混色模型

不发光的无源物体用CMY相减混色模型

RGB相加混色模型与CMY相减混色模型有互补色，数值上互补， RGB111表示白，CMY000是白

HSL颜色模型 H色调 S饱和度 L亮度

windows定义了16种标准颜色，叫做16色VGA（Video Graphics Array）

7.彩色空间的线性变换

为了使用人的视觉特性，达到降低数据量的目的，

通常把RGB空间转换到其他空间去

目前采用的空间主要有三种YIQ,YUV,YCC

记录下RGB转换为YUV的转换关系

Y=0.299R+0.587G+0.114B

U=0.147R-0.289G+0.436B

V=0.615R-0.515G-0,.100B

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 音视频理论知识

相关文章推荐

新的分享

章节导航