视频编解码学习之四:视频处理及编码标准
2012-07-30 00:52
387 查看
第10章 视频处理
1.视频处理
在视频压缩前后,对视频图像质量增强的操作
视频编解码系统输出的图像主观质量不仅与压缩算法的性能有关,还受视频处理的影响
压缩之前对视频的处理称作预处理(Pre-processing)
压缩之后对视频的处理称作后处理(Post-processing)
2. 预处理
预处理的目的
为了减少原图像受到的损害,保持原图像的重要特征,使原图像能被高效的压缩
噪声污染
光照差
抖动
为了进行视频格式转换
去隔行
空间缩放
帧率转换
去噪声处理
去隔行(Deinterlace)
隔行扫描的视频图像在逐行扫描播放设备上播放会有隔行效应,降低了主观质量
3. 去隔行的方法
在单场内去隔行
用奇数(偶数)行插值出偶数(奇数)行
两场间去隔行
用两场的像素值(包括运动矢量信息)插值出一帧象素值
运动补偿方法
用前后向参考场的运动矢量信息,产生高质量的逐行帧
4. MPEG去隔行处理
MPEG-2后处理去隔行
5. 空间缩放
上采样(Up sample)方法
最近邻插值(Nearest-neighbor interpolation )
用原图像上每一个象素点值作为上采样图像上对应四个相邻象素点的值
会产生阶梯形状的效应
线性,双线性插值
P(x,y)=P(0,0)xy+P(1,0)(1-x)y+P(0,1)x(1-y)+P(1,1)(1-x)(1-y)
双三次插值(Bicubic interpolation)
用邻近的16个象素值插值当前象素
有更平滑的插值效果
下采样(Down sample)方法
缩小原始图像
5. 超分辨率
光流:象素的运动矢量
6. 帧率转换
3:2下拉
24帧/秒电影转换成60场/秒的电视视频
24/30=4/5
帧率下采样(跳帧)
帧率上采样
7. 后处理
后处理的目的是为了去除解码图像的各种效应,最大程度恢复损失的图像数据,提高解码图像的主观质量
量化方法使变换系数信息损失导致解码图像产生失真和块边界的不连续性
块效应(Block Artifact),振铃效应(Ringing Artifact)
失真(Distortion)
视频码流传输及解码导致的解码图像质量问题
跳帧(Frame Skip)
数据丢失(Data Loss)
8. 块效应
块效应产生原因
由于块被独立的处理
9. 去除块效应滤波
去除块效应滤波
环外滤波(Out loop filter):
滤波器在解码环路外,对显示缓冲区的图像进行滤波
非标准部分,只有解码器需要环外滤波
MPEG-2,MPEG-4 SP
环路滤波(In loop filter):
滤波器在解码环路内,滤波后的图像可以作为参考帧用于运动估计和补偿
标准的一部分,编解码器都需要环路滤波
AVS,H.264/AVC
10. 振铃效应
振铃效应产生原因
由于高频系数的量化严重
11. 数据丢失
数据丢失
12. H.264的环路滤波
滤波边界
适应性滤波
滤波强度
滤波决策阈值
滤波强度
滤波强度和量化参数QP有关
QP越高,量化程度越大,会产生更多的块效应,需要更强的滤波
QP越低,量化程度越小,会产生更少的块效应,用弱一些的滤波来防止边界变得模糊
根据滤波强度(Bs)的不同有两种滤波器
1≤ Bs≤3,基本滤波操作
Bs=4,强力滤波操作
边界滤波计算
截断操作参数C
Bs=4
块效应更明显
需要更剧烈的滤波,去除块效应
当满足以下条件对边界进行强滤波
强滤波时修改p0, p1, p2的像素值
弱滤波时只修改p0的像素值
第11章 视频编码标准
1.国际标准组织
ITU (International Telecommunications Union):国际电信联盟
ISO (International Standardization Organization):国际标准化组织
IEC (International Electrotechnical Commission):国际电工委员会
2. ITU
ITU-T (Telecommunication):电信标准化部门
ITU-R (Radiocommunication):无线电通信部门
ITU-D (Development):电信发展部门
VCEG (Video Coding Experts Group):视频编码专家组,属于ITU-T的Study Group 16/Question 6 (ITU-T SG16/Q.6)
3. VCEG
VCEG制订标准:
H.261:第一个视频编码标准,用于ISDN(px64Kbps)传输的视频会议,主要采用了基于整象素的运动补偿
H.262 (MPE-2):与MPEG合作制定的标准
H.263 (H.263+, H.263++):用于低码率的视频编码,主要用于PSDN低于54Kbps的视频会议和视频电话,采用了1/2象素运动补偿,考虑了数据损失和错误鲁棒性的需要
H.26L: H.264的前身标准
H.264 (MPEG-4 AVC):目前编码效率最高的标准
4. ISO/IEC
JPEG:ISO/IEC JTC1/SC29/WG1
MPEG:ISO/IEC JTC1/SC29/WG11
5. MPEG
MPEG制订标准:
MPEG-1 : H.261+半象素运动补偿+双向预测+条带结构编码,用于VCD,LAN视频(最大1.5Mbps)
MPE-2: MPEG-1+隔行视频编码+缩放功能,用于HDTV(18Mbps) 、SDTV (2-5Mbps)数字信号传输和DVD(6-8Mbps)存储,兼容MPEG-1标准
MPEG-4 ASP (P-2) :从H.263标准发展而来,基于视频对象平面编码,能在解码端控制视频对象,合成场景,并有音视频交互功能
MPEG-4 AVC (P-10)(H.264/AVC):与VECG合作制定的标准
6. 视频编码标准
国际标准组织及其制定的编码标准
7. 标准的应用
8. 其他标准组织
AVS (China Audio and Video Standard)
AVS1.0 :面向高清数字电视广播
AVS-M:面向移动视频
AVS-S:面向监控视频
SMPTE (The Society of Motion Picture and Television Engineers )
VC-1
9. 视频编码标准发展
10. MPEG-1
标准文档:ISO/IEC 11172-2
编码技术:基于H.261
B帧编码:B帧不能被其它帧参考
16x16 ½精度运动补偿
码率控制:宏块级的码率控制,调整宏块的量化参数控制码率
支持视频随机访问,回放,码流编辑,音视频同步
参考软件:Simulation Model 3(SM3)
11. MPEG-2
标准文档:ISO/IEC 13818-2
编码技术:基于MPEG-1
帧和场运动补偿
三种类型的缩放
空间缩放
时间缩放
SNR缩放
参考软件:Test Model 5 (TM5)
Profile:工具集
Level:参数限制
不同的应用使用不同的Profile和Level的组合
12. H.263系列
H.263编码技术:基于H.261
半象素精度运动补偿
可选的数据流层次结构
四种高效编码模式
D选项—无限制的运动矢量模式
E选项—基于语法的算术编码
F选项—高级预测模式,OBMC
G选项—PB帧模式
支持更多的视频图像分辨率
参考软件TMN2.0(Test Model Near-term 2.0)
H.263+编码技术:基于H.263
允许自定义视频图像格式
增加了12个选项提高压缩效率
I选项—高级的帧内预测模式
J选项—去块效应滤波
K选项—条带结构模式
L选项—补充增强信息,用于解码器的显示相关的信息
M选项—增强的PB帧模式
N选项—参考帧选择
O选项—分级,时间分级,空间分级,SNR分级
P选项—参考帧重采样
Q选项—减少的分辨率更新
R选项—独立的片段解码
S选项—可替代的inter-VLC
T选项—改进的量化
H.263++编码技术:基于H.263+
增加了三个选项,增强抗误码能力
U选项—增强型参考帧选择
V选项—数据分区条带,变换量化系数和运动矢量数据分离
W选项—增加的补充增强信息,包括定点IDCT的选项,图像信息,信息类型,重复的图像头,交替场指示,稀疏参考帧识别
13. MPEG-4
标准文档:ISO/IEC 14496-2
编码技术:基于H.263
增加了基于对象的编码和操作
形状分割编码
缩放的静态纹理小波变换
网格动画编码
人脸动画编码
内容合成,半合成编码
10比特,12比特深度采样
参考软件VM7(Verification Model 7
基于对象编码
场景被分成多个对象
每个对象用形状,运动和纹理特征描述
Video Object Plane(VOP)
Sprite编码
在序列开始编码整个视频背景和仿射映射,通过仿射映射将部分背景内容放到解码图像上显示
网格(Mesh)动画编码
对象可由初始的网格和节点的运动矢量描述
Profile
14. H.264/AVC
标准文档:ISO/IEC 14496-10(ITU-T H.264)
前身为:H.26L(Long Range),基于MPEG-2/4
参考软件JM(Joint Model)
15. H.264编码结构
16. H.264-Intra编码
4个亮度16x16的模式
9个亮度4x4的模式
4个色度8x8的模式
编码复杂度高
不利于错误恢复
17. H.264-运动补偿
可变块运动补偿
¼象素精度亮度运动补偿
½像素滤波器(1, -5, 20, 20, -5, 1)
1/8象素精度色度运动补偿
色度采用双线性滤波
图像外运动矢量
多参考帧
每个宏块的四个8x8子块都可以使用不同的参考帧
18. H.264多参考帧
P帧
只参考一个list的参考帧,List0
B帧
参考两个list的参考帧,List0和List1
每个List最大可包含16个参考帧
List0:以前的参考帧缓冲
List1:将来的参考帧缓冲
19. H.274-加权预测
20. H.264-切换图像
SP/SI帧实现
码流切换
随机切入
错误恢复
也可以实现快进,快退
特点
对于不同的参考图像可以得到完全相同的重构图像
SP帧的编码效率低于P帧但高于I帧
SI帧的编码效率低于I帧
21. H.264-FMO
灵活宏块顺序(Flexible MB Order,FMO)
宏块有不同的组合构成条带
七种不同的宏块组合方式
FMO增强了解码的错误恢复能力
22. H.264-数据分区
上层的语法元素的丢失会严重影响压缩码流的解码
将码流按照重要程度分成三部分
A:头信息:包括宏块类型,运动矢量等
B:Intra系数信息
C:Inter系数信息
用不同的优先级传输不同重要程度的分区来实现错误恢复
23. H.264-ASO,RP
任意条带顺序(Arbitrary Slice Order,ASO)
条带之间独立解码
条带可以按任意顺序传输
丢失的条带可以被解码的条带恢复出来
冗余图像(Redundant Picture)
在码流里放入冗余的图像,如果图像数据丢失了,可以用冗余图像代替
24. H.264-视频编码层
网络独立的编码层
VCL层包含:
序列参数集:Sequence Parameter Set(SPS),存放序列头信息
图像参数集:Picture Parameter Set(PPS),存放图像头信息
条带以下数据
额外的增强信息(Supplemental Enhancement Information,SEI)
25. H.264-网络提取层
提取的VCL数据
适合于传输层的数据传输和媒介的存储
NAL单元为数据包和码流系统定义了一种通用的传输格式
NAL单元连接在一起构成了NAL流
面向码流传输的NAL单元
面向数据包传输的NAL单元
26. H.264-Profiles
Profile:码流语法子集
Fidelity Range Extensions
27. H.264-Levels
Level:参数限制
28. AVS vs. H.264
29. 性能比较
30. AVS会员
1.视频处理
在视频压缩前后,对视频图像质量增强的操作
视频编解码系统输出的图像主观质量不仅与压缩算法的性能有关,还受视频处理的影响
压缩之前对视频的处理称作预处理(Pre-processing)
压缩之后对视频的处理称作后处理(Post-processing)
2. 预处理
预处理的目的
为了减少原图像受到的损害,保持原图像的重要特征,使原图像能被高效的压缩
噪声污染
光照差
抖动
为了进行视频格式转换
去隔行
空间缩放
帧率转换
去噪声处理
去隔行(Deinterlace)
隔行扫描的视频图像在逐行扫描播放设备上播放会有隔行效应,降低了主观质量
3. 去隔行的方法
在单场内去隔行
用奇数(偶数)行插值出偶数(奇数)行
两场间去隔行
用两场的像素值(包括运动矢量信息)插值出一帧象素值
运动补偿方法
用前后向参考场的运动矢量信息,产生高质量的逐行帧
4. MPEG去隔行处理
MPEG-2后处理去隔行
5. 空间缩放
上采样(Up sample)方法
最近邻插值(Nearest-neighbor interpolation )
用原图像上每一个象素点值作为上采样图像上对应四个相邻象素点的值
会产生阶梯形状的效应
线性,双线性插值
P(x,y)=P(0,0)xy+P(1,0)(1-x)y+P(0,1)x(1-y)+P(1,1)(1-x)(1-y)
双三次插值(Bicubic interpolation)
用邻近的16个象素值插值当前象素
有更平滑的插值效果
下采样(Down sample)方法
缩小原始图像
5. 超分辨率
光流:象素的运动矢量
6. 帧率转换
3:2下拉
24帧/秒电影转换成60场/秒的电视视频
24/30=4/5
帧率下采样(跳帧)
帧率上采样
7. 后处理
后处理的目的是为了去除解码图像的各种效应,最大程度恢复损失的图像数据,提高解码图像的主观质量
量化方法使变换系数信息损失导致解码图像产生失真和块边界的不连续性
块效应(Block Artifact),振铃效应(Ringing Artifact)
失真(Distortion)
视频码流传输及解码导致的解码图像质量问题
跳帧(Frame Skip)
数据丢失(Data Loss)
8. 块效应
块效应产生原因
由于块被独立的处理
9. 去除块效应滤波
去除块效应滤波
环外滤波(Out loop filter):
滤波器在解码环路外,对显示缓冲区的图像进行滤波
非标准部分,只有解码器需要环外滤波
MPEG-2,MPEG-4 SP
环路滤波(In loop filter):
滤波器在解码环路内,滤波后的图像可以作为参考帧用于运动估计和补偿
标准的一部分,编解码器都需要环路滤波
AVS,H.264/AVC
10. 振铃效应
振铃效应产生原因
由于高频系数的量化严重
11. 数据丢失
数据丢失
12. H.264的环路滤波
滤波边界
适应性滤波
滤波强度
滤波决策阈值
滤波强度
滤波强度和量化参数QP有关
QP越高,量化程度越大,会产生更多的块效应,需要更强的滤波
QP越低,量化程度越小,会产生更少的块效应,用弱一些的滤波来防止边界变得模糊
根据滤波强度(Bs)的不同有两种滤波器
1≤ Bs≤3,基本滤波操作
Bs=4,强力滤波操作
边界滤波计算
截断操作参数C
Bs=4
块效应更明显
需要更剧烈的滤波,去除块效应
当满足以下条件对边界进行强滤波
强滤波时修改p0, p1, p2的像素值
弱滤波时只修改p0的像素值
第11章 视频编码标准
1.国际标准组织
ITU (International Telecommunications Union):国际电信联盟
ISO (International Standardization Organization):国际标准化组织
IEC (International Electrotechnical Commission):国际电工委员会
2. ITU
ITU-T (Telecommunication):电信标准化部门
ITU-R (Radiocommunication):无线电通信部门
ITU-D (Development):电信发展部门
VCEG (Video Coding Experts Group):视频编码专家组,属于ITU-T的Study Group 16/Question 6 (ITU-T SG16/Q.6)
3. VCEG
VCEG制订标准:
H.261:第一个视频编码标准,用于ISDN(px64Kbps)传输的视频会议,主要采用了基于整象素的运动补偿
H.262 (MPE-2):与MPEG合作制定的标准
H.263 (H.263+, H.263++):用于低码率的视频编码,主要用于PSDN低于54Kbps的视频会议和视频电话,采用了1/2象素运动补偿,考虑了数据损失和错误鲁棒性的需要
H.26L: H.264的前身标准
H.264 (MPEG-4 AVC):目前编码效率最高的标准
4. ISO/IEC
JPEG:ISO/IEC JTC1/SC29/WG1
MPEG:ISO/IEC JTC1/SC29/WG11
5. MPEG
MPEG制订标准:
MPEG-1 : H.261+半象素运动补偿+双向预测+条带结构编码,用于VCD,LAN视频(最大1.5Mbps)
MPE-2: MPEG-1+隔行视频编码+缩放功能,用于HDTV(18Mbps) 、SDTV (2-5Mbps)数字信号传输和DVD(6-8Mbps)存储,兼容MPEG-1标准
MPEG-4 ASP (P-2) :从H.263标准发展而来,基于视频对象平面编码,能在解码端控制视频对象,合成场景,并有音视频交互功能
MPEG-4 AVC (P-10)(H.264/AVC):与VECG合作制定的标准
6. 视频编码标准
国际标准组织及其制定的编码标准
7. 标准的应用
8. 其他标准组织
AVS (China Audio and Video Standard)
AVS1.0 :面向高清数字电视广播
AVS-M:面向移动视频
AVS-S:面向监控视频
SMPTE (The Society of Motion Picture and Television Engineers )
VC-1
9. 视频编码标准发展
10. MPEG-1
标准文档:ISO/IEC 11172-2
编码技术:基于H.261
B帧编码:B帧不能被其它帧参考
16x16 ½精度运动补偿
码率控制:宏块级的码率控制,调整宏块的量化参数控制码率
支持视频随机访问,回放,码流编辑,音视频同步
参考软件:Simulation Model 3(SM3)
11. MPEG-2
标准文档:ISO/IEC 13818-2
编码技术:基于MPEG-1
帧和场运动补偿
三种类型的缩放
空间缩放
时间缩放
SNR缩放
参考软件:Test Model 5 (TM5)
Profile:工具集
Level:参数限制
不同的应用使用不同的Profile和Level的组合
12. H.263系列
H.263编码技术:基于H.261
半象素精度运动补偿
可选的数据流层次结构
四种高效编码模式
D选项—无限制的运动矢量模式
E选项—基于语法的算术编码
F选项—高级预测模式,OBMC
G选项—PB帧模式
支持更多的视频图像分辨率
参考软件TMN2.0(Test Model Near-term 2.0)
H.263+编码技术:基于H.263
允许自定义视频图像格式
增加了12个选项提高压缩效率
I选项—高级的帧内预测模式
J选项—去块效应滤波
K选项—条带结构模式
L选项—补充增强信息,用于解码器的显示相关的信息
M选项—增强的PB帧模式
N选项—参考帧选择
O选项—分级,时间分级,空间分级,SNR分级
P选项—参考帧重采样
Q选项—减少的分辨率更新
R选项—独立的片段解码
S选项—可替代的inter-VLC
T选项—改进的量化
H.263++编码技术:基于H.263+
增加了三个选项,增强抗误码能力
U选项—增强型参考帧选择
V选项—数据分区条带,变换量化系数和运动矢量数据分离
W选项—增加的补充增强信息,包括定点IDCT的选项,图像信息,信息类型,重复的图像头,交替场指示,稀疏参考帧识别
13. MPEG-4
标准文档:ISO/IEC 14496-2
编码技术:基于H.263
增加了基于对象的编码和操作
形状分割编码
缩放的静态纹理小波变换
网格动画编码
人脸动画编码
内容合成,半合成编码
10比特,12比特深度采样
参考软件VM7(Verification Model 7
基于对象编码
场景被分成多个对象
每个对象用形状,运动和纹理特征描述
Video Object Plane(VOP)
Sprite编码
在序列开始编码整个视频背景和仿射映射,通过仿射映射将部分背景内容放到解码图像上显示
网格(Mesh)动画编码
对象可由初始的网格和节点的运动矢量描述
Profile
14. H.264/AVC
标准文档:ISO/IEC 14496-10(ITU-T H.264)
前身为:H.26L(Long Range),基于MPEG-2/4
参考软件JM(Joint Model)
15. H.264编码结构
16. H.264-Intra编码
4个亮度16x16的模式
9个亮度4x4的模式
4个色度8x8的模式
编码复杂度高
不利于错误恢复
17. H.264-运动补偿
可变块运动补偿
¼象素精度亮度运动补偿
½像素滤波器(1, -5, 20, 20, -5, 1)
1/8象素精度色度运动补偿
色度采用双线性滤波
图像外运动矢量
多参考帧
每个宏块的四个8x8子块都可以使用不同的参考帧
18. H.264多参考帧
P帧
只参考一个list的参考帧,List0
B帧
参考两个list的参考帧,List0和List1
每个List最大可包含16个参考帧
List0:以前的参考帧缓冲
List1:将来的参考帧缓冲
19. H.274-加权预测
20. H.264-切换图像
SP/SI帧实现
码流切换
随机切入
错误恢复
也可以实现快进,快退
特点
对于不同的参考图像可以得到完全相同的重构图像
SP帧的编码效率低于P帧但高于I帧
SI帧的编码效率低于I帧
21. H.264-FMO
灵活宏块顺序(Flexible MB Order,FMO)
宏块有不同的组合构成条带
七种不同的宏块组合方式
FMO增强了解码的错误恢复能力
22. H.264-数据分区
上层的语法元素的丢失会严重影响压缩码流的解码
将码流按照重要程度分成三部分
A:头信息:包括宏块类型,运动矢量等
B:Intra系数信息
C:Inter系数信息
用不同的优先级传输不同重要程度的分区来实现错误恢复
23. H.264-ASO,RP
任意条带顺序(Arbitrary Slice Order,ASO)
条带之间独立解码
条带可以按任意顺序传输
丢失的条带可以被解码的条带恢复出来
冗余图像(Redundant Picture)
在码流里放入冗余的图像,如果图像数据丢失了,可以用冗余图像代替
24. H.264-视频编码层
网络独立的编码层
VCL层包含:
序列参数集:Sequence Parameter Set(SPS),存放序列头信息
图像参数集:Picture Parameter Set(PPS),存放图像头信息
条带以下数据
额外的增强信息(Supplemental Enhancement Information,SEI)
25. H.264-网络提取层
提取的VCL数据
适合于传输层的数据传输和媒介的存储
NAL单元为数据包和码流系统定义了一种通用的传输格式
NAL单元连接在一起构成了NAL流
面向码流传输的NAL单元
面向数据包传输的NAL单元
26. H.264-Profiles
Profile:码流语法子集
Fidelity Range Extensions
27. H.264-Levels
Level:参数限制
28. AVS vs. H.264
29. 性能比较
30. AVS会员
相关文章推荐
- 视频编解码学习之四:视频处理及编码标准
- 视频编解码学习之四:视频处理及编码标准
- (转载)视频编解码学习之四:视频处理及编码标准
- 视频编解码学习之四:视频处理及编码标准
- 视频编解码学习之四:视频处理及编码标准
- 视频编解码学习之四:视频处理及编码标准
- 视频编解码学习之四:视频处理及编码标准
- IO学习(十)了解解码与编码,用转换流处理乱码问题
- 使用 ffmpeg 进行网络推流:拉流->解封装->解码->处理原始数据(音频、视频)->编码->编码->推流
- 视频编解码学习之---编码框架
- 学习视频编码、解码知识需要哪些前置知识?
- 四:视频处理及编码标准
- H.264再学习 -- 目前主流的几种数字视频压缩编解码标准(转载)
- HI3531视频编码解码处理芯片项目相关理解和整理
- 视频编码解码学习之二:编解码框架
- 视频编解码学习之二:视频编码基础、预测
- opencv学习系列:使用自定义类实现视频和帧处理的接口
- Open CV学习记录(十五)—读取视频,处理后保存
- H.263:视频编码和解码(Video Coding and Decoding - CODEC rk)
- VP9 vs H.265——下一代视频编码标准的王道之争