[转]AVS-视频技术概述

conner 发表于 2006-3-29 00:07:54

虞露

　　AVS是中国自主制定的音视频编码技术标准。AVS工作组成立于2002年6月，当年8月开始了第一次的工作会议。经过7次AVS正式工作会议和3次视频组附加会议，经历一年半的时间，审议了182个提案，先后采纳了41项提案，2003年12月19日AVS视频部分终于定稿！当前，AVS视频主要面向高清晰度电视、高密度光存储媒体等应用中的视频压缩。

　　在2002年的最初几次会议中，视频组专家统一了以当前国际上最先进的MPEG-4 AVC/ H.264框架为起点，自主制定适合既定应用的中国标准，其中强调自主知识产权，同时充分考虑实现复杂度。

　　一、AVS-视频的核心技术

　　AVS-视频当中具有特征性的核心技术包括：8x8整数变换、量化、帧内预测、1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等。

　　1.变换量化

　　AVS的8x8变换与量化可以在16位处理器上无失配地实现，从而克服了MPEG-4 AVC/ H.264之前所有视频压缩编码国际标准中采用的8x8 DCT变换存在失配的固有问题。而MPEG-4 AVC/ H.264所采用的4x4整数变换在高分辨率的视频图像上的去相关性能不及8x8的变换有效。AVS采用了64级量化，可以完全适应不同的应用和业务对码率和质量的要求。在解决了16位实现的问题后，目前AVS所采用的8x8变换与量化方案，即适合于16位DSP或其他软件方式的快速实现，也适合于ASIC的优化实现。

　　2.帧内预测

　　AVS的帧内预测技术沿袭了MPEG-4 AVC/ H.264帧内预测的思路，用相邻块的像素预测当前块，采用代表空间域纹理方向的多种预测模式。但AVS亮度和色度帧内预测都是以8x8块为单位的。亮度块采用5种预测模式，色度块采用4种预测模式，而这4种模式中又有3种和亮度块的预测模式相同。在编码质量相当的前提下，AVS采用较少的预测模式，使方案更加简洁、实现的复杂度大为降低。

　　3.帧间预测

　　帧间运动补偿编码是混合编码技术框架中最重要的部分之一。AVS标准采用了16×16，16×8，8×16和8×8的块模式进行运动补偿，而去除了MPEG-4 AVC/ H.264标准中的8×4，4×8，4×4的块模式，目的是能更好地刻画物体运动，提高运动搜索的准确性。实验表明，对于高分辨率视频，AVS选用的块模式已经能足够精细地表达物体的运动。较少的块模式，能降低运动矢量和块模式传输的开销，从而提高压缩效率、降低编解码实现的复杂度。

　　AVS和MPEG-4 AVC/ H.264都采用了1/4像素精度的运动补偿技术。MPEG-4 AVC/ H.264采用6抽头滤波器进行半像素插值并采用双线性滤波器进行1/4像素插值。而AVS采用了不同的4抽头滤波器进行半像素插值和1/4像素插值，在不降低性能的情况下减少插值所需要的参考像素点，减小了数据存取带宽需求，这在高分辨率视频压缩应用中是非常有意义的。

　　在传统的视频编码标准（MPEG-x系列与H.26x系列）中，双向预测帧B帧都只有一个前向参考帧与一个后向参考帧，而前向预测帧P 帧则只有一个前向参考帧。而新近的MPEG-4 AVC/ H.264充分地利用图片之间的时域相关性，允许P帧和B帧有多个参考帧，最多可以有31个参考帧。多帧参考技术在提高压缩效率的同时也将极大地增加存储空间与数据存取的开销。AVS中P帧可以利用至多2帧的前向参考帧，而B帧采用前后各一个参考帧，P帧与B帧（包括后向参考帧）的参考帧数相同，其参考帧存储空间与数据存取的开销并不比传统视频编码的标准大，而恰恰是充分利用了必须预留的资源。

　　AVS的B帧的双向预测使用了直接模式(direct mode)、对称模式(symmetric mode)和跳过模式(skip mode)。使用对称模式时，码流只需要传送前向运动矢量，后向运动矢量可由前向运动矢量导出，从而节省后向运动矢量的编码开销。对于直接模式，当前块的前、后向运动矢量都是由后向参考图像相应位置块的运动矢量导出，无需传输运动矢量，因此也可以节省运动矢量的编码开销。跳过模式的运动矢量的导出方法和直接模式的相同，跳过模式编码的块其运动补偿的残差也均为零，即该模式下宏块只需要传输模式信号，而不需要传输运动矢量、补偿残差等附加信息。

　　4.熵编码

　　AVS熵编码采用自适应变长编码技术。

　　在AVS熵编码过程中，所有的语法元素和残差数据都是以指数哥伦布码的形式映射成二进制比特流。采用指数哥伦布码的优势在于：一方面，它的硬件复杂度比较低，可以根据闭合公式解析码字，无需查表；另一方面，它可以根据编码元素的概率分布灵活地确定以k阶指数哥伦布码编码，如果k选得恰当，则编码效率可以逼近信息熵。

　　对预测残差的块变换系数，经扫描形成（level、run）对串，level、run不是独立事件，而存在着很强的相关性，在AVS中level、run采用二维联合编码，并根据当前level、run的不同概率分布趋势，自适应改变指数哥伦布码的阶数。

　　二、AVS-视频目前的性能与应用

　　AVS-视频目前定义了一个档次（profile）即基准档次。该基准档次又分为4个级别(level)，分别对应高清晰度与标准清晰度应用。

　　与MPEG-4 AVC/ H.264的baseline profile相比，AVS-视频增加了B帧、interlace等技术，因此其压缩效率明显提高，而与MPEG-4 AVC/ H.264的main profile相比，又减少了CABAC等实现难度大的技术，从而增强了可实现性。

　　AVS-视频的主要特点是应用目标明确，技术有针对性。因此在高分辨率应用中，其压缩效率明显比现在在数字电视、光存储媒体中常用的MPEG-2视频提高一个层次。在压缩效率相当的前提下，又较MPEG-4 AVC/ H.264的 main profile的实现复杂度大为降低。

　　目前的AVS-视频技术可实现标准清晰度（CCIR 601或相当清晰度）、低清晰度（CIF、SIF）等不同格式视频的压缩，但针对此类应用的压缩效率还有待提高，这应当是AVS-视频下一步的工作重点。

　　
----《中国多媒体视讯》

页: [1]

中国Linux公社论坛's Archiver

[转]AVS-视频技术概述