视频流可以在PC上实时压缩吗?

视频压缩技术

视频编码的基本原理

视频图像数据具有很强的相关性,也就是说,存在大量的冗余信息。其中,冗余信息可分为空间冗余信息和时间冗余信息。压缩技术就是去除数据中的冗余信息(去除数据之间的相关性)。压缩技术包括帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。

时域冗余信息

帧间编码技术可以去除时域中的冗余信息,它包括以下三个部分:

-运动补偿

运动补偿是通过前一幅局部图像对当前局部图像进行预测和补偿,是减少帧序列冗余信息的有效方法。

-运动表现

不同区域的图像需要使用不同的运动矢量来描述运动信息。运动矢量通过熵编码来压缩。

-运动估计

运动估计是一组从视频序列中提取运动信息的技术。

注意:常见的压缩标准都使用基于块的memc。

去空域冗余信息

主要使用帧间编码技术和熵编码技术:

-变换编码

帧内图像和预测的差分信号具有高空间冗余信息。变换编码将空间信号变换到另一个正交向量空间,这降低了它的相关性和数据冗余。

-量化编码

变换编码后,产生若干变换系数,这些系数被量化,使编码器的输出达到一定的比特率。这一过程导致精确度下降。

-熵编码

熵编码是无损编码。它进一步压缩变换和量化后获得的系数和运动信息。

视频编码的基本框架(图)

国际音视频压缩标准的发展历程

H.261

H.261标准是为ISDN设计的,主要用于实时编解码。压缩和解压缩信号时延不超过150ms,码率为px64kbps(p=1~30)。

H.261标准主要采用运动补偿帧间预测、DCT变换、自适应量化、熵编码等压缩技术。只有I帧和P帧,没有B帧,运动估计的精度也只是在像素级别。支持两种图像扫描格式:QCIF和CIF。

263

H.263标准是一种非常低比特率的图像编码国际标准。一方面是基于H.261,以混合编码为核心。它的基本原理框图和H.261非常相似,原始数据和码流组织也很相似。另一方面,H.263还吸收了MPEG等其他国际标准的一些有效合理的部分,如半像素精度运动估计、PB帧预测等,使其性能优于H.261。

H.263使用的比特率可以小于64Kb/s,传输比特率可以不固定(可变比特率)。H.263支持多种分辨率:SQCIF(128x96),QCIF,CIF,4CIF,16CIF。

与H.261和H.263相关的国际标准

与H.261相关的国际标准

H.320:窄带可视电话系统和终端设备;

H.221:视听电信业务中64~1 920Kb/s信道的帧结构;

H.230:视听系统的帧同步控制和指示信号;

H.242:一种视听终端系统,使用高达2MB/s的数字频道..

H.263相关的国际标准

H.324:甚低比特率多媒体通信终端设备;

H.223:极低比特率多媒体通信复合协议;

H.245:多媒体通信控制协议;

G.723.1.1:传输速率为5.3Kb/s和6.3 KB/s的语音编码器..

联合图像专家组

1986年,国际标准化组织成立了联合摄影专家组(JPEG),主要致力于制定连续色调、多级灰度和静止图像的数字图像压缩编码标准。基于离散余弦变换(DCT)的常用编码方法是JPEG算法的核心内容。

MPEG-1/2

MPEG-1标准用于在数字存储器上对运动图像及其伴音进行编码,其数字速率为1.5Mb/s/s..MPEG-1的视频原理框图和H.261类似。

MPEG-1视频压缩技术的特点:1。随机存取;2.快进/快退搜索;3.反向重放;4.视听同步;5.容错能力;6.编码/解码延迟。MPEG-1视频压缩策略:为了提高压缩比,必须同时使用帧内/帧间图像数据压缩技术。帧内压缩算法与JPEG压缩算法几乎相同,采用基于DCT的变换编码技术,减少空间域的冗余信息。帧间压缩算法采用预测法和插值法。预测误差可以通过DCT变换编码进一步压缩。帧间编码技术可以减少时间轴方向的冗余信息。

MPEG-2被称为“21世纪的电视标准”。它在MPEG-1的基础上进行了许多重要的扩展和改进,但其基本算法与MPEG-1相同。

MPEG-4

MPEG-4标准不是MPEG-2的替代品,它侧重于不同的应用领域。MPEG-4的初衷主要是针对视频会议和可视电话对超低比特率压缩(小于64Kb/s)的需求。在制定过程中,MPEG组织深刻感受到,人们对媒体信息尤其是视频信息的需求已经从播放转变为基于内容的访问、检索和操作。

MPEG-4与上面提到的JPEG和MPEG-1/2有很大的不同。它为多媒体数据压缩和编码提供了更广阔的平台。它定义了一种格式和一个框架,而不是特定的算法。它希望建立一个更加自由的交流和发展环境。因此,MPEG-4的新目标是支持各种多媒体应用,特别是多媒体信息的基于内容的检索和访问,并根据不同的应用需求现场配置解码器。编码系统也是开放的,可以随时添加新的有效的算法模块。应用包括实时视听通信、多媒体通信、远程监控/监视、视频点播、家庭购物/娱乐等。

JVT:新一代视频压缩标准

JVT是由ISO/IEC MPEG和ITU-T VCEG建立的联合视频小组,致力于制定新一代数字视频压缩标准。

JVT标准在ISO/IEC的正式名称是:MPEG-4 AVC(part10)标准;ITU-T中的名称:H.264(以前称为H.26L)

H264/AVC

H264综合了以往标准的优点,吸收了以往标准制定中积累的经验。设计简单,比MPEG4-4更容易推广。H.264开创了多参考帧、多块类型、整数变换、帧内预测等新的压缩技术,使用了更精细的亚像素运动矢量(1/4、1/8)和新一代环路滤波器,大大提高了压缩性能,改善了系统。

H.264具有以下优点:

-高效压缩:相比H.263+和MPEG-4SP,码率降低50%。

-在时间延迟约束方面具有良好的灵活性。

-容错

-编码/解码的复杂性和可伸缩性

-解码所有细节:没有不匹配。

-高质量应用

-网络友好型

监控中的视频编码技术

目前,监控中主要采用MJPEG、MPEG1/2、MPEG4(SP/ASP)和H.264/AVC等几种视频编码技术。对于最终用户来说,他主要关心的是:清晰度、存储容量(带宽)、稳定性和价格。使用不同的压缩技术会极大地影响上述因素。

MJPEG

MJPEG(运动JPEG)压缩技术主要是基于静态视频压缩。它的主要特点是基本不考虑视频流中不同帧之间的变化,只压缩某一帧。

MJPEG压缩技术可以获得高清视频图像,并动态调整帧率和分辨率。但由于没有考虑帧间变化,重复存储了大量冗余信息,因此单帧视频占用的空间较大。目前流行的MJPEG技术最多只能做到每帧3千字节,通常是8 ~ 20千字节!

MPEG-1/2

MPEG-1标准主要针对SIF标准的分辨率(NTSC制式为352X240;PAL制是352X288)。压缩比特率的主要目标是1.5Mb/s/s,与MJPEG技术相比,MPEG1在实时压缩、每帧数据量和处理速度上都有显著的提升。但是MPEG1也有很多缺点:存储容量还是太大,清晰度不够高,网络传输困难。

MPEG-2在MPEG-1的基础上进行了扩展和升级,MPEG-1的向后兼容主要用于存储媒体、数字电视、高清等应用领域。分辨率为:低分辨率(352x288)、中分辨率(720x480)和第二高分辨率(1440x65438)。与MPEG-1相比,MPEG-2视频提高了分辨率,满足了用户对高清的要求。但由于压缩性能提升不大,存储容量仍然过大,不适合网络传输。

MPEG-4

与MPEG-1/2相比,MPEG-4视频压缩算法在低比特率压缩方面有显著的改进。在CIF(352*288)或更高清晰度(768*576)的情况下,视频压缩在清晰度和存储容量上比MPEG-1有更大的优势,更适合网络传输。此外,MPEG-4可以方便地动态调整帧速率和比特率,以减少存储容量。

由于MPEG-4的系统设计过于复杂,MPEG-4很难完全实现兼容,在视频会议、可视电话等领域也很难实现,偏离了初衷。此外,中国的企业不得不面对高额专利费的问题。目前规定:

-每个解码设备需要支付MPEG-LA 0.25。

-编解码设备也需要按时间付费(4分钱/天=1.2美元/月=14.4美元/年)。

H.264/AVC

H.264集中了以往标准的优点,在多个领域取得了突破性进展,使其获得了比以往标准好得多的整体性能:

-与H.263+和MPEG-4 SP相比,可节省高达50%的码率,大大降低存储容量;

H.264可以在不同分辨率、不同码率下提供高视频质量;

-采用“网络友好”的结构和语法,使其更有利于网络传输。

H.264采用简单的设计,比MPEG4-4更容易普及,更容易在视频会议和可视电话中实现,更容易实现互联互通,可以很容易地与G.729等低比特率语音压缩结合,形成一个完整的系统。

MPEG LA吸收了MPEG-4高昂的专利费,很难普及。MPEG LA制定了以下低成本的H.264收费标准:H.264在播放时基本不收费;H.264编解码器嵌入产品时,年产量小于65438+万台,大于65438+万台为0.2美元,大于500万台为0.1美元。低专利费让中国H.264监控产品更容易走向世界。

监控中视频编码分辨率的选择

目前,监测行业主要使用以下分辨率:SQCIF、QCIF、CIF和4CIF。

SQCIF和QCIF的优势是存储容量低,可以在窄带内使用,这个分辨率的产品价格便宜。缺点是图像质量通常很差,用户无法接受。

CIF是目前监控行业的主流解决方案。它的优点是存储容量低,在普通宽带网络中传输,价格相对低廉,图像质量好,被大多数用户接受。缺点是画质达不到高清的要求。

4CIF是标清分辨率,优点是图像清晰。缺点是存储容量大,网络传输带宽要求高,价格高。

分辨率的新选择- 528x384

2CIF(704x288)已被部分产品采用,以解决4CIF清晰度低、存储容量大、价格高等缺点。但由于704x288只是提高了水平分辨率,所以画质的提升并不是特别明显。

经过测试,我们发现另一款2CIF分辨率为528x384,比704x288更能解决CIF和4CIF的问题。特别是在512kbps-1mbps的码率下,可以获得稳定的高质量图像,满足了用户对图像质量更高的要求。目前,该解决方案已经被许多网络多媒体广播所采用,并被广大用户所接受。比如杭州网通在线影院采用512x384的分辨率,在768k可以稳定获得类似DVD的画质。

视频编码在监控中的最佳实现方式

目前,视频编码正处于技术快速变革的时期,视频编码的压缩性能也在不断提高。

ASCI和DSP主要用于监控。由于ASIC芯片的设计和生产周期太长,跟不上视频编码的发展速度。而DSP芯片,由于其通用的设计,可以实现各种视频编码算法,可以及时更新视频编码器,跟上视频编码的发展速度。另外,使用DSP芯片可以比ASIC更灵活地配置编码器,使编码器达到最佳性能。

目前海康威视产品的技术水平。

海康威视产品采用最先进的H.264视频压缩算法和高性能DSP处理器。

强大的H.264视频压缩引擎使产品获得极高的压缩比、高质量的图像质量和良好的网络传输性能。高性能DSP处理器可以灵活配置视频编解码:动态设置分辨率、帧率、码率、画质等。可以双码流输出,实现本地存储和网络传输的功能。

使用TM130X DSP产品,单芯片可以实时压缩一路视频,分辨率如下:SQCIF、QCIF、CIF、2CIF(PAL:704x288或528x384)。

使用DM642 DSP的产品,单个芯片可以实时压缩分辨率低于4个通道的视频:SQCIF、QCIF、CIF和2CIF(PAL:704x288或528x384)。单芯片可以实时压缩2路4CIF视频。

电视节目制作的数字化网络化已经成为大家关心的热点,其中一项重要的技术就是数字视频压缩。运动图像专家组(MPEG)是ISO/IEC的一个工作组,负责制定运动图像、音频及其混合信息的压缩、解压缩、处理和编码的国际标准。MPEG制定了MPEG-1、MPEG-2和MPEG-4标准。MPEG-1和MPEG-2已广泛应用于多媒体行业,如数字电视、CD、视频点播、存档、网上音乐等。MPEG-4主要用于64 kb/s以下的低速率音视频编码,用于窄带多媒体通信等领域。MPEG目前正在制定MPEG-7和MPEG-21。而M-JPEG、MPEG-2、DV在当今的视频压缩技术中已经占据了主要地位,呈现出不可替代、竞争激烈、共同发展的状态。

M-JPEG和DV都采用帧内压缩,压缩效率低于MPEG-2。在低比特率下,MPEG-2可以提供比M-JPEG更高的压缩比,并保持更好的图像质量。在要求高画质的时候(比如节目剪辑和后期制作),MPEG-2和M-JPEG与DV的区别要小得多。电视服务的多样性要求压缩标准能够提供多种比特率。可变比特率(VBR)对于电视台有效利用资源非常重要。MPEG-2可以通过改变GOP结构以及DCT和huffman编码的参数来调整输出比特率。M-JPEG可以通过改变DCT和huffman编码参数来调整压缩比;DV格式由于其应用特点,不提供VBR。M-JPEG开发较早,已经在非线性视频编辑中使用多年。软硬件技术成熟,成本低廉。就目前的硬件平台而言,平均比MPEG-2平台便宜5000美元左右。目前M-JPEG、DV、MPEG-2各有优势,其设备已经得到广泛应用。日本和北美大部分使用DV格式进行后期制作;在1999的D84和D85技术声明中,EBU推荐电视台在演播室使用50 Mb/s的纯I帧4: 2: 2p MPEG-2。在国内,M-JPEG应用广泛,MPEG-2 IBP格式的编辑讨论热烈。

下面是两种视频压缩技术的比较,分别是M-JPEG和MPEG-2,主要用于电视台的数字网络。最后,对MPEG-7进行了简要总结。

M-JPEG被称为针对运动图像优化的JPEG压缩。JPEG根据一帧图像的DCT变换压缩图像数据,JPEG压缩电视数字信号的每一帧(4:2:2数据)。由于电视剪辑和特技制作需要以帧为基本单位,所以以帧为单位进行压缩(帧内压缩)的M-JPEG格式已经成功应用于数字视频系统,尤其是数字非线性节目编辑系统。目前国内大部分非线性编辑系统采用的是4:1 M-JPEG压缩,被认为是可以接受的播放级别。PAL 4:2:2数字信号经4:1压缩后,其数据速率为5 MB/s(40M b/s),视频节目每小时占用18 GB存储空间。由于M-JPEG是一种帧内压缩方法,它可以提供精确到帧的随机存取而没有任何存取延迟,并且可以实现精确到帧的节目编辑。所谓MPEG-2压缩,就是基于运动图像的相邻帧之间存在一定相似性的原理。通过运动预测,参考前一帧和本帧的相似性,去掉与前一帧相似的冗余数据,只记录与前一帧不同的数据,大大提高了视频数据的压缩效率。这种压缩方法也称为帧相关压缩。由于采用了运动预测帧相关压缩方法,对视频压缩有很好的效果。在获得广播级数字视频质量的前提下,压缩效率可达20:1,数据速率可降至1 MB/s(8M b/s),一小时视频节目占用空间3.6 GB。数据存储空间利用率高,网络传输效率是M-JPEG系统的5倍以上。这给基于MPEG-2的压缩视频的存储、传输、编辑和播放带来了很大的好处,可以大大节省存储成本,可以引入各种类型的存储介质,如硬盘、光盘、数据磁带、存储芯片等。

但由于MPEG-2格式只有一个完整的帧,即I帧,在电视需要精确的帧拼接时会带来一些困难,需要硬件板或者软件系统的支持。MPEG-2有两种压缩模式:帧内压缩和帧间压缩,使用三种类型的图像,即I帧、P帧和B帧。I帧使用无运动补偿的帧内压缩,提供适中的压缩比。因为I帧不依赖于其他帧,所以它是随机访问的入口点,也是解码的参考帧。P帧根据之前的I帧或P帧进行预测,采用运动补偿算法进行压缩,压缩比高于I帧。P帧是解码B帧和后续P帧的参考帧。它本身有误差,会造成误差传播。b帧是基于插值重建的帧,基于前后两个IP帧或PP帧,不传播错误。它使用双向预测进行压缩,从而提供更高的压缩比。目前,各种硬件板制造商正在努力解决基于MPEG-2的IBP帧编辑问题。目前,国内已有奥维讯、索贝尔、大洋等多家公司用软件解决了IBP帧的精确编辑问题,使MPEG-2格式应用于电视节目的制作、传输、存储和播出,构建所有电视台的数字网络系统成为可能。

1996 10年6月,运动图像专家组开始解决多媒体内容描述问题,即多媒体内容描述接口(简称MPEG-7)。MPEG-7将扩展现有的识别内容的容量限制,并将包括更多的数据类型。MPEG-7的目标是支持多种音视频描述,包括自由文本、n维时空结构、统计信息、客观属性、主观属性、生产属性和组合信息。对于视觉信息,描述将包括颜色、视觉对象、纹理、草图、形状、体积、空间关系、运动和变形。

MPEG-7的目标是提供一种根据信息的抽象层次来描述多媒体素材的方法,从而表达不同层次用户的信息需求。以视觉内容为例,较低的抽象层将包括形状、大小、纹理、颜色、运动(轨迹)和位置的描述。音频的较低抽象层包括音调、模式、声速、声速变化和声音的空间位置。MPEG-7的目标是支持数据管理的灵活性、数据资源的全球化和互操作性。

对于未来的多媒体服务,内容表示和描述必须一起考虑,也就是说,很多涉及内容表示的服务都必须首先处理内容描述。通过使用MPEG-7来描述可用的视听信息,我们可以快速找到我们想要的信息,更自由地与多媒体内容进行交互,重用视听信息的内容,或者以新的方式组合这些内容的某些组件。

编解码技术在过去的十年里不断进步。最新的编解码技术(H.264/AVC和VC-1)代表了第三代视频压缩技术。为特定应用选择正确的编解码器并优化其实时实现仍然是一个巨大的挑战。最佳设计必须平衡压缩效率和可用计算能力。……

视频压缩是所有激动人心的新视频产品的重要驱动力。为特定应用选择正确的编解码器并优化其实时处理仍然是一个巨大的挑战。最佳设计必须平衡压缩效率和可用计算能力。另外,如何在有限的计算能力下获得最佳的压缩效率,也是一个大学问。

数字视频的主要挑战是原始或未压缩的视频需要存储或传输大量数据。比如标清NTSC视频的数字化一般是每秒30帧,使用4:2:2的YCrCb和720×480,要求数据速率超过165Mbps。保存一个90分钟的视频需要110GB,相当于一个标准DVD-R存储容量的25倍以上,即使是视频流应用中常用的低分辨率视频(如CIF: 352× 288 4: 2: 0,每秒30帧)也需要超过36.5Mbps的数据速率,这是ADSL或3G无线等宽带网络速度的许多倍。目前宽带网络可以提供1 ~ 10 Mbps的连续传输能力。显然,数字视频的存储或传输需要压缩技术。

视频压缩的目的是对数字视频进行编码——在保持视频质量的同时,尽可能少地占用空间。编解码技术的理论基础是信息论的数学原理。然而,实用编解码技术的发展需要艺术上的深思熟虑。

压缩权衡

在选择数字视频系统的编解码技术时,需要考虑很多因素。主要因素包括应用的视频质量要求、传输信道或存储介质所处的环境(速度、延迟、误差特性)以及源内容的格式。同样重要的是预期分辨率、目标比特率、颜色深度、每秒帧数,以及内容和显示是逐行还是隔行。压缩通常需要在应用的视频质量要求和其他要求之间进行权衡。首先是用于存储还是单播、组播、双向通信还是广播?对于存储应用程序,有多少存储容量可用,需要多长时间?除存储之外,应用的最高比特率是多少?双向视频通信的延迟容差或允许的端到端系统延迟是多少?如果不是双向交流,内容需要提前离线编码还是实时编码?网络或存储介质的容错程度如何?根据基本的目标应用程序,不同的压缩标准以不同的方式处理这些权衡。

另一方面,需要权衡编解码器实时处理的成本。可实现更高压缩比的新算法,如H.264/AVC或WMV9/VC-1,需要更高的处理能力,这将影响编解码设备的成本、系统功耗和系统内存。

……

标准对于编解码技术的普及非常重要。由于规模经济,用户根据可承受的标准寻找相应的产品。该行业愿意投资于标准,因为它可以保证制造商之间的互操作性。因为自己的内容可以获得较长的生命周期和广泛的需求,内容提供商也青睐标准。虽然几乎所有的视频标准都是针对少数特定的应用,但是如果能够应用的话,在其他应用中也能发挥优势。

为了实现更好的压缩并获得新的市场机会,ITU和MPEG一直在开发压缩技术和新的标准。中国最近制定了一个名为AVS的国家视频编码标准,我们稍后也将介绍该标准。目前正在制定的标准有ITU/MPEG联合可分级视频编码(H264/ AVC的修订版)和MPEG多视点视频编码。此外,为了满足新的应用需求,现有的标准也在不断发展。例如,H.264最近定义了一种称为保真度范围扩展的新模式,以满足新的市场需求,如专业数字编辑、HD-DVD和无损编码。

使用数字视频压缩技术的终端设备范围很广,从电池驱动的便携式设备到高性能的基本设备。

数字视频的最佳处理器解决方案取决于具体的目标应用。TI拥有多种DSP,可支持多种标准,并满足主要设计和系统限制。TI拥有广泛的解决方案,包括低功耗C5000 DSP和移动OMAP应用处理器、高性能C6000 DSP和视频优化的高性能DM64x和DM644x数字媒体处理器。

德州仪器(TI)的DM列处理器是专为高端视频系统的要求而设计的。该系列最新的处理器是性能强大的DM6446[15],采用了TI的达芬奇技术[16]。DM6446的双核架构兼具DSP和RISC技术的优点,集成了时钟频率为594MHz的c64x+ DSP内核和ARM926EJ-S内核。新一代c64x+ DSP是TMS320C6000(tm) DSP平台中性能最高的固定DSP,基于TI开发的第二代高性能高级VLIW架构的增强版打造。C64x+兼容上一代C6000 DSP平台代码。DM644x等可编程数字媒体处理器可以利用一个可编程数字媒体处理器支持所有现有的行业标准和专有视频格式。DM6446还具有片内存储器,包括一个二级缓存和许多具有视频专用功能的外设。DM6446还包括一个视频/视频协处理器(VICP),用于减轻相关算法(如JPEG、H.264、MPEG4-4和VC-1)的DSP内核繁重的视频和视频处理负担,以便将更多的DSP MIPS用于视频后期处理或其他并行功能。

压缩标准规定了所需的语法和可用的工具,但是许多算法结果取决于具体的实现。主要变量包括:码率控制算法、单通道和多通道编码、I/B/P帧比、运动搜索范围、运动搜索算法、选择的个别工具和模式。这种灵活性允许我们在计算负载和提高质量之间做出不同的权衡。显然,所有编码器都可以通过高或低的频率实现不同的视频质量水平。

越来越多的视频压缩标准可以为特定的终端应用提供越来越高的压缩效率和更丰富的工具。此外,网络化的趋势意味着许多产品越来越需要支持多种标准。多种标准和专有算法的流行也使我们很难选择单一标准,尤其是当硬件决策往往先于产品部署时。而且,每种视频编码算法都提供了丰富的工具和功能来平衡压缩效率的复杂性。工具和功能的选择是一个与具体应用和用例密切相关的迭代过程。由于必须支持的编解码器数量增加,以及针对特定解决方案和应用的优化编解码器的选择范围扩大,在数字视频系统中采用灵活的媒体处理器已成为大势所趋。数字媒体处理器,如DM6446,可以完全满足性能处理要求,并具有灵活的架构,因此可以快速将新标准推向市场,包括H.264、AVS和WMV9。我们可以在标准定义阶段实现算法,并保持软件算法和工具的更新,以便跟踪标准的修订,满足应用程序不断变化的质量要求。

编辑条目

/其他/2004-10-15/1438441503 . shtml