MPEG視頻壓縮技術(shù)的發(fā)展及其特點(diǎn)

作者：時(shí)間：2010-09-16 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

本文引用地址：http://2s4d.com/article/166543.htm

　　1.1 MPEG-1

　　在MPEG出現(xiàn)之前，關(guān)于圖像壓縮已經(jīng)有兩個(gè)標(biāo)準(zhǔn)，即用于靜態(tài)圖像數(shù)據(jù)壓縮的JPEG和用于電視電話(huà)、會(huì)議電視圖像壓縮的H.261，但是他們都與計(jì)算機(jī)數(shù)據(jù)標(biāo)準(zhǔn)無(wú)關(guān)。這就要求制定一個(gè)圖像、伴音、存儲(chǔ)和傳輸四個(gè)方面的計(jì)算機(jī)系統(tǒng)和廣播電視都統(tǒng)一的標(biāo)準(zhǔn)，從而有利于各種媒體廣泛交流，因此MPEG就應(yīng)運(yùn)而生了。

　　MPEG-1標(biāo)準(zhǔn)完成的基本任務(wù)就是質(zhì)量適當(dāng)?shù)膱D像(包括伴音)數(shù)據(jù)必須成為計(jì)算機(jī)數(shù)據(jù)的一種，和已有的數(shù)據(jù)(如文字、繪圖等數(shù)據(jù))在計(jì)算機(jī)內(nèi)兼容，并且這些數(shù)據(jù)必須在現(xiàn)有的計(jì)算機(jī)網(wǎng)絡(luò)和廣播電視等通信網(wǎng)絡(luò)中兼容傳輸。MPEG-1標(biāo)準(zhǔn)有3個(gè)組成部分：MPEG視頻、MPEG音頻、MPEG系統(tǒng)。所以MPEG涉及的問(wèn)題是視頻壓縮、音頻壓縮及多種壓縮數(shù)據(jù)流的復(fù)合和同步問(wèn)題。MPEG-1標(biāo)準(zhǔn)是適用于傳輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體動(dòng)力圖像及其伴音的編碼標(biāo)準(zhǔn)，可以處理各種類(lèi)型的活動(dòng)圖像，其基本算法對(duì)于壓縮水平方向360個(gè)象素、豎直方向288個(gè)象素的空間分辨力，每秒24至30幅畫(huà)面的運(yùn)動(dòng)圖像有很好的效果。與JPEG不同，它沒(méi)有定義產(chǎn)生合法數(shù)據(jù)流所需的詳細(xì)算法，而是在編碼器設(shè)計(jì)中提供了大量的靈活性，另外定義已編碼位流和解碼器的一系列參數(shù)都包含在位流本身當(dāng)中，這些特點(diǎn)允許算法可以用于不同大小和寬度比的圖像，也可以用在工作速率范圍很大的信道和設(shè)備上。

　　MPEG-1標(biāo)準(zhǔn)壓縮首先對(duì)色差信號(hào)進(jìn)行亞采樣，減少數(shù)據(jù)量，采用運(yùn)動(dòng)補(bǔ)償技術(shù)，減少幀間冗余度，利用二維DCT變換云除空間相關(guān)性，對(duì)DCT分量進(jìn)行量化，舍去不重要的信息，將量化后DCT分量按照頻率得新排序，將DCT分量進(jìn)行變字長(zhǎng)編碼，最后對(duì)每個(gè)數(shù)據(jù)塊的直流分量(DC)進(jìn)行預(yù)測(cè)差分編碼。MPEG視頻的編碼和解碼框圖如圖1所示。

　　1.2 MPEG-2

　　MPEG-2標(biāo)準(zhǔn)全稱(chēng)為“運(yùn)動(dòng)圖像及其伴音的編碼”，主要針對(duì)高精晰度電視(HDTV)所需要的視頻及伴音信號(hào)，傳輸速率為10Mbps。

　　MPEG-2標(biāo)準(zhǔn)分為八個(gè)部分，統(tǒng)稱(chēng)為ISO/IEC1318國(guó)際標(biāo)準(zhǔn)。第一部分：系統(tǒng)，描述多個(gè)視頻，音頻和數(shù)據(jù)基本碼流合成傳輸碼流和節(jié)目碼流的方式;第二部分：視頻，描述視頻編碼方法;第三部分：音頻，描述與MPEG-1音頻標(biāo)準(zhǔn)反向兼容的音頻編碼方法;第四部分：符合測(cè)試，描述測(cè)試一個(gè)編碼碼流是否符合MPEG-2標(biāo)準(zhǔn)的第一、二、三部分的軟件實(shí)現(xiàn)方法;第五部分：數(shù)字存儲(chǔ)器體-命令與控制，描述交互式多媒體網(wǎng)絡(luò)中服務(wù)器與用戶(hù)間的會(huì)話(huà)信令集;第六部分;非向后兼容的音頻，規(guī)定不與MPEG-1音頻反向兼容的多通道音頻編碼;第七部分：10比特視頻，現(xiàn)已停止;第八部分：實(shí)時(shí)接口，規(guī)定了傳送碼流的實(shí)時(shí)接口。

　　MPEG-2視頻編碼標(biāo)準(zhǔn)是一個(gè)按等級(jí)劃分的系列，按編碼圖像的分辨率分成4個(gè)“級(jí)”：低級(jí)(LL：low level)，輸入信號(hào)的像素為ITU-R601格式的四分之一;主級(jí)(ML：main level)，輸入信號(hào)的像素為ITU-R601;高級(jí)-1440(H14L：high-1440 level)為4：3模式電視高清晰度格式;高級(jí)(HL：high level)為16：9模式電視的高清晰度格式。按所使用的編碼工具的集合分成5個(gè)“類(lèi)”：簡(jiǎn)單類(lèi)(SP：simple profile)，只有基準(zhǔn)幀I和預(yù)測(cè)幀P;主類(lèi)(MP：main profile)，比SP增加了雙向推測(cè)幀B;信雜比分層類(lèi)(SNRP：SNR scalable profile);空間可分層類(lèi)(SSP：spatial scalable profile);高類(lèi)(HP：high profile)。“級(jí)”與“類(lèi)”的若干組合構(gòu)成MPEG-2視頻編碼標(biāo)準(zhǔn)在某種特定應(yīng)用下的子集。對(duì)某一輸入格式的圖像，采用特定集合的壓縮編碼工具，產(chǎn)生規(guī)定速率范圍內(nèi)的編碼碼流。MPEG-2的編碼碼流分為6個(gè)層次。從上至下依次為：視頻序列層(Sequence);圖像組層(GOP：GroupofPicture);圖像層(Picture);像條層(Slice);宏塊層(MacroBlock)和像塊層(Block)。

　　MPEG-2的編碼流程：在幀內(nèi)編碼的情況下，編碼圖像僅經(jīng)過(guò)DCT，量化器和比特流編碼器即生成編碼比特流，而不經(jīng)過(guò)預(yù)測(cè)環(huán)處理。DCT直接應(yīng)用于原始的圖像數(shù)據(jù)。在幀間編碼的情況下，原始圖像首先與幀存儲(chǔ)器中的預(yù)測(cè)圖像進(jìn)行比較，計(jì)算出運(yùn)動(dòng)矢量，由此運(yùn)動(dòng)矢量和參考幀生成原始圖像的預(yù)測(cè)圖像。而后，將原始圖像與預(yù)測(cè)像素差值所生成的差分圖像數(shù)據(jù)進(jìn)行DCT變換，再經(jīng)過(guò)量化器和比特流編碼器生成輸出的編碼比特流。

　　1.3 MPEG-4

　　MPEG-4標(biāo)準(zhǔn)的目標(biāo)是：支持多種多媒體應(yīng)用(主要側(cè)重于對(duì)多媒體信息內(nèi)容的訪(fǎng)問(wèn))，可根據(jù)應(yīng)用的不同要求現(xiàn)場(chǎng)配置解碼器。MPEG-4旨在為視(音)頻數(shù)據(jù)的通信、存取與管理提供一個(gè)靈活的框架與一套開(kāi)放的編碼工具。

　　在MPEG-4圖像與視頻標(biāo)準(zhǔn)中，視頻表示工具的目標(biāo)，是為多媒體環(huán)境下的紋理、圖像和視頻數(shù)據(jù)的有效存儲(chǔ)、傳輸及管理提供標(biāo)準(zhǔn)化的核心技術(shù)。尤其強(qiáng)調(diào)這些工具對(duì)圖像和視頻內(nèi)容的原子單元(稱(chēng)為視頻對(duì)象VO)的編解碼能力。對(duì)任意形狀的視頻對(duì)象進(jìn)行有效的表示，以支持所謂基于內(nèi)容的功能集。而此功能集支持內(nèi)容(即場(chǎng)景中的物理對(duì)象VO)的單獨(dú)編碼和解碼，這一特性為交互性提供了有力的底層機(jī)制支持，也為在壓縮域?qū)D像或視頻的VO內(nèi)容進(jìn)行靈活的表示和管理提供了有利條件。MPEG-4圖像與視頻標(biāo)準(zhǔn)統(tǒng)一支持傳統(tǒng)矩形和任意形狀圖像與視頻的編解碼。對(duì)于基于內(nèi)容的應(yīng)用，輸入的圖像序列可能具有任意形狀和位置。形狀可以用8位透明分量表示(一個(gè)VO由多個(gè)其它對(duì)象構(gòu)成時(shí))或用一個(gè)二值掩模描述。另外，通過(guò)對(duì)場(chǎng)景中每個(gè)物理采用適當(dāng)?shù)暮途?xì)的基于對(duì)象的運(yùn)動(dòng)預(yù)測(cè)工具，可以大大提高某些視頻序列的壓縮比。對(duì)于MPEG-4擴(kuò)展的基于內(nèi)容的編碼可視為傳統(tǒng)的VLBV內(nèi)核或HBV工具由矩形輸入向任意形狀輸入的邏輯延伸。從這個(gè)意義上，基于內(nèi)容的編碼是VLBV和HBV內(nèi)核的超集。

　　MPEG-4標(biāo)準(zhǔn)在原有的基礎(chǔ)上增加了七個(gè)新的功能。增加的各個(gè)功能的特點(diǎn)：

　　(1)基于內(nèi)容的操作與比特流編輯支持無(wú)需編碼就可進(jìn)行基于內(nèi)容的操作與比特流編輯。(2)自然與合成數(shù)據(jù)混合編碼。提供將自然視頻圖像同合成數(shù)據(jù)(文本、圖形)有效結(jié)合的方式，同時(shí)支持交互性操作。(3)增強(qiáng)的時(shí)間域隨機(jī)存取。MPEG-4將提供具有效的隨機(jī)存取方式：在有限的時(shí)間間隔內(nèi)，可按幀或任意形狀的對(duì)象，對(duì)一音、視頻序列進(jìn)行隨機(jī)存取。(4)提高編碼效率。在與現(xiàn)有的正在形成的標(biāo)準(zhǔn)的可比擬速率上，MPEG-4標(biāo)準(zhǔn)將提供更好的主觀(guān)視覺(jué)質(zhì)量的圖像。(5)對(duì)多個(gè)并發(fā)數(shù)據(jù)流的編碼。MPEG-4將提供對(duì)一景物的有效多視角編碼，加上多伴音聲道編碼及有效的視聽(tīng)同步。在立體視頻應(yīng)用方面，MPEG-4將利用同一景物的多視點(diǎn)觀(guān)察所造成的信息冗余，在足夠的觀(guān)察視點(diǎn)條件下有效地描述三維自然景物。(6)錯(cuò)誤易發(fā)環(huán)境中的抗錯(cuò)性“靈活多樣”是指允許采用各種有線(xiàn)網(wǎng)和各種存儲(chǔ)媒體，MPEG-4將提高抗錯(cuò)誤能力，尤其是在易發(fā)生嚴(yán)重錯(cuò)誤環(huán)境下的低比特應(yīng)用中(移動(dòng)通信鏈路)。MPEG-4是第一個(gè)在其音、視頻表示規(guī)范中考慮信道特性的標(biāo)準(zhǔn)，目的不是取代已由通信網(wǎng)提供的錯(cuò)誤控制技術(shù)，而是提供一種對(duì)抗殘留錯(cuò)誤是緊韌性。(7)基于內(nèi)容的尺度可變性。內(nèi)容尺度可變性意味著給圖像中的各個(gè)對(duì)象分配優(yōu)先級(jí)。基于內(nèi)容的尺度可變性是MPEG-4的核心，因?yàn)橐坏﹫D像中所含對(duì)象的目錄及相應(yīng)的優(yōu)先級(jí)確定后，其它的集內(nèi)容的功能就比較容易實(shí)現(xiàn)了。對(duì)甚低比特率應(yīng)用來(lái)說(shuō)，尺度可變形成一個(gè)關(guān)鍵的因素，因?yàn)樗峁┝俗赃m應(yīng)可用資源的能力。

　　以上七個(gè)新的功能可以歸納為三類(lèi)：基于內(nèi)容的交互性、高壓縮率和靈活多樣的存取模式。前三個(gè)功能為基于內(nèi)容的交互性，四、五為高壓縮率模式，最后兩個(gè)為靈活多樣的存取模式。

新聞中心

MPEG視頻壓縮技術(shù)的發(fā)展及其特點(diǎn)

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)