新聞中心

EEPW首頁 > 模擬技術(shù) > 設(shè)計應(yīng)用 > 國際視頻編碼標(biāo)準(zhǔn)mpeg簡述及AVS視頻關(guān)鍵技術(shù)

國際視頻編碼標(biāo)準(zhǔn)mpeg簡述及AVS視頻關(guān)鍵技術(shù)

作者: 時間:2011-04-20 來源:網(wǎng)絡(luò) 收藏
20世紀(jì)90年代以來,ITU-T和ISO制定了一系列音視頻編碼技術(shù)標(biāo)準(zhǔn)(信源編碼技術(shù)標(biāo)準(zhǔn))和建議,這些標(biāo)準(zhǔn)和建議的制定極大地推動了多媒體技術(shù)的實用化和產(chǎn)業(yè)化。從技術(shù)進步的角度看,1994年完成的第一代信源編碼技術(shù)標(biāo)準(zhǔn)MPEG-1和MPEG-2的壓縮能力為50-75倍。進入新世紀(jì)以來,第二代信源編碼技術(shù)標(biāo)準(zhǔn)相繼出臺,壓縮效率可達(dá)到100-150倍。第二代信源編碼技術(shù)標(biāo)準(zhǔn)將使原來剛剛形成不久的國際數(shù)字電視和數(shù)字音視頻產(chǎn)業(yè)格局重新“洗牌”。
國際上音視頻編解碼標(biāo)準(zhǔn)主要有兩大系列:ISO/IEC JTC1制定的MPEG系列標(biāo)準(zhǔn),數(shù)字電視采用的是MPEG系列標(biāo)準(zhǔn);ITU針對多媒體通信制定的H.26x系列視頻編碼標(biāo)準(zhǔn)和G.7系列音頻編碼標(biāo)準(zhǔn)。
CCITT(國際電報電話咨詢委員會,現(xiàn)并入國際電信聯(lián)盟ITU)從1984年開始提出一系列有關(guān)音頻編碼算法和國際標(biāo)準(zhǔn)。1984年CCITT第15研究組成立了一個專家組,專門研究電視電話的編碼問題,經(jīng)過5年以上的研究和努力,在1990年12月完成和批準(zhǔn)了CCITT推薦書 H.261。在H.261的基礎(chǔ)上,1996年ITU-T完成了H.263編碼標(biāo)準(zhǔn),在編碼算法復(fù)雜度增加很少的基礎(chǔ)上,H.263能提供更好的圖像質(zhì)量、更低的速率,目前,H.263編碼是IP視頻通信采用最多的一種編碼方法。1998年ITU-T推出的H.263+是H.263建議的第二版,它提供了12個新的可協(xié)商模式和其他特征,進一步提高了壓縮編碼性能。
MPEG是國際標(biāo)準(zhǔn)化組織和國際電工委員會第一聯(lián)合技術(shù)組(ISO/IEC JTC1)1988年成立的運動圖像專家組(Moving Picture Expert Group)的簡稱,全稱為ISO/IEC JTC1第29分委會第11工作組(ISO/IEC JTC1/SC29/WG11),負(fù)責(zé)數(shù)字視頻、音頻和其他媒體的壓縮、解壓縮、處理和表示等國際技術(shù)標(biāo)準(zhǔn)的制定工作。從1988年開始,MPEG專家組每年召開四次左右的國際會議,主要內(nèi)容是制定、修訂、發(fā)展MPEG系列多媒體標(biāo)準(zhǔn)。視音頻編碼標(biāo)準(zhǔn)MPEG-1(1992)和MPEG-2(1994)、基于視聽媒體對象的多媒體編碼標(biāo)準(zhǔn)MPEG-4(1999年)、多媒體內(nèi)容描述標(biāo)準(zhǔn)MPEG-7(2001)、多媒體框架標(biāo)準(zhǔn)MPEG-21。目前,MPEG系列國際標(biāo)準(zhǔn)已經(jīng)成為影響最大的多媒體技術(shù)標(biāo)準(zhǔn),對數(shù)字電視、視聽消費電子產(chǎn)品、多媒體通信等信息產(chǎn)業(yè)的重要產(chǎn)品產(chǎn)生了深遠(yuǎn)影響。
CCITT H.261標(biāo)準(zhǔn)始于1984年,實質(zhì)完成于1989年,是MPEG的先驅(qū)。MPEG-1和H.261有共同的數(shù)據(jù)結(jié)構(gòu)、編碼工具和語法元素,然而兩者并非完全后向兼容,MPEG-1可看作是H.261的擴展集。MPEG-1的發(fā)展始于1988年,實質(zhì)完成于1992年。MPEG-2可被看作是MPEG-1的擴展集,始于1990年,實質(zhì)完成于1994年。H.263始于1992年,第一版完成于1995年。MPEG-4(其視頻部分建立在MPEG-2和H.263的基礎(chǔ)上)始于1993年,第一版實質(zhì)完成于1998年。
MPEG專家組已經(jīng)和正在制定的標(biāo)準(zhǔn)包括:
(1) MPEG-1標(biāo)準(zhǔn):1992年11月正式成為國際標(biāo)準(zhǔn),名稱為“用于數(shù)字存儲媒體速率為1.5Mbps的運動圖像及其伴音的壓縮編碼”。MPEG-1的支持的視頻參數(shù)為352 X 240 X 30幀/秒或相當(dāng)。
(2) MPEG-2:1994年11月成為國際標(biāo)準(zhǔn)(ISO/IEC13818),這是一個適應(yīng)性廣的動態(tài)影像和聲音編碼方案,最初目標(biāo)是把視頻及其伴音信號壓縮到10Mb/s,經(jīng)實驗可適用于1.5-60Mb/s的編碼范圍,甚至還可以更高。MPEG-2可用于數(shù)字通信、存儲、廣播、高清晰度電視等的壓縮編碼。DVD和數(shù)字電視廣播采用的是MPEG-2標(biāo)準(zhǔn)。1994年后,MPEG-2標(biāo)準(zhǔn)還進行了一定擴展和修訂。

MPEG標(biāo)準(zhǔn)中視頻編解碼技術(shù)
MPEG標(biāo)準(zhǔn)主要基于三大編碼工具:自適應(yīng)塊變換編碼(Adaptive block transform coding)消除空間冗余;運動補償差分脈沖編碼調(diào)制(Motion-compensated DPCM)消除時域冗余,二者融合為混合編碼技術(shù)(hybrid coding)。熵編碼(Entropy coding)用于消除混合編碼器產(chǎn)生的統(tǒng)計冗余。還有一些輔助工具作為主要工具的補充,用于消除已編碼數(shù)據(jù)某些特殊部分的剩余冗余,或者根據(jù)具體應(yīng)用對編碼進行調(diào)整,也有的編碼工具支持將數(shù)據(jù)格式化為特定比特流以便于存儲和傳輸。
現(xiàn)代熵編碼始創(chuàng)于20世紀(jì)40年代末;60年代末應(yīng)用于視頻編碼;然后不斷改進,80年代中期引入了二維可變長編碼(2D VLC)和算術(shù)編碼(arithmetic coding)方法。
DPCM始創(chuàng)于1952年,同年首次應(yīng)用于視頻編碼。DPCM最初是作為空間編碼技術(shù)而發(fā)展,到了70年代中期,DPCM開始用于時域編碼。DPCM作為一種完整的視頻編碼方案,一直持續(xù)到80年代初期。從70年代中早期開始,DPCM的關(guān)鍵元素與變換編碼技術(shù)融合,逐漸形成了混合編碼技術(shù),并于80年代早期發(fā)展成為MPEG的雛形。
變換編碼60年代末首次用于視頻,70年代上半期得到實質(zhì)性的發(fā)展,被認(rèn)為在空間編碼方面達(dá)到最高分辨率效果。在混合編碼中,變換編碼用于消除空間冗余,DCPM用于消除時間冗余。運動補償預(yù)測技術(shù)極大地提高了時域DCPM的性能,它始創(chuàng)于1969年,80年代初發(fā)展成為MPEG的基本形式。80年代早期,擴展出內(nèi)插編碼(interpolative coding),即通過多幀內(nèi)插進行預(yù)測,中間幀通過比例運動矢量(scaled motion vectors)預(yù)測。直至80年代末,雙向預(yù)測技術(shù)(bi-directional prediction)誕生,該技術(shù)才發(fā)展到最終形式。在近年來的進展中(H.264),預(yù)測質(zhì)量得到改進,亦即不同信號之間的相關(guān)性降低。因此,變換的必需性降低,H.264使用了簡化的變換(4 x4)。

國際視頻編碼標(biāo)準(zhǔn)mpeg簡述及AVS視頻關(guān)鍵技術(shù)

AVS標(biāo)準(zhǔn)和相關(guān)國際標(biāo)準(zhǔn)的時間對應(yīng)關(guān)系以及AVS工作組已經(jīng)開展的工作如下圖所示。

視頻壓縮基本原理
視頻能夠壓縮的根本原因在于視頻數(shù)據(jù)具有較高的冗余度。壓縮就是指冗余的消除,主要基于兩種技術(shù):統(tǒng)計學(xué)和心理視覺。
消除統(tǒng)計冗余的基本依據(jù)是視頻數(shù)字化過程在時間和空間上采用了規(guī)則的采樣過程。視頻畫面數(shù)字化為規(guī)則的像素陣列,其密集程度適于表征每點最高的空間頻率,而絕大多數(shù)畫面幀包含非常少甚至不含這種最高頻率的細(xì)節(jié)。同樣,所選的幀頻能夠表征場景中最快的運動,而理想的壓縮系統(tǒng)只要描述場景所必需的瞬時運動即可。簡言之,理想的壓縮系統(tǒng)能夠動態(tài)適應(yīng)視頻在時間和空間上的變化,所需要的數(shù)據(jù)量遠(yuǎn)低于數(shù)字化采樣所產(chǎn)生的原始數(shù)據(jù)。
心理視覺技術(shù)主要是針對人類視覺系統(tǒng)極限。人類視覺在對比度帶寬、空間帶寬(特別是彩色視覺)、時間帶寬等方面存在極限。而且,這些極限并非相互獨立,整體的視覺系統(tǒng)存在上限,例如,人眼不可能同時察覺到時間和空間的高分辨率。顯然,沒有必要表征那些不能被感知的信息,或者說,一定程度的壓縮損失是人的視覺系統(tǒng)是感知不出來的。
視頻編碼標(biāo)準(zhǔn)并非一個單一的算法,而是一整套的編碼工具,這些工具綜合起來就達(dá)到了完整的壓縮效果。視頻壓縮的歷史可以追溯到上個世紀(jì)50年代初,在隨后30多年時間里,主要的壓縮技術(shù)和工具逐漸發(fā)展起來,在上世紀(jì)80年代初,視頻編碼技術(shù)初步成型。最初每個主要的工具都是作為視頻編碼的一個完整解決方案而提出,各條技術(shù)主線平行發(fā)展,最終各性能最佳者匯合成為完整的解決方案,方案集成的主要貢獻者是標(biāo)準(zhǔn)化組織,來自各國家和組織的專家們共同完成了方案集成工作,或者說,編碼標(biāo)準(zhǔn)方案是標(biāo)準(zhǔn)委員會原創(chuàng)的。另外,盡管有些技術(shù)多年前就已經(jīng)提出,但由于實現(xiàn)代價昂貴而沒能在當(dāng)時得到實際應(yīng)用,直到近年來半導(dǎo)體技術(shù)的發(fā)展才滿足實時視頻處理的要求。

國際視頻編碼標(biāo)準(zhǔn)mpeg簡述及AVS視頻關(guān)鍵技術(shù)
圖 2編碼工具與標(biāo)準(zhǔn)的發(fā)展(Cliff, 2002)
(3) MPEG-4:注意到低帶寬應(yīng)用的需要和交互式圖形應(yīng)用(游戲等合成內(nèi)容)、交互式多媒體(WWW等內(nèi)容分發(fā)和訪問技術(shù))的快速發(fā)展,MPEG專家組成立了MPEG-4工作組,以促進上述三個領(lǐng)域的集成。1999年初,定義標(biāo)準(zhǔn)框架的MPEG-4(第一版)成為國際標(biāo)準(zhǔn)(ISO/IEC 14496-1),提供多種算法和工具的第二版已于99年底成為國際標(biāo)準(zhǔn)(ISO/IEC 14496-2),后續(xù)還在制定第三、四、五版。

第二代視頻編碼標(biāo)準(zhǔn)
1994年制定的MPEG-2標(biāo)準(zhǔn)和H.263標(biāo)準(zhǔn)是國際音視頻標(biāo)準(zhǔn)領(lǐng)域的一個里程碑,是音視頻行業(yè)遵循的基本標(biāo)準(zhǔn)。近十年來,音視頻編碼技術(shù)本身和產(chǎn)業(yè)應(yīng)用背景都發(fā)生了明顯變化。ITU-T于1997年提出的一個長期的視頻標(biāo)準(zhǔn)化項目H.26L,ITU-T并在1999年8月推出該標(biāo)準(zhǔn)的第一版測試模型。為了響應(yīng)ISO/IEC MPEG對先進視頻編碼技術(shù)的需求,從2001年開始,ISO和ITU開始組建了聯(lián)合視頻工作組(JVT,Joint Video Team ,ISO/IEC MPEG和ITU-T VCEG聯(lián)合視頻工作組),在H.26L的基礎(chǔ)上開發(fā)新的視頻編碼標(biāo)準(zhǔn),即JVT標(biāo)準(zhǔn)。


上一頁 1 2 下一頁

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉