IPTV編解碼標準綜述
IPTV是一種利用寬帶網(wǎng),集互聯(lián)網(wǎng)、多媒體、通訊等多種技術(shù)于一體,向家庭用戶提供包括數(shù)字電視在內(nèi)的多種交互式服務(wù)的嶄新技術(shù)。由于國際上固話運營商都是從最近兩年才興起IPTV熱,所以至今也沒有一個國家在IPTV業(yè)務(wù)方面形成成熟標準,國內(nèi)IPTV業(yè)務(wù)也同樣無標準可循。中國通信標準化協(xié)會(CCSA)IP與多媒體工作委員會IPTV特別工作組于2005年下半年成立,并啟動了對IPTV標準的研究和制訂工作。參加IPTV特別工作組的單位幾乎包含了目前從事IPTV業(yè)務(wù)運營、開發(fā)和研究的國內(nèi)外所有企業(yè)。
IPTV最重要的標準就是編解碼標準,編碼直接關(guān)系到解碼,解碼又會影響到機頂盒。標準化是產(chǎn)業(yè)化成功的前提,之所以目前尚沒有廠家大規(guī)模生產(chǎn)網(wǎng)絡(luò)機頂盒,一個重要原因就是沒有確定的標準支持。盡管IPTV編解碼標準有很多種,但在中國主要是采用MPEG-4、H.264技術(shù)以及中國提出的具有自主知識產(chǎn)權(quán)的標準AVS,國內(nèi)企業(yè)面臨一場抉擇。
1 MPEG-4標準簡介
運動圖像專家組MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)標準第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成為國際標準。MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法,它是針對數(shù)字電視、交互式繪圖應(yīng)用、交互式多媒體等整合及壓縮技術(shù)的需求而制定的國際標準。MPEG-4標準將眾多的多媒體應(yīng)用集成于一個完整的框架內(nèi),旨在為多媒體通信及應(yīng)用環(huán)境提供標準的算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等應(yīng)用領(lǐng)域普遍采用的統(tǒng)一數(shù)據(jù)格式。
MPEG-4的編碼理念是:MPEG-4標準同以前標準的最顯著的差別在于它是采用基于對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯(lián)系的視頻音頻對象,分別編碼后,再經(jīng)過復(fù)用傳輸?shù)浇邮斩?,然后再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象采用不同的編碼方法和表示方法,又有利于不同數(shù)據(jù)類型間的融合,并且這樣也可以方便的實現(xiàn)對于各種對象的操作及編輯。
MPEG-4除采用第一代視頻編碼的核心技術(shù),如變換編碼、運動估計與運動補償、量化、熵編碼外,還提出了一些新的有創(chuàng)見性的關(guān)鍵技術(shù),并在第一代視頻編碼技術(shù)基礎(chǔ)上進行了卓有成效的完善和改進。下面重點介紹其中的一些關(guān)鍵技術(shù)。
?。?)視頻對象提取技術(shù)
MPEG-4實現(xiàn)基于內(nèi)容交互的首要任務(wù)就是把視頻/圖像分割成不同對象或者把運動對象從背景中分離出來,然后針對不同對象采用相應(yīng)編碼方法,以實現(xiàn)高效壓縮。因此視頻對象提取即視頻對象分割,是MPEG-4視頻編碼的關(guān)鍵技術(shù),也是新一代視頻編碼的研究熱點和難點。
盡管MPEG-4 框架已經(jīng)制定,但至今仍沒有通用的有效方法去根本解決視頻對象分割問題,視頻對象分割被認為是一個具有挑戰(zhàn)性的難題,基于語義的分割則更加困難。目前進行視頻對象分割的一般步驟是:先對原始視頻/圖像數(shù)據(jù)進行簡化以利于分割,這可通過低通濾波、中值濾波、形態(tài)濾波來完成;然后對視頻/圖像數(shù)據(jù)進行特征提取,可以是顏色、紋理、運動、幀差、位移幀差乃至語義等特征;再基于某種均勻性標準來確定分割決策,根據(jù)所提取特征將視頻數(shù)據(jù)歸類;最后是進行相關(guān)后處理,以實現(xiàn)濾除噪聲及準確提取邊界。
(2)VOP視頻編碼技術(shù)
視頻對象平面(VOP,Video Object Plane)是視頻對象(VO)在某一時刻的采樣,VOP是MPEG-4視頻編碼的核心概念。MPEG-4在編碼過程中針對不同VO采用不同的編碼策略,即對前景VO的壓縮編碼盡可能保留細節(jié)和平滑;對背景VO則采用高壓縮率的編碼策略,甚至不予傳輸而在解碼端由其他背景拼接而成。這種基于對象的視頻編碼不僅克服了第一代視頻編碼中高壓縮率編碼所產(chǎn)生的方塊效應(yīng),而且使用戶可與場景交互,從而既提高了壓縮比,又實現(xiàn)了基于內(nèi)容的交互,為視頻編碼提供了廣闊的發(fā)展空間。MPEG-4支持任意形狀圖像與視頻的編解碼。
(3)視頻編碼可分級性技術(shù)
隨著因特網(wǎng)業(yè)務(wù)的巨大增長,在速率起伏很大的IP(Internet Protocol)網(wǎng)絡(luò)及具有不同傳輸特性的異構(gòu)網(wǎng)絡(luò)上進行視頻傳輸?shù)囊蠛蛻?yīng)用越來越多。在這種背景下,視頻分級編碼的重要性日益突出,其應(yīng)用非常廣泛,且具有很高的理論研究及實際應(yīng)用價值,因此受到人們的極大關(guān)注。
MPEG-4通過視頻對象層(VOL,Video Object Layer)數(shù)據(jù)結(jié)構(gòu)來實現(xiàn)分級編碼。MPEG-4提供了兩種基本分級工具,即時域分級(Temporal Scalability)和空域分級(SpatialScalability),此外還支持時域和空域的混合分級。每一種分級編碼都至少有兩層VOL,低層稱為基本層,高層稱為增強層?;緦犹峁┝艘曨l序列的基本信息,增強層提供了視頻序列更高的分辨率和細節(jié)。
在隨后增補的視頻流應(yīng)用框架中,MPEG-4提出了FGS(Fine Granularity Scalable,精細可伸縮性)視頻編碼算法以及PFGS(Progressive Fine Granularity Scalable,漸進精細可伸縮性)視頻編碼算法。
FGS編碼實現(xiàn)簡單,可在編碼速率、顯示分辨率、內(nèi)容、解碼復(fù)雜度等方面提供靈活的自適應(yīng)和可擴展性,且具有很強的帶寬自適應(yīng)能力和抗誤碼性能。但還存在編碼效率低于非可擴展編碼及接收端視頻質(zhì)量非最優(yōu)兩個不足。 PFGS則是為改善FGS編碼效率而提出的視頻編碼算法,其基本思想是在增強層圖像編碼時使用前一幀重建的某個增強層圖像為參考進行運動補償,以使運動補償更加有效,從而提高編碼效率。
(4)運動估計與運動補償技術(shù)
MPEG-4采用I-VOP、P-VOP、B-VOP三種幀格式來表征不同的運動補償類型。它采用了H.263中的半像素搜索(half pixel searching)技術(shù)和重疊運動補償(overlapped motioncompensation)技術(shù),同時又引入重復(fù)填充(repetitive padding)技術(shù)和修改的塊(多邊形)匹配(modified block (polygon)matching)技術(shù)以支持任意形狀的VOP區(qū)域。
此外,為提高運動估計算法精度,MPEG-4采用了MVFAST(Motion Vector Field Adaptive Search Technique)和改進的PMVFAST(Predictive MVFAST)方法用于運動估計。對于全局運動估計,則采用了基于特征的FFRGMET(Feature-based Fast and Robust Global Motion Estimation Technique)方法。
在MPEG-4視頻編碼中,運動估計相當耗時,對編碼的實時性影響很大。因此這里特別強調(diào)快速算法。運動估計方法主要有像素遞歸法和塊匹配法兩大類,前者復(fù)雜度很高,實際中應(yīng)用較少,后者則在H.263和MPEG中廣泛采用。目前有三種常用的匹配準則:(1)絕對誤差和(SAD, Sum of Absolute Difference)準則:(2)均方誤差(MSE, Mean Square Error)準則;(3)歸一化互相關(guān)函數(shù)(NCCF, Normalized Cross Correlation Function)準則。在上述三種準則中,SAD準則具有不需乘法運算、實現(xiàn)簡單方便的優(yōu)點而使用最多,但應(yīng)清楚匹配準則的選用對匹配結(jié)果影響不大。
在選取匹配準則后就應(yīng)進行尋找最優(yōu)匹配點的搜索工作。最簡單、最可靠的方法是全搜索法(FS, Full Search),但計算量太大,不便于實時實現(xiàn)。因此快速搜索法應(yīng)運而生,主要有交叉搜索法、二維對數(shù)法和鉆石搜索法,其中鉆石搜索法被MPEG-4校驗?zāi)P停╒M, Verification Model)所采納。
評論