MPEG視頻壓縮技術(shù)的發(fā)展及其特點
1.4 MPEG-7
MPEG-7標(biāo)準(zhǔn)稱為“多媒體內(nèi)容描述接口”,它將擴(kuò)展現(xiàn)有內(nèi)容識別專用解決方案的有限能力,特別是還包括了更多數(shù)據(jù)類型。換言之,MPEG-7將規(guī)定一個用于描述各種不同類型多媒體信息的描述符的標(biāo)準(zhǔn)集合。
MPEG-7對定義其它描述符及其結(jié)構(gòu)(描述方案)和他們之間關(guān)系的方法進(jìn)行標(biāo)準(zhǔn)化。這種描述(也就是描述符和描述方案的組合)將與內(nèi)容本身關(guān)聯(lián)起來,以便對用戶感興趣的素材進(jìn)行快速高效的搜索。MPEG-7標(biāo)準(zhǔn)化了一種用來定義描述方案的語言,即描述定義語言(DDL)。加之相關(guān)的MPEG-7數(shù)據(jù)的AV素材,就可以被加上索引,并可進(jìn)行檢索。
MPEG-7像MPEG家族中其他成員一樣,是針對滿足特定需要的音、視頻信息的標(biāo)準(zhǔn)化表述,MPEG-7的描述符并不依賴于描述的內(nèi)容是編碼的或存儲的方式,可以把MPEG-7的描述說明附加到模擬制的電影里或使用紙張打印出來的圖片上。然而,盡管MPEG-7 描述不依賴于所處理素材的(編碼)表示方式,但由于在一定程度上它是在MPEG-4的基礎(chǔ)上發(fā)展起來的,而MPEG-4采用了按照具有一定時間關(guān)系和空間關(guān)系的對象來進(jìn)行音、視頻編碼的處理方式,因此用MPEG-4編碼有可能把描述說明附加到場景中的成員(對象)。所以,MPEG-7在描述中要提供不同的程度,才可能實現(xiàn)不同等級的識別。
因為描述特征必須在應(yīng)用環(huán)境中才有意義,所以會因用戶范圍的不同和應(yīng)用領(lǐng)域的不同而有所區(qū)別。這就意味著,同樣的素材,因為要和應(yīng)用范圍相匹配,可能會使用不同類型的特征來描述。當(dāng)然,所有這些描述都會以高效方式進(jìn)行編碼,業(yè)績能提高搜索的效率。同時,中間也可能存在過渡的抽象等級。抽象等級與提取特征的方式有關(guān),許多低等級的特征可以用全自動的方式提取出來,而高等級的特征就需要更多的人工交互。
2 MPEG的未來展望
MPEG視頻壓縮系統(tǒng)是一個技術(shù)含量很高的復(fù)雜集成系統(tǒng),在世界上也只有少數(shù)極有實力的公司才能推出商業(yè)產(chǎn)品。由于MPEG視頻壓縮系統(tǒng)的技術(shù)復(fù)雜、設(shè)備昂貴,故至今為止普及程度很低。但隨著技術(shù)的進(jìn)步、工藝的成熟和價格下降,其應(yīng)用面正在拓寬。過去需要花費上百萬元才能做成的事,現(xiàn)在幾萬元即可實現(xiàn)。如果你已有這樣的MPEG視頻壓縮系統(tǒng),就可以很容易地把錄像、照片、圖片、電影等節(jié)目加以壓縮存放在計算機(jī)中生活錄像、檔案管理等各類視頻制作中。
MPEG制定的是一系列的標(biāo)準(zhǔn),實際上很多情況下并沒有給出具體的實現(xiàn),最后的實施還要通過各個廠商和研發(fā)人員實現(xiàn)。MPEG的研空主要集中在兩方面:(1)對MPEG實現(xiàn)的研究;(2)進(jìn)一步研究圖像壓縮方法已獲得更大數(shù)據(jù)的壓縮比并且實現(xiàn)人機(jī)對話的功能。
從現(xiàn)在MPGE標(biāo)準(zhǔn)來看,作者認(rèn)為主要將集中在基于對象的處理方法上,也就對于不同的數(shù)據(jù)、內(nèi)容、要求將根據(jù)情況選擇不同方法處理。首先這是滿足人機(jī)對話最基于要求,也是滿足以人為本宗旨的要求,每一個人都可以根據(jù)自己的需求而要求采用不同的處理方法;其次,這是進(jìn)一步獲得更大圖像數(shù)據(jù)壓縮比的要求。以前基于數(shù)據(jù)本身和其交換與統(tǒng)計個性的壓縮方法很難滿足高速公路上的數(shù)據(jù)流速度,而基于對象的處理方法,要是現(xiàn)實基于模型的壓縮方法,可以針對不同對象(內(nèi)容)采用不同的壓縮方法,從而獲得巨大的壓縮比,而且滿足人的視覺要求。在MPEG-4和MPEG-7標(biāo)準(zhǔn)中已經(jīng)注意到這個問題,引入了甚至對象或稱為內(nèi)容的研究。因此,筆者認(rèn)為基于對象的圖像處理方法將是未來MPEG的發(fā)展方向。
MPGE視頻壓縮技術(shù)和VCD制作為我們開拓了一條發(fā)展的新路。MPEG視頻壓縮技術(shù)的推廣應(yīng)用,可能會產(chǎn)生一個新行業(yè),即多媒體制作。這方面的市場剛剛啟動,在教育、培訓(xùn)等方面幾乎是空白,是一個有很大發(fā)展?jié)摿Φ男袠I(yè),有待于開拓。未來是信息化的社會,各種多媒體數(shù)據(jù)的傳輸和存儲是信息處理的基本問題,本文僅僅從MPEG標(biāo)準(zhǔn)方面進(jìn)行了詳細(xì)的闡述,還有很多這方面的技術(shù)有待于研究和開發(fā),希望有志于此研究的人士共同探討。
評論