基于OMAP3的視頻解碼器的通用解碼方案
分析了0MAP平臺的硬件結構與軟件編程特點;總結了TI公司提供的專用圖像圖形處理庫(IMGLIB)的使用技巧,并與OMAPl510進行了部分比較;在流行的視頻編解碼標準的基礎上,提出了基于OMAP3的視頻解碼器的通用解碼方案。
本文引用地址:http://2s4d.com/article/269123.htm1 OMAP平臺簡介
開放式多媒體應用平臺OMAP結合高性能、低功耗的DSP核與控制性能強大的ARM內核,是一種開放式的、可編程的體系結構,目前主要有OMAP1X、OMAP2X和OMAP3X系列。以OMAP3530為例,硬件結構如圖1所示。
1.1 OMAP3530的硬件平臺
0MAP3530的硬件平臺主要由ARM內核、DSP內核以及流量控制器(Traffic Controler,TC)組成。
(1)ARM內核
OMAP3530采用ARM Cortex-A8核,工作主頻最高可達720 MHz。它包括存儲器管理單元、16 KB的高速指令緩沖存儲器、16 KB的數(shù)據(jù)高速緩沖存儲器和256K字的二級Cache;片內有64 KB的內部SRAM,為液晶顯示等應用提供了大量的數(shù)據(jù)和代碼存儲空間。CortexA8內核采用13級流水線、32位的RISC處理器架構。系統(tǒng)中的控制寄存器對MMU、Cache和讀寫緩存控制器進行存取操作。ARM內核具有整個系統(tǒng)的控制權,可以設置DSP、TC以及各種外設的時鐘及其他工作參數(shù),控制DSP的運行停止。OMAP3530平臺可支持包含繪圖、多媒體內容和Java程序的先進應用。
(2)DSP內核
TMS320C64X+內核具有最佳的功耗性能比,工作主頻最高為520 MHz;它具有高度的并行能力,32位讀寫和功能強大的EMIF,雙流水線的獨立操作以及雙MAC的運算能力。它采用3項關鍵的革新技術:增大的空閑省電區(qū)域、變長指令和擴大的并行機制。其結構針對多媒體應用高度優(yōu)化,適合低功耗的實時語音圖像處理。另外,TMS320C64X+內核增加了固化了算法的硬件加速器,來處理運動估計、8×8的DCT/IDCT和1/2像素插值,降低了視頻處理的功耗。
(3)流量控制器
流量控制器TC用于控制ARM、DSP、DMA以及本地總線對OMAP3530內所有存儲器(包括SRAM,SDRAM、Flash和ROM等)的訪問。
OMAP3530具有豐富的外圍接口,如液晶控制器、存儲器接口、攝像機接口、空中接口、藍牙接口、通用異步收發(fā)器、I2C主機接口、脈寬音頻發(fā)生器、串行接口、主客戶機USB口、安全數(shù)字多媒體卡控制器接口、鍵盤接口等。這些豐富的外圍接口使應用OMAP的系統(tǒng)具有更大的靈活性和可擴展性。
1.2 OMAP3530的軟件平臺
利用OMAP可以建立兩個操作系統(tǒng):基于ARM的操作系統(tǒng)(如WinCE、Linux等),以及基于DSP的DSP/BIOS。連接兩個操作系統(tǒng)使用的核心技術是DSP/BIOS橋。0MAP支持多種實時多任務操作系統(tǒng)在ARM微處理器上工作,用來對ARM微處理器進行實時多任務調度管理,對TMS320C64X+進行控制和通信;同時,支持多種實時多任務操作系統(tǒng)在TMS320C64X+上工作,實現(xiàn)復雜的多媒體信號處理。DSP/BIOS橋包含DSP管理器、DSP管理服務器、DSP和外圍接口鏈接驅動器。DSP/BIOS橋提供運行在Cortex-A8上的應用程序和運行TMS320C64X+上的算法之間的通信管理服務。開發(fā)者可以利用DSP/BIOS橋中的應用編程接口控制在DSP中實時任務的執(zhí)行,并同DSP交換任務運行結果和狀態(tài)消息。在這個環(huán)境下,開發(fā)者可以調用局部DSP網關組件來實現(xiàn)諸如視頻、音頻和語音等功能。因此,開發(fā)者不需要了解DSP和DSP/BIOS橋,就能開發(fā)新的應用軟件。使用標準應用編程接口開發(fā)的應用軟件,與基于0MAP的未來無線設備兼容。
2 視頻編碼標準與OMAP圖形圖像庫應用
2.1 視頻編碼標準
從1988年開始,ISO/IEC MPEG和ITU-T針對不同的應用制訂了一系列視頻編碼國際標準。MPEG的有MPEG-1、MPEG-2、MPEG-4標準,ITU-T的有H.261、H.263、H_263+/H.263++以及H.264標準。2001年12月,ISO和ITU-T正式成立聯(lián)合視頻小組(Joint Video Team,JVT)共同制定新的H.264編碼標準。2002年6月,我國信息產業(yè)部制訂了我國的數(shù)字音視頻編碼技術標準(Audio-Video Coding Standard,AVS)。AVS是我國具備自主知識產權的第二代信源編碼標準。與目前比較流行的標準(如MPEG-2、MPEG-4、H.263、H.264)相比,從編碼效率來看,MPEG-4是MPEG-2的1.4倍,AVS和H.264都是MPEG-2的2倍以上;從算法復雜度上來看,H.264的算法在編碼端比MPEG-2復雜4~5倍,在解碼端復雜2~3倍,而AVS在復雜度上比H.264有較大幅度降低,且不需要交納高昂的專利費用。
目前,應用比較廣泛的視頻編碼標準中,基本上都有如下的步驟:將圖像序列編碼為幀內模式和幀問模式兩種,并且分別進行編碼。采用幀內編碼時,直接對8×8的像素塊進行DCT變換,然后將量化系數(shù)進行變長編碼后形成輸出碼流;另一路經反量化、反DCT變換后形成恢復圖像,直接存入幀存儲器。采用幀間編碼時,對原始數(shù)據(jù)的每個塊先進行運動估計,并與經運動估計后的預測圖像相減,產生差分圖像,接著進行DCT變換和量化,并同運動矢量數(shù)據(jù)一起編碼形成碼流;另一路經反量化、反DCT變換后形成恢復圖像,存入幀存儲器,用于下一步的運動估計。
不同的標準具有各自的特點,例如MPEGl與H.261采用整像素,MPEG4和H.263采用半像素,H.264與AVS采用1/4至1/8像素精度的運動估計,H.261采用單參考幀,H.264與AVS采用多參考幀等。特別是目前的H.264標準,采用整數(shù)DCT/IDCT、幀內預測、多模式運動估計、去塊效應濾波器等先進技術,造成了極大的算法復雜度,對硬件實時解碼提供了很高的要求。
2.2 OMAP圖形圖像庫(IMGLIB)應用
針對圖像與視頻處理的需要,TI提供了IMGLIB庫供C程序調用。庫里內容主要有2部分:
①硬件加速部分。由匯編語言編寫,但是計算由硬件的加速模塊來實現(xiàn),無法修改。例如DCT/IDCT都是針對8×8塊進行的,變換矩陣已經固定,硬件加速指令共有16種,其中DCT/IDCT各1條,運動估計指令10條,插值指令4條。
②軟件加速部分。用匯編語言編寫,包括矩陣量化反量化、JPEG變長編碼、一維/二維離散小波變換反變換及小波包變換反變換,以及圖像的直方圖計算、邊緣檢測、帶移位操作的3×3掩模操作等。這些軟件加速指令都提供了標準的C接口,用戶可以直接調用,也可以模仿編寫規(guī)則編譯生成自己的庫文件。
存儲器相關文章:存儲器原理
矢量控制相關文章:矢量控制原理
評論