新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應用 > 基于雙FPGA+ARM架構(gòu)的圖像壓縮系統(tǒng)

基于雙FPGA+ARM架構(gòu)的圖像壓縮系統(tǒng)

作者: 時間:2011-08-26 來源:網(wǎng)絡 收藏

目前的存儲方案大都無法支持高分辨率。另外,在一些DSP解決方案中,因為DSP接口不靈活以及DSP本身處理能力的限制,很難支持高分辨。

本文引用地址:http://2s4d.com/article/150285.htm

  本設(shè)計開發(fā)出了一套+的高速計算機屏幕圖像。通過對圖像壓縮任務的劃分,利用的并行計算能力和靈活的編程方式,完成圖像壓縮算法。對于壓縮后的碼流,系統(tǒng)采用管理,linux的嵌入式系統(tǒng)能夠以文件的形式存儲碼流,另外,ARM對網(wǎng)絡和音頻常用設(shè)備能方便地管理。系統(tǒng)支持主流接口(VGA,DVI),壓縮后的碼流可以存儲在本地硬盤,也可以通過網(wǎng)絡發(fā)送到遠端服務器。雙的設(shè)計對計算機屏幕圖像壓縮更為方便,原始圖像經(jīng)過前端預處理FPGA進行幀間檢測,以決定該幀圖像進入主FPGA的壓縮模式,主FPGA為核心壓縮引擎,負責完成高速圖像壓縮算法。

  1 系統(tǒng)與實現(xiàn)

  系統(tǒng)整體如圖1所示,采用雙FPGA+ARM架構(gòu),主要包括圖像前端預處理、圖像壓縮模塊和碼流管理部分。

  

  前面一塊FPGA完成前端預處理,如分辨率檢測、色彩轉(zhuǎn)換和圖像分析等功能;后面一塊FPGA用來實現(xiàn)圖像實時壓縮,其中ARM對系統(tǒng)進行管理,如壓縮后碼流管理、網(wǎng)絡管理和音頻錄制等。

  1.1 預處理模塊

  本系統(tǒng)同時支持VGA、DVI兩種主流顯卡接口。采用AD9888[2]作為視頻模數(shù)轉(zhuǎn)換器,TI公司的TFP403[3]為DVI接收芯片。Xilinx公司Virtex4[4](XC4VLX40)完成圖像預處理,主要包括圖像數(shù)據(jù)的采集、色彩空間轉(zhuǎn)換和幀間檢測。前端處理模塊如圖2所示。

  

  1.1.1 圖像數(shù)據(jù)采集

  預處理FPGA接收到的圖像數(shù)據(jù)為接口芯片送來的圖像數(shù)據(jù),包括像素時鐘信號(PCLK)、場同步信號(VSYNC)、行同步信號(HSYNC)以及數(shù)據(jù)信號(R[7:0],G[7:0],B[7:0])。圖像數(shù)據(jù)的采集包括判斷圖像分辨率和提取圖像數(shù)據(jù)兩個步驟。

  當前的計算機屏幕分辨率很多,工業(yè)VGA標準規(guī)定了各種分辨率的像素時鐘及場、行同步信號時序,根據(jù)相鄰場同步信號(VSYNC)之間行同步信號(HSYNC)數(shù)目,以及相鄰行同步信號(HSYNC)之間像素時鐘(PCLK)數(shù)目識別VGA信號分辨率。根據(jù)場同步信號(VSYNC)和行同步信號(HSYNC)提出圖像數(shù)據(jù)。

  1.1.2 色彩空間轉(zhuǎn)換

  VGA輸出為RGB信號,而人眼對圖像的亮度分量更為敏感,所以,對圖像數(shù)據(jù)進行色彩空間轉(zhuǎn)換,將RGB信號轉(zhuǎn)換為YUV信號,轉(zhuǎn)換公式:

  

  系統(tǒng)實現(xiàn)時采用4:2:2采樣模式,F(xiàn)PGA采用定點化處理后,得到亮度分量Y 和色度分量UV。

  1.1.3 幀間檢測

  幀間檢測的核心思想是對比相鄰兩幀圖像,判斷每個像素點是否變化。以3×3的塊為判斷單元,如果有變化則將該像素位置和像素值都存起來;如果沒有變化則不傳輸這些信息。當?shù)玫搅艘粋€4×4的塊以后把這個16個點的信息作為一個整體傳給后面的模塊,然后統(tǒng)計1幀圖像總的碼流大小。如果該值低于一個設(shè)定的閾值,則認為當前幀沒有變化,直接傳當前幀變化部分的像素和位置信息到后面的碼流整理模塊;如果統(tǒng)計后碼流的大小大于設(shè)定的閾值,則將當前幀送入LX100中進行壓縮。

  1.2 圖像壓縮模塊

  圖像壓縮為系統(tǒng)核心模塊,該壓縮引擎包括小波變換和熵編碼,算法全部由系統(tǒng)主FPGA完成。該FPGA芯片選用Xilinx公司的Virtex4[4]系列FPGA(XC4VLX160)。圖像壓縮引擎結(jié)構(gòu)如圖3。

  

  在系統(tǒng)算法設(shè)計中,圖像小波變換采用了離散小波變換的空間推舉算法(SCLA)[5]。不同于傳統(tǒng)的離散小波變換(DWT),SCLA對行與列同時進行變換,其乘法次數(shù)是小波變換算法中最少的,而重建圖像質(zhì)量也很高,PSNR值優(yōu)于JPEG,接近JPEG2000。編碼算法采用了改進的無鏈表零樹編碼算法(SLC),該算法綜合了多層次零樹編碼算法(SPIHT[6])和無鏈表零樹編碼(LZC[7])的特點,在性能上優(yōu)于LZC,逼近SPIHT,而且易于硬件實現(xiàn)。

  系統(tǒng)的架構(gòu)由FPGA和兩片外部SDRAM實現(xiàn)。SDRAM用于緩存小波變換后的小波系數(shù)。FPGA完成小波變換算法SCLA和熵編碼算法SLC。SCLA算法由5個流水線小波濾波器完成,每個濾波器完成一層小波分解,而小波分解運算需要乘法器,在FPGA芯片選型時,根據(jù)小波濾波器中需要乘法器的個數(shù)選擇FPGA。在本系統(tǒng)中,5個流水的小波濾波器包括36個乘法器,對于亮度分量Y和色度分量UV兩路數(shù)據(jù)并行處理,則需要72個乘法器,而在Virtex4系列FPGA(XC4VLX160)中有96個DSP單元。由小波變換得到小波系數(shù),系統(tǒng)設(shè)計時采用2片外部SDRAM和FPGA片內(nèi)SRAM結(jié)合的方法緩存小波系數(shù)。對于亮度分量Y和色度分量UV兩路數(shù)據(jù)并行處理以提高系統(tǒng)吞吐量,SDRAM1和SDRAM2分量用來緩存Y和UV的小波系數(shù)。熵編碼算法SLC負責對小波系數(shù)編碼,該算法以一棵小波樹為基本處理單元,即當前端小波系數(shù)構(gòu)成一棵小波樹時,熵編碼模塊便啟動編碼,從而完成一幀圖像所有小波樹的編碼。


上一頁 1 2 下一頁

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉