視頻壓縮技術(shù)解析
本文引用地址:http://2s4d.com/article/165860.htm 視頻數(shù)據(jù)中存在著大量的冗余, 即圖像的各像素數(shù)據(jù)之間存在極強(qiáng)的相關(guān)性。 利用這些相關(guān)性, 一部分像素的數(shù)據(jù)可以由另一部分像素的數(shù)據(jù)推導(dǎo)出來, 結(jié)果視頻數(shù)據(jù)量能極大地壓縮, 有利于傳輸和存儲。 視頻數(shù)據(jù)主要存在以下形式的冗余。 1. 空間冗余 2. 時間冗余 3. 結(jié)構(gòu)冗余 6. 圖像區(qū)域的相同性冗余 6.1.2 視頻信號的數(shù)字化和壓縮 圖 6-1 電視信號的數(shù)字化和復(fù)原
視頻圖像在水平方向相鄰像素之間、 垂直方向相鄰像素之間的變化一般都很小, 存在著極強(qiáng)的空間相關(guān)性。 特別是同一景物各點的灰度和顏色之間往往存在著空間連貫性, 從而產(chǎn)生了空間冗余, 常稱為幀內(nèi)相關(guān)性。
在相鄰場或相鄰幀的對應(yīng)像素之間, 亮度和色度信息存在著極強(qiáng)的相關(guān)性。 當(dāng)前幀圖像往往具有與前、 后兩幀圖像相同的背景和移動物體, 只不過移動物體所在的空間位置略有不同, 對大多數(shù)像素來說, 亮度和色度信息是基本相同的, 稱為幀間相關(guān)性或時間相關(guān)性。
在有些圖像的紋理區(qū), 圖像的像素值存在著明顯的分布模式。 如方格狀的地板圖案等。 已知分布模式, 可以通過某一過程生成圖像, 稱為結(jié)構(gòu)冗余。
4. 知識冗余
有些圖像與某些知識有相當(dāng)大的相關(guān)性。 如人臉的圖像有固定的結(jié)構(gòu), 嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于臉部圖像的中線上。 這類規(guī)律性的結(jié)構(gòu)可由先驗知識得到, 此類冗余稱為知識冗余。
5. 視覺冗余
人眼具有視覺非均勻特性, 對視覺不敏感的信息可以適當(dāng)?shù)厣釛墶?在記錄原始的圖像數(shù)據(jù)時, 通常假定視覺系統(tǒng)是線性的和均勻的, 對視覺敏感和不敏感的部分同等對待, 從而產(chǎn)生了比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來編碼)更多的數(shù)據(jù), 這就是視覺冗余。 人眼對圖像細(xì)節(jié)、 幅度變化和圖像的運(yùn)動并非同時具有最高的分辨能力。
人眼視覺對圖像的空間分解力和時間分解力的要求具有交換性, 當(dāng)對一方要求較高時, 對另一方的要求就較低。 根據(jù)這個特點, 可以采用運(yùn)動檢測自適應(yīng)技術(shù), 對靜止圖像或慢運(yùn)動圖像降低其時間軸抽樣頻率, 例如每兩幀傳送一幀; 對快速運(yùn)動圖像降低其空間抽樣頻率。
另外, 人眼視覺對圖像的空間、 時間分解力的要求與對幅度分解力的要求也具有交換性, 對圖像的幅度誤差存在一個隨圖像內(nèi)容而變的可覺察門限, 低于門限的幅度誤差不被察覺, 在圖像的空間邊緣(輪廓)或時間邊緣(景物突變瞬間)附近, 可覺察門限比遠(yuǎn)離邊緣處增大3~4倍, 這就是視覺掩蓋效應(yīng)。
根據(jù)這個特點, 可以采用邊緣檢測自適應(yīng)技術(shù), 對于圖像的平緩區(qū)或正交變換后代表圖像低頻成分的系數(shù)細(xì)量化, 對圖像輪廓附近或正交變換后代表圖像高頻成分的系數(shù)粗量化; 當(dāng)由于景物的快速運(yùn)動而使幀間預(yù)測編碼碼率高于正常值時進(jìn)行粗量化, 反之則進(jìn)行細(xì)量化。 在量化中, 盡量使每種情況下所產(chǎn)生的幅度誤差剛好處于可覺察門限之下, 這樣能實現(xiàn)較高的數(shù)據(jù)壓縮率而主觀評價不變。
在圖像中的兩個或多個區(qū)域所對應(yīng)的所有像素值相同或相近, 從而產(chǎn)生的數(shù)據(jù)重復(fù)性存儲, 這就是圖像區(qū)域的相似性冗余。 在這種情況下, 記錄了一個區(qū)域中各像素的顏色值, 與其相同或相近的區(qū)域就不再記錄各像素的值。 矢量量化方法就是針對這種冗余圖像的壓縮方法。
7. 紋理的統(tǒng)計冗余
有些圖像紋理盡管不嚴(yán)格服從某一分布規(guī)律, 但是在統(tǒng)計的意義上服從該規(guī)律, 利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量, 稱為紋理的統(tǒng)計冗余。
電視圖像信號數(shù)據(jù)存在的信息冗余為視頻壓縮編碼提供了可能。
模擬電視信號(包括視頻和音頻)通過取樣、 量化后編碼 為二進(jìn)制數(shù)字信號的過程稱為模數(shù)變換(A/D變換)或脈沖編碼調(diào)制(PCM, Pulse Coding Modulation), 所得到的信號也稱為PCM信號, 其過程可用圖6-1(a)表示。 若取樣頻率等于fs、 用n比特量化, 則PCM信號的碼率為nfs(比特/s)。 PCM編碼既可以對彩色全電視信號直接進(jìn)行, 也可以對亮度信號和兩個色差信號分別進(jìn)行, 前者稱為全信號編碼, 后者稱為分量編碼。
PCM信號經(jīng)解碼和插入濾波恢復(fù)為模擬信號, 如圖6-1(b)所示, 解碼是編碼的逆過程, 插入濾波是把解碼后的信號插補(bǔ)為平滑、 連續(xù)的模擬信號。 這兩個步驟合稱為數(shù)模變換(D/A變換)或PCM解碼。
(a) A/D變換; (b) D/A變換
評論