視頻壓縮技術(shù)解析

作者：時間：2012-02-23 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

6.1.1 視頻信號壓縮的可能性

本文引用地址：http://2s4d.com/article/165860.htm

視頻數(shù)據(jù)中存在著大量的冗余，即圖像的各像素數(shù)據(jù)之間存在極強(qiáng)的相關(guān)性。利用這些相關(guān)性，一部分像素的數(shù)據(jù)可以由另一部分像素的數(shù)據(jù)推導(dǎo)出來，結(jié)果視頻數(shù)據(jù)量能極大地壓縮，有利于傳輸和存儲。視頻數(shù)據(jù)主要存在以下形式的冗余。

1. 空間冗余
視頻圖像在水平方向相鄰像素之間、垂直方向相鄰像素之間的變化一般都很小，存在著極強(qiáng)的空間相關(guān)性。特別是同一景物各點的灰度和顏色之間往往存在著空間連貫性，從而產(chǎn)生了空間冗余，常稱為幀內(nèi)相關(guān)性。

2. 時間冗余
在相鄰場或相鄰幀的對應(yīng)像素之間，亮度和色度信息存在著極強(qiáng)的相關(guān)性。當(dāng)前幀圖像往往具有與前、后兩幀圖像相同的背景和移動物體，只不過移動物體所在的空間位置略有不同，對大多數(shù)像素來說，亮度和色度信息是基本相同的，稱為幀間相關(guān)性或時間相關(guān)性。

3. 結(jié)構(gòu)冗余
在有些圖像的紋理區(qū)，圖像的像素值存在著明顯的分布模式。如方格狀的地板圖案等。已知分布模式，可以通過某一過程生成圖像，稱為結(jié)構(gòu)冗余。
4. 知識冗余
有些圖像與某些知識有相當(dāng)大的相關(guān)性。如人臉的圖像有固定的結(jié)構(gòu)，嘴的上方有鼻子，鼻子的上方有眼睛，鼻子位于臉部圖像的中線上。這類規(guī)律性的結(jié)構(gòu)可由先驗知識得到，此類冗余稱為知識冗余。
5. 視覺冗余
人眼具有視覺非均勻特性，對視覺不敏感的信息可以適當(dāng)?shù)厣釛墶?在記錄原始的圖像數(shù)據(jù)時，通常假定視覺系統(tǒng)是線性的和均勻的，對視覺敏感和不敏感的部分同等對待，從而產(chǎn)生了比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來編碼)更多的數(shù)據(jù)，這就是視覺冗余。人眼對圖像細(xì)節(jié)、幅度變化和圖像的運(yùn)動并非同時具有最高的分辨能力。
人眼視覺對圖像的空間分解力和時間分解力的要求具有交換性，當(dāng)對一方要求較高時，對另一方的要求就較低。根據(jù)這個特點，可以采用運(yùn)動檢測自適應(yīng)技術(shù)，對靜止圖像或慢運(yùn)動圖像降低其時間軸抽樣頻率，例如每兩幀傳送一幀；對快速運(yùn)動圖像降低其空間抽樣頻率。
另外，人眼視覺對圖像的空間、時間分解力的要求與對幅度分解力的要求也具有交換性，對圖像的幅度誤差存在一個隨圖像內(nèi)容而變的可覺察門限，低于門限的幅度誤差不被察覺，在圖像的空間邊緣(輪廓)或時間邊緣(景物突變瞬間)附近，可覺察門限比遠(yuǎn)離邊緣處增大3～4倍，這就是視覺掩蓋效應(yīng)。
根據(jù)這個特點，可以采用邊緣檢測自適應(yīng)技術(shù)，對于圖像的平緩區(qū)或正交變換后代表圖像低頻成分的系數(shù)細(xì)量化，對圖像輪廓附近或正交變換后代表圖像高頻成分的系數(shù)粗量化；當(dāng)由于景物的快速運(yùn)動而使幀間預(yù)測編碼碼率高于正常值時進(jìn)行粗量化，反之則進(jìn)行細(xì)量化。在量化中，盡量使每種情況下所產(chǎn)生的幅度誤差剛好處于可覺察門限之下，這樣能實現(xiàn)較高的數(shù)據(jù)壓縮率而主觀評價不變。

6. 圖像區(qū)域的相同性冗余
在圖像中的兩個或多個區(qū)域所對應(yīng)的所有像素值相同或相近，從而產(chǎn)生的數(shù)據(jù)重復(fù)性存儲，這就是圖像區(qū)域的相似性冗余。在這種情況下，記錄了一個區(qū)域中各像素的顏色值，與其相同或相近的區(qū)域就不再記錄各像素的值。矢量量化方法就是針對這種冗余圖像的壓縮方法。
7. 紋理的統(tǒng)計冗余
有些圖像紋理盡管不嚴(yán)格服從某一分布規(guī)律，但是在統(tǒng)計的意義上服從該規(guī)律，利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量，稱為紋理的統(tǒng)計冗余。
電視圖像信號數(shù)據(jù)存在的信息冗余為視頻壓縮編碼提供了可能。

6.1.2 視頻信號的數(shù)字化和壓縮
模擬電視信號(包括視頻和音頻)通過取樣、量化后編碼為二進(jìn)制數(shù)字信號的過程稱為模數(shù)變換(A／D變換)或脈沖編碼調(diào)制(PCM， Pulse Coding Modulation)，所得到的信號也稱為PCM信號，其過程可用圖6-1(a)表示。若取樣頻率等于fs、用n比特量化，則PCM信號的碼率為nfs(比特／s)。 PCM編碼既可以對彩色全電視信號直接進(jìn)行，也可以對亮度信號和兩個色差信號分別進(jìn)行，前者稱為全信號編碼，后者稱為分量編碼。

PCM信號經(jīng)解碼和插入濾波恢復(fù)為模擬信號，如圖6-1(b)所示，解碼是編碼的逆過程，插入濾波是把解碼后的信號插補(bǔ)為平滑、連續(xù)的模擬信號。這兩個步驟合稱為數(shù)模變換（D／A變換）或PCM解碼。

圖 6-1 電視信號的數(shù)字化和復(fù)原
(a) A/D變換； (b) D/A變換

新聞中心

視頻壓縮技術(shù)解析

評論

相關(guān)推薦

技術(shù)專區(qū)