視頻復(fù)雜度自適應(yīng)的H．264基本單元層碼率控制方法

作者：時間：2016-10-15 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

摘要：為了提高JVT-H017碼率控制提案中的基本單元層比特數(shù)分配方法在視頻序列復(fù)雜度較高時分配的準(zhǔn)確度，提出了一種視頻復(fù)雜度自適應(yīng)的基本單元層碼率控制方法。利用DMAD參數(shù)來判斷視頻場景的復(fù)雜度，對JVT-H017的比特數(shù)分配方法進(jìn)行了改進(jìn)；同時提出了一種基本單元層編碼的理想情況，并以此理想情況下的比特數(shù)消耗情況來對基本單元的比特數(shù)進(jìn)行修正。仿真結(jié)果表明，該方法有效地提高了視頻編碼的峰值信噪比(PSNR)，最大可提高0．49 dB，并且輸出碼率更接近預(yù)定編碼碼率。
關(guān)鍵詞：H．264；碼率控制；預(yù)測模型；視頻復(fù)雜度

碼率控制一直是H．264／AVC視頻編碼標(biāo)準(zhǔn)的研究熱點。由Li和Ma等人提出的JVT-H017提案在碼率、圖像質(zhì)量和緩沖器占用度上達(dá)到了良好平衡，已成為最主流的碼率控制方法。JVT-H017使用待編碼基本單元的MAD(平均絕對誤差)預(yù)測模型的參數(shù)來預(yù)測當(dāng)前幀剩余所有基本單元的MAD，并根據(jù)所得結(jié)果為當(dāng)前基本單元分配比特數(shù)。當(dāng)視頻復(fù)雜度較高時，基本單元的時空相關(guān)性都明顯降低，此時這種基本單元比特數(shù)分配方法會產(chǎn)生較大誤差。
對此，許多學(xué)者提出了很多改進(jìn)的碼率控制方法。Jianpeng提出使用二維窗口來選取模型參數(shù)的歷史數(shù)據(jù)點，但二維窗口通常數(shù)據(jù)點較少，準(zhǔn)確度受到限制；Yang提出了空域的MAD預(yù)測模型來增加MAD預(yù)測的精確度，但計算復(fù)雜度比較高；Yin提出使用相鄰已編碼基本單元的MAD加權(quán)平均值來計算當(dāng)前基本單元的MAD，但沒有準(zhǔn)確利用基本單元空域時域的相關(guān)性；Jen-Yeu提出利用DMAD(Difference of MAD)改進(jìn)JVT-H017的幀間比特數(shù)分配方法并將其應(yīng)用到基本單元層，改善了高復(fù)雜度視頻和場景變換時的編碼質(zhì)量。
文中在Jen-Yeu提出的基本單元層碼率控制方法的基礎(chǔ)上，對其復(fù)雜度參數(shù)進(jìn)行了重新定義，提高了復(fù)雜度估計的準(zhǔn)確性，同時利用理想狀況下的比特數(shù)消耗情況來對基本單元比特數(shù)預(yù)測值進(jìn)行修正。文中所有仿真均以官方驗證軟件JMl3．2為實驗平臺。

1 JVT-H017基本單元層碼率控制誤差分析
JM軟件采用了JVT-H017算法中的基本單元目標(biāo)比特數(shù)計算方法

其中，i表示當(dāng)前幀的序號，j表示當(dāng)前基本單元在當(dāng)前幀中的序號，Ti(j)表示基本單元的目標(biāo)比特數(shù)，PMAD表示基本單元MAD的線性預(yù)測值，TRi(j)表示第i幀中第j個基本單元編碼前該幀剩余比特數(shù)，Nunit表示當(dāng)前幀的基本單元總數(shù)。
JVT-H017的比特數(shù)分配方法并沒有充分考慮相鄰幀的基本單元間的時間和空間相關(guān)性，當(dāng)視頻內(nèi)容變化速度比較快或發(fā)生場景變換時，基本單元之間的時空相關(guān)性變差，此時使用當(dāng)前基本單元j的線性預(yù)測系數(shù)去預(yù)測當(dāng)前幀剩余基本單元的MAD而得到的PMADi(k){k=j+1，j+2…Nunit}會有較大的誤差，而基于PMADi(k)計算的目標(biāo)比特數(shù)的準(zhǔn)確度也會有較大幅度下降，使得基本單元的比特數(shù)分配變得不準(zhǔn)確。

2 基于DMAD的基本單元比特分配方法
在JVT-H017算法中，最終為待編碼P幀分配的比特數(shù)f(i)由和兩部分組成

其中，是從當(dāng)前GOP剩余比特數(shù)角度為待編碼P幀分配的比特數(shù)，是從編碼碼率和緩沖器占用度角度分配給待編碼P幀的比特數(shù)。在JM13．2模型中，β設(shè)為常數(shù)0．5。
Jen-Yeu通過實驗發(fā)現(xiàn)式(2)中的系數(shù)β與圖像的時間相關(guān)性有很大的關(guān)系，進(jìn)而影響了幀間比特數(shù)分配和幀圖像的編碼信噪比，并基于此提出用DMAD(Difference of MAD)來判斷視頻序列的復(fù)雜度。第i幀第j個基本單元的DMAD為
DMAD(i，j)=|MAD(i，j)-MAD(i-1，j)| (3)
當(dāng)DMAD值較大時，表明連續(xù)的兩幀之間某一幀的預(yù)測誤差較大，此時圖像中極有可能有高速的物體運動或發(fā)生場景變換。
DMAD(i，j)被進(jìn)一步歸一化為

用來代替式(2)中的權(quán)重系數(shù)β。由于H．264是以基本單元為基本單位進(jìn)行編碼的，所以式(2)被進(jìn)一步改進(jìn)并用來計算基本單元的目標(biāo)比特數(shù)，如式(5)所示。

其中，f(i，j)表示第i幀第j個基本單元的目標(biāo)比特數(shù)，Nunit為一幀中的基本單元總數(shù)。
但由于式(4)的分母選自幀內(nèi)已編碼基本單元的最大值，如果當(dāng)前基本單元的DMAD只是局部最大，而其本身絕對值并不高，也會使取得比較大的值，從而被誤判斷為高復(fù)雜度，因此并不能很好的反應(yīng)不同視頻序列間復(fù)雜度的區(qū)別。
對此，文中將復(fù)雜度從低到高排列的akiyo，mother daughter，suzie，foreman，coastguard，mobile 6個序列(在常見碼率下編碼，6個序列的PSNR以約2．5～4 dB遞減，表明6個序列的復(fù)雜度有比較明顯的差異，能夠反映不同視頻序列編碼的普遍情況)以24 kbits／s，48kbits／s和64 kbits／s的碼率進(jìn)行150幀編碼，記錄各序列每次編碼時所有P幀基本單元的DMAD值。對同一序列在3種碼率下編碼的基本單元DMAD記錄值進(jìn)行統(tǒng)一排序并求取排序結(jié)果的中位數(shù)，該中位數(shù)代表了對應(yīng)序列的基本單元的中等復(fù)雜度。求得6個序列編碼結(jié)果的中位數(shù)的平均值為0．18，它反映了不同視頻序列編碼時基本單元的中等復(fù)雜度的均值。
選取0．18作為判斷基數(shù)，將改進(jìn)為β(i，j)。

β(i，j)與視頻復(fù)雜度成正相關(guān)，可以有效反映相鄰幀間圖像復(fù)雜度的變化情況和不同視頻序列復(fù)雜度的區(qū)別。若DMAD(i，j)=0．18，則當(dāng)前基本單元為具有中等復(fù)雜度的基本單元，此時β(i，j)=0．5；當(dāng)視頻復(fù)雜度降低時，DMAD(i，j)減小，β(i，j)也會相應(yīng)減小；反之亦然。而當(dāng)DMAD接近或大于0．36時，即認(rèn)為視頻復(fù)雜度很高，或發(fā)生場景變換，此時β(i，j)取值為0．9?；?beta;(i，j)，將式(5)改進(jìn)為

在實際編碼時，由于在編碼前無法得到當(dāng)前基本單元的DMAD，所以用當(dāng)前基本單元的PMAD來計算其DMAD的近似值
DMAD(i，j)≈|PMD(i，j)-MAD(i-1，j)| (8)

3 理想的比特數(shù)消耗情況
JVT-H017在幀內(nèi)比特數(shù)消耗量超過幀預(yù)測值后，采用簡單增加量化參數(shù)的方法來減少后續(xù)基本單元的比特數(shù)消耗，但在此之前并無其它的比特數(shù)限制措施。因此提出一種視頻編碼的理想條件，并用這種理想條件下的比持?jǐn)?shù)消耗情況來修正超過幀預(yù)測值前基本單元的比特數(shù)分配。假設(shè)待編碼幀的比特數(shù)預(yù)測完全準(zhǔn)確，剛好等于該幀實際比特數(shù)消耗量，幀內(nèi)各基本單元的MAD均相等，且消耗比特數(shù)相同，則該幀比特數(shù)消耗情況如圖1所示。

本文引用地址：http://2s4d.com/article/201610/306852.htm

圖1中，Nunit是幀內(nèi)基本單元總數(shù)，TRi(j)表示第i幀中第j個基本單元編碼前該幀剩余比特數(shù)，設(shè)首基本單元的序號為1，那么易知TRi(1)即為當(dāng)前幀比特數(shù)預(yù)測值，TRi(1)／Nunit為上述理想狀況下一個基本單元所消耗的比特數(shù)(各基本單元消耗比特數(shù)相同)。
根據(jù)圖1易知，第i幀中第j個基本單元編碼完成后該幀消耗的總比特數(shù)的理想值與實際值的差Di(j)可由式(9)表示。

其中，TAi(k)表示編碼第i幀中第k個基本單元實際消耗的比特數(shù)。
當(dāng)Di(j)0時，即認(rèn)為該幀比特數(shù)消耗過多，此時適當(dāng)增加量化參數(shù)(仿真中為增加1)以更強(qiáng)的控制后續(xù)基本單元的比特數(shù)消耗。

4 仿真結(jié)果與分析
文中以H．264官方驗證軟件JM13．2作為實驗平臺，對提出的基本單元層碼率控制方法進(jìn)行仿真。測試序列為QCIF格式，共編碼150幀，首幀為I幀，其余為P幀，不考慮跳幀，幀率為15幀每秒，I幀和首P幀的初始量化步長的計算采用默認(rèn)方法。分別對復(fù)雜度相差較大的akiyo，earphone，foreman和mobile序列進(jìn)行編碼測試。

表1所示為在24 kbits／s，48 kbits／s和64 kbits／s 3種編碼碼率下對上述序列進(jìn)仃編碼的結(jié)果。從表1可見，除了在24kbits／s碼率下編碼mobile 序列外，采用本文算法編碼的平均峰值信噪比均要高于JM軟件和[6]中提出的算法，最大可比JM提高0．49dB，比[6]中的算法提高0，18dB。碼率控制的結(jié)果也更為精確，JM13．2的實際碼率與預(yù)定碼率的平均誤差是0．37％，[6]中算法的碼率平均誤差是0．32％，而本文算法的碼率平均誤差是0.28％，可見本文算法更符合預(yù)定的碼率要求。
為了驗證算法在場景變換時的編碼性能，在48 kbits／s碼率下，用3種方法分別對carphone序列和akiyo序列的混合序列C55A55進(jìn)行編碼測試，混合序列在第55幀發(fā)生場景變換。編碼結(jié)果如圖2和圖3所示。由圖2可見，本文提出的方法在場景變換幀及后續(xù)幀均取得了更高的編碼信噪比，提高了新場景的編碼質(zhì)量。

圖3對3種碼率控制方法在編碼過程中的緩沖區(qū)狀態(tài)進(jìn)行了對比。從圖3可見，文中方法比JM更接近目標(biāo)緩沖區(qū)占用度，并且在場景變換時有效降低了緩沖區(qū)占用度，在編碼器緩沖區(qū)尺寸有限的情況下，為新場景提供丁更多可用編碼資源。

5 結(jié)論
文中提出了一種復(fù)雜度自適應(yīng)的基本單元層碼率控制算法。該算法利用DMAD參數(shù)來判斷視頻復(fù)雜度，對JVT-H017的比特數(shù)分配方法進(jìn)行了改進(jìn)，并利用理想的基本單元層編碼情況來對基本單元比特數(shù)分配進(jìn)行修正。仿真表明，該方法在一般情況和場景變換時的編碼質(zhì)量均高于JM模型，平均峰值信噪比最大可提高0．49 dB，實際編碼碼率更接近預(yù)定要求。

新聞中心

視頻復(fù)雜度自適應(yīng)的H．264基本單元層碼率控制方法

評論

相關(guān)推薦

技術(shù)專區(qū)