依靠視頻預(yù)/后處理實現(xiàn)更出眾的高清多媒體
消費類視頻應(yīng)用如今正在經(jīng)歷爆炸性的增長,可以提供逼真圖像并允許用戶根據(jù)不同顯示設(shè)備調(diào)整畫面的數(shù)字視頻壓縮技術(shù)正是這種增長的幕后推手。數(shù)字視頻技術(shù)的流行使得沉寂多年的電視市場再度活躍起來,視頻產(chǎn)品再次成為了消費電子領(lǐng)域的熱門商品。隨之而來的,如何借助視頻增強技術(shù)來進(jìn)行產(chǎn)品差異化就變得異常重要。
視頻產(chǎn)品的差異化
高清數(shù)字視頻編解碼算法的標(biāo)準(zhǔn)化確保了不同產(chǎn)品之間的協(xié)同工作能力,標(biāo)準(zhǔn)編碼器的輸出必須能夠被所有標(biāo)準(zhǔn)解碼器解碼。因此在編解碼算法上沒有太多的差異化空間。這對于終端產(chǎn)品設(shè)計者來說有好處,因為它利于芯片設(shè)計人員針對算法作出非常高效的設(shè)計;而對于那些希望自己的產(chǎn)品與眾不同的設(shè)計者來說,則是個缺點。好在用于提高圖像質(zhì)量和色彩還原能力的視頻預(yù)處理和后處理模塊提供了產(chǎn)品差異化的機(jī)會,同時也對產(chǎn)品的可編程性提出了要求。
視頻預(yù)處理算法
毫無疑問的,視頻流不會以來自傳感器的初始狀態(tài)傳輸,在進(jìn)行編碼之前,會對原始碼流進(jìn)行一系列的變換處理。主要的預(yù)處理操作包括:
* 像素掃描/數(shù)據(jù)傳輸–這一步操作只是簡單的從傳感器得到圖像。
* 拜爾格式解交織–現(xiàn)代視頻圖像技術(shù)用三色RGB拜爾濾波器替代了單色的圖像傳感器,因此來自傳感器的數(shù)據(jù)流包括了紅、綠、藍(lán)的顏色信息。這些信息被分離后,變換為YCbCr的亮度與色度信息來表示圖像。
* 噪聲濾波–電子世界中總是會有噪聲存在,而降低或消除噪聲的最佳階段是在進(jìn)行編碼之前。
* 抖動檢測與補償–抖動檢測與補償可以減小因相機(jī)抖動造成的圖像質(zhì)量下降。
* 局部動態(tài)范圍補償–在特定的模式下,圖像的動態(tài)范圍可能會超出傳感器的極限。而照相機(jī)或攝像機(jī)應(yīng)該具備智能調(diào)整曝光量從而擴(kuò)展傳感器基本動態(tài)范圍的功能。
* 對焦調(diào)整(銳化)–圖像傳感器無法捕獲連續(xù)的圖像信息。它們將圖像分解為一個個像素,然后根據(jù)不同的分辨率在像素間進(jìn)行插值并重新組合成新的圖像。這種操作會導(dǎo)致圖像銳度的下降,但通過適當(dāng)?shù)念A(yù)處理算法是可以糾正的。除此之外,銳化算法還可以使由于鏡頭原因輕微跑焦的圖像看起來更銳利。
* 顏色校正–不同色溫下的白光是有所不同的,這會影響到最終獲取的圖像。除此之外,不同的顯示設(shè)備處理顏色的方法也不一樣。視頻系統(tǒng)中的顏色校正補償功能可以糾正顏色偏移,特別是皮膚色調(diào)的偏移
* 人臉識別–在人物眾多的圖像中,拍攝者通常希望圖像聚焦在人物的面部。照相機(jī)和攝像機(jī)的一個重要功能就是能夠識別人臉并自動對焦。
* 立體圖像–根據(jù)平面圖像的密度信息來構(gòu)建立體圖像,這種預(yù)處理常用在融合了虛擬和真實圖像的混合現(xiàn)實系統(tǒng)中。
圖1是四種預(yù)處理算法的示例圖像:噪聲濾波、抖動檢測與補償、動態(tài)范圍補償和顏色校正。
圖1: 四種預(yù)處理算法示例:噪聲濾波、抖動檢測與補償、動態(tài)范圍補償和顏色校正。
評論