數(shù)字家庭新秀-數(shù)字可視對(duì)講技術(shù)探討
引言
20世紀(jì)60年代,電視改變了人們的生活,出現(xiàn)了“電視一代”;80年代,電腦改變了人們的工作方式,促成了“電腦一代”;90年代,互聯(lián)網(wǎng)改變了人們獲取信息的方式,誕生了“網(wǎng)絡(luò)一代”。進(jìn)入21世紀(jì),數(shù)字化的生活方式將無處不再,最終會(huì)全面進(jìn)入每個(gè)人的家庭,數(shù)字家庭的浪潮已經(jīng)洶涌澎湃。
傳統(tǒng)的數(shù)字家庭中心之爭:PC中心論、TV中心論及SetBox中心論,其優(yōu)勢和劣勢都很明顯,就單一產(chǎn)品而言都難以獨(dú)自承擔(dān)數(shù)字家庭的重任。近年來市場上出現(xiàn)了另一產(chǎn)品逐漸承擔(dān)了數(shù)字家庭越來越多的功能和責(zé)任,這就是數(shù)字可視對(duì)講。傳統(tǒng)的樓宇可視對(duì)講產(chǎn)品逐漸往數(shù)字化,網(wǎng)絡(luò)化、智能化的方向發(fā)展,可視對(duì)講產(chǎn)品除了擔(dān)當(dāng)可視對(duì)講、遙控開鎖、報(bào)警等功能外,還實(shí)現(xiàn)了遠(yuǎn)程視頻監(jiān)控、異動(dòng)報(bào)警、門禁、三表抄送、信息發(fā)布、智能家居控制、上網(wǎng)及視頻點(diǎn)播甚至手機(jī)聯(lián)動(dòng)等增值服務(wù)。這類產(chǎn)品大多內(nèi)置了性能強(qiáng)大的Soc處理器和觸摸TFT顯示屏,尤其標(biāo)配的網(wǎng)絡(luò)功能,給產(chǎn)品帶來了更多的想象空間,將越來越多的融合PVR、DPF數(shù)碼相框、可視電話、媒體播放器等數(shù)字媒體功能。數(shù)字可視對(duì)講悄悄地充當(dāng)了數(shù)字家庭另一中心的角色。
可視對(duì)講發(fā)展趨勢
可視對(duì)講經(jīng)歷了從模擬黑白、彩色到數(shù)字化的歷程,向著網(wǎng)絡(luò)化和智能化的方向發(fā)展,并逐漸融合多種媒體功能。模擬可視對(duì)講(黑白、彩色),音視頻通過同軸電纜傳輸,控制信號(hào)通過單片機(jī)總線傳輸,其技術(shù)特點(diǎn)決定著產(chǎn)品有著先天的缺點(diǎn),而數(shù)字化網(wǎng)絡(luò)傳輸帶來的不僅僅是通過將音視頻及所有控制信息均通過一根網(wǎng)絡(luò)線傳輸克服了模擬傳輸帶來的弊端,更為重要的是為用戶增添了更為實(shí)用的增值業(yè)務(wù)。下表所示為模擬對(duì)講與數(shù)字對(duì)講的對(duì)比。
今后數(shù)字可視對(duì)講的發(fā)展更多的是融合了智能家居控制,逐漸成為智能家居的控制中心,同時(shí)也會(huì)將越來越多的附加功能加入其中。
圖2 數(shù)字可視對(duì)講Roadmap plan
數(shù)字可視對(duì)講技術(shù)原理及框圖
數(shù)字可視對(duì)講系統(tǒng)的構(gòu)成,一般包含這么幾個(gè)模塊:室內(nèi)機(jī),梯口機(jī)、交換機(jī)、管理機(jī)等。如圖3所示。
圖3 數(shù)字可視對(duì)講系統(tǒng)框圖
{{分頁}}
訪客來訪,通過梯口機(jī)撥號(hào)呼叫指定的室內(nèi)機(jī),梯口機(jī)通過將訪客的影音信息數(shù)字化后編碼壓縮傳送給指定的室內(nèi)機(jī),室內(nèi)機(jī)接收到網(wǎng)絡(luò)傳輸過來的影音信號(hào)進(jìn)行解壓縮顯示,確定訪客身份后,按動(dòng)開鎖鍵開啟梯口的門鎖。同時(shí),梯口機(jī)和室內(nèi)機(jī)之間還實(shí)現(xiàn)了VoIP,兩個(gè)終端可實(shí)現(xiàn)雙向語音對(duì)講,為業(yè)主辨別來客身份提供進(jìn)一步溝通、確認(rèn)之需要。
在兩個(gè)室內(nèi)機(jī)或室內(nèi)機(jī)與管理機(jī)之間,系統(tǒng)則提供了雙向的視頻及語音傳輸功能。在功能實(shí)現(xiàn)上,梯口機(jī)、管理機(jī)都可以歸結(jié)為室內(nèi)機(jī)。室內(nèi)機(jī)的功能最為全面,實(shí)現(xiàn)音視頻的壓縮傳輸、接收解壓縮顯示和回聲抵消功能,同時(shí)可作為各項(xiàng)網(wǎng)絡(luò)增值業(yè)務(wù)的實(shí)現(xiàn)終端。本文以海思半導(dǎo)體的多用途媒體網(wǎng)絡(luò)處理芯片Hi3510為例介紹室內(nèi)機(jī)的構(gòu)成。Hi3510是海思半導(dǎo)體針對(duì)媒體壓縮/解壓縮處理、網(wǎng)絡(luò)傳輸、VoIP多功能混合應(yīng)用市場開發(fā)的處理芯片,已廣泛應(yīng)用于可視電話、網(wǎng)絡(luò)攝像機(jī)、網(wǎng)絡(luò)視頻服務(wù)器及數(shù)字可視對(duì)講等產(chǎn)品上。從Hi3510應(yīng)用于數(shù)字可視對(duì)講的系統(tǒng)框圖中,我們可以看出完整的信號(hào)處理元素和流程。
圖4 Hi3510數(shù)字可視對(duì)講最小系統(tǒng)框圖
以Hi3510為核心,配備圖像傳感器作為影像輸入源,視頻信號(hào)通過ITU656接口輸送給Hi3510,Hi3510對(duì)數(shù)字視頻進(jìn)行壓縮處理,經(jīng)過PHY將數(shù)據(jù)以TCP/IP包傳輸?shù)侥康牡?同時(shí),Hi3510對(duì)通過PHY傳送的TCP/IP包進(jìn)行解碼、縮放,通過RGB888接口送至TFT Module顯示;為方便用戶進(jìn)行選擇操作,可通過SPI接口及GPIO實(shí)現(xiàn)觸摸屏和按鍵功能;語音數(shù)據(jù)則通過一顆音頻Codec進(jìn)行AD編碼后通過I2S總線送往Hi3510處理,Hi3510不僅僅需要對(duì)語音作壓縮處理以備傳輸,而且還需要實(shí)現(xiàn)雙向語音傳輸所需的回聲抵消功能、唇音同步以及按鍵的雙音多頻DTMF等。多達(dá)兩個(gè)的USB1.1接口提供了豐富的個(gè)人存貯界面,各種影音即可通過網(wǎng)絡(luò)傳輸也可通過USB及USB轉(zhuǎn)SD存貯至本地,以便需要時(shí)播放。若需擴(kuò)展WIFI無線傳輸,另一個(gè)USB1.1接口可提供成本低且易實(shí)現(xiàn)的USB轉(zhuǎn)Wi-Fi方案。
技術(shù)核心:視頻壓縮、語音處理、網(wǎng)絡(luò)傳輸
未來多媒體產(chǎn)品的核心不外乎:音視頻壓縮,語音處理和網(wǎng)絡(luò)傳輸三大部分。無論是從PC娛樂、SetBox,還是Digital TV以及任何多媒體產(chǎn)品都可以看到這三大要素的蹤影。作為數(shù)字家庭中的新秀,這三要素也是構(gòu)成數(shù)字可視對(duì)講系統(tǒng)的基礎(chǔ)。
由于歷史原因,早期的數(shù)字可視對(duì)講的視頻編碼格式多為H.263,其目的是為了和可視電話兼容。H.264作為H.263的升級(jí)版本提供了更大的壓縮比和更好的網(wǎng)絡(luò)適應(yīng)性?;诖?,越來越多的數(shù)字可視對(duì)講產(chǎn)品采用H.264標(biāo)準(zhǔn)作為視頻壓縮的格式。 H.264最大特點(diǎn)是對(duì)帶寬的要求很低,在同等的還原圖像質(zhì)量的情況下,H.264要比MPEG-4節(jié)省50%以上的碼率。同時(shí),H.264在設(shè)計(jì)之初就考慮到了在不同網(wǎng)絡(luò)資源下的分級(jí)編碼傳輸。H.264具有較強(qiáng)的容錯(cuò)能力,在質(zhì)量不穩(wěn)定的網(wǎng)絡(luò)環(huán)境中,可以得到比MPEG4編碼視頻更好的質(zhì)量。當(dāng)然,H.264帶來的好處不是免費(fèi)的、更高的壓縮比和良好的網(wǎng)絡(luò)適應(yīng)性能,而是處理算法的復(fù)雜化,對(duì)處理器提出了更高的性能要求。
{{分頁}}
為了適應(yīng)網(wǎng)絡(luò)傳輸?shù)奶攸c(diǎn),語音也需要低帶寬、高音質(zhì)的音頻編碼標(biāo)準(zhǔn)。日常所常見的MP3、AAC等多媒體音頻格式不能很好的適應(yīng)語音網(wǎng)絡(luò)通信的要求。語音網(wǎng)絡(luò)通信使用的更多的是G.7xx和AMR(Adaptive Multi-Rate)語音編碼,以便在有限帶寬下提供多路數(shù)的語音數(shù)據(jù)業(yè)務(wù)。例如,G.729是一種高效的壓縮編碼技術(shù),可將經(jīng)過采樣的64kb/s話音以幾乎不失真的質(zhì)量壓縮至8kb/s,非常適合在VoIP系統(tǒng)中使用;AMR主要用于移動(dòng)設(shè)備的音頻,壓縮比比較大,但相對(duì)其他的壓縮格式質(zhì)量比較差,由于多用于人聲通話,效果還是很不錯(cuò)的。同時(shí)為了支撐雙向語音對(duì)講業(yè)務(wù),語音處理模塊仍要提供對(duì)回聲抵消、唇音同步、噪聲抑制、雙音多頻DTMF的支持。普通的多媒體處理器往往只能提供單一的語音處理功能,因此應(yīng)用在數(shù)字可視對(duì)講上的處理器需提供更為靈活和強(qiáng)大的語音支持。
海思半導(dǎo)體Hi3510芯片靈活的多核架構(gòu),滿足了視頻H.264的復(fù)雜編碼和音頻多種壓縮格式的要求,同時(shí)內(nèi)置雙MAC,可方便配置帶路由功能的網(wǎng)絡(luò),降低eBOM。圖5為Hi3510內(nèi)部邏輯圖。
圖5 Hi3510功能邏輯圖
內(nèi)置的H.264/263 硬件加速器完成視頻編解碼算法,保障了流暢的視頻畫面,對(duì)H.263的兼容使得采用Hi3510為主芯片的設(shè)備可兼容早期的可視電話系統(tǒng),實(shí)現(xiàn)多終端對(duì)接。32位的語音DSP,在提供從MP3、WMA到G.7xx,AMR多種語音編碼處理的同時(shí),支持回聲抵消、噪聲抑制、唇音同步等處理需求。主頻220MHz的ARM處理器,可實(shí)現(xiàn)更多增值業(yè)務(wù),IE瀏覽、數(shù)碼相框、信息發(fā)布均在ARM上完成。Hi3510以ARM+Audio DSP+H.264/263硬件加速的多核處理架構(gòu)并配備豐富的通信接口,如MAC、UART、USB等。
結(jié)語
數(shù)字可視對(duì)講無論在市場上還是技術(shù)上,目前正處于加速發(fā)展時(shí)期,并越來越成為數(shù)字家庭的一個(gè)重要角色。其自身具備的三大要素:視頻壓縮、語音處理、網(wǎng)絡(luò)傳輸,使得數(shù)字可視對(duì)講與其他家庭多媒體產(chǎn)品互相融合。由此,隨著技術(shù)的發(fā)展,對(duì)內(nèi)置的處理器也提出了更高的要求。
評(píng)論