IP視頻電話(huà)設(shè)計(jì)營(yíng)造逼真環(huán)境
伴隨寬帶的繁榮,IP網(wǎng)絡(luò)步入千家萬(wàn)戶(hù),同時(shí)也催生出VoIP業(yè)務(wù),全球VoIP用戶(hù)有望在2010年達(dá)到1.5億。雖然目前國(guó)內(nèi)對(duì)VoIP服務(wù)的規(guī)范還未明朗,但是“擦邊球”式的業(yè)務(wù)已經(jīng)造就了一個(gè)不小的市場(chǎng),據(jù)iSuppli的估算,中國(guó)VoIP的市場(chǎng)份額在2005年底約為5.6億美元,這一數(shù)字到2010年可達(dá)到11億美元。隨著業(yè)務(wù)的發(fā)展,人們不再滿(mǎn)足基本的語(yǔ)音通話(huà),生動(dòng)的影像可以營(yíng)造逼真的環(huán)境,更能縮短溝通的距離。IP 視頻電話(huà)除了對(duì)視頻和語(yǔ)音質(zhì)量的高要求,電話(huà)終端也在向多功能的方向發(fā)展,網(wǎng)頁(yè)瀏覽、收發(fā)e-mail甚至是類(lèi)似PVR功能的視頻留言都將出現(xiàn)在終端話(huà)機(jī)上。
因而,一個(gè)優(yōu)秀的IP 視頻電話(huà)開(kāi)發(fā)平臺(tái),除了需要支持各種音頻/視頻編解碼的處理能力外,更多的特性體現(xiàn)在平臺(tái)開(kāi)發(fā)的靈活性上。例如,在應(yīng)用層添加豐富的I/O接口讓客戶(hù)定制不同的應(yīng)用、提供良好的圖形用戶(hù)見(jiàn)面以及同時(shí)支持SIP和H.323多種通信協(xié)議等等。聞亭數(shù)字系統(tǒng)公司總裁董永宏把這種方便靈活的方式稱(chēng)作交鑰匙(Turn Key)式解決方案。在聞亭和TI最近聯(lián)合推出的視頻電話(huà)開(kāi)發(fā)平臺(tái)VDP-II上,采用了主板+子板的模式,董永宏稱(chēng)這種模塊化的設(shè)計(jì)更適合客戶(hù)小批量的靈活生產(chǎn)。
高質(zhì)量的音視頻體驗(yàn)
目前的IP 視頻電話(huà)消費(fèi)市場(chǎng)是以商業(yè)用戶(hù)為主,他們要求視頻電話(huà)具備高分辨率和良好的語(yǔ)音質(zhì)量,以提高身臨其境的體驗(yàn)。對(duì)于用做長(zhǎng)途通話(huà)的家庭用戶(hù),清晰逼真的環(huán)境也能實(shí)現(xiàn),因而先進(jìn)的編解碼技術(shù)已經(jīng)開(kāi)始應(yīng)用到新一代的視頻電話(huà)解決方案中。
圖 基于DM644X的視頻電話(huà)方案
新興的視頻編解碼標(biāo)準(zhǔn)H.264需要的帶寬只有目前通用的H.263的一半、MPEG-2的1/5,這個(gè)性能優(yōu)勢(shì)將允許流媒體在更低的帶寬上傳輸,非常適合像網(wǎng)絡(luò)視頻應(yīng)用這樣在帶寬受限緊缺的應(yīng)用中。董永宏告訴記者,IP 視頻電話(huà)中通常采用H.264 Baseline Profile,它滿(mǎn)足了實(shí)時(shí)通話(huà)的低延遲要求,同時(shí)還能實(shí)現(xiàn)720x480的D1分辨率。此外,IP 視頻電話(huà)機(jī)正在綜合更多的多媒體功能,例如有些解決方案廠(chǎng)商在應(yīng)用軟件里加入了視頻回放和錄制功能,從而實(shí)現(xiàn)視頻留言。或者為了增加數(shù)碼像框的功能而加入JPEG幀采集。
在音頻編解碼技術(shù)方面,國(guó)際電信聯(lián)盟 (ITU)針對(duì)寬帶 IP 電話(huà)應(yīng)用的 G.722.2 (WB-AMR)規(guī)范將成為IP 視頻電話(huà)的主導(dǎo)標(biāo)準(zhǔn)。G.722.2 是取樣在 16KHz 的語(yǔ)音壓縮標(biāo)準(zhǔn),音頻覆蓋從 50Hz 到 7KHz。與窄帶編解碼器如 G.711 和 G.729 相比,G.722.2通過(guò)提高摩擦音(如 s、f)的可理解性來(lái)改善所有通過(guò) IP 和無(wú)線(xiàn)網(wǎng)絡(luò)傳輸?shù)恼Z(yǔ)音交流。設(shè)計(jì)人員還需要考慮到與移動(dòng)電話(huà)的IP通話(huà),采用GSM-AMR(Adaptive Multi-Rate)語(yǔ)音編解碼技術(shù)可以減少GSM- G.729的轉(zhuǎn)換環(huán)節(jié),改善固定電話(huà)和移動(dòng)電話(huà)的通話(huà)質(zhì)量。值得一提的是,iLBC也是一種收到歡迎的低比特率編解碼,iLBC在丟包率達(dá)到10%的情況下都能具有健壯性,因而輸送的語(yǔ)音音質(zhì)超過(guò) G.729 和 G.723.1。iLBC 支持兩種基本的幀長(zhǎng)度:13.3 kbps 比特率下編碼幀長(zhǎng)度為 30 ms;而 15.2 kbps比特率下編碼幀長(zhǎng)度則為 20 ms。
除了音視頻編解碼技術(shù)外,一個(gè)好的實(shí)時(shí)軟件框架同樣能幫助改善體驗(yàn)。例如,QoS自適應(yīng)功能、DTMF抖動(dòng)緩沖器和媒體同步化等等。
雙核處理優(yōu)勢(shì)
IP 視頻電話(huà)的開(kāi)發(fā)面臨著成本和性能的雙重挑戰(zhàn),高性能的數(shù)字媒體處理器在其中舉足輕重。通常情況下,IP 視頻電話(huà)需要處理2種不同的任務(wù):事務(wù)密集型和流密集型。有些解決方案在VoIP系統(tǒng)中加入視頻協(xié)處理器控制設(shè)計(jì)成本,但是卻沒(méi)有足夠的帶寬處理寬帶音頻和高清視頻。
相較而言,集成一個(gè)通用處理器和一個(gè)DSP的雙核數(shù)字多媒體SoC更能有效協(xié)調(diào)成本和性能之間的關(guān)系:采用ARM處理器處理事務(wù)密集型任務(wù),用DSP處理流密集型任務(wù)。在一個(gè)典型的MPEG-4編解碼器中,離散余弦變換及其反變換、像素插值和運(yùn)動(dòng)估計(jì)四種功能大約占據(jù)了整個(gè)處理過(guò)程的80%,一個(gè)每秒15幀的MPEG-4解碼幾乎占據(jù)了RISC處理器的所有資源,而DSP卻有足夠的計(jì)算能力完成相同的任務(wù)。在雙核架構(gòu)中,ARM處理器則負(fù)責(zé)支持應(yīng)用操作系統(tǒng)并完成以控制為核心的應(yīng)用處理,ARM集成了大量的內(nèi)部電路和外圍接口,例如LCD控制器、UART串行接口、USB2.0、I2C等等。雙核架構(gòu)的一個(gè)明顯優(yōu)勢(shì)就是可以使操作系統(tǒng)的效率和多媒體代碼的執(zhí)行更加優(yōu)化并延長(zhǎng)電源壽命;同時(shí)采用雙處理器可以將總工作負(fù)荷進(jìn)行合理劃分,從而降低時(shí)鐘工作頻率,減少系統(tǒng)的功耗。
有些解決方案還添加了一種視頻/影像協(xié)處理器 (VICP),用于減輕相關(guān)算法(如:JPEG、H.264、MPEG4 與 VC-1)的 DSP 內(nèi)核繁重的視頻與影像處理負(fù)擔(dān),從而使更多的 DSP MIPS 能夠用于視頻后處理或者其他并行運(yùn)行功能。
IP視頻電話(huà)的發(fā)展正在經(jīng)歷著類(lèi)似2001年VoIP的發(fā)展?fàn)顩r,一方面要求高質(zhì)量的基本通話(huà)功能,另一方面設(shè)備制造商也正在單一設(shè)備上提供更多的附加增值應(yīng)用,如WEB瀏覽器、Wi-Fi、短消息甚至是互動(dòng)游戲等等。而隨著技術(shù)的發(fā)展,視頻電話(huà)也正在協(xié)調(diào)成本和性能的關(guān)系,有望在不久的將來(lái)走進(jìn)大眾的生活。
評(píng)論