關(guān) 閉

新聞中心

EEPW首頁(yè) > 安全與國(guó)防 > 設(shè)計(jì)應(yīng)用 > IVA音視頻識(shí)別技術(shù)解析

IVA音視頻識(shí)別技術(shù)解析

作者: 時(shí)間:2016-12-22 來(lái)源:網(wǎng)絡(luò) 收藏
隨著全球觸屏?xí)r代的到來(lái),交流平臺(tái)的移動(dòng)化、社交化、智能化已成為必然的發(fā)展方向。在這樣的趨勢(shì)下,視頻互動(dòng)成為視頻行業(yè)制定戰(zhàn)略的最新重要考慮因素。下面重點(diǎn)介紹下在歐美近兩年最受關(guān)注的IVA技術(shù)。

  IVA是In Video Action技術(shù)的縮寫(xiě),IVA目前與Google Voice的字幕自動(dòng)化生成技術(shù)、百度Video In視頻無(wú)痕植入技術(shù)并稱(chēng)改變視頻行業(yè)的三大革命性技術(shù)。

本文引用地址:http://2s4d.com/article/201612/332920.htm

  隨著觸屏?xí)r代的到來(lái),交流平臺(tái)的移動(dòng)化、社交化、智能化已成為必然的發(fā)展方向。在這樣的趨勢(shì)下,視頻互動(dòng)成為視頻行業(yè)制定戰(zhàn)略的重要考慮因素。

  IVA技術(shù)簡(jiǎn)單來(lái)說(shuō)是一種音視頻識(shí)別技術(shù),加上一套互動(dòng)工具所構(gòu)成的互動(dòng)體系。識(shí)別技術(shù)就像一個(gè)探頭,能夠?qū)ふ乙曨l中撥動(dòng)心弦(或人為設(shè)定)的時(shí)刻,并用互動(dòng)技術(shù)實(shí)現(xiàn)與觀眾的互動(dòng)共鳴。值得一提的是,IVA技術(shù)可將直播視頻畫(huà)面中的人物、物體、品牌、紋理、場(chǎng)景甚至情緒等信息分揀出來(lái),再通過(guò)各種互動(dòng)工具與受眾進(jìn)行雙向交流。

  IVA的使命分三個(gè)層次,初級(jí)IVA、中級(jí)IVA、高級(jí)IVA。

  其中,初級(jí)IVA是依據(jù)音視頻樣本庫(kù)標(biāo)記視頻流中與樣本庫(kù)匹配的視頻片斷,比如從視頻流中識(shí)別廣告時(shí)段和廣告主、識(shí)別新聞聯(lián)播等節(jié)目的片頭、根據(jù)錄音識(shí)別用戶(hù)正在觀看的節(jié)目等。

  中級(jí)IVA利用圖像處理技術(shù)、大數(shù)據(jù)技術(shù)和深度學(xué)習(xí)技術(shù),識(shí)別視頻流中的場(chǎng)景、形狀、紋理和人物等。中級(jí)IVA可以從視頻流中識(shí)別大海、森林、鬧市等多達(dá)200多種場(chǎng)景,在場(chǎng)景連續(xù)出現(xiàn)超過(guò)30幀的情況下,識(shí)別率可以高達(dá)90%以上;形狀識(shí)別的典型案例是從視頻流中準(zhǔn)確識(shí)別1000多種飲料瓶的品牌、容積;衣物、布料的質(zhì)地和品牌識(shí)別屬于紋理識(shí)別的范疇;人物識(shí)別被廣泛應(yīng)用在機(jī)場(chǎng)、車(chē)站等場(chǎng)所的嫌疑犯追逃和運(yùn)動(dòng)追蹤,也被電視臺(tái)用來(lái)進(jìn)行視頻索引和標(biāo)簽。

  高級(jí)IVA是識(shí)別音視頻對(duì)受眾的感性**和情緒影響,比如識(shí)別一部電影中的淚點(diǎn)、笑點(diǎn)等,高級(jí)IVA才剛剛起步,還有很長(zhǎng)的路要走。

  目前,IVA已被應(yīng)用在EPG(電子節(jié)目單)自動(dòng)校準(zhǔn)、視頻自動(dòng)索引和標(biāo)簽、電視“搖一搖”等領(lǐng)域。IVA更具廣闊前景的應(yīng)用是互動(dòng)營(yíng)銷(xiāo)(又稱(chēng)心性營(yíng)銷(xiāo))。2011年,國(guó)內(nèi)就引進(jìn)歐美技術(shù)開(kāi)始了在這方面的嘗試和探索。人性付費(fèi)模式是在IVA技術(shù)基礎(chǔ)上的另一種延伸,利用IVA技術(shù)加強(qiáng)視頻內(nèi)容與受眾之間的情感聯(lián)系,讓觀眾在一定情緒的引導(dǎo)下掏腰包。以《中國(guó)好聲音》為例,當(dāng)觀眾被天籟的聲音所陶醉,通過(guò)IVA技術(shù)可以彈出互動(dòng)窗口,讓觀眾為歌手獻(xiàn)上鮮花以資鼓勵(lì);亦或是在破音時(shí),用雞蛋表達(dá)無(wú)奈;甚至可以在選手表演時(shí),直接通過(guò)手機(jī)參與到導(dǎo)師轉(zhuǎn)椅子的過(guò)程中。將傳統(tǒng)的被動(dòng)收視改變?yōu)橛^眾與觀眾之間、觀眾與節(jié)目之間全方位的互動(dòng),極大地激發(fā)出觀眾的存在感、溝通欲、控制欲等人性需求。當(dāng)然,在播放廣告的過(guò)程中,在某個(gè)消費(fèi)**點(diǎn)時(shí)利用IVA技術(shù),可以出現(xiàn)互動(dòng)按鈕,為感興趣的用戶(hù)直接提供營(yíng)銷(xiāo)通道,將廣告、銷(xiāo)售合二為一。



關(guān)鍵詞: IVA音視頻識(shí)

評(píng)論


技術(shù)專(zhuān)區(qū)

關(guān)閉