谷歌AI新功能挑戰(zhàn)Zoom:視頻會議除了說話聲 再無尷尬背景聲
新冠疫情肆虐全球,讓在家辦公成為了常態(tài),也讓視頻會議成為了日常需求。Zoom成為了全球視頻會議市場的最大贏家。
本文引用地址:http://2s4d.com/article/202006/414141.htmZoom去年年底日用戶峰值還只有1000萬人,今年4月底已經(jīng)達到了3億人,一個季度增長了三十倍。今年以來,Zoom股價從68美元一路飆高到目前的220美元價位,市值超過了620億美元。市場調(diào)查機構(gòu)Datanyze的數(shù)據(jù)顯示,Zoom在美國視頻會議的市場份額高達36.3%,隨后則是視頻會議應(yīng)用GoToWebinar和思科Webex。
相比之下,谷歌、微軟、蘋果等傳統(tǒng)巨頭此前幾乎沒有發(fā)力這一領(lǐng)域。他們要么沒有重視開發(fā)這一需求產(chǎn)品,要么相關(guān)產(chǎn)品不夠簡潔專注。巨頭的缺失也讓視頻會議市場帶來了競爭空間,成為了新貴們爭奪的領(lǐng)地。
但谷歌和微軟兩大巨頭已經(jīng)盯上了這塊變大的蛋糕,近期先后在Google Meet和Microsoft Teams產(chǎn)品上推出了系列新功能,希望吸引自己原本巨大的用戶基礎(chǔ)。Zoom產(chǎn)品的功能缺失就成為了兩大巨頭的發(fā)力重點,背景降噪就是其中之一。在這一方面,兩大巨頭雄厚的人工智能實力將提供堅實的技術(shù)支持。
微軟5月份就表示,近期會在Teams推出無關(guān)背景聲的降噪功能。不過,Google Meet還是比微軟更早一步,他們本周就推出了強力背景降噪Cloud De-Noiser。目前已經(jīng)在G Suite的網(wǎng)頁端推出,隨后會在iOS和Android升級。AI模式可以識別所有語言的聲音。谷歌表示,Meet今年4月底的日會議參與用戶已經(jīng)達到了1億人。
打開這一功能之后,除了你的說話聲,其他背景聲音通通消失。視頻會議就只有會議應(yīng)該有的聲音,再也不用擔(dān)心令人尷尬的聲音干擾你的視頻會議了。用戶在視頻會議時再也不用擔(dān)心自家狗狗的叫聲打擾會議,也不用對持續(xù)不斷的鍵盤打字聲感到煩躁,不用擔(dān)心吃飯的吧唧聲。當(dāng)然,也不會再聽見馬桶沖水的聲音。但De-Noiser功能也會智能保留一些可能有益于會議的自然背景聲音,例如說話者的深呼吸聲和笑聲。這項功能已經(jīng)在內(nèi)部測試和優(yōu)化了一年多時間,今年1月開始在谷歌全公司內(nèi)側(cè)。
Cloud De-Noiser的功能背后是谷歌基于云端的機器學(xué)習(xí)算法。算法會智能過濾掉各種背景干擾聲。谷歌G Suite產(chǎn)品管理總監(jiān)拉查佩爾(Serve Lachapelle)在演示視頻中,先后讓薯片塑料袋、圓珠筆等各種雜亂的背景聲音消失。雖然在強力降噪模式下,他原本的說話聲音變得有些沉悶,但依然清晰可辨,完全不影響視頻會議的工作效率。
拉查佩爾表示,自己在谷歌瑞典辦公室工作,和谷歌硅谷總部存在著時差,經(jīng)常在吃飯時間和總部同事開視頻會議。去除各種吃飯時候的尷尬聲音,是他們一年半之前開始研發(fā)De-Noiser功能的主要動力。G Suite團隊就各種背景聲音打造了AI模型,解決了遲滯問題。他們用自己上千次的視頻會議數(shù)據(jù),對模型進行不斷訓(xùn)練,更好地辨別人聲和背景聲。
拉查佩爾從事視頻會議相關(guān)產(chǎn)品功能已經(jīng)有25年時間,效力谷歌也已經(jīng)有13年時間。2017年谷歌收購一家創(chuàng)業(yè)公司Limes Audio,招納了一批音頻工程師。此外,谷歌人工智能部門Google Brain和Google Reserch也提供了技術(shù)幫助。谷歌在聲音識別和增強領(lǐng)域已經(jīng)進行了數(shù)年研發(fā),有了大量的技術(shù)積累。
評論