10億元砸向研發(fā),小冰到底要搞什么?
意外。
今年科技圈的“寒冬”大潮還在持續(xù)上演著,而有這么一則消息卻與這股大勢“背道而馳”:
小冰公司,完成10億元新一輪融資。
這家公司,很多友友們并不陌生。
因?yàn)榻鼛啄瓿鲎运业谋姸?strong style="margin: 0px; padding: 0px; outline: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important; color: rgb(0, 153, 127);">虛擬人,經(jīng)?;钴S出現(xiàn)在人們的熱議話題中。
而隨著這次最新消息的曝光,新融資的歸去來,也成了外界最關(guān)心的問題,特別還是大環(huán)境不好的當(dāng)前。
對此,小冰公司在官宣中也直接做了解答:
用于加速AI Being小冰框架技術(shù)研發(fā)。
未來一個季度內(nèi),完成框架中正在運(yùn)行的30萬名虛擬員工(AI Being Employee)的升級。
更進(jìn)一步的,小冰公司更是直言了這些動作背后的一個“小目標(biāo)”——
推動虛擬員工的普及。
至此,新的疑問也接踵而至:
讓虛擬員工普及,靠譜嗎?不會影響人類員工嗎?
為什么現(xiàn)在“寒冬”已然如此,這事還如此受資本熱捧?
帶著種種疑問,我們不妨一同來挖一挖。
虛擬員工,真的有在干實(shí)事嗎?或許很多人對虛擬人能做的事情,印象都停留在具備娛樂、藝術(shù)性質(zhì)的創(chuàng)作上。
例如小冰公司最初一批走紅的虛擬人之一,夏語冰,就是一位作畫高手。
而在此之后,國內(nèi)市場上也逐步浮現(xiàn)出眾多顏值超高、擅長繪畫唱歌的虛擬人。
△柳夜熙、Ayayi但事實(shí)上,虛擬人現(xiàn)在在人類生活中起到的作用,可不只是“你以為的你以為”了。
因?yàn)樗麄円呀?jīng)悄然在人類社會中上崗打工了,也就是我們剛才提到的小冰公司的虛擬員工。
既然是上崗,業(yè)績是考核虛擬人打工的一個很好的標(biāo)準(zhǔn),我們不妨一同來看看他們做的事,到底夠不夠?qū)嵲凇?/p>
例如每日經(jīng)濟(jì)新聞的主播N小黑/N小白,他倆便是非常典型的虛擬員工代表選手。
而且最初由于形象、播報(bào)方式過于逼真,連續(xù)播報(bào)了70天新聞,愣是沒有觀眾發(fā)覺他倆不是真人。
再如招商集團(tuán)最近推出的一名虛擬員工招小影,外貌上不僅實(shí)現(xiàn)了與真人無異的神態(tài),更是身懷“十八般武藝”。
她既有工作匯總、信息通知等通用技能,又具備專業(yè)領(lǐng)域知識和業(yè)務(wù)自動處理等能力。
而在今年的冬奧賽事上,也出現(xiàn)了虛擬員工的身影,他就是冬奧數(shù)字教練——觀君。
更令人詫異的是,從披露的信息來看,“觀君”作為非人類,冬奧前已在自由式滑雪空中技巧運(yùn)動隊(duì)“服役”了三年,助力取得了兩金一銀。
觀君會針對運(yùn)動員的每一跳做出專業(yè)判斷,嚴(yán)格判別扣分動作,而且是與國際裁判計(jì)分準(zhǔn)則保持高度一致的那種。
具體應(yīng)用里,觀君會在運(yùn)動員起跳、空中和落地三個階段,做一個全流程動作量化的工作。
例如在下面的這段訓(xùn)練過程中,觀君便能實(shí)時(shí)提供運(yùn)動出臺的速度和角度、最高點(diǎn)達(dá)到了多少米,還有落地點(diǎn)等信息。
不僅如此,就連冬奧播報(bào)天氣的主播,也是由虛擬員工馮小殊來擔(dān)任。
更早像萬科集團(tuán)的財(cái)務(wù)數(shù)字員工崔筱盼,更是因?yàn)閿孬@集團(tuán)總部優(yōu)秀新人獎而破圈出名。
……
不難看出,從業(yè)務(wù)能力上來看,小冰公司的這些虛擬員工可以說是高分通過考核。
所以他們是如何做到的?
主要依托其自研的小冰框架技術(shù)(Avatar Framework)。
例如在面容、表情、肢體動作在內(nèi)的整體自然度可以做到真假難辨,主要是結(jié)合了小冰深度神經(jīng)網(wǎng)絡(luò)渲染(Xiaoice Neural Rendering,XNR)及小樣本學(xué)習(xí)技術(shù)。
簡單來說,這項(xiàng)技術(shù)主要包含三個步驟。
第一步是構(gòu)建兩個專家模型。
第一個是語音專家模型,基本的思路便是利用很大量的數(shù)據(jù)來學(xué)習(xí)、理解人類的語音。
例如人類在講話講到激動的時(shí)候,他的嘴型都會有比較明顯的變化,而語音專家模型就是學(xué)會這項(xiàng)技能。
第二個是專家模型,則是通過采集攝像機(jī)等設(shè)備拍出來的人物視頻數(shù)據(jù),學(xué)習(xí)人類在說話過程中,嘴部的變化與眼睛、臉部其它肌肉之間如何產(chǎn)生微妙的聯(lián)動變化。
如此一來,就能會讓虛擬人在說話時(shí),整個面部表情能夠變得自然流暢。
第二步便來到了渲染的環(huán)節(jié)。
也就是將語音輸入到深度神經(jīng)網(wǎng)絡(luò)渲染模型,而后會一幀一幀地渲染出自然的臉,并形成動態(tài)的過程。
但在這個過程中,前兩個專家模型也會起到一個監(jiān)督的作用,目的還是讓整體效果能夠自然。
第三步,則是一個自動化的過程。
也就是當(dāng)把文字輸入進(jìn)來的時(shí)候,就會通過TTS(TextToSpeech)的方式,將文本變成語音。
而當(dāng)機(jī)器接收到這些語音信號后,又會將其聯(lián)動虛擬人的所有姿態(tài)、動作、表情等,最終生成一個完整的視頻。
也正是在這種技術(shù)路線上的改變,最終才得以讓小冰的虛擬人“瞞天過?!钡仳_過了人眼。
除此之外,小冰框架中還會涉及情感計(jì)算、全雙工交互、超級自然語音等等,可以說是從全方面讓虛擬員工無限逼近真人。
在此次融資消息對外公布的同時(shí),小冰公司也宣稱要拿這筆錢全部投入到研發(fā)當(dāng)中。
其中就包括對旗下人工智能虛擬員工產(chǎn)品線啟動年度升級,加強(qiáng)的技術(shù)包括大模型對話引擎、3D神經(jīng)網(wǎng)絡(luò)渲染、超級自然語音及AIGC人工智能內(nèi)容生成。
……
所以,如此對比下來之后,不難看出現(xiàn)在虛擬人已經(jīng)不再是“花瓶”般的擺設(shè)。
而是確確實(shí)實(shí)在各自的崗位上干著實(shí)事,并且還是讓工作效率變得更高、工作質(zhì)量也能加強(qiáng)的那種。
但小冰公司很顯然的沒有滿足于此,從此次消息公布上來看,它還要繼續(xù)造“人”。
虛擬員工的未來如何?要回答這個問題,我們不妨從虛擬人賽道的大環(huán)境著手來看。
單就從2020年以來,小冰公司自身便已經(jīng)經(jīng)歷了三次融資,并且早在去年便已經(jīng)被估值到了10億美元之多。
很顯然的,市場和資本對于虛擬人賽道可以說是看好的態(tài)度。
在量子位智庫的《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告》中,更大范圍來看亦是如此。報(bào)告預(yù)測:
在2030年,我國虛擬數(shù)字人整體市場規(guī)模將達(dá)到2700億。
其中,得益于虛擬IP的巨大潛力,以及虛擬第二分身的起步,身份型虛擬數(shù)字人將占據(jù)主導(dǎo)地位,約1750億,并逐步成為Metaverse中的重要一環(huán)。
服務(wù)型虛擬數(shù)字人則相對穩(wěn)定發(fā)展,多模態(tài)AI助手仍有待進(jìn)一步發(fā)展,多種對話式服務(wù)升級至虛擬數(shù)字人形態(tài),總規(guī)模超過950億。
而且從目前虛擬人市場發(fā)展情況來看,這個賽道仍處于前期培育階段。
在各行業(yè)近兩年開始意識到其技術(shù)可行性和商業(yè)價(jià)值后,虛擬人行業(yè)將快速進(jìn)入高速發(fā)展期。
首先,作為多模態(tài)升級的代表技術(shù),虛擬數(shù)字人的應(yīng)用場景眾多,可廣泛與各行業(yè)領(lǐng)域相結(jié)合,變現(xiàn)路徑和市場潛力明確。其中虛擬直播、虛擬偶像已得到明確的商業(yè)價(jià)值驗(yàn)證。而虛擬分身生成等場景也已得到了資本和相關(guān)產(chǎn)業(yè)方的認(rèn)可。
其次,大多數(shù)國內(nèi)玩家為綜合實(shí)力較強(qiáng),發(fā)展成熟的AI科技公司,在客戶積累、技術(shù)實(shí)力、銷售渠道、資金供給等方面較為可靠,行業(yè)預(yù)計(jì)可直接進(jìn)入平穩(wěn)發(fā)展期。
最后,在多家業(yè)內(nèi)代表公司看來,虛擬數(shù)字人作為Metaverse 主要的交互載體,具有明確的巨大增長潛力,并基于NFT、VR等有理想的延展空間。行業(yè)天花板高,能夠維持長期和衍生發(fā)展。
這也就不難理解為何市場和資本會如此青睞以小冰公司為代表的虛擬人賽道了。
但另一方面,從更大范圍的AIGC(AI生成內(nèi)容)市場發(fā)展來看,更是印證了這點(diǎn)。
像Stable Diffusion的爆火,在僅發(fā)布一個月的時(shí)間內(nèi),其背后的公司便被估值到了69億元。
這種火爆,未來的市場規(guī)模和前景也已經(jīng)有了推測:
到2030年,AIGC市場規(guī)?;?qū)⒊^萬億人民幣。
這是市場對于虛擬人、AIGC的肯定,而回歸到小冰公司自身,其“打法”也是值得討論一番。
其實(shí)早在元宇宙、AIGC等成為熱詞出現(xiàn)之前,小冰公司已然在AI作畫、創(chuàng)作,情感計(jì)算等方面著手發(fā)力,像夏語冰那批虛擬人,便是很好的印證。
并且像AI Being這樣的概念,也是由小冰于2019年率先提出,其前瞻性可見一斑。
在2020年年末,小冰公司董事長、清華大學(xué)雙聘教授沈向洋在給吳恩達(dá)的新年賀詞中也表示:
我預(yù)見2021年,人工智能社區(qū)將創(chuàng)造出更多工具來釋放人類的創(chuàng)造力。人工智能將幫助世界各地的人們,以各有態(tài)度的方式去溝通和表達(dá)情感和情緒。
過去,期待在藝術(shù)領(lǐng)域里有所成就的專業(yè)人士,比如繪畫、音樂、詩歌和舞蹈,必須長年學(xué)習(xí)和苦練。用中國老話講,是“臺上三分鐘,臺下十年功”;用流行語說,就是從平凡到專業(yè)的“一萬小時(shí)”門檻。
我預(yù)期,諸如小冰X Suites這樣的工具,可以幫助每一個人減少花費(fèi)在重復(fù)練習(xí)上的成本,把寶貴的精力投入到創(chuàng)造更圓融的創(chuàng)意、更具想象力的表達(dá)上。
從現(xiàn)在開始,我們應(yīng)該將注意力轉(zhuǎn)移到AI幫助人們釋放創(chuàng)造力這件大事上。
就目前看來,小冰公司已經(jīng)是率先在AIGC形成穩(wěn)定商業(yè)落地與文本、聲音、圖像的產(chǎn)品化陣列。
例如文本方面,小冰金融文本生成產(chǎn)品覆蓋約90%的機(jī)構(gòu)投資人。
在繪畫方面,“夏語冰”創(chuàng)作的水墨畫是唯一入選去年迪拜世博會中國館的人工智能繪畫作品。
又比如聲音,由小冰進(jìn)行詞曲創(chuàng)作及歌聲生成的各類作品,先后被采用為上海大劇院演出季、成都大運(yùn)會、世界人工智能大會等重要活動的主題曲,也是今年首屆全民閱讀大會推廣曲集中,唯一入選的人工智能作品。
而至于現(xiàn)在為什么要推廣虛擬員工,小冰公司此前也是有所透露,這樣做的目的并不是要讓虛擬人替代人類,而是釋放機(jī)械性質(zhì)的勞動力,讓人類更專注于創(chuàng)造性工作:
但目前的創(chuàng)新成就與未來理想狀態(tài)相比還有很長一段路要走。
因此,這次小冰公司的融資要全部投入研發(fā)也就不難理解了。
或許在不久的將來,和你共事的同事是虛擬人不再會是什么新鮮事,反倒身邊沒有虛擬人同事,會成為怪事兒。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。