AI語音交互的2018:這個(gè)市場最“火爆”!
作為語音交互的一大重要細(xì)分應(yīng)用場景,兒童終端市場在經(jīng)過過去兩年持續(xù)的試水和探索之后,2018年迎來新一波的增長高潮。從智能故事機(jī)、早教娛樂機(jī)再到兒童智能音箱,幾乎每一類都成為了當(dāng)前市面上的爆品,成為2018年國內(nèi)語音交互應(yīng)用領(lǐng)域的一道“靚麗風(fēng)景”。
本文引用地址:http://2s4d.com/article/201808/391235.htm應(yīng)用轉(zhuǎn)型與場景需求“雙向”驅(qū)動(dòng) 兒童智能語音市場“爆火”
受惠于智能語音技術(shù)的成熟及應(yīng)用場景的快速擴(kuò)張,今年以來,在各大頭部廠商的牽動(dòng)下,兒童智能語音終端市場迎來新一輪噴發(fā),成為語音交互眾多應(yīng)用場景中的一道亮景。其中,增長最快的要數(shù)智能早教機(jī)、故事機(jī)和兒童智能音箱三類產(chǎn)品,業(yè)內(nèi)預(yù)估今年國內(nèi)早教機(jī)器人市場規(guī)模將突破50億,而兒童智能音箱在百度阿里等巨頭的推動(dòng)下,目前也已占據(jù)整個(gè)智能音箱市場的20%左右,達(dá)到百萬量級(jí)出貨,足見市場之火爆。
今年,做兒童機(jī)器人的公司就多達(dá)好幾百家,僅大大小小的智能故事機(jī)廠家也有一兩千家左右,數(shù)量比去年幾乎翻了一番,深圳市炭火智能科技有限公司市場經(jīng)理許波表示:“其中,很大一部分廠商基本都是從別的行業(yè)過來的,例如有些廠商過去就是做車載后視鏡這類終端或者一些非智能類硬件產(chǎn)品,都想借此市場良機(jī)賺錢。今年上半年受益于市場持續(xù)火爆,公司智能早教機(jī)產(chǎn)品目前的累計(jì)銷量已達(dá)到25萬臺(tái),相比去年有較為可觀的增長,下半年我們保守估計(jì)銷量能夠突破30多萬。如今,市面上只要是帶智能語音交互功能,且定價(jià)在千元以內(nèi)外觀還可以的兒童機(jī)器人產(chǎn)品基本上都能達(dá)到月銷量幾萬臺(tái)的水平?!?/p>
智能故事機(jī)市場,思必馳商務(wù)總監(jiān)韓嘉璇也預(yù)計(jì):“2018年整個(gè)故事機(jī)市場出貨量可能達(dá)到3000萬到4000萬臺(tái),其中會(huì)有一多半屬于智能故事機(jī)產(chǎn)品,市場巨大。當(dāng)前的兒童智能終端領(lǐng)域,思必馳方案的整體市場占有率約為20%-30%,依托于前端算法的優(yōu)勢(shì),在Android系統(tǒng)的高端市場也擁有超過50%的市場占有率,相關(guān)合作品牌包括步步高、火火兔、遙藍(lán)、小蘿卜等兒童終端的出貨量均十分可觀。”
為何語音交互能迅速在兒童市場爆火?編者認(rèn)為,其一主要是越來越多的智能音箱巨頭相繼發(fā)力兒童市場的原因,智能音箱向兒童市場的轉(zhuǎn)移,實(shí)現(xiàn)了很好的智能對(duì)非智能應(yīng)用的“降維打擊”效果。事實(shí)上,早在今年4月份,亞馬遜就特意推出了一款Echo Dot兒童版,盡管硬件上與之前的Dot并無差別,但是在軟件層面,比如語音識(shí)別、兒童讀物等都是針對(duì)兒童進(jìn)行量身打造的;緊隨其后的5月,阿里、百度、出門問問、喜馬拉雅等廠商也都紛紛針對(duì)兒童推出了專門的智能音箱,深耕兒童應(yīng)用市場。兒童智能音箱的爆火,進(jìn)一步帶動(dòng)智能語音技術(shù)向更多應(yīng)用場景擴(kuò)散,早教機(jī)及故事機(jī)這類場景自然就成為了首發(fā)戰(zhàn)場。
另一方面,越來越多“頭部”廠商集中發(fā)力AI智能語音交互類硬件產(chǎn)品也是關(guān)鍵原因。許波認(rèn)為:“'頭部'廠商的帶動(dòng),很大程度上使得現(xiàn)有非智能交互類產(chǎn)品尤其是傳統(tǒng)故事機(jī)市場快速萎縮,盡管這種產(chǎn)品在價(jià)格方面相比智能交互類硬件更便宜一些,但隨著智能交互類產(chǎn)品的大舉入侵,二者之間的價(jià)格優(yōu)勢(shì)也正逐步淡化。更為重要的是,在智能化產(chǎn)品的打擊下,這類非智能的產(chǎn)品越來越?jīng)]有賣點(diǎn),導(dǎo)致消費(fèi)者不買賬。比如我們最近接觸的一家故事機(jī)銷售商,去年他們非智能產(chǎn)品的業(yè)務(wù)表現(xiàn)還相對(duì)比較強(qiáng)勁,但今年這塊產(chǎn)品的出貨量就不怎么理想,現(xiàn)在庫存也比較多,很多產(chǎn)品也只能降價(jià)甩賣?!?/p>
從應(yīng)用場景需求本身的角度來看,鑒于中國兒童教育市場體量本身就十分巨大,加之智能語音交互與兒童終端產(chǎn)品近年來正快速融合,順理成章地推動(dòng)了該場景對(duì)語音交互逐漸形成剛需。聲智科技聯(lián)合創(chuàng)始人常樂也表示:“隨著語音交互在技術(shù)端的逐步深化,如今的語音交互已不再是按鍵和觸控交互方式的輔助或補(bǔ)充,而是以更加獨(dú)立或者占有主導(dǎo)權(quán)的交互模態(tài)呈現(xiàn)出來,進(jìn)而降低了老人和兒童使用電子產(chǎn)品的難度。對(duì)于3歲以上的兒童來說,他們迫切需要用語言來表達(dá)觀點(diǎn)和獲取知識(shí),而語音交互正好切中了這一訴求。聲智科技在2016年成立之時(shí),就幫助奇虎360打造了多款兒童機(jī)器人和故事機(jī)系列產(chǎn)品,而隨著兒童智能音箱市場的爆發(fā)以及語音交互剛性需求的帶動(dòng),兒童故事機(jī)、陪伴以及早教等智能語音交互終端產(chǎn)品的市場體量會(huì)非常巨大。”
兒童應(yīng)用場景挑戰(zhàn)多 算法優(yōu)化與內(nèi)容適配是關(guān)鍵
誠如上述,在兒童教育類終端市場持續(xù)高漲的態(tài)勢(shì)下,智能語音交互的市場潛力可謂是不可限量。但就目前的應(yīng)用現(xiàn)狀來看,與成人類語音交互場景不同,兒童場景存在著更多語音及語意方面的“不確定性”和“復(fù)雜性”,這也給語音交互廠商帶來了更多技術(shù)層面上的挑戰(zhàn),首當(dāng)其沖的就是語音交互系統(tǒng)、內(nèi)容及相關(guān)算法的適配。
深圳市微納感知計(jì)算技術(shù)有限公司市場總監(jiān)程剛在接受本刊采訪時(shí)就坦言:“現(xiàn)階段經(jīng)過訓(xùn)練,市面上其實(shí)已經(jīng)有很多產(chǎn)品可以做到對(duì)方言的識(shí)別,成人應(yīng)用場景之前的很多難點(diǎn)都在逐漸被克服。但兒童交互產(chǎn)品的區(qū)別在于,產(chǎn)品要做到童音識(shí)別,除了需要解決孩子具備的更高音階以及不同的言語模式問題外,更為重要的是,孩子并不擅長按照機(jī)器能理解的方式與其交互,成年人建立的語音庫并不能很好的理解兒童的語言,即使包括Amazon Echo與Google Home在內(nèi)的業(yè)內(nèi)頂尖設(shè)備也都出現(xiàn)了在與兒童交互的場景下識(shí)別錯(cuò)誤的現(xiàn)象?!?/p>
常樂對(duì)此也表示贊同,她認(rèn)為:“對(duì)于小朋友來說,好奇心重,且思維邏輯不如成年人那般嚴(yán)謹(jǐn),因此小朋友在對(duì)智能語音終端提出問題時(shí)常常是出其不意、前言不搭后語且猶豫反復(fù)的。針對(duì)兒童的這種語音交互特性,常常需要做更多技術(shù)層面上的優(yōu)化,比如我們就推出了Free-cut(隨時(shí)打斷,任意喚醒),F(xiàn)ree-ask(支持識(shí)別猶豫及停頓)以及One-shot(一句連控,喚醒識(shí)別連續(xù)說)等技術(shù),來提升兒童語音交互體驗(yàn)?!?/p>
對(duì)于兒童不同于成年人的語音音階和言語模式等問題,常樂認(rèn)為需要針對(duì)這些發(fā)音特點(diǎn)進(jìn)行專業(yè)的模型訓(xùn)練:“例如我們?cè)趲椭俣?#39;小度智能音箱'打造'兒童模式'時(shí),就構(gòu)建了一個(gè)集合百萬級(jí)數(shù)據(jù)的兒童語音庫,針對(duì)兒童的發(fā)聲特點(diǎn)進(jìn)行了專項(xiàng)優(yōu)化,基于6000+個(gè)兒童數(shù)據(jù)模型和超過30000小時(shí)的童聲語音測(cè)試,打造出了兒童專用語音喚醒模型以及語音識(shí)別交互引擎,使得音箱在與兒童進(jìn)行對(duì)話時(shí),能夠提供更高的識(shí)別和喚醒的準(zhǔn)確率、更快的反應(yīng)速度以及更流暢且自然的語音交互。目前該方案已經(jīng)能夠?qū)崿F(xiàn)定制化,并經(jīng)過360兒童故事機(jī)、兒童陪伴機(jī)器人以及兒童智能音箱等眾多終端產(chǎn)品的百萬級(jí)規(guī)模量產(chǎn)驗(yàn)證,成本可控?!?/p>
除此之外,與成年人相比,小朋友雖然對(duì)智能語音交互產(chǎn)品的用戶體驗(yàn)包容度要更高,但他們更為關(guān)注產(chǎn)品端所能提供的內(nèi)容。常樂也認(rèn)為,不同于成年人一樣具備清晰的邏輯思辨能力,小朋友往往會(huì)帶著求知和娛樂的心態(tài)使用智能語音交互產(chǎn)品,他們更關(guān)心的是智能語音產(chǎn)品的背后提供的內(nèi)容,比如提問的百科問答是否能得到答案,或者想要聽的兒歌和故事是否可以播放等。因此,對(duì)于語音技術(shù)廠商來說,如何在提供足夠優(yōu)質(zhì)的兒童教育服務(wù)內(nèi)容的同時(shí),又能在語音交互系統(tǒng)及算法層面上針對(duì)兒童這類特殊應(yīng)用場景做更多的優(yōu)化,提供更為靈活且符合兒童心理預(yù)期的定制化語音交互解決方案,將是市場決勝的關(guān)鍵。
總之,編者認(rèn)為,在兒童教育市場高速成長的驅(qū)動(dòng)下,兒童智能語音終端市場的"雪球"無疑會(huì)越滾越大,這也為業(yè)內(nèi)廠商推動(dòng)語音交互走向大規(guī)模普及創(chuàng)造了絕佳的機(jī)遇。當(dāng)然,機(jī)遇與挑戰(zhàn)總是并存的,兒童語音交互市場需要比成人場景更為復(fù)雜且更具定制化特性的語音交互系統(tǒng)及算法設(shè)計(jì),同時(shí)在內(nèi)容端也擁有更多的要求,這就需要廠商在軟件系統(tǒng)開發(fā)、算法設(shè)計(jì)以及內(nèi)容提供方面耗費(fèi)更多的精力、成本以及資源。不過,隨著未來市場體量的不斷增大,這些成本問題也會(huì)逐步消散。
評(píng)論