新聞中心

EEPW首頁 > 消費(fèi)電子 > 業(yè)界動(dòng)態(tài) > 智能音箱讓情感重新有了溫度:還是那個(gè)熟悉的聲音

智能音箱讓情感重新有了溫度:還是那個(gè)熟悉的聲音

作者: 時(shí)間:2018-04-19 來源:鈦媒體 收藏

  有人說,人會(huì)經(jīng)歷三次死亡:第一次是身體停止運(yùn)轉(zhuǎn)導(dǎo)致的生理上死亡;第二次是舉行完葬禮代表你社會(huì)位置的消失;第三次是當(dāng)世界上沒人再記得你的時(shí)候,真正意義上的死亡。

本文引用地址:http://2s4d.com/article/201804/378617.htm

  當(dāng)你某天將要離開這個(gè)世界的時(shí)候,你是否想過要嘗試科技的方式,將自己身上獨(dú)有的特點(diǎn)化身為情感寄托,換一種形式陪伴在家人和朋友身邊呢?

  今天故事的主角王先生就是一個(gè)敢為人先的科技愛好者,身患肺癌的他在叮咚的幫助下,通過語音合成技術(shù)記錄下了自己的聲音,有了自己專屬的TTS發(fā)音人,并將一整套語音交互對(duì)話定制在了中。

  一位特殊的用戶

  “不管怎么說,用我的聲音,能陪伴他們更長的時(shí)間。”

  3月12日,王先生第三次來到北京完成了所有的錄制內(nèi)容,除了一些日常交互場景下的對(duì)話,他還特別準(zhǔn)備了給孩子們十八歲的成人禮祝福,以及給父母和妻子的一些日常留言。

  隨著人工智能技術(shù)民主化進(jìn)程的加快,它的應(yīng)用正在覆蓋我們生活中的各個(gè)場景,智能音箱是其中一個(gè)很大的品類,不過王先生只是一位普通的智能設(shè)備用戶,他是如何吸引到叮咚的呢,這就要從去年底一個(gè)不經(jīng)意之間的留言談起。

  當(dāng)時(shí),叮咚智能音箱的微信公眾號(hào)后臺(tái)收到了一位用戶的留言,這位用戶的疑問并不是關(guān)于產(chǎn)品使用上的困惑,也不是任何對(duì)于企業(yè)的吐槽,他問了一個(gè)讓整個(gè)叮咚團(tuán)隊(duì)都非常驚訝的問題——叮咚智能音箱可以專屬定制嗎?

  雖說消費(fèi)升級(jí)的趨勢下誕生了很多專屬定制的服務(wù),但是智能音箱說到底還是一款標(biāo)準(zhǔn)化的產(chǎn)品,專屬定制就意味著對(duì)發(fā)音人系統(tǒng)進(jìn)行全新的規(guī)劃與設(shè)計(jì)并長期運(yùn)維。

  雖然沒有這種標(biāo)準(zhǔn)服務(wù),但是本著對(duì)每個(gè)用戶都負(fù)責(zé)的態(tài)度,叮咚與這位留言的用戶取得了聯(lián)系,緊接著一個(gè)生動(dòng)又真實(shí)的故事才呈現(xiàn)到我們眼前。

  王先生來自河南,是一個(gè)從事電梯銷售工作的80后,他原本有著自己幸福美滿的家庭、穩(wěn)定的生活狀態(tài)和對(duì)未來的無限期待,卻沒想到一場意外的疾病如噩夢(mèng)般打破了原本平靜的一切。

  2017年11月,他在醫(yī)院查出了肺癌。隨后他辭去了工作,一邊積極接受治療、一邊在家安心陪伴父母,并開始思考關(guān)于人生的終極問題——如何才能在有限的時(shí)間給世界留下更多痕跡。

  一直以來,王先生對(duì)人工智能相關(guān)的話題都非常感興趣,也因此成為了智能叮咚智能音箱的早期用戶,在長期的使用過程中,每天與音箱之間的交互對(duì)話場景早已成為了王先生和他的家人生活的一部分。

  于是他就在想,能不能把智能音箱交互對(duì)話的聲音換成自己的,用這種方式來陪伴家人,也算是為身邊的人留下一點(diǎn)念想。

  利用語音合成技術(shù)定制專屬聲音

當(dāng)一個(gè)智能音箱有了感情:AI式人文關(guān)懷

  王先生在錄制自己的聲音

  一套語音交互錄制的流程并不簡單,它首先需錄制用戶數(shù)小時(shí)的干聲,對(duì)錄音開展數(shù)據(jù)標(biāo)注,隨后進(jìn)行特征訓(xùn)練和技術(shù)優(yōu)化,才使得韻律、音色、音質(zhì)及自然度更加貼近,最終達(dá)到可媲美真人的播報(bào)效果,看似簡單的需求,卻要需要技術(shù)、產(chǎn)品和平臺(tái)的全面支持。

  接到消息后,京東、科大訊飛、叮咚團(tuán)隊(duì)馬上進(jìn)行緊急溝通,鎖定科大訊飛專門負(fù)責(zé)語音合成業(yè)務(wù)的訊飛智聲團(tuán)隊(duì)尋求技術(shù)幫助。溝通后訊飛智聲當(dāng)即決定為這位用戶提供免費(fèi)技術(shù)支持。

  據(jù)介紹,語音合成技術(shù)的主要原理就是根據(jù)韻律建模的結(jié)果,從原始語音庫中其突出相應(yīng)的語音基元,之后再利用特定的語音合成技術(shù)對(duì)語音基元進(jìn)行加工和調(diào)整,機(jī)器進(jìn)行語音合成時(shí),往往并沒有這些文本的人聲錄音,而是通過音節(jié)拼接與參數(shù)調(diào)整來合成盡可能接近人聲的完整語音。

  在叮咚官方做出決定后一周,他們?cè)诰〇|奶茶館第一次見到了來北京復(fù)診的王先生。

  王先生首先對(duì)叮咚的做法表示了感謝,起初還覺得不可思議的他如今成為了故事的主角,對(duì)于病情的話題他也沒有絲毫回避,表示當(dāng)前的身體狀態(tài)應(yīng)該能夠完成長時(shí)間的錄音。

  通過充分的溝通后,相關(guān)工作人員也做好了準(zhǔn)備,等待王先生前去錄制。但是,王先生的病情突然發(fā)生了變化,來北京進(jìn)行聲音錄制的工作一直被延后,從雙方第一次見面到今年3月錄制完畢,王先生已經(jīng)經(jīng)過了四次化療。

  錄制完成后就是緊張的研發(fā)工作,經(jīng)過技術(shù)團(tuán)隊(duì)的不斷努力下項(xiàng)目已盡基本接近完成,兩周后,王先生專屬的TTS發(fā)音人將正式上線到他的專屬智能音箱里。

  科技發(fā)展應(yīng)以人為本

  人類歷史上推動(dòng)社會(huì)變遷的因素當(dāng)中,科技是一個(gè)重要的驅(qū)動(dòng)力,它帶來了生產(chǎn)關(guān)系的進(jìn)步,提升了人的幸福感,即使是工業(yè)革命百年之后的今天,科技的發(fā)展仍是以人為本。

  比如英特爾的創(chuàng)始人戈登·摩爾見到霍金后,就決定開始將他使用的電腦升級(jí)至搭載英特爾處理器的設(shè)備。從那以后,英特爾保持著每兩年一次的頻率向霍金提供輔助設(shè)備,并免費(fèi)提供技術(shù)支持。再后來,英特爾實(shí)驗(yàn)室專門選一批專家組建“人機(jī)交流研究團(tuán)隊(duì)”為霍金研發(fā)輔助情境感知工具。

  曾經(jīng)有一次在微軟Build大會(huì)上,微軟盲人程序員Saqib Shaikh在臺(tái)上展示了搭載Seeing AI的智能眼鏡,這款設(shè)備可以通過傳感器來幫他感知并理解這個(gè)世界,這一充滿人文關(guān)懷的時(shí)刻,也得到了很多人的稱贊。

  類似科技公司以人為本的案例不勝枚舉,而叮咚為特殊用戶定制聲音的這個(gè)故事在于,它讓讓普通用戶的數(shù)據(jù)有機(jī)會(huì)參與到了AI的應(yīng)用當(dāng)中來,并且通過自己的數(shù)據(jù)還能為家人帶來一些變化,這種方式已經(jīng)超越了產(chǎn)品本身的意義,已經(jīng)從基礎(chǔ)的功能需求上升到了到價(jià)值傳遞、甚至是人文關(guān)懷的層面。

  人工智能這個(gè)方向還有很多技術(shù)等待著我們?nèi)ヌ剿鳌⑷ソ鉀Q,但“技術(shù)不是目的,技術(shù)只是手段”,通過技術(shù)來突破一些限制,幫助人們創(chuàng)造更美好的生活,并承擔(dān)一些社會(huì)責(zé)任,這才是技術(shù)和產(chǎn)品的最終目的。

  或許,科技本身不存在所謂的人文關(guān)懷,科技的本質(zhì)是探索未知的過程,它充滿著不確定性和真理優(yōu)先的原則,人文關(guān)懷更多的是存在于從事科技行業(yè)的人、與之相關(guān)的企業(yè)、甚至背后的社會(huì)制度當(dāng)中。



關(guān)鍵詞: 智能音箱

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉