深度:語音技術革命正在改變人類的交流方式
MyTalkTools Mobile是由一位父親開發(fā)的,以幫助他兒子克服通信困難,他的兒子出生時患有Nager綜合癥,這是一種影響聽力、言語和其他能力的罕見疾病。目前該軟件已擁有超過10萬名用戶。
本文引用地址:http://2s4d.com/article/201811/394166.htm2017年初,微軟推出了GazeSpeak應用程序,幫助肌萎縮性側索硬化(ALS)患者用眼球運動進行溝通。該應用通過手機攝像頭跟蹤患者的眼睛運動,并用AI進行字詞預測。
2)語音生成設備
機器學習、自然語言處理和文本預測技術極大地推動輔助通信技術的發(fā)展,語音合成應用可以為用戶提供定制化、個性化的服務。
語音生成設備可以將單詞或圖片轉化成語音,比輔助應用APP更加先進。某些產品允許用戶可以從幾種不同的聲音中進行選擇,例如男性或女性,兒童或成人,甚至可以選擇一些地域口音。某些算法模型可以追蹤患者眼睛運動或頭部運動來進行詞匯選擇,并合成語音。
Pocket Go Talk是一款可穿戴的小型便攜式AAC設備,也可以在桌面使用,具有五種可調節(jié)的掃描速度。通過5個易操作的按鈕生成25條語音消息,每條語音可以長達12秒。
便攜式輔助書寫平板MegaBee是在英國斯托克曼德維爾醫(yī)院的閉鎖綜合征患者的幫助下研發(fā)出來的。通過眼球運動和閃爍作為選擇字母或短語的方法,然后在屏幕上顯示,從而幫助中風、多發(fā)性硬化癥、運動神經元疾病患者及其它語言障礙患者進行交流。
還有很多新興科技公司正在利用機器人技術提升患者的社交能力。盧森堡機器人公司LuxAI推出適用于自閉癥兒童的社交機器人QTrobot,實驗證明,該機器人可以明顯增加自閉癥兒童的注意力和參與度,同時減少他們的焦慮和破壞行為。
美國波士頓公司VocalID利用眾包和語音混合技術為語言障礙患者提供個性化的合成語音。目前已有110多個國家的超過14000人為公司的語音庫The Human Voicebank提供了600多萬句話。
2017年,谷歌宣布神經網絡模型WaveNet正式商用于Google Assistant中,比初始模型效率提高了1000倍,可以更好地模擬自然語音。該模型可以根據真實的人類語音對音頻波形進行建模分析,從中學習并創(chuàng)建自己的聲音。
3)代表未來的腦機接口
意念交流是很多科幻小說和電影里的場景,而現(xiàn)在科研人員正在通過腦機接口技術將之變成現(xiàn)實。
早在1998年,英國雷丁大學的研究員Kevin Warwick博士在自己的手臂上植入一個發(fā)射器來控制門和其它裝置。2002年,他將電極接入自己的神經系統(tǒng),以便用思維控制輪椅,并允許遠程機器人手臂模仿他的手臂動作。
Warwick博士的目標是幫助語言障礙患者進行溝通,他將一個芯片植入他妻子的手臂,通過互聯(lián)網將兩人的大腦聯(lián)系在一起,創(chuàng)造了世界上第一個腦—腦電子通信。
2012年,美國因中風而癱瘓的患者Cathy Hutchinson利用腦植入芯片成功的用思維控制機器手臂端起一杯咖啡,并和吸管中喝了一口。
2014年初,法國公司Axilum Robotics與西班牙巴塞羅那大學、Starlab公司和哈佛醫(yī)學院一起進行第一次腦對腦的溝通,在5000公里外,實現(xiàn)了直接在兩個人的大腦之間進行溝通。
2016年埃隆·馬斯克成立了Neuralink公司進行腦機接口研究,以幫助治療人類的腦部疾病。
2018年5月,俄羅斯新西伯利亞國立技術大學聲稱研制出了一款用意念控制的越野輪椅。頸部以下癱瘓者可乘坐該輪椅在室內甚至城市街道上獨立行動。
2018年6月,美國麻省理工學院下屬計算機科學與人工智能實驗室(CSAIL)的研究人員開發(fā)了一種新界面系統(tǒng),它可以讀取人類操作人員的腦電波,通過思維命令機器執(zhí)行任務。
目前腦控科技已經成為各國科研人員競相研究的前沿課題。盡管大多數研究目前還停留在實驗室階段,一旦該技術成功商業(yè)化,癱瘓者、語言障礙者、盲人等群體將迎來生命中的第二個春天。
語音2.0:語音界面技術和實時翻譯
未來,科技創(chuàng)新將使人類的交流與溝通提升到另外一個層次,它不僅僅是幫助語言障礙患者進行無障礙交流;還會在人與人或人與機器之間進行信息交換。
由于人類語言的多樣化,限制了人與人之間的溝通,特別是跨國別和跨語種的交流。近幾年,隨著實時翻譯技術的成熟,語言鴻溝正被慢慢地消除。
2017年10月,谷歌推出Pixel Buds藍牙耳機,使用Pixel智能手機即可在40種不同語言之間進行即時翻譯。
微軟的Skype Translator可以對語音、視頻及50種語言的文本內容實現(xiàn)八種語言之間的實時翻譯
各種便攜式翻譯設備可以幫助游客在幾秒鐘內進行語言翻譯。未來,小小的耳機設備將打破出行的語言限制,而傳統(tǒng)的翻譯這一職業(yè)也將被新技術所替代。
在語言的新技術革命中,手語也正在被技術所替代。2015年,美國德克薩斯A&M大學開發(fā)了一款可穿戴設備,通過感知用戶的手臂動作,將手語翻譯成英語。該設備可以識別出大約40個美國標準手語動作,準確率達到了96%。
利益于人工智能技術的飛速發(fā)展,機器不僅僅是充當翻譯人員,還可以成為溝通伙伴。據Gartner預測,到今年年底,我們與新技術的互動中有30%將通過與智能機器完成。目前每六個美國成年人中,就有一個擁有智能音箱或相關設備。除了控制智能家居外,亞馬遜的AI助手Alexa已經可以幫助用戶在線購物。未來AI助手將能實現(xiàn)更多的功能。
無論是在醫(yī)療、旅游、還是商業(yè)活動,以人工智能為代表的新技術正在徹底改變人與人之間的交流方式,并將打破身體、地域、國別、語種的各種限制。未來,我們的交流對象也將不再局限在人類,可以是機器、可以是動物。
這一切都是科技帶來的福利??萍迹驹撊绱?。
評論