科大訊飛吳曉如:17年,我們的方向從未改變
科大訊飛成立于1999年12月30日,是從中科大大學實驗室走出來的企業(yè)。經(jīng)過十幾年的發(fā)展,科大訊飛目前已成為中國最大的智能語音技術提供商,在智能語音技術領域擁有長期的研究積累,并在中文語音合成、語音識別、口語評測等多項技術上擁有國際領先的成果。
本文引用地址:http://2s4d.com/article/201701/342576.htm吳曉如介紹說,科大訊飛是一個技術驅動的企業(yè),他們堅持的夢想是讓機器人像人一樣,能聽會說,能理解,會思考。而科大訊飛17年來在語音技術方面的持續(xù)創(chuàng)新,就是一步步實現(xiàn)這個夢想的過程,通過人工智能的不斷發(fā)展,讓機器說的更自然,讓機器聽的更準確。
“人工智能好像這幾年突然熱起來了,但是對于訊飛來講,我們1999年創(chuàng)業(yè)開始一直干的就是這個活。”吳曉如說。
人工智能通常被分成三個階段,第一個階段是計算機階段,讓計算機具有較高的運算速度,目前這一階段基本已經(jīng)實現(xiàn)??拼笥嶏w主要解決的是后兩個階段,即感知智能和認知智能。
在感知智能階段,主要解決的是聽和看的問題,即讓機器代替人的眼睛、耳朵,可以將聽到的聲音轉換成文字等。例如科大訊飛提供的訊飛輸入法、作文的自動閱卷功能等等
在認知智能階段,不僅要讓機器聽得清,更要能聽得懂,例如,除了將聽到的語音轉化成中文文字之外,還可以通過機器翻譯將其翻譯成對應的英文語句。
吳曉如
吳曉如介紹說,語音技術作為人工智能技術中間一個比較重要的領域,是科大訊飛17年來一直堅持的方向,同時也在探索如何將技術落地到真正的應用當中去,做成能解決用戶痛點的好產(chǎn)品。因此,為了能實現(xiàn)機器能聽會說,能理解會思考,科大訊飛聚焦技術的創(chuàng)新,不斷發(fā)展語音合成技術、語音識別技術、圖像識別技術,并將其應用到醫(yī)療、教育、汽車等領域。
語音識別讓機器有了嘴巴
而此類平臺的入局者,除了如點名時間、太火鳥這類孵化平臺,還不乏京東、小米、百度、聯(lián)想這類大玩家。據(jù)悉,年初百度與京東發(fā)起創(chuàng)建了“創(chuàng)新硬件開放平臺”,為加入平臺的合作伙伴提供技術、產(chǎn)品、渠道、營銷、數(shù)據(jù)等支持,通過該平臺孵化的智能硬件產(chǎn)品將帶有“Baidu Inside”和京東“JD+”品牌標識。近日聯(lián)想也發(fā)布其NBD(New Business Development)孵化平臺計劃,并宣布推出首批三款智能硬件產(chǎn)品。在各類智能硬件亂花漸欲迷人眼的表面下,新的鏈條已見雛形。
平臺產(chǎn)業(yè)鏈初現(xiàn):各盡所能 各取所需
語音識別讓機器有了一個“嘴巴”,可以實時將各種文字讀出來,例如老人可以通過語音播報聽書或者報紙,我們開車的時候可以通過語音來聽一些文字性的內容。同時,現(xiàn)在的語音合成還走向了個性化的合成。比如通過語音合成模擬奧巴馬的音色,可以模仿奧巴馬發(fā)出聲音。或者通過模仿一個人的音色,讓一個不會說法語的人的聲音“說法語”。
在醫(yī)療領域,語音識別也具有實用性,例如科大訊飛推出了一款APP,在醫(yī)生查房時,可以通過語音輸入來記錄病例和布置醫(yī)囑,節(jié)省了醫(yī)生手寫病例的時間,省去了護士的等待時間,提高了醫(yī)生尋房的工作效率。
除此之外,醫(yī)生可以通過語音隨時查詢這個病人當前和過去的一些情況,還可以搜索到相關的治療方案和醫(yī)學資料作為參考。
而借助圖像技術,可以幫助放射科醫(yī)生進行診斷結果,吳曉如介紹說,在肺部腫瘤和肺部結節(jié)在圖像診斷上的結果,機器已經(jīng)和醫(yī)生不相上下了。
“人工智能是非常勤奮的學習者,只要以前有一定量的,醫(yī)生看片子的結果,他用這個結果去學習,學完了他就可以看其他的片子。所以就是可以看到,不僅幫他做筆寫的記錄,不僅幫他查詢后臺的資料,還可以大量的圖像診斷的結果,機器幫他自動看。自動看就帶來了兩種,一種是提高醫(yī)生的效率,還有一種是幫助醫(yī)生診斷的結果更加準確,所以可以看到,整個人工智能目前已經(jīng)可以給醫(yī)生帶來更大的方便了。”
讓機器成為有感情的設備
科大訊飛基于語音識別技術推出了一個應用——飛魚系統(tǒng)。用戶可以通過語音操作飛魚系統(tǒng)撥打電話、搜索音樂、查詢天氣情況、搜索目的地等,它承擔了一個車載秘書的功能,當你使用的越多,它對用戶的個人喜好越來越了解,對答的時候便能提供更準確的服務。
“相當于汽車原來是一個冷冰冰的交通工具,因為飛魚系統(tǒng),或者智能交互語音,技術應用,它變成了一定意義上有情感的交通設備”
除了汽車領域,科大訊飛在智能家居領域也有發(fā)展,通過和京東合作推出智能家居產(chǎn)品,其中智能音箱“叮咚叮咚”是一款非常有意思的產(chǎn)品。
“你在3—5米范圍內想聽任何歌你就跟他說就可以了,你跟他說叮咚叮咚,我想聽什么歌,他就會從后臺海量的音樂庫里面,把這個音樂給你播出來。當然以后,這個叮咚叮咚以后還會做很多擴展,它可以成為你家里面以后智能家居的中央控制設備,比如他可以控制窗簾,冰箱彩電打開都可以。所以叮咚叮咚以后可以成為你家里面控制各種智能家居的重要環(huán)節(jié)。”
人工智能,讓教育可以因材施教
除了醫(yī)學這種專業(yè)化的技術應用領域,人工智能在教育領域也得到了應用。
在因材施教方面,科大訊飛通過知識圖譜技術,可以收集和分析學生日常學習和完成作業(yè)過程中產(chǎn)生的數(shù)據(jù),精確的告訴老師每個學生的知識點掌握情況,老師便可以針對每一位學生的學習情況來有針對性的布置作業(yè),達到因材施教的效果。
在語言教學方面,科大訊飛推出一款叫教具的產(chǎn)品,將觸控筆放在書中的文字上,它就可以將文字讀出來,可以輔助偏遠地區(qū)或者少數(shù)民族區(qū)域的普通話教學,也可以應用到英語等外語教學過程中。
而在教學方式方面,智慧課堂可以為老師提供更為豐富的教學手段,老師在上課的時候不僅僅是具備一本教科書,而是可以任意調取后臺海量的學習資源,例如當老師講到淝水之戰(zhàn)時,可以通過地圖演示、播放視頻等形式來幫助學生理解。
“訊飛要做一個非常酷的公司”
吳曉如說,現(xiàn)在外界講到科大訊飛的時候,會說這是一個技術很牛的公司,但是科大訊飛要“頂天立地”,在技術上保持領先之外,也為大家的生活和行業(yè)帶來了非常多酷炫的產(chǎn)品,改變很多人的工作模式和生活模式,例如記者采訪的時候可以通過訊飛的產(chǎn)品將采訪錄音直接轉化成文字,法官庭審的時候有了一個機器秘書幫他做庭審記錄等等。
但由于大部分是B2B的業(yè)務,大眾消費者對于科大訊飛的認知度并沒有那么高,以后科大訊飛會通過產(chǎn)品,讓外界了解到:這是一家很酷的公司。
“我們也不僅僅是訊飛僅僅具有理工范,我們還希望它更具備一些人文方面的情懷,希望兩方面結合起來,給外界的產(chǎn)品感覺我們這個產(chǎn)品不僅僅酷在技術上,而且還酷在實際應用上。”
評論