Audience為行動裝置賦予多感運算處理能力
藉由來自人腦接收與處理刺激訊號的靈感,音訊處理器制造商Audience開發(fā)出以神經(jīng)科學為基礎的多感運算處理器技術,在微晶片中模擬人類聽覺處理流程,并提升自然的語音使用體驗,實現(xiàn)永不間斷(Always-On)的語音和動作感應。
本文引用地址:http://2s4d.com/article/249112.htmAudience是一家將聽覺神經(jīng)科學商業(yè)化的公司,主要技術著重于分析人類大腦如何處理訊號的方式,并導入于先進的DSP音訊晶片方案中。Audience行銷副總裁Bart DeCanne介紹,從2008年年底推出首款產(chǎn)品至今,市場上已有超過220種行動裝置采用Audience的語音處理器,出貨量累積超過4億顆。
在分析各種感官輸入時,Audience先從聽覺開始瞭解人耳如何接收訊號以及大腦如何進行分析與處理。Bart DeCanne表示,“人類大腦在這方面的功能十分強大,例如在一個集會中,當有十個人同時交談時,你可以選擇性地只聽到其中一個人的聲音。”
除了處理聽覺以外,人腦也能處理動作感應、視覺等多種感官感覺。Audience模擬人類神經(jīng)系統(tǒng)從多重感官接收訊息并作出適當動作與回應的方式,開發(fā)出最新多感運算處理器引擎 eS700 系列與超低功耗動作處理器 MQ100 ,預計在今年下半年就可見到采用這些處理器的產(chǎn)品上市。Audience eS700多感運算處理器家族包括702、703、704、705、752與754,搭載進階語音、不間斷偵測(Always-On) VoiceQ與MotionQ,以及智慧型音訊編解碼器等功能。
VoiceQ是一項低功耗的持續(xù)性語音感應技術,能透過一個關鍵字喚醒后,提供毫無延遲且不間斷的語音偵測與指令。持續(xù)運作的VoiceQ處于隨時感知狀態(tài),可讓裝置隨時聆聽周遭環(huán)境,并且對預先設定的語音指令做出反應。行動裝置也只在需要時被喚醒,并可減少誤判減輕電力消耗,從而實現(xiàn)<1.5mA電流損耗的超低功耗不間斷語音偵測。
VoiceQ的差異化關鍵在于提供人聲辨識的能力,而不至于受到背景噪音的影響被錯誤啟動。此外,還可經(jīng)由關鍵字預先編程實現(xiàn)多位使用者驗證,讓共用裝置的不同使用者以語音登入取代鍵盤輸入的PIN碼。
進階語音技術讓行動裝置無論如何放置,甚至放在衣服口袋中,都能維持良好的語音品質(zhì);透過先進的雜訊(風切聲)抑制演算法,即使在風大的環(huán)境以及極端嚴苛的吵雜條件下也能清楚地撥打與接聽電話,大幅改善手機使用體驗。
eS700系列支援兩種擴音模式——指向式與360度語音。指向式針對行動裝置最佳位置提供最佳效果;360度語音則不論任何角度都有最佳效果,適合放在桌上進行電話會議及放在杯架上。
Audience智慧型音訊編解碼器eS75X可實現(xiàn)最佳SNR與類比性能,內(nèi)建所有必要的ADC/DAC以滿足業(yè)界對于喇叭、頭戴式耳機、耳內(nèi)式耳機等驅(qū)動單元的需求,并內(nèi)含兩條線路輸出,可搭配AP實現(xiàn)最佳化效能。此外,自動語音辨識(ASR)輔助演算法則可降低雜訊并保留語音。
MotionQ技術則支援不間斷偵測的環(huán)境感知應用程式,如安全監(jiān)控、室內(nèi)導航以及手勢辨識等,同時僅消耗不到5mW的功率,顯著低于其他運動處理器架構(gòu)。
此外,Audience并推出超低功耗的MQ100動作感應處理器,這是一款專為管理和融合來自終端設備各種感測器資訊而設計的動作處理器。為了確保終端裝置不間斷偵測,目前的動作處理需要感測器與AP之間持續(xù)通訊,使得功耗高達60-200mW,但Bart DeCanne強調(diào),高電源效率的MQ100功耗還不到5mW,而且還比任何感測器中樞MCU的尺寸更小,從而實現(xiàn)低成本。
Audience最近并宣布與聯(lián)發(fā)科(MediaTek)合作,為其最新MT6592八核心處理器搭配MT6290 LTE基頻處理器的智慧型手機平臺,提供具備進階語音功能的eS700系列智慧音訊編解碼器。Bart DeCanne表示:“透過Audience預先整合且經(jīng)測試的音訊編解碼器全功能音訊子系統(tǒng),可滿足聯(lián)發(fā)科客戶對于不同音訊功能選項的需求,協(xié)助其減少研發(fā)作業(yè),實現(xiàn)最佳化音訊處理。”
Audience的多感運算處理器器以運算聽覺場景分析(CASA)技術為基礎,為行動裝置實現(xiàn)增強的語音通訊與雜訊抑制功能。
評論