Audience為行動(dòng)裝置賦予多感運(yùn)算處理能力

作者：時(shí)間：2014-07-01 來(lái)源：semi

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

　　藉由來(lái)自人腦接收與處理刺激訊號(hào)的靈感，音訊處理器制造商Audience開(kāi)發(fā)出以神經(jīng)科學(xué)為基礎(chǔ)的多感運(yùn)算處理器技術(shù)，在微晶片中模擬人類聽(tīng)覺(jué)處理流程，并提升自然的語(yǔ)音使用體驗(yàn)，實(shí)現(xiàn)永不間斷(Always-On)的語(yǔ)音和動(dòng)作感應(yīng)。

本文引用地址：http://2s4d.com/article/249112.htm

　　Audience是一家將聽(tīng)覺(jué)神經(jīng)科學(xué)商業(yè)化的公司，主要技術(shù)著重于分析人類大腦如何處理訊號(hào)的方式，并導(dǎo)入于先進(jìn)的DSP音訊晶片方案中。Audience行銷副總裁Bart DeCanne介紹，從2008年年底推出首款產(chǎn)品至今，市場(chǎng)上已有超過(guò)220種行動(dòng)裝置采用Audience的語(yǔ)音處理器，出貨量累積超過(guò)4億顆。

　　在分析各種感官輸入時(shí)，Audience先從聽(tīng)覺(jué)開(kāi)始瞭解人耳如何接收訊號(hào)以及大腦如何進(jìn)行分析與處理。Bart DeCanne表示，“人類大腦在這方面的功能十分強(qiáng)大，例如在一個(gè)集會(huì)中，當(dāng)有十個(gè)人同時(shí)交談時(shí)，你可以選擇性地只聽(tīng)到其中一個(gè)人的聲音。”

　　除了處理聽(tīng)覺(jué)以外，人腦也能處理動(dòng)作感應(yīng)、視覺(jué)等多種感官感覺(jué)。Audience模擬人類神經(jīng)系統(tǒng)從多重感官接收訊息并作出適當(dāng)動(dòng)作與回應(yīng)的方式，開(kāi)發(fā)出最新多感運(yùn)算處理器引擎 eS700 系列與超低功耗動(dòng)作處理器 MQ100 ，預(yù)計(jì)在今年下半年就可見(jiàn)到采用這些處理器的產(chǎn)品上市。Audience eS700多感運(yùn)算處理器家族包括702、703、704、705、752與754，搭載進(jìn)階語(yǔ)音、不間斷偵測(cè)(Always-On) VoiceQ與MotionQ，以及智慧型音訊編解碼器等功能。

　　VoiceQ是一項(xiàng)低功耗的持續(xù)性語(yǔ)音感應(yīng)技術(shù)，能透過(guò)一個(gè)關(guān)鍵字喚醒后，提供毫無(wú)延遲且不間斷的語(yǔ)音偵測(cè)與指令。持續(xù)運(yùn)作的VoiceQ處于隨時(shí)感知狀態(tài)，可讓裝置隨時(shí)聆聽(tīng)周遭環(huán)境，并且對(duì)預(yù)先設(shè)定的語(yǔ)音指令做出反應(yīng)。行動(dòng)裝置也只在需要時(shí)被喚醒，并可減少誤判減輕電力消耗，從而實(shí)現(xiàn)<1.5mA電流損耗的超低功耗不間斷語(yǔ)音偵測(cè)。

　　VoiceQ的差異化關(guān)鍵在于提供人聲辨識(shí)的能力，而不至于受到背景噪音的影響被錯(cuò)誤啟動(dòng)。此外，還可經(jīng)由關(guān)鍵字預(yù)先編程實(shí)現(xiàn)多位使用者驗(yàn)證，讓共用裝置的不同使用者以語(yǔ)音登入取代鍵盤(pán)輸入的PIN碼。

　　進(jìn)階語(yǔ)音技術(shù)讓行動(dòng)裝置無(wú)論如何放置，甚至放在衣服口袋中，都能維持良好的語(yǔ)音品質(zhì);透過(guò)先進(jìn)的雜訊(風(fēng)切聲)抑制演算法，即使在風(fēng)大的環(huán)境以及極端嚴(yán)苛的吵雜條件下也能清楚地?fù)艽蚺c接聽(tīng)電話，大幅改善手機(jī)使用體驗(yàn)。

　　eS700系列支援兩種擴(kuò)音模式——指向式與360度語(yǔ)音。指向式針對(duì)行動(dòng)裝置最佳位置提供最佳效果;360度語(yǔ)音則不論任何角度都有最佳效果，適合放在桌上進(jìn)行電話會(huì)議及放在杯架上。

　　Audience智慧型音訊編解碼器eS75X可實(shí)現(xiàn)最佳SNR與類比性能，內(nèi)建所有必要的ADC/DAC以滿足業(yè)界對(duì)于喇叭、頭戴式耳機(jī)、耳內(nèi)式耳機(jī)等驅(qū)動(dòng)單元的需求，并內(nèi)含兩條線路輸出，可搭配AP實(shí)現(xiàn)最佳化效能。此外，自動(dòng)語(yǔ)音辨識(shí)(ASR)輔助演算法則可降低雜訊并保留語(yǔ)音。

　　MotionQ技術(shù)則支援不間斷偵測(cè)的環(huán)境感知應(yīng)用程式，如安全監(jiān)控、室內(nèi)導(dǎo)航以及手勢(shì)辨識(shí)等，同時(shí)僅消耗不到5mW的功率，顯著低于其他運(yùn)動(dòng)處理器架構(gòu)。

　　此外，Audience并推出超低功耗的MQ100動(dòng)作感應(yīng)處理器，這是一款專為管理和融合來(lái)自終端設(shè)備各種感測(cè)器資訊而設(shè)計(jì)的動(dòng)作處理器。為了確保終端裝置不間斷偵測(cè)，目前的動(dòng)作處理需要感測(cè)器與AP之間持續(xù)通訊，使得功耗高達(dá)60-200mW，但Bart DeCanne強(qiáng)調(diào)，高電源效率的MQ100功耗還不到5mW，而且還比任何感測(cè)器中樞MCU的尺寸更小，從而實(shí)現(xiàn)低成本。

　　Audience最近并宣布與聯(lián)發(fā)科(MediaTek)合作，為其最新MT6592八核心處理器搭配MT6290 LTE基頻處理器的智慧型手機(jī)平臺(tái)，提供具備進(jìn)階語(yǔ)音功能的eS700系列智慧音訊編解碼器。Bart DeCanne表示：“透過(guò)Audience預(yù)先整合且經(jīng)測(cè)試的音訊編解碼器全功能音訊子系統(tǒng)，可滿足聯(lián)發(fā)科客戶對(duì)于不同音訊功能選項(xiàng)的需求，協(xié)助其減少研發(fā)作業(yè)，實(shí)現(xiàn)最佳化音訊處理。”

　　Audience的多感運(yùn)算處理器器以運(yùn)算聽(tīng)覺(jué)場(chǎng)景分析(CASA)技術(shù)為基礎(chǔ)，為行動(dòng)裝置實(shí)現(xiàn)增強(qiáng)的語(yǔ)音通訊與雜訊抑制功能。

新聞中心

Audience為行動(dòng)裝置賦予多感運(yùn)算處理能力

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)