關(guān) 閉

新聞中心

EEPW首頁 > 工控自動化 > 設(shè)計應(yīng)用 > 實時語音識別系統(tǒng)在家庭監(jiān)護機器人的實現(xiàn)

實時語音識別系統(tǒng)在家庭監(jiān)護機器人的實現(xiàn)

作者: 時間:2012-05-18 來源:網(wǎng)絡(luò) 收藏

摘要:文中闡述的是項目中設(shè)計的部分,通過DSP、DMA和ARM Cortex-A8的并行處理,利用雙緩沖的方法,在嵌入式Linux上了基于ATK的。文中對該的軟硬件進(jìn)行了設(shè)計。在硬件方面,給出系統(tǒng)的硬件組成原理,并提供了關(guān)鍵部分原理圖;在軟件方面,提出語音識別的方法,給出應(yīng)用程序流程。最后通過真人說話來進(jìn)行語音識別實驗,語音識別率達(dá)到了94.67%以上,實驗驗證了系統(tǒng)的軟件硬件設(shè)計的正確性。

本文引用地址:http://2s4d.com/article/160582.htm

關(guān)鍵詞:語音處理;;ATK;實時系統(tǒng)

語音是人類最常用的交流方式,也是人類和計算機交流最渴望的方式。因此用語音同計算機交流也成為了最近研究的熱點,計算機對語音的理解是計算機科學(xué)中的一個引人人勝的、富有挑戰(zhàn)性的課題。

進(jìn)入90年代,隨著多媒體時代的來臨,迫切要求語音識別系統(tǒng)從實驗室走向?qū)嵱谩TS多發(fā)達(dá)國家如美國、日本、韓國以及IBM、Apple、ATT、NTT等著名公司都為語音識別系統(tǒng)的實用化開發(fā)研究投以巨資。IBM公司于1997年開發(fā)出漢語ViaVoice語音識別系統(tǒng),次年又開發(fā)出可以識別上海話、廣東話和四川話等地方口音的語音識別系統(tǒng)ViaVoice’98。目前市場上已經(jīng)出現(xiàn)了語音識別電話、語音識別記事本等產(chǎn)品,如美國VPTC公司的Voice Organizer和法國的Parrot等。

我國語音識別研究工作開始的較晚,但近年來發(fā)展得很快,一直緊跟國際水平,國家也很重視,并把大詞匯量語音識別的研究列入“8 63”計劃,由中科院聲學(xué)所、自動化所、清華大學(xué)電子工程系及北京大學(xué)等單位研究開發(fā),取得了高水平的科研成果,如中科院自動化所研制的非特定人、連續(xù)語音聽寫系統(tǒng)和漢語語音人機對話系統(tǒng),其字準(zhǔn)確率或系統(tǒng)響應(yīng)率可達(dá)90%以上。鑒于中國未來龐大的市場,國外也非常重視漢語語音識別的研究。美國、新加坡等地聚集了一批來自大陸、臺灣、香港等地的學(xué)者,研究成果已達(dá)到相當(dāng)高水平。

1 系統(tǒng)設(shè)計

文中是項目中的語音識別系統(tǒng)設(shè)計部分,設(shè)計目的是設(shè)計出一種可以識別語音的、協(xié)助家庭行動不方便人員的機器人。為該語音識別系統(tǒng),設(shè)計了語音識別系統(tǒng)總體結(jié)構(gòu)框圖,如圖1所示。

b.JPG

1.1 硬件設(shè)計

文中所研究和設(shè)計的功能,都是應(yīng)用在移動機器人上的。因而系統(tǒng)的研究設(shè)計需要考慮到體積小、省電、便于移動的特性,并需具有便于家庭用戶操作的友好顯示界面。對于語音識別部分,需要用到用于語音識別算法處理的處理器、語音采集電路和語音輸出電路,如圖2所示。其中語音識別算法運算的處理器主要負(fù)責(zé)算法的運算處理,相當(dāng)于機器人的大腦;語音采集電路負(fù)責(zé)采集外部的聲音信號,相當(dāng)于機器人的耳朵;語音輸出電路負(fù)責(zé)輸出話語聲音,相當(dāng)于機器人的嘴巴。

c.JPG

1)語音識別算法處理器選擇

根據(jù)系統(tǒng)設(shè)計功能的要求,目前常用的語音識別芯片種類一般有:單片機(MCU)、DSP和SoC(System on Circuit)。考慮到普通單片機(MCU)資源的緊缺及運行速度較慢的缺點,因而在本系統(tǒng)設(shè)計將不考慮使用單片機(MCU)作為語音識別的處理器。DSP包含用作數(shù)字信號處理的專用部件,運算能力強、精度高,但目前DSP的價格比較高,同時考慮到本系統(tǒng)的特性,需要選擇一種既有較強的運算能力,合適于語音識別的功能,并且能實現(xiàn)較好的用戶操作界面,并帶有文件系統(tǒng)(用于識別地圖)的功能,因而選擇DSP并不是明智之舉。目前Texas Instruments公司新推出的一款芯片OMAP3530,它具有雙內(nèi)核ARM CortexTM-A8的內(nèi)核和TMS320C64+TM DSP內(nèi)核,屬于高性能的OMAP35x架構(gòu)系列產(chǎn)品,滿足了系統(tǒng)設(shè)計的各種功能特性要求。

2)語音編解碼芯片選擇

機器人選擇一款合適的語音處理芯片是非常重要的。考慮到系統(tǒng)中用到了各種電源,并需要對電源進(jìn)行管理,因此選擇TI公司配套的TPS 65930芯片來作為系統(tǒng)語音識別部分的音頻編解碼處理功能的硬件平臺是非常合適的。該芯片是一個集成了電源管理、ADC、嵌入式電源控制(EPC)、全功能的音頻編解碼器于一體的芯片,滿足了系統(tǒng)所有電源管理和音頻編解碼的需要,為設(shè)計的PCB板節(jié)省了空間,同時減少了多電源硬件設(shè)計的負(fù)責(zé)布線煩惱。

3)電路設(shè)計

本文的設(shè)計是用在移動機器人上的,因而需要語音的輸入、識別處理及語音輸出的功能。對于語音的輸入采集,本文使用聲音傳感器麥克風(fēng)及外圍電路來實現(xiàn)。對于語音輸出部分,使用功率放大器結(jié)合喇叭來使用。設(shè)計語音部分原理圖如圖3所示。

d.JPG


上一頁 1 2 3 下一頁

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉