新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于DSP的人工耳蝸語音處理器設(shè)計(jì)

基于DSP的人工耳蝸語音處理器設(shè)計(jì)

作者: 時(shí)間:2014-04-04 來源:網(wǎng)絡(luò) 收藏

摘要:傳統(tǒng)的人工耳蝸語音處理器采用設(shè)計(jì),投入成本高,可移植性差,設(shè)計(jì)了一種基于A的人工耳蝸語音處理器。該處理器采用雙麥克風(fēng)接受語音信號,實(shí)現(xiàn)了語音信號的自適應(yīng)噪聲消除和CIS(Continuous Interleaved Sampling)方案。同一段語音由采樣處理得到的刺激脈沖與MATLAB采樣處理的結(jié)果基本相同。實(shí)驗(yàn)結(jié)果表明,基于的人工耳蝸語音處理器能實(shí)現(xiàn)語音信號中噪聲的消除并得到良好的刺激脈沖。

本文引用地址:http://2s4d.com/article/235932.htm

關(guān)鍵詞:;人工耳蝸;自適應(yīng)噪聲消除;語音處理器

人工耳蝸又稱人造耳蝸、電子耳蝸,是目前唯一可以幫助重度耳聾患者恢復(fù)聽覺的裝置。相對于助聽器將聲音放大改善耳聾患者的聽力,人工耳蝸是將聲音轉(zhuǎn)換成電信號,然后以微弱電流刺激聽覺神經(jīng)纖維的形式傳遞聲音信息,從而產(chǎn)生聽覺。目前商用的人工耳蝸一般由體外語音處理器和體內(nèi)植人體組成,體外部分由麥克風(fēng)、語音處理器和編碼發(fā)射器組成,體內(nèi)部分由接收解碼器、刺激器和電極整列組成,并通過手術(shù)植入患者的體內(nèi)。目前國內(nèi)外商用的人工耳蝸語音處理器均采用設(shè)計(jì),投入成本高,可移植性差。隨著現(xiàn)代微電子技術(shù)的發(fā)展,采用通用集成電路設(shè)計(jì)實(shí)用可靠的人工耳蝸已成為可能,其低成本、移植性好的特性將有助于人工耳蝸更好的普及。該系統(tǒng)基于TI公司的16位定點(diǎn)處理器,由完成語音采集和A/D轉(zhuǎn)換,系統(tǒng)設(shè)計(jì)包括硬件設(shè)計(jì)部分和軟件設(shè)計(jì)部分。本設(shè)計(jì)采用雙麥克風(fēng)接收語音輸入的自適應(yīng)噪聲消除技術(shù),改善了在低信噪比環(huán)境中的語音識別效果。為了提高系統(tǒng)的運(yùn)行速度、降低系統(tǒng)的功耗,對軟件設(shè)計(jì)部分進(jìn)行了優(yōu)化。

1 帶自適應(yīng)噪聲消除技術(shù)的CIS算法

1.1 自適應(yīng)噪聲消除原理

在低信噪比的環(huán)境下,耳聾患者的語音識別率大幅下降?;谧赃m應(yīng)濾波器的噪聲消除法能有效的增強(qiáng)語音,消除背景噪聲,從而提高患者的語音識別率。本文中語音采集部分利用了兩個(gè)麥克風(fēng)接收語音,經(jīng)過采樣后作為兩個(gè)通道的輸入信號,輸入信號中均包括語音信號成分s和噪聲成分n。假設(shè)麥克風(fēng)1的采樣結(jié)果為s1+n1,麥克風(fēng)2的采樣結(jié)果為s2+n2。由于麥克風(fēng)1和麥克風(fēng)2分別對同一環(huán)境中的聲音進(jìn)行采樣,s1和s2為相關(guān)信號,n1和n2為相關(guān)信號。假設(shè)麥克風(fēng)1和麥克風(fēng)2收到的語音信號一樣,即s1等于s2。通過兩路信號相加得到主通道輸入信號x1=2s1+n1+n2,通過兩路信號相減得到參考通道輸入信號x2=n1-n2。由于主通道語音中的噪聲n1+n2與參考噪聲n1-n2是相關(guān)的,參考通道中的自適應(yīng)濾波器在接收n1-n2以后使輸出在最小均方誤差下最接近主通道噪聲n1+n2。輸出端e得到了消除噪聲后的增強(qiáng)語音信號。本文中自適應(yīng)濾波器采用了歸一化LMS算法,當(dāng)信噪比較大時(shí),采用較小的收斂因子,減少穩(wěn)定失調(diào)誤差;當(dāng)信噪比較小時(shí),采用較大的收斂因子,加快算法的收斂速度。自適應(yīng)噪聲消除原理如圖1所示。

 

 

1.2 帶自適應(yīng)噪聲消除技術(shù)的CIS方案

文中設(shè)計(jì)的人工耳蝸語音處理器采用CIS方案,即連續(xù)間隔采樣方案(Continuous Interleaved Sampling,CIS)。語音信號先經(jīng)過預(yù)加重處理,以補(bǔ)償語音信號中的高頻成分,然后做FFT變換,經(jīng)n個(gè)帶通濾波器后劃分為與刺激電極相對應(yīng)的通道,對各個(gè)通道能量求和并利用對數(shù)或指數(shù)函數(shù)壓縮已提高患者的聽力動態(tài)范圍。帶自適應(yīng)噪聲消除技術(shù)的CIS方案如圖2所示。

 

 

2 硬件結(jié)構(gòu)與設(shè)計(jì)

本系統(tǒng)以TMS320VC5509A DSP為核心,TLV320AIC23語音Codec芯片等其他外設(shè)為輔助設(shè)備。TMS320VC5509A控制系統(tǒng)的外設(shè)和處理CIS算法程序,TLV320AIC23對外部聲音進(jìn)行采樣和A/D轉(zhuǎn)換。TMS320VC5509A是TI公司推出的一款高性能低功耗的16位定點(diǎn)數(shù)字信號處理器,它擁有豐富的片內(nèi)資源,能方便的控制其他設(shè)備,輸出處理結(jié)果等。TLV320AIC23具有很低的功耗,在ADC和DAC的噪音可分別達(dá)到90 dB和100 dB。此外TLV320AIC23支持MIC和LINE IN兩種輸入方式,內(nèi)部ADC和DAC轉(zhuǎn)換模塊均帶有完整的數(shù)字濾波器,可以在8 kHz到96 kHz的采樣頻率范圍內(nèi)傳輸數(shù)據(jù)寬度為16位,20位,24位,32位的數(shù)據(jù)。

語音采集芯片TLV320AIC23與主處理芯片TMS320VC5509A的接口電路如圖3所示。

 

 

DSP與AIC23的接口有兩個(gè),一個(gè)是控制接口采用I^2C模塊,通過編程完成對AIC23的配置;一個(gè)是數(shù)據(jù)音頻接口,通過MCBSP0傳輸數(shù)據(jù)。

AIC23的控制接口有SPI/和I^2C兩種工作方式,由于VC5509A片內(nèi)外設(shè)含有I^2C模塊.因此使用I^2C方式控制AIC23更為方便。此時(shí)VC5509A作為I^2C總線的主設(shè)備,AIC23作為從設(shè)備。在I^2C總線上AIC23有7位外設(shè)地址,9位寄存器的設(shè)置值。SCL和SD1分別是AIC23的控制端口和數(shù)據(jù)輸入端,分別和VC5509的I^2C模塊端口SCL,SDA相連。TLV3320AIC23的數(shù)據(jù)音頻接口支持右判,左判,I^2S和DSP 4種接口模式。本系統(tǒng)采用DSP模式,把AIC23設(shè)為主模式,DSP設(shè)為從模式,即MCBSP0的移位時(shí)鐘和幀同步時(shí)鐘全部由AIC23提供。在幀同步脈沖到來時(shí)第一個(gè)數(shù)據(jù)字即為左通道數(shù)據(jù),右通道數(shù)據(jù)緊跟著左通道數(shù)據(jù)。

語音是時(shí)變的,非平穩(wěn)的隨機(jī)過程,但由于語音的形成過程與與人類發(fā)音系統(tǒng)的生理結(jié)構(gòu)密切相關(guān),通常假設(shè)語音信號是短時(shí)平穩(wěn)的,即在10至30 ms的時(shí)間段內(nèi)其頻譜特性和一些物理特征參量可近似的看作是不變的。因此語音信號要進(jìn)行分幀處理,在采樣率為8 kHz時(shí)可將幀長取為N=256較為合適。

3 系統(tǒng)軟件設(shè)計(jì)

本系統(tǒng)中語音信號由LINE IN輸入,LLINE IN和RLINEIN分別對應(yīng)自適應(yīng)噪聲消除原理圖中的麥克風(fēng)1和麥克風(fēng)2,語音信號分別經(jīng)過AIC 23內(nèi)部的A/D轉(zhuǎn)換后,通過MCBSP0通道傳送到VC5509A內(nèi)。VC5509A對這些語音數(shù)據(jù)進(jìn)行CIS算法處理,得到各個(gè)通道的刺激脈沖。

系統(tǒng)軟件設(shè)計(jì)分為系統(tǒng)初始化,系統(tǒng)中斷處理程序和CIS算法程序。系統(tǒng)的初始化包括設(shè)置時(shí)鐘發(fā)生器,MCBSP初始化,I^2C初始化以及對AIC23控制寄存器的配置。系統(tǒng)中斷處理程序設(shè)置一個(gè)標(biāo)志位,每中斷一次左右聲道各采集一個(gè)數(shù)據(jù),當(dāng)采集滿一幀時(shí)能使采樣值保存在兩個(gè)數(shù)據(jù)緩沖區(qū)的另一個(gè)緩沖區(qū)中。系統(tǒng)中主程序一直處于循環(huán)處理過程,在一幀信號執(zhí)行完CIS算法程序后,等待下一幀信號接收完畢,然后重新執(zhí)行CIS算法程序。為保證語音信號處理的連續(xù)性,CIS算法處理時(shí)間應(yīng)當(dāng)小于一幀數(shù)據(jù)的采樣時(shí)間。本系統(tǒng)CPU時(shí)鐘為144 MHz,采樣頻率8 kHz,中斷頻率8 kHz,因此每125μs采集一個(gè)點(diǎn),采集一幀256個(gè)數(shù)據(jù)需32 ms,即每隔32 ms輸出1個(gè)刺激脈沖,CIS子程序運(yùn)行一次需23.1 ms。圖4為系統(tǒng)設(shè)計(jì)流程圖。

 

 

4 設(shè)計(jì)結(jié)果驗(yàn)證

文中設(shè)計(jì)的CIS算法首先用MATLAB進(jìn)行驗(yàn)證,然后修改成C語言在DSP上實(shí)現(xiàn)。為了更方便的分析算法結(jié)果,文中利用了集成在MATLAB 7.0中的CCSLlink工具。利用該工具可在MATLAB環(huán)境下完成對CCS和DSP目標(biāo)板的操作,自動實(shí)現(xiàn)調(diào)試,數(shù)據(jù)傳遞和驗(yàn)證。在創(chuàng)建好CCSIDE連接對象后,利用MATLAB把工程文件加載到CCSIDE中,經(jīng)過編譯連接生成DSP可執(zhí)行文件。把可執(zhí)行文件加載到DSP目標(biāo)板,運(yùn)行程序,由waver ead函數(shù)讀取wav格式音頻文件。該音頻文件是立體聲的波形文件,采樣精度16位,采樣率22 050 Hz,左聲道模擬麥克風(fēng)1,右通道模擬麥克風(fēng)2。為了模擬真實(shí)環(huán)境中的噪聲,左右聲道各加入了相關(guān)的高斯白噪聲,通過LINE IN連接線接到DSP目標(biāo)板。先將自適應(yīng)濾波前后的結(jié)果進(jìn)行對比,如圖5所示。

 

 

自適應(yīng)消噪后的語音信號經(jīng)過預(yù)加重,F(xiàn)FT變換,帶通濾波,能量求和及非線性壓縮后可得到與每個(gè)電極相對應(yīng)的刺激脈沖。以第一通道為例,同一語音分別經(jīng)DSP和MATLAB采樣處理的結(jié)果對比如圖6所示。

 

 

5 CIS算法實(shí)現(xiàn)優(yōu)化

功耗是人工耳蝸語音處理器設(shè)計(jì)需要考慮的重要內(nèi)容,本系統(tǒng)在降低功耗方面做了一些努力。由于語音實(shí)時(shí)采樣分析的需要,每幀數(shù)據(jù)的處理時(shí)間必須小于每幀數(shù)據(jù)的采樣時(shí)間。CIS算法優(yōu)化后減少了每幀數(shù)據(jù)的處理時(shí)間,可以使CPU工作在較低的工作頻率,一定程度上降低了系統(tǒng)功耗。CIS算法中開平方運(yùn)算和FFT運(yùn)算需要較多的處理時(shí)間,其中浮點(diǎn)數(shù)開平方運(yùn)算需要10 ms,浮點(diǎn)數(shù)FFT運(yùn)算需要51 ms。本算法中采用了DSP函數(shù)庫中的sqrt_16函數(shù)和cfft函數(shù),這些函數(shù)全部為優(yōu)化過的匯編語言,可有C?語言方便調(diào)用,執(zhí)行速度得到了很大的提高。

6 結(jié)束語

文中介紹了基于16位定點(diǎn)DSP芯片TMS320VC5509A的人工耳蝸語音處理器的硬件設(shè)計(jì)和軟件設(shè)計(jì)。為了提高低噪聲中的語音識別率,本設(shè)計(jì)采用了雙麥克風(fēng)接收語音輸入的自適應(yīng)消噪技術(shù)。聲音經(jīng)過語音Codec芯片TLV320AIC23采集并進(jìn)行A/D轉(zhuǎn)換后傳輸?shù)紻SP內(nèi)。系統(tǒng)運(yùn)行結(jié)果表明,該系統(tǒng)可以實(shí)現(xiàn)語音信號中噪聲的消除,并得到良好的電極刺激脈沖,其低功耗、低成本、移植性好的特性將有助于人工耳蝸更好的普及。

射頻卡相關(guān)文章:射頻卡原理


關(guān)鍵詞: DSP ASIC

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉