DSP嵌入式說話人識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

作者：時(shí)間：2009-12-28 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

0 引言
說話人身份識別屬于生物認(rèn)證技術(shù)的一種，是一項(xiàng)根據(jù)語音中反映說話人生理和行為特征的語音參數(shù)來自動識別說話人身份的技術(shù)。近年來，說話人身份識別以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢受到矚目，在信息安全等領(lǐng)域的應(yīng)用逐漸增大，并成為人們?nèi)粘Ｉ詈凸ぷ髦兄匾移占暗陌踩?yàn)證方式。目前，說話人身份識別在理論上和實(shí)驗(yàn)室條件下已經(jīng)達(dá)到了比較高的識別精度，并開始走向?qū)嶋H應(yīng)用階段。ATT、歐洲電信聯(lián)盟、ITT、Keyware、T-NETIX，Motorola和Vi-sa等公司相繼開展了相關(guān)實(shí)用化研究，國內(nèi)這方面研究主要在中科聲學(xué)所，中科院自動化所，清華大學(xué)等研究所和大學(xué)中進(jìn)行。
基于嵌入式的說話人身份識別系統(tǒng)具有高精度，適時(shí)性好，低功耗，低費(fèi)用，體積小等優(yōu)勢，逐漸成為說話人身份識別面向?qū)嶋H應(yīng)用的新熱點(diǎn)。而隨著DSP新技術(shù)的發(fā)展，DSP芯片無論在處理速度、精度、功耗或者體積等方面都取得了突破性的進(jìn)展。DSP也越來越多的應(yīng)用于說話人身份識別。但目前這方面研究主要局限于小數(shù)據(jù)量、與PC機(jī)配套使用上，沒有太大的實(shí)用價(jià)值。在此介紹一種基于TMS320C6713 DSP芯片設(shè)計(jì)的嵌入式，10個(gè)人范圍的說話人身份識別系統(tǒng)。該系統(tǒng)可以自舉運(yùn)行，并可靈活的選擇訓(xùn)練、識別或者更換訓(xùn)練者、識別者，識別率達(dá)98％以上。

本文引用地址：http://2s4d.com/article/152184.htm

1 系統(tǒng)的架構(gòu)及硬件構(gòu)成
系統(tǒng)總體實(shí)現(xiàn)流程如圖1所示。系統(tǒng)主要分為訓(xùn)練和識別兩部分，系統(tǒng)初始化后由操作者控制訓(xùn)練或識別。訓(xùn)練目的是提取說話人模型參數(shù)并將其存儲在FLASH ROM中。識別目的是讀取待識別者語音信息并將獲得的模型參數(shù)與訓(xùn)練的模型參數(shù)比較，從而獲得識別結(jié)果。

1．1 系統(tǒng)的主要硬件構(gòu)成
系統(tǒng)硬件構(gòu)成如圖2所示，主要包含語音采集模塊、數(shù)據(jù)處理模塊(DSP)、程序數(shù)據(jù)存儲及自舉FLASH模塊、數(shù)據(jù)存儲器RAM模塊、系統(tǒng)時(shí)序邏輯控制CPLD模塊、JTAG接口模塊。

語音采集模塊主要由TLV320AIC23音頻編解碼器來完成，該芯片是TI公司的一款高性能的立體聲音頻Codec芯片，內(nèi)置放大器，輸入／輸出增益可編程設(shè)置。模數(shù)，數(shù)／模轉(zhuǎn)換集成在一塊芯片中。采樣率8～96 kHz可編程實(shí)現(xiàn)。另外還具有低功耗，連接電路簡單，性價(jià)比高的特點(diǎn)。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解（linux不再難懂）

新聞中心

DSP嵌入式說話人識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

評論

相關(guān)推薦

技術(shù)專區(qū)