新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 語音識別電路設(shè)計圖集錦 —電路圖天天讀(71)

語音識別電路設(shè)計圖集錦 —電路圖天天讀(71)

作者: 時間:2017-10-31 來源:網(wǎng)絡(luò) 收藏

  TOP1 控制家用電器系統(tǒng)電路

本文引用地址:http://2s4d.com/article/201710/369387.htm

  技術(shù)是近年來十分活躍的研究領(lǐng)域。系統(tǒng)的實用化研究是語音識別研究的一個主要方向。以玩具市場為例,具有高科技含量的電子玩具、智能玩具發(fā)展迅猛,電子互動式、智能化玩具已經(jīng)成為玩具行業(yè)發(fā)展的主流。我國是玩具生產(chǎn)和出口大國,但在高科技玩具的發(fā)展方面和國外的差距很大,因此,及時投入精力廣泛開展這方面的研究,無論對技術(shù)創(chuàng)新應(yīng)用,還是社會經(jīng)濟發(fā)展,都有巨大的現(xiàn)實意義。與機器進行語音交流,讓機器明白你說什么,這是人們長期以來夢寐以求的事情。語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。近二十年來,語音識別技術(shù)取得顯著進步,開始從實驗室走向市場。語音識別功能大大增加了玩具使用的樂趣,并使玩具體現(xiàn)出一定的智能性,因此成為大部分電子玩具、智能玩具設(shè)計中使用的關(guān)鍵技術(shù)。

  語音模塊

  語音輸出電路如圖所示,其中VDDH為參考電壓,VSS是系統(tǒng)的模擬地。音頻信號由SPCE061A 的DAC引腳輸出送到電路的J4端,通過音量電位器R9的調(diào)節(jié)端送到集成音頻功率放大器SPY0030,經(jīng)音頻放大后,音頻信號從SPY0030輸出經(jīng) J2 端口外接揚聲器播放聲音。 SPCE061A內(nèi)置2路10位精度的DAC,只需要外接功放電路即可完成語音的播放。圖中的SPY0030是凌陽的一款音頻放大芯片,可以工作在 2.4~6V范圍內(nèi),最大輸出功率可達700mW。 J5 都是語音輸出接口,;是兩針的插針外接喇叭,由DAC 輸出引腳經(jīng)語音集成。

  

  放大器SPY0030 放大,然后輸出。SPY0030 是音頻功率放大器。因為聲音是不同振幅和不同頻率的波,即交流信號電流,三極管的集電極電流永遠是基極電流的β倍,β是三極管的交流放大倍數(shù),應(yīng)用這一點,若將小信號注入基極,則集電極流過的電流會等于基極電流的β倍,然后將這個信號用隔直電容隔離出來,就得到了電流(或電壓)是原先的β倍的大信號,這現(xiàn)象稱為三極管的放大作用。經(jīng)過電流與電壓的共同放大,就完成了功率放大。R14為可調(diào)電阻,當(dāng)調(diào)節(jié)阻值大小事,即調(diào)節(jié)了基極的輸入信號,最終影響的就是輸出信號即語音輸出音量的大小。SPY0030的放大倍數(shù)固定為20倍。

  語音輸入電路如圖所示,其中VMC提供傳聲器的電源,AVSS1是系統(tǒng)的模擬地,VCM為參考電壓,1腳和2腳分別是傳聲器X1的正極、負極的輸入引腳,連接SPCE061A的MICP、NICN管腳上。當(dāng)對著傳聲器講話時,1腳和2腳將隨著傳聲器輸入的聲音產(chǎn)生變化的波形,并在SPCE061A的兩個端口處形成兩路反相的波形,送到SPCE061A 控制器內(nèi)部的運算放大器進行音頻放大,經(jīng)過放大的音頻信號,通過ADC轉(zhuǎn)化器轉(zhuǎn)化為數(shù)字量,保存到相應(yīng)的寄存器中。 SPCE061A的A/D轉(zhuǎn)換器有8個通道,其中有1個通道是MIC-NI輸入,它專門用于對語音信號進行采樣。語音信號經(jīng)過MCI轉(zhuǎn)換成電信號,然后輸入至SPCE061A內(nèi)部前置放大器。由于人們說話時,麥克風(fēng)距離嘴邊的距離不同,語音信號的能量將會有很大的差異,此時,如果芯片的的輸入信號太大或是太小都將影響識別的精度。而SPCE06lA內(nèi)部就帶有自動增益控制電路AGC能隨時跟蹤、監(jiān)視前置放大器輸出的音頻信號電平,當(dāng)輸入信號增大時AGC電路自動減小放大器的增益;當(dāng)輸入信號減小時,AGC電路自動增大放大器的增益,從而以補償太小或是太大的信號,以便使進入戶A/D的信號保持在最佳電平,又可使削波減至最小。 SPCE061A芯片中已經(jīng)集成了音頻輸入專用ADC以及AGC放大電路,因為此芯片外部的電路比較簡單。

  

  MICP和MICN將隨著MIC產(chǎn)生的波形變化,并在兩個端口處形成兩路反相波形,在經(jīng)過兩級運放放大,把放大的語音信號交給ADC轉(zhuǎn)換為數(shù)字量,這時就可以通過編程對這些數(shù)據(jù)進行處理,進行語音處理識別等功能。 正如我們在前面介紹的61 板具有強大的語音處理功能,如圖3-8所示,X1 是語音的MIC 輸入端,帶自動增益(AGC)控制。

  SPR4096外擴Flash模塊

  在本系統(tǒng)中,當(dāng)我們對系統(tǒng)進行訓(xùn)練、識別、操作時,有一些語音提示,由于SPCE061A內(nèi)部只有32k字的flash空間,除了一部分空間作為程序的存儲之后,剩下的用來存儲語音數(shù)據(jù)時遠遠不夠的,于是系統(tǒng)外擴了flash。SPR4096與SPCE061A的連接方式為:SCK與SPCE061A的 IOB0接,SDA與SPCE061A的IOB1口接。SPR4096按串行接口模式工作,要把CF2~CF0均接高電平。CF7為低電平時選中 FLASH,高電平時選中SRAM。 SPR4096是一個高性能的4M-bit(512&TImes;8-bit)FLASH,分為256個扇區(qū)。每個扇區(qū)2Kbyte。SPR4096還內(nèi)置了以個 4K&TImes;8bit的SRAM。在進行FLASH的編程/擦除時,可以并發(fā)執(zhí)行SRAM的讀/寫。SPR4096內(nèi)置了一個總線存儲器接口和一個串行接口,它允許通過8-bit并行模式或者1-bit的串行模式訪問FLASH/SRAM存儲區(qū)。 SPR4096串行接口的工作頻率可達到5MHz。SPR4096有兩個電源輸入端VDDI和VDDQ。VDDI是給內(nèi)部FLASH和控制邏輯供電的;VDDQ是專門為I/O供電的。

  

  供電電壓VDDQ:2.25V~3.6V。SPR4096最大讀電流為2mA,最大編程/擦除電流為6 mA 。SPR4096模塊包括總線存儲接口,串行接口,SRAM,編程與擦除控制器和一個4M的FLASH。選擇串行接口時,SCLK作為時鐘信號線,SDA 作為1-bit的數(shù)據(jù)線。如果接收到FLASH的讀指令或者SRAM的讀/寫指令,串口會把這些指令傳給編程和擦除控制器,讓編程和擦除控制器去完成相應(yīng)操作。 串行接口模式的選中是通過CF2~CF0來實現(xiàn)的。當(dāng)CF2~CF0均接高電平時,選中的就是串行接口模式,在串行接口模式下,CF7為低電平時選中 FLASH,高電平時選中SRAM。該芯片有SIF(Serial Interface)和BMI(Busmenory Interface)兩種工作方式,但DIP24只支持SIF方式。

 全球電子測量技術(shù)與市場領(lǐng)導(dǎo)者——是德科技(原安捷倫電子測量事業(yè)部)UXM新品體驗會將于近期拉開帷幕,歡迎各位業(yè)內(nèi)人士踴躍參加,您的到來,將是KEYSIGHT的最大榮幸!報名地址請點擊以下圖片進入:


  TOP2 語音識別機器人系統(tǒng)電路

  系統(tǒng)電源電路設(shè)計

  SPCE061A采用低電壓供電方式,這可以大大降低芯片的功率損耗。其中,SPCE06lA的電源分兩種,即內(nèi)核電源(VDD)和I/O口電源(VDDH)。I/O口電源采用5V電壓,而內(nèi)核電源則為3.3V或者更低。降低芯片內(nèi)核電壓的目的主要還是降低芯片的功耗,同時也可以降低芯片的工作溫度,延長芯片使用壽命。盡管這種語音芯片的工作電壓范圍很大,但是為了使芯片內(nèi)核運行更加穩(wěn)定,同時又保證I/O口及外部擴展部件的工作電壓要求,電源電路采用芯片7805和SPY0029分別提供5V和3.3V電壓完成對整個系統(tǒng)供電。 7805芯片電路中正常工作是,輸入、輸出電壓差為2~3V。電路中靠近引腳處接入電容C40、C41用來實現(xiàn)頻率補償,防止穩(wěn)壓器產(chǎn)生高頻自激震蕩和抑制電路引入的高頻干擾,C39是電解電容,以減小穩(wěn)壓電源輸出端由輸入電源引入的低頻干擾。

  

  6是保護二級管,當(dāng)輸入端短路時,給輸出電容器C39一個放電通路,防止C39兩端電壓作用于調(diào)整管的be結(jié),造成調(diào)整管be結(jié)擊穿而損壞。

  控制與結(jié)果顯示電路

  鍵盤模組可直接用排線與61I/O口相連。1*8KEY 的8 列分別定義為COL1~COL8,1 行定義為ROW1。如圖3-11所示。 按鍵分別和SPCE061A的IOA0~IOA7相連,他們的作用分別為1個系統(tǒng)開關(guān)鍵,1個系統(tǒng)復(fù)位鍵,1個單個命令訓(xùn)練按鍵,1個所有語句循環(huán)訓(xùn)練按鍵,剩余4個初步設(shè)定為LCD功能控制按鍵。每個按鍵的按下與抬起都會送給IOA口一個電壓值,當(dāng)按鍵按下使相應(yīng)的IOA口得到一個高電壓。相反,則為低電壓。單片機則根據(jù)IO口的電壓值進行相應(yīng)的操作。

  

  LED模組

  利用LED顯示來測試是否達到控制電器目標(biāo)。利用數(shù)碼管顯示數(shù)字的不同來模擬驗證是否能達到對家用電器的控制。 LED和LCD電路作為系統(tǒng)的顯示部分,以顯示當(dāng)前的系統(tǒng)狀況及識別結(jié)果以便檢驗實驗結(jié)果和提示用戶進行下一步操作。LCD部分在實驗階段可不接入。 計劃采用內(nèi)置SPLC0501點陣式圖形液晶顯示模塊由液晶驅(qū)動控制器SPLC501、LCD顯示器和外部設(shè)備的接口等幾部分組成,液晶驅(qū)動控制器 SPLC501集行、列驅(qū)動器、顯示數(shù)據(jù)存儲器(DDRAM,Display Data RAM)和控制器與一體,廣泛用于小規(guī)模液晶顯示模塊。內(nèi)置SPLC501點陣式圖形液晶顯示模塊的管腳排列和SPEC061A接線方法如圖所示。

  

  雖然實現(xiàn)了語音控制家用電器,但是總的來說系統(tǒng)界面不是很友好。為此,我們可以充分利用計算機和通信技術(shù),并用VB等軟件開發(fā)友好的管理界面,將數(shù)據(jù)和其他信息通過計算機統(tǒng)一進行管理和控制。

  語音識別機器人系統(tǒng)電路設(shè)計

  目前制造業(yè)市場上,工業(yè)機器人具有相當(dāng)大的市場潛力,要使工業(yè)機器人真正應(yīng)用于生產(chǎn)線上的各個方面,滿足人們?nèi)找嬖鲩L的需求,就離不開高性能的語音識別控制系統(tǒng)。隨著計算機軟硬件技術(shù)、半導(dǎo)體技術(shù)、電子技術(shù)、通訊技術(shù)等的飛速發(fā)展人類已經(jīng)進入后PC時代。語音識別技術(shù)得到了迅猛發(fā)展, 支持語音識別的各種產(chǎn)品紛紛面世。人類實現(xiàn)了語音命令控制空調(diào)、電視、燈光、自動窗簾等的使用,讓人們的生活“隨音所欲”,更加舒適,更加便捷?;诹桕?16位SPCE061A單片機設(shè)計了一個具有語音識別功能的機器人。在經(jīng)過訓(xùn)練后使機器人對訓(xùn)練人的命令做出應(yīng)答,完成跳兩首舞曲、走步、轉(zhuǎn)向、轉(zhuǎn)頭、發(fā)射飛盤等動作。

  語音識別可劃分為訓(xùn)練和識別兩個過程。在第一階段,語音識別系統(tǒng)對人類的 語言進行學(xué)習(xí),把學(xué)習(xí)內(nèi)容組成語音庫存儲起來,在第二階段就可以把當(dāng)前輸入的語音在語音庫中查找相應(yīng)的詞義或語義。凌陽16位SPCE061A單片機內(nèi)嵌 32K字閃存,2K字SRAM,內(nèi)置10位ADC、DAC,有多達14個的中斷源。它的CPU內(nèi)核采用16位具有DSP功能的微處理器芯片, 而且CPU可最高工作在49MHz的主頻下,能夠非常容易地、快速地處理復(fù)雜的數(shù)字信號,因此與其他類型的單片機相比,在數(shù)字語音處理方面 SPCE061A更具有優(yōu)勢?;赟PCE061A設(shè)計了一個具有語音識別功能的機器人。經(jīng)過訓(xùn)練,訓(xùn)練人可使用各種命令讓機器人完成許多有趣的動作,使得人機交互更具智能化。

  SPCE061A最小系統(tǒng)

  

  SPCE061A最小系統(tǒng)中,含有SPCE061A芯片外圍的基本模塊,其主要由晶體輸入模塊(OSC)、鎖相環(huán)外圍電路(PLL)、復(fù)位電路(RESET)、指示燈(LED)等組成,參看圖 4-1。在OSC32O、OSC32I端口接上晶體振蕩器和諧振電容,在VCOIN端口接上相對應(yīng)的電容和電阻后即可工作。在其他不用的VDD端口和 GND端口也不能懸空應(yīng)該接上0.1uF的耦合電容以提高抗干擾能力。 圖 4-1 SPCE061A最小系統(tǒng)。

  TOP3 機器人硬件驅(qū)動電路

  電源輸入端口是61板的能源供應(yīng)中心,整塊板子的電源都是由此提供進去,可采用電池或穩(wěn)壓電源提供5V輸入,并且必須至少保證電流在50mA以上,否則會造成系統(tǒng)無法倍頻和下載出錯。SPCE061A的內(nèi)核供電為3.3V,由于I/O端口可接3.3V也可以接5V,所以在電源模塊中有一個端口電平選擇跳線J5用于選擇端口電壓,電源模塊參看圖,如下:

  

  由于此系統(tǒng)需要的端口高電平為5V,所以圖當(dāng)中的J5跳線需要跳到1和2上。

  放音電路設(shè)計

  

  將HM628128A中存儲的語音數(shù)據(jù)順序取出,解碼后,以8kHz的速率進行D/A轉(zhuǎn)換輸出,語音數(shù)據(jù)經(jīng)電容濾波恢復(fù)成原始語音波形,最后用三極管驅(qū)動揚聲器放音。SPCE061A音頻輸出共有兩個DAC通道,DAC1和DAC2輸出的模擬電信號通過DAC1和DAC2引腳輸出。DAC的輸出范圍是 0x0000~0xFFFF。DAC1和DAC2的輸出數(shù)據(jù)應(yīng)寫入P_DAC1和P_DAC2單元。上電復(fù)位以后,兩個DAC均被自動打開,此時會消耗少量的電流(幾個毫安)。如若不需要,盡量關(guān)閉DAC輸出(將P_DAC_Ctrl單元的第一位置為1)。而且DAC的直流電壓必須保持平穩(wěn)地變化,否則可能由于電壓的突變引起揚聲器產(chǎn)生雜音。為減緩電壓的變化幅度,從而輸出高質(zhì)量的音頻數(shù)據(jù)可以采用ramp up/down技術(shù)。其應(yīng)用條件是:被喚醒/上電復(fù)位后首次使用DAC時,上電復(fù)位功能應(yīng)在被關(guān)閉/進入睡眠狀態(tài)之前。 放音利用的是SPCE061A內(nèi)部的DAC,電路參看圖 4-8。圖中的SPY0030是凌陽公司的產(chǎn)品。和LM386相比,在工作電壓上,LM386需在4V以上,而SPY0030僅需2.4V(兩節(jié)電池)即可工作;在輸出功率上,LM386僅在100mW以上,而SPY0030可達700mW。

  機器人硬件驅(qū)動電路

  

  機器人驅(qū)動電路采用功率較大的三極管搭成H橋來驅(qū)動電機從而實現(xiàn)電機的正向旋轉(zhuǎn)與電機的反向旋轉(zhuǎn),本系統(tǒng)中使用H橋驅(qū)動的電機包括兩個用于走路的電機與一個頭部轉(zhuǎn)向的電機。同時用了一個三極管驅(qū)動單向旋轉(zhuǎn)的電機,如加速電機與發(fā)射電機。語音處理技術(shù)本身就是一門理論性強、實用面廣而且難度較大的綜合學(xué)科。而開發(fā)出具有語音功能的單片機也是相當(dāng)困難的。凌陽unsp系列16位單片機,就是適應(yīng)這種需求而設(shè)計的。凌陽SPCE061A實現(xiàn)語音識別其獨特之處在于:硬件電路簡單,因為SPCE061A是一款專門為語音信號處理設(shè)計的單片機,麥克風(fēng)和喇叭可以直接接入,接放大電路可不用外接。具有一套高效的指令系統(tǒng),軟件編程容易,有相應(yīng)的API函數(shù),可直接調(diào)用。

  TOP4 SPCE061A智能小車語音識別電路

  本文利用凌陽單片機設(shè)計一個具有語音識別功能的智能遙控小車。該設(shè)計將遙控車由傳統(tǒng)的手動遙控改成了語音識別遙控,集成了先進的語音識別技術(shù),加上小車的機動靈活的特點,使控制者可以通過語音控制小車實現(xiàn)預(yù)設(shè)動作,從而釋放控制者的雙手,而且小車和控制者之間還具有一定的交互功能。所以此次研究具有較強的實用性和發(fā)展前景。

  繼電器驅(qū)動電路的設(shè)計

  

  由于單片機I/O口提供的電流太小,不能直接驅(qū)動繼電器工作。在這里采用8050NPN管來提供一個開關(guān)電壓,實現(xiàn)I/O口對繼電器的驅(qū)動;用IN4007去掉繼電器斷開時線圈產(chǎn)生的反向電流,保護8050NPN管不被損壞。繼電器驅(qū)動電路如圖所示。

  行駛狀態(tài)控制電路設(shè)計

  

  如圖所示為行使?fàn)顟B(tài)控制電路,整個小車的行駛狀態(tài)由兩個電機MOTOR A和MOTOR B來控制;MOTOR A控制小車的左邊兩個輪子,MOTOR B控制小車右邊兩個輪子。具體控制如所示。

  麥克錄音輸入及AGC電路

  麥克風(fēng)電路如圖所示。凌陽的SPCE061A是16位單片機,具有DSP功能,有很強的信息處理能力,最高時鐘可達到49M,具備運算速度高的優(yōu)勢等等,這為語音的播放、錄放、合成及辨識提供了條件。本系統(tǒng)接入MIC電路如下圖所示,MIC為錄制語音辨識命令服務(wù)。麥克錄音輸入及AGC電路。

  

  語音播報電路

  音頻部分的原理圖如下所示,在下圖中可以看到兩個跳線,其作用在于可以測量DAC的輸出波形;另外拔掉跳線,可以斷開DAC到喇 叭放大的通路,使得DAC通道處于開路狀態(tài)。這樣便于用DAC做其他用途,用戶可以用過這個跳線來加入自己的外圍電路。

  

  本設(shè)計綜合應(yīng)用了SPCE061A豐富的硬件資源,成功的實現(xiàn)了語音控制功能。下面簡單的介紹一下實際應(yīng)用中的一些資源優(yōu)勢:在硬件方面,較高的執(zhí)行速度、內(nèi)置的硬件乘法器、ADC和DAC功能、內(nèi)置的AGC自動增益環(huán)節(jié),這些為語音處理提供了強大基礎(chǔ)。在軟件方面,標(biāo)準(zhǔn)的C語言編程,豐富的語音資源函數(shù)為編程提供了很大的方便。 該設(shè)計方案結(jié)構(gòu)簡單,以單芯片實現(xiàn)了語音播放與識別以及電機控制功能,相當(dāng)于“語音識別芯片+普通單片機”的功能。但是比“語音識別芯片+普通單片機”方案實現(xiàn)起來要簡單很多,而且成本也會降低很多。

  TOP5 AVR單片機語音識別電路模塊

  基于AVR單片機的語音識別系統(tǒng)設(shè)計,系統(tǒng)以AVR單片機為控制核心,實現(xiàn)對人的語音的識別控制。系統(tǒng)采用的主控芯片為Atreel公司的 ATMEGAl28,語音識別功能采用ICR oute公司的單芯片LD3320。LD3320內(nèi)部集成語音識別算法,無需外部FLASH,RAM資源,可以很好地完成非特定人的語音識別任務(wù)。同時該芯片內(nèi)部集成了MP3播放功能,支持MPEG等格式,可實現(xiàn)語音提示或MP3歌曲的播放功能。由于內(nèi)部含有16位A/D、D/A轉(zhuǎn)換器和功放電路,所以不需要外接功放電路就可以產(chǎn)生清晰的聲音。該系統(tǒng)已經(jīng)預(yù)留好各種接口,具有良好的擴展性。

  LD3320語音識別電路

  LD3320芯片是一款“語音識別”專用芯片。該芯片集成了語音識別處理器和一些外部電路,包括A/D、D/A轉(zhuǎn)換器、麥克風(fēng)接口、聲音輸出接口等,而且可以播放MP3。不需要外接任何的輔助芯片如FLASH,RAM等,直接集成到產(chǎn)品中即可以實現(xiàn)語音識別、聲控、人機對話功能。圖3為LD3320電路原理圖,與MCU通信采用SPI總線方式,時鐘不能超過1.5MHz。

  

  麥克風(fēng)工作電路如圖所示,音頻輸出只需將揚聲器連接到SPOP和SPON即可。使用SPI總線方式時,LD3320的MD要設(shè)為高電平,SPIS設(shè)為低電平。SPI總線的引腳有SDI,SDO,SDCK以及SCS。INTB為中斷端口,當(dāng)有識別結(jié)果或MP3數(shù)據(jù)不足時,會觸發(fā)中斷,通知MCU處理。 RSTB引腳是LD3320復(fù)位端,低電平有效。LED1,LED2作為上電指示燈。

  

  嵌入式語音識別處理ISD-SR3000應(yīng)用電路

  由ISD-SR3000構(gòu)成的語音識別系統(tǒng)由電路如圖2所示。以下分別介紹電路中各部分的功能。

  

  時鐘電路

  SR3000內(nèi)含片內(nèi)振蕩器,但應(yīng)用時也可通過X1和X2/CLKIN端的外接晶振或外部時鐘源來產(chǎn)生時鐘信號。外部時鐘源信號應(yīng)通過X2/CLKIN端輸入。要注意的是,外部時鐘源電平與CLKIN的輸入電平要相符(3.3V或5V)。

  

  外接晶振可通過X1和X2/CLKIN端與芯片內(nèi)的振蕩電路相連。為減少寄生電容和電感對振蕩頻率的影響,外接的晶振和電容應(yīng)盡量靠近X1和X2 /CLKIN端。ISD-SR3000可工作在3.3V±10%和5V±10%兩種電壓,不同電壓的接線方式不同。圖3是采用3.3V電源時的接線圖,圖 4為采用5V電源時的接線圖。SD-SR3000具有低功耗模式,在低功耗模式時的電流消耗僅12mA,此時芯片中的一些功能模塊處于未激活狀態(tài),因而不能進行語音識別。低功耗模式時的引腳CS0和CS1必須置1,這時,MWCLK、MWDIN信號將保持在Vss+0.5V,而RESET、MWCS信號則將保持在Vcc- 0.5V。

  TOP6 揭秘DSP和HMM的語音識別系統(tǒng)電路

  存儲器接口

  ISD-SR3000利用擴展的Flash(閃存)和RO來存儲聲音標(biāo)簽、詞匯、提示符和音質(zhì)模型。建議選用16M以上存儲容量的擴展Flash存儲器,如Am29LA160D等。外接64kB的SRAM可實現(xiàn)HMM算法。表2給出了擴展地址線的接口信號。

  

  ISD-SR3000可為模擬和數(shù)字電話提供一個支持主和從CODEC接口模式的CODEC接口,該接口具有8位和16位的信道寬度,能支持可變和固定格式的通信協(xié)議。在主模式下,可利用SR3000來控制CODEC的運行以滿足模擬電話和獨立標(biāo)準(zhǔn)的應(yīng)用;在從模式下,CODEC接口由外接信號控制,此模式可用于數(shù)字電話,如ISDN或DECT線等。CODEC接口使用的5個信號分別為CDIN、CODUT、CCLK、CFS0和CSF1。其中 CDIN、CDOUT、CCLK和CFS0被連接到第一個CODEC。CDIN、CDOUT、CCLK和CFS1被連接到第二個CODEC接口。數(shù)據(jù)通過 CDOUT輸出端傳送給CODEC接口,并通過CDIN輸入端從CODEC讀出。CCLK和CFS0端在主模式下為輸出狀態(tài),而在從模式下為輸入狀態(tài)。 CFS1是一個輸出端。

  揭秘DSP和HMM的語音識別系統(tǒng)電路模塊設(shè)計

  語音信號采集模塊主要包括語音信號的輸入輸出模擬通道、DSP和AD50的連接、DSP和AD50的周邊設(shè)備連接等。其中,DSP和AD50的周邊設(shè)備連接包括電源電路、時鐘電路、復(fù)位電路、存儲器擴展電路和去耦電路等,這些電路的連接可查看相關(guān)芯片資料。語音信號的前后端處理主要由輸入輸出模擬通道組成。這兩個電路的主要作用是將信號進行處理,盡量減少輸入輸出引入的噪聲。同時,還可以調(diào)整輸入輸出的放大系數(shù),使語音信號適合各種不同的功放,得到最佳的語音效果。為了達到更好的效果,AD50的模擬信號輸入采用差分輸入方式,即使用兩個運算放大器,將單端輸入信號轉(zhuǎn)換成差分輸入信號,電路連接如圖3.5所示。使用差分信號,信號一J下一負同時進入采集系統(tǒng),如果此時有隨機噪聲出現(xiàn),通過『F負信號的加減,可以有效消除部分噪聲。

  AD50差分輸入電路

  

  AD50的D/A輸出為差分信號,可以直接驅(qū)動600歐姆的負載。

  差分輸出電路

  

  要使TLC320AD50正常工作,還需要進行電源供電及去耦電路以及一些功能引腳包括幀同步延遲輸出、電壓下拉、輸出監(jiān)控、參考電壓過濾輸出等的連接,具體連接如圖3.7所示。

  TLC320AD50外圍電路

  

  DSP通過多通道緩沖串口連接AD50。DSP最多可以使一個緩沖串口與3個AD50芯片連接。本系統(tǒng)采用DSP為主設(shè)備、AD50為從設(shè)備的連接方法。如圖3.8所示,AD50的時鐘信號MCLK由DSP的定時器0的輸出TOUT0提供,時鐘頻率可以通過設(shè)置定時器0來改變。AD50的移位時鐘輸出 SCLK連接到DSP的緩沖串口0的接收時鐘引腳CLKR0,幀同步信號FS連接到DSP緩沖串口0的FRXO。AD50的FC引腳連接到DSP的通用 I/O引腳XF,用于控制二次串行通信。圖3.8中DSP的DR0為輸入,其余均為輸出。

  TOP7 程序存儲器電路

  程序存儲器主要用于系統(tǒng)運行時,將采集的數(shù)字語音信號暫時存儲在RAM中以備后續(xù)的處理。由于采集的數(shù)據(jù)不是太大,擴展32k的程序存儲器即可滿足要求。因此本系統(tǒng)只用到CY7C1021的低32k字空間,將DSP的地址線的低15位與CY7C1021的地址線引腳相連,而地址線的1卜18位通過一個數(shù)字邏輯電路后用于尋址CY7C1021的低32k字空間。電路原理圖如圖3.9所示。

  Y7C1021主要電路原理圖

  

  圖3.10是CY7C1021讀和寫信號數(shù)字邏輯電路。圖中,DSP的DSP—R/W和DSP—MSTRB引腳通過或門后的輸出作為SRAM的寫信號,DSP—R/W的非和DSP—MSTRB引腳通過或門后輸出作為SRAM的讀信號。

  

  圖3.1l是CY7C1021的第16位地址引腳數(shù)字邏輯電路。圖中,DSP A15經(jīng)過一個非門作為二四譯碼器SN74LSl39AD的使能信號,DSP A16和DSP A17經(jīng)過譯碼器后輸出端Yl與Y2的非通過一個與門后的輸出作為SRAM的第16位地址線。因此,低32k的SRAM映射到DSP程序空間的0X1 8000__oXlFFFF。

  

  數(shù)據(jù)存儲器電路

  數(shù)據(jù)存儲器主要用于存儲編譯后的系統(tǒng)軟件的數(shù)據(jù),用于語音識別系統(tǒng)板上電自舉。選用flash芯片,是因為flash芯片是電可擦可寫芯片,可以在線對flash進行操作,修改應(yīng)用程序方便。地址緩沖器和數(shù)據(jù)緩沖器電路連接分別如圖3.12和3.13所示:

  SN74LVTHl6244外圍電路

  

  SN74LVTHl6245外圍電路原理圖

  

  TOP8 LED顯示電路與外圍電路設(shè)計

  SST39VFl60有1M*16bit的容量,但擴展數(shù)據(jù)存儲器只需64K空間足以,所以電路SST39VFl60的地址線的高4位接地。電路原理圖如圖3.14所示:

  SST39VFl60外圍電路

  

  LED顯示電路

  LED顯示電路在此系統(tǒng)中用于顯示語音識別的結(jié)果,與輸入的語音比較可知系統(tǒng)識別率的高低。電路中用SN74LS373作為暫存器,通過DSP的I/O 端口選擇引腳IS和DSP的第17個地址引腳來控制SN74LS373的輸出使能端,用一個共陰極七段數(shù)碼管來顯示識別結(jié)果【241。電路圖如圖3.15 所示:

  LED顯示電路原理圖

  

  J-TAG電路

  JTAG標(biāo)準(zhǔn)是IEEEl990年公布的1 149.1標(biāo)準(zhǔn)的又一稱呼,是針對現(xiàn)代超大規(guī)模集成電路測試、檢驗困難而提出的、基于邊界掃描機制和標(biāo)準(zhǔn)測試存儲口的國際標(biāo)準(zhǔn)。JTAG標(biāo)準(zhǔn)公布以后,TI公司為其以后的DSP器件均設(shè)置符合國際標(biāo)準(zhǔn)的JTAG邏輯測試口,通過JTAG測試口訪問和調(diào)試TI DSP芯片。電路設(shè)計中需要注意的問題:當(dāng)仿真器與DSP距離大于15.24cm時,JTAG仿真頭與DSP之間的EMUO、EMUl、TMS、TDI引腳互聯(lián)時應(yīng)通過上拉電阻接高電平,而TMS、TDI、TDO、TCK之問互聯(lián)時還要加緩沖器,只在距離小于15.24cm時它們之間不用通過緩沖器連接。

  JTAG在線仿真電路原理圖

  

  電源電路

  此系統(tǒng)中,有兩類電壓,一類是DSP芯片的內(nèi)核電壓,為1.8V,另一類是DSP的外圍電路供電電壓,為3.3V。為了能夠滿足雙電壓供電,本系統(tǒng)選用TPS767D318電源芯片供電。根據(jù)芯片推薦電路搭建電路原理圖如圖3.17所示:

  系統(tǒng)電源供電電路原理圖

  

  簡述了與硬件相關(guān)的驅(qū)動程序的設(shè)計,將硬件驅(qū)動程序與語音識別程序綜合,編譯通過后載入目標(biāo)板即對語音信號進行識別。介紹了一個基于DSP的非特定人漢語孤立數(shù)字語音識別系統(tǒng)的設(shè)計過程,系統(tǒng)通過AD50芯片將模擬語音信號采集到DSP芯片中,再采用語音識別算法對采集到的信號進行處理,并將識別的結(jié)果用LED輸出完成了整個系統(tǒng)設(shè)計。

  TOP9 語音識別系統(tǒng)在家庭監(jiān)護機器人應(yīng)用電路

  語音是人類最常用的交流方式,也是人類和計算機交流最渴望的方式。因此用語音同計算機交流也成為了最近研究的熱點,計算機對語音的理解是計算機科學(xué)中的一個引人人勝的、富有挑戰(zhàn)性的課題。我國語音識別研究工作開始的較晚,但近年來發(fā)展得很快,一直緊跟國際水平,國家也很重視,中科院自動化所研制的非特定人、連續(xù)語音聽寫系統(tǒng)和漢語語音人機對話系統(tǒng),其字準(zhǔn)確率或系統(tǒng)響應(yīng)率可達90%以上。鑒于中國未來龐大的市場,國外也非常重視漢語語音識別的研究。

  

  STM32嵌入式語音識別電路模塊設(shè)計

  介紹了一種以ARM為核心的嵌入式語音識別模塊的設(shè)計與實現(xiàn)。模塊的核心處理單元選用ST公司的基于ARM Cortex-M3內(nèi)核的32位處理器STM32F103C8T6。本模塊以對話管理單元為中心,通過以LD3320芯片為核心的硬件單元實現(xiàn)語音識別功能,采用嵌入式操作系統(tǒng)μC/OS-II來實現(xiàn)統(tǒng)一的任務(wù)調(diào)度和外圍設(shè)備管理。經(jīng)過大量的實驗數(shù)據(jù)驗證,本文設(shè)計的語音識別模塊具有高實時性、高識別率、高穩(wěn)定性的優(yōu)點。

  語音識別電路

  圖3為語音識別部分原理圖,參照了ICRoute發(fā)布的LD3320數(shù)據(jù)手冊進行設(shè)計。LD3320的內(nèi)部集成了快速穩(wěn)定的優(yōu)化算法,不需外接Fla-sh、RAM,不需要用戶事先訓(xùn)練和錄音而完成非特定人語音識別,識別準(zhǔn)確率高。

  

  圖中,LD3320采用并行方式直接與STM32F103C8T6相接,均采用1kΩ電阻上拉,A0用于判斷是數(shù)據(jù)段還是地址段;控制信號,復(fù)位信號以及中斷返回信號INTB與STM32F103C8T6直接相連,采用10kΩ電阻上拉,輔助系統(tǒng)穩(wěn)定工作;和STM32F103C8T6采用同一個外部8 MHz時鐘;發(fā)光二極管D1、D2用于復(fù)位后的上電指示;MBS(引腳12)作為麥克風(fēng)偏置,接了一個RC電路,保證能輸出一個浮動電壓給麥克風(fēng)。

  智能語音識別云臺轉(zhuǎn)動模塊電路設(shè)計

  云臺轉(zhuǎn)動電路

  雙自由度云臺有4 個控制轉(zhuǎn)動方向的端口, 分別是水平左轉(zhuǎn)、水平右轉(zhuǎn)、上升、下降, 需要24 V 的交流電來驅(qū)動, 而語音識別結(jié)果的二進制序列經(jīng)過解碼后由單片機AT89S52 的I/O 口輸出, 其端口電平是0 ~5 V 的直流。為了能使單片機根據(jù)語音識別結(jié)果驅(qū)動云臺轉(zhuǎn)動,在AT89S52 和云臺之間放置一個電流放大器件ULN2003 。ULN2003 是大電流、高耐壓達林頓陣列, 包括7 個達林頓管, 在5 V 的工作電壓下, 能夠與TTL 和CMOS 電路直接相連, 這樣就可以直接處理原來需要標(biāo)準(zhǔn)邏輯緩沖器來處理的數(shù)據(jù)。將控制云臺轉(zhuǎn)動方向的4 個端口D_Right 、D_Left 、D_Up 、D_Down 分別與繼電器K1、K2、K3、K4 相連, 單片機AT89S52 根據(jù)解碼后的語音識別結(jié)果控制繼電器的斷開和閉合, 從而控制云臺轉(zhuǎn)動的方向和角度。云臺轉(zhuǎn)動電路圖如圖所示。

  

  TOP10 語音識別播放電路

  語音識別播放電路主要由語音芯片LD3320、STC10L08XE 單片機及其他外圍電路構(gòu)成。語音芯片LD3320 內(nèi)部固化有完整的非特定人語音識別特征庫和高效的非特定人語音識別搜索引擎模塊, 不需要事先訓(xùn)練和錄音。只需要單片機把候選識別語句的拼音串傳入芯片內(nèi)部, 通過芯片內(nèi)部的DSP 算法, 找出最佳識別結(jié)果。同時此芯片還支持MP3 播放功能, 此時需要外接Flash 芯片, 用來存儲播放的聲音素材等數(shù)據(jù)。STC10L08XE 單片機讀取串行存儲芯片的MP3 數(shù)據(jù), 依次送入LD3320 芯片內(nèi)部就可以從芯片的相應(yīng)引腳輸出聲音。STC10L08XE 單片機與語音芯片LD3320 之間采用并行的通信方式, 故在硬件上需要使用8 根數(shù)據(jù)線和4 個控制信號將語音芯片與單片機并行連接。

  最小系統(tǒng)電路

  最小系統(tǒng)電路圖如下圖所示,在OSC0,OSC1 口接晶振以及諧振電容,在鎖相環(huán)接入相應(yīng)電容電阻,在電源端和接地端接上0.1UF 去耦電容,提高考干擾能力。

  

  SPCE061A 語音識別模塊硬件結(jié)構(gòu)

  在SPCE061A 主控芯片對語音信號進行A/D 轉(zhuǎn)換具有專門的轉(zhuǎn)換通道——聲音模-數(shù)轉(zhuǎn)換通道。并且SPCE061A 內(nèi)部置有麥克風(fēng)放大電路和自動增益控制部分。自動增益控制部分可以自動調(diào)節(jié)所收到的麥克風(fēng)音量,這樣使得該系統(tǒng)不會受到發(fā)送命令的人所處位置的限制。 SPCE061A 內(nèi)部的麥克風(fēng)前置放大電路主要由輸入級、中間級、輸出級三部分組成,輸入級采用的是差分放大電路,它是麥克風(fēng)前置放大電路的主要組成部分,差分放大電路作為輸入級有很大的優(yōu)勢,能夠有效的抑制輸入端輸入的共模干擾,對于輸入的有效差分信號則不會產(chǎn)生任何干擾。本系統(tǒng)的語音識別信號輸入電路如下圖所示。 C23,C24 是作為退偶電容用,減少噪音信號對語音識別的干擾。

  

  SPCE061A 的音頻輸出模塊硬件電路設(shè)計圖如下所示:

  

  電源模塊電路設(shè)計分析

  

  TOP11 RSC-4X系列語音識別集成應(yīng)用電路

  在本系統(tǒng)中SPCE061A 所需要用到的3.3V 電源,采用AMS1117 芯片產(chǎn)生。AMS1117 是一個正向低壓降穩(wěn)壓器,AMS1117 有兩種:一種為固定輸出電壓,輸出的電壓值有:1.5V、1.8V、2.5V、2.85V、3.0V、3.3V;另一種為可調(diào)節(jié)輸出電壓。AMS1117 內(nèi)部集成了過熱保護電路和過流保護電路。為了保護AMS1117 的穩(wěn)定性,在輸出端要接一個至少22UF 的鉭電容由AMS1117 構(gòu)成的3.3V 電壓產(chǎn)生電路圖。

  由LM2576 構(gòu)成的5V 電壓產(chǎn)生電路圖如下圖所示:

  

  電機驅(qū)動模塊硬件電路設(shè)計

  L298 是專用驅(qū)動集成電路,可以驅(qū)動感性負載,例如:大功率直流電機和步進電機等,可驅(qū)動46V,2A 以下的電機。其輸入端可以直接與單片機連接,并且可以實現(xiàn)電機的正轉(zhuǎn)、反轉(zhuǎn)、加速和減速等控制。L298 有兩個電源,分別為邏輯電源和動力電源,6V 為邏輯電源。12V 為動力電源。電路圖如下所示:

  

  總的來說,計還是比較簡單的,對于語音識別技術(shù)更是有了全新的認(rèn)識,完全掌握了SPCE061A的原理及其技術(shù)。還有,語音識別是一項很有應(yīng)用前景的全新項目,可以應(yīng)用于多種未來新新項目,應(yīng)用范圍廣,可靠性高。是一個很有前途的創(chuàng)新項目!

  RSC-4X系列語音識別集成應(yīng)用電路設(shè)計

  RSC-4x系列是新一代嵌入式語音識別處理器集成電路,它具有集成度高、外圍電路簡單、功耗低、不怕掉電、使用方便等特點。一個完整的語音識別系統(tǒng)僅由RSC-4x系列芯片及少量外部元器件(揚聲器、麥克風(fēng)、音頻輸入/輸出電路、存儲器和電池或整流穩(wěn)壓電源)等組成.R S C-4 x系列芯片適用7.0語音識別技術(shù)RSC-4x系列芯片通常采用48P/64P/100P-LQFP封裝。

  

  工作原理:RSC-4x是一種交互式智能語音識別電路,通過執(zhí)行內(nèi)嵌的馬爾可夫鏈和神經(jīng)網(wǎng)絡(luò)去處理語音識別。說話者需要在芯片的外部存儲器(如 sRAM、EEPROM、閃存等)存儲語音識別信息,識別過程中需要ROM去存儲要被識別的字.RSC-4x有如下幾個獨創(chuàng)的識別特性:

  1、語音識別無須訓(xùn)練。在一個活動單元內(nèi)可識別16個字(單元存儲的字由內(nèi)部ROM和外部存儲器限制)。

  2、連續(xù)接收每一個特殊的字。由于這個功能,所以此產(chǎn)品可以用在一般的場合和對一些特殊的字時需要安靜的環(huán)境。

  3、字定點測量允許芯片一次可連續(xù)接收達5個SI或10個SD,在該字定點方式下,無須保持安靜的環(huán)境.RSC-4x系列可在芯片的sRAM中存儲6個sD字或在外部存儲器中存入更多的字。

  RSC-4x利用巧妙的頻域規(guī)則提供高質(zhì)量語音合成,典型的數(shù)據(jù)率小于5k/s.語音合成需要片內(nèi)或片外ROM去存儲所要合成的語音數(shù)據(jù).RSC-4x 提供4種高質(zhì)量音樂/語音合成手段.RSC-4x獨到之處還有可使用計算機網(wǎng)絡(luò)系統(tǒng)產(chǎn)生具有128種音色、47種真實樂器聲的高檔音樂 MIDI.。RSC-4x可以在不同的采樣比率下對聲音進行錄音和重播,采樣比取決于對語音時長和音質(zhì)的要求,數(shù)據(jù)率在14k/s時,一般就可以獲得較高音質(zhì)的效果.RSC-4x還可以消除靜差以提高聲音質(zhì)量和減少存儲容量。



關(guān)鍵詞: 語音識別 單片機 智能硬件

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉