基于LabVIEW的語音分析平臺的實(shí)現(xiàn)
語音處理是目前信息學(xué)領(lǐng)域的研究熱點(diǎn)和難點(diǎn),其任務(wù)是研究如何利用信號處理技術(shù)研究語 音信號,使未來的計(jì)算機(jī)“能聽會(huì)說”。語音信號的處理是對語音信號進(jìn)行分析,只有通過分析得到的參數(shù)才能做進(jìn)一步的研究。語音分析涉及大量復(fù)雜的數(shù)學(xué)運(yùn) 算,如果采用硬件方式實(shí)現(xiàn),從價(jià)格和靈活性上都不可取。如果通過計(jì)算機(jī)軟硬件結(jié)合的方法采用主流的編程方式實(shí)現(xiàn),則存在編程復(fù)雜,不易擴(kuò)展和界面不友好等 問題。
本文引用地址:http://2s4d.com/article/193767.htm虛擬儀器是全新概念的最新一代測量儀器,自1987年誕生以來,以前所未有的速度迅猛發(fā)展。虛擬儀器與計(jì)算機(jī)軟硬件技術(shù)的發(fā)展 同步,他利用計(jì)算機(jī)強(qiáng)大的計(jì)算能力和豐富的軟硬件資源來組織儀器系統(tǒng),從而實(shí)現(xiàn)實(shí)驗(yàn)儀器系統(tǒng)的部分乃至全部的功能,并最終實(shí)現(xiàn)從傳統(tǒng)儀器向計(jì)算機(jī)的過渡。 虛擬儀器的測量功能可以由用戶根據(jù)需要自行設(shè)計(jì)軟件來定義或擴(kuò)展,而非由廠家事先定義且固定不可變更。尤其是美國NI公司的圖形化虛擬儀器開發(fā)平臺 LabVIEW,不僅編程簡單功能完備,而且有多種專用軟件包和豐富的各種板卡可供選擇,這就為開發(fā)一個(gè)符合要求且界面友好的語音分析平臺提供了便利。
1工作原理
語音信號一般被看作一種短時(shí)平穩(wěn)的隨機(jī)信號,主要是對他進(jìn)行時(shí)域、頻域和倒譜域上的信號分析。
語音信號的時(shí)域分析是對信號從統(tǒng)計(jì)的意義上進(jìn)行分析,得到短時(shí)平均能量、過零率、自相關(guān)函數(shù)以及幅差函數(shù)等信號參數(shù)。根據(jù)語音理論,氣流激勵(lì)聲道產(chǎn)生語 音,語音信號是氣流與聲道的卷積,因此可以對信號進(jìn)行同態(tài)分析,將信號轉(zhuǎn)換到倒譜域,從而把聲道和激勵(lì)氣流信息分離,獲得信號的倒譜參數(shù)。
線性預(yù)測編碼分析是現(xiàn)代語音信號處理技術(shù)中最核心的技術(shù)之一,他基于全極點(diǎn)模型,其中心思想是利用若干過去的語音抽樣來逼近當(dāng)前的語音抽樣,采用最小均 方誤差逼近的方法來估計(jì)模型的參數(shù)。矢量量化是一種最基本也是極其重要的信號壓縮算法,充分利用矢量中各分量間隱含的各種內(nèi)在關(guān)系,比標(biāo)量量化性能優(yōu)越, 在語音編碼、語音識別等方向的研究中扮演著重要角色。
語音識別通常是指利用計(jì)算機(jī)識別語音信號所表示的內(nèi)容,其目的是準(zhǔn)確地理解語音所蘊(yùn)含的含義。語音識別的研究緊密跟蹤識別領(lǐng)域的最新研究成果并基本與之保持同步。
語音信號分析,首先需要將語音信號采集到計(jì)算機(jī)并做預(yù)先處理,然后通過選擇實(shí)時(shí)或延遲的方式,實(shí)現(xiàn)上述各種類型的參數(shù)分析,并將分析結(jié)果以圖形的方式輸出或保存,從而實(shí)現(xiàn)整個(gè)平臺的功能。
2系統(tǒng)構(gòu)成
語音分析平臺由軟、硬件2部分組成,硬件部分的任務(wù)是通過麥克風(fēng)和聲卡將語音信號轉(zhuǎn)換為電信號,經(jīng)過A/D轉(zhuǎn)換,以數(shù)字信號的形式傳入計(jì)算機(jī),同時(shí)具備能將語音波形文件通過聲卡外接耳機(jī)或音箱回放。系統(tǒng)框圖如圖1所示。
2.1硬件部分
硬件包括3個(gè)部分:拾音及信號調(diào)理電路,A/D轉(zhuǎn)換電路,PC機(jī)接口電路。由于聲卡已經(jīng)成為計(jì)算機(jī)的標(biāo)準(zhǔn)配置(集成或插卡形式),故采用聲卡、話筒的組合實(shí)現(xiàn)這部分功能,不但使用簡便而且省去大量硬件設(shè)計(jì)工作。
2.2軟件部分
LabVIEW是美國NI公司推出的一種通用虛擬儀器開發(fā)軟件,他包含豐富的功能函數(shù)庫和完備的總線設(shè)備驅(qū)動(dòng)程序。LabVIEW的一大特色是其基于圖 形的編程方式是采用數(shù)據(jù)流(dat astream)而非傳統(tǒng)的文本方式的編程方法。這種編程方式強(qiáng)調(diào)信號處理的實(shí)際過程,有利于簡化編程,縮短開發(fā)時(shí)間和降低開發(fā)難度。
LabVIEW的編程包括前面板設(shè)計(jì)和后臺設(shè)計(jì)。前面板對應(yīng)一臺儀器的面板,實(shí)現(xiàn)對儀表的控制和信號的表達(dá)功能。LabVIEW提供了一套豐富的控制模 板庫,用戶通過這些模板來設(shè)計(jì)面板的內(nèi)容。后臺對應(yīng)一臺儀器的內(nèi)部工作部分,用于實(shí)現(xiàn)儀表對信號的采集處理等操作。對應(yīng)的LabVIEW提供了一套功能模 板庫,用來幫助用戶實(shí)現(xiàn)程序改造、儀器控制數(shù)據(jù)分析等功能。主要的功能模塊如下:
采集與預(yù)處理完成語音信號的采集,然后對信號進(jìn)行消噪處理。
時(shí)域處理主要包括短時(shí)分析與預(yù)處理、短時(shí)能量、短時(shí)平均幅度和短時(shí)平均過零率、語音端點(diǎn)檢測、短時(shí)自相關(guān)函數(shù)、短時(shí)平均幅度差函數(shù)和基音周期估計(jì)等。
頻域處理主要包括基于短時(shí)傅里葉分析與重構(gòu)、復(fù)倒譜和倒譜分析、聯(lián)合時(shí)頻分析。
預(yù)測與量化主要包括語音信號預(yù)測編碼分析和矢量量化。
語音識別主要包括特征表示與提取、譜失真測度、模板匹配技術(shù)、隱馬爾可夫模型技術(shù)、孤立詞及連接詞識別、大詞匯量連續(xù)語音識別和說話人識別。
與Matlab軟件接口通過LabVIEW提供的Script Node子VI連接主流算法仿真分析軟件Matlab,充分發(fā)揮后者強(qiáng)大的數(shù)據(jù)處理能力。盡管LabVIEW中提供了一些信息處理功能函數(shù),但是畢竟功能 有限,仍無法滿足用戶各種各樣的數(shù)值計(jì)算和分析的需求。而Matlab特別擅長數(shù)值分析和處理,如果能夠在LabVIEW中調(diào)用他的話,不失為一種較好的 解決方法。
軟件在實(shí)現(xiàn)過程中,充分利用LabVIEW軟件本身所提供的豐富的應(yīng)用分析工具包如數(shù)字濾波器、頻域分析等工具模塊,避免大量的軟硬件開發(fā)工作。
3結(jié)語
通過上述方法構(gòu)建的語音分析平臺,界面豐富友好,操作使用方便,并且能不斷隨著虛擬儀器技術(shù)和計(jì)算機(jī)軟硬件技術(shù)的進(jìn)步而升級。特別重要的是用戶可以在該平臺上開發(fā)驗(yàn)證新的語音信號分析處理算法。
參考文獻(xiàn)
[1]蔡蓮紅,黃德智,蔡銳.現(xiàn)代語音技術(shù)基礎(chǔ)與應(yīng)用[M].北京:清華大學(xué)出版社,2003.
[2]易克初,田斌,付強(qiáng).語音信號處理[M].北京:國防工業(yè)出版社,2000.
[3]劉君華,郭會(huì)軍.基于LabVIEW的虛擬儀器設(shè)計(jì)[M].北京:電子工業(yè)出版社,2002.
評論