一種用于抗噪語(yǔ)音識(shí)別的動(dòng)態(tài)參數(shù)補(bǔ)償新方法
表1~表3列出的是在不同噪聲環(huán)境和信噪比條件下的各種算法的識(shí)別率。可以看出使用補(bǔ)償算法的識(shí)別率比失配情況下有很大的提高。在-5dB條件下,使用了DPCM的識(shí)別方法對(duì)各種噪聲語(yǔ)音的平均識(shí)別率比僅使用Log―Add PMC和Log―NormalPMC的方法有絕對(duì)的7.5%和6.6%增加,在0dB情況下絕對(duì)增加值分別為8%和7.3%。在信噪比5―10dB下,有含DPCM方法的識(shí)別率比其他兩種算法仍然有性能上的提高。
表4列出了更新每個(gè)狀態(tài)的4個(gè)高斯密度分布中的單個(gè)高斯密度分布時(shí),靜態(tài)均值和方差以及動(dòng)態(tài)均值和方差(注:Log―Add PMC算法只對(duì)均值補(bǔ)償)從倒譜域變化到對(duì)數(shù)譜域、在對(duì)數(shù)譜域進(jìn)行模型補(bǔ)償、以及從對(duì)數(shù)譜域變回倒譜域所需的乘法、除法、指數(shù)運(yùn)算以及對(duì)數(shù)運(yùn)算的次數(shù)。其中N和M分別表示在倒譜域和對(duì)數(shù)譜域特征的維數(shù)。從表中可看出含有DPCM的算法復(fù)雜度比其原始算法的復(fù)雜度只有輕微的增加。
實(shí)驗(yàn)證明了本文的DPCM算法可以處理在不同加性噪聲環(huán)境下的語(yǔ)音識(shí)別任務(wù),并且能夠取得比較好的識(shí)別效果。性能的提升歸功于相對(duì)應(yīng)比較準(zhǔn)確的動(dòng)態(tài)模型補(bǔ)償方法的應(yīng)用。通過(guò)這種方法的使用,含DPCM算法的識(shí)別率比目前的PMC算法有較明顯的提升。
5 結(jié)論
文中提出了一種新的動(dòng)態(tài)特征補(bǔ)償方法,并給出了反映加性噪聲的語(yǔ)音動(dòng)態(tài)特征失配函數(shù),以及在此基礎(chǔ)上依據(jù)合理的假設(shè),推導(dǎo)出的一系列動(dòng)態(tài)模型參數(shù)補(bǔ)償DPCM的算法公式。并且DPCM算法可以與任意的靜態(tài)模型補(bǔ)償算法結(jié)合以提高原始算法的識(shí)別率。實(shí)驗(yàn)結(jié)果表明在不同的噪聲環(huán)境下結(jié)合DPCM的PMC算法可以給出比原始PMC算法具有更好的識(shí)別率,在低信噪比條件下提升效果更為明顯。此外結(jié)合DPCM的模型補(bǔ)償算法的復(fù)雜度與原補(bǔ)償算法的復(fù)雜度基本相當(dāng),只有輕微的增加。可見(jiàn)DPCM算法是一種非常有效的動(dòng)態(tài)特征補(bǔ)償算法。
評(píng)論