博客專欄

EEPW首頁 > 博客 > 語音識(shí)別芯片實(shí)現(xiàn)人機(jī)交互!

語音識(shí)別芯片實(shí)現(xiàn)人機(jī)交互!

發(fā)布人:13826044550 時(shí)間:2021-08-17 來源:工程師 發(fā)布文章

物聯(lián)網(wǎng)時(shí)代,語音識(shí)別被視作為人機(jī)交互的入口,人工智能和機(jī)器學(xué)習(xí)的迅猛發(fā)展,使語音控制變得更為實(shí)用。雖然語音識(shí)別與生物識(shí)別相比,發(fā)展相對(duì)緩慢,但是學(xué)術(shù)界和工業(yè)界對(duì)于語音市場(chǎng)都很看好,這意味著未來發(fā)展空間十分巨大。而人工智能芯片的應(yīng)用領(lǐng)域也不斷向多維度發(fā)展。

語音識(shí)別芯片最大的特點(diǎn)就是能夠語音識(shí)別,它能讓機(jī)器聽懂人類的語音,并且可以根據(jù)命令執(zhí)行各種動(dòng)作,如眨眼睛、動(dòng)嘴巴(智能娃娃)。

除此之外,語音識(shí)別芯片還具有高品質(zhì)、高壓縮率錄音放音功能,可實(shí)現(xiàn)人機(jī)對(duì)話。

人機(jī)交互的入口:語音識(shí)別芯片

九芯電子 NRK220X語音識(shí)別芯片

按照使用者的限制而言,語音識(shí)別芯片可以分為特定人語音識(shí)別芯片和非特定人語音識(shí)別芯片。

特定人語音識(shí)別

特定人語音識(shí)別芯片是針對(duì)指定人的語音識(shí)別,其他人的話不識(shí)別,須先把使用者的語音參考樣本存入當(dāng)成比對(duì)的資料庫(kù),即特定人語音識(shí)別在使用前必須要進(jìn)行語音訓(xùn)練,一般按照機(jī)器提示訓(xùn)練2遍語音詞條即可使用。

非特定人語音識(shí)別

非特定人語音識(shí)別芯片是不用針對(duì)指定的人的識(shí)別技術(shù),不分年齡、性別,只要說相同語言就可以,應(yīng)用模式是在產(chǎn)品定型前按照確定的十幾個(gè)語音交互詞條,采集200人左右的聲音樣本,經(jīng)過PC算法處理得到交互詞條的語音模型和特征數(shù)據(jù)庫(kù),然后燒錄到芯片上。應(yīng)用這種芯片的機(jī)器(智能娃娃、電子寵物、兒童電腦)就具有交互功能了。

一般我們選擇的AI智能產(chǎn)品都是非特定語音識(shí)別芯片,只需要說出智能產(chǎn)品的喚醒詞就可以實(shí)現(xiàn)人機(jī)對(duì)話。

當(dāng)然語音識(shí)別的內(nèi)容條數(shù)也是有限制的,一般市面上的語音識(shí)別芯片只能識(shí)別20條左右,不能滿足一些產(chǎn)品語音交互的需求,而九芯電子的NRK220X語音識(shí)別芯片可以識(shí)別三百條;可以滿足語音識(shí)別內(nèi)容指令多的智能產(chǎn)品的需求。

人機(jī)交互的入口:語音識(shí)別芯片

九芯電子NRK2201語音識(shí)別芯片

NRK220X語音識(shí)別模塊為廣州九芯電子自主研發(fā)的一款模塊,無須外圍元件,直接對(duì)接外部,集成了一顆高性能、低成本的離線語音識(shí)別芯片,具有語音識(shí)別及播報(bào)功能,需要外掛 SPI-Flash,存儲(chǔ)詞條或者語音播內(nèi)容。

他具有識(shí)別率高,工業(yè)級(jí)性能、簡(jiǎn)單易用,更新詞條方便等優(yōu)勢(shì)。廣泛應(yīng)用在智能家居、AI人工智能、玩具等多種領(lǐng)域。

而且語音存放的長(zhǎng)度由音頻采樣率及芯片內(nèi)部(或外掛)ROM空間所決定,音頻采樣率的大小直接影響音頻輸出的音質(zhì),同一型號(hào)芯片的音頻采樣率越高,音質(zhì)越好,但是需要占用更多的ROM空間。芯片的成本也因存儲(chǔ)空間的增大而有不同幅度的上漲。


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。




相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉