開發(fā)深度學(xué)習(xí) 谷歌運(yùn)用AI獨(dú)立音軌
在未來AI會(huì)需要更多的硬件來支持,谷歌認(rèn)為人工智能的領(lǐng)域還只是一個(gè)初期階段,它帶來的只是智能硬件設(shè)備上的一個(gè)核心算法,通過智能設(shè)備上的核心AI在進(jìn)一步的提升該技術(shù),并且改善硬件設(shè)備上的一個(gè)核心點(diǎn),讓這項(xiàng)技術(shù)通過AI做的更加完善。
本文引用地址:http://2s4d.com/article/201804/378555.htm
谷歌目前在開發(fā)一種深度學(xué)習(xí)算法,這項(xiàng)算法可以提升音頻的環(huán)境范圍,想象一下,在非常嘈雜的環(huán)境中如果能聽到音頻是一件非常不容易的事情,但通過AI算法它可以解決這樣的問題。
此外,這樣的解決方法,主要用于識(shí)別一個(gè)獨(dú)立系統(tǒng),谷歌打算通過這個(gè)AI系統(tǒng)獨(dú)立出來一個(gè)音軌,這也就是說可以分某一個(gè)人的聲音,谷歌公司內(nèi)部團(tuán)隊(duì)可以區(qū)分某一個(gè)人的聲音。
據(jù)了解,這項(xiàng)技術(shù)可以使用于單軌視頻,在通過算法分離出視頻中不同人的音頻內(nèi)容,也可以讓用戶手動(dòng)選取視頻中的人臉,專門收聽此人的聲音。尤其是在多個(gè)聲源中可以成功過濾掉其他聲音,只保留一個(gè)核心的聲音。但問題還是存在的,在實(shí)驗(yàn)效果的時(shí)候表現(xiàn)的并不是非常理想,可能AI技術(shù)上還有一些殘留,目前AI上可以做到保留一個(gè)核心,并去掉其他聲音來解決嘈雜的環(huán)境音,日后還會(huì)慢慢加強(qiáng),未來若將此項(xiàng)技術(shù)運(yùn)用到監(jiān)聽和間諜工作當(dāng)中那將是很大的問題。
評(píng)論