博客專欄

EEPW首頁 > 博客 > NVIDIA力助桃園機捷 打造互動語音AI實踐無人客服智能車站

NVIDIA力助桃園機捷 打造互動語音AI實踐無人客服智能車站

發(fā)布人:12345zhi 時間:2023-08-14 來源:工程師 發(fā)布文章

桃園機場捷運互動語音AI與虛擬分身「霏霏」。NVIDIA

            桃園機場捷運互動語音AI與虛擬分身「霏霏」。NVIDIA

    桃園大眾捷運股份有限公司(桃捷公司)為在車站實現(xiàn)以科技取代真人、提供更優(yōu)質(zhì)的服務(wù)和增強旅客體驗,率先在機場捷運系統(tǒng)的A18高鐵桃園站和A20興南站導(dǎo)入虛擬智能站務(wù)人員「霏霏」。桃捷公司透過與臺灣在地開發(fā)商喬泰科技合作,采用NVIDIA(輝達)的人工智能(AI)軟、硬件平臺和開發(fā)環(huán)境,并結(jié)合NVIDIA的技術(shù)諮詢服務(wù)NVIDIA AI Enterprise打造了「霏霏」AI語音客服系統(tǒng)。

桃園捷運站務(wù)中心主任謝明融表示:「當(dāng)這個計劃構(gòu)想成形以后,最重要的就是如何找到能達成我們想要效果的合作夥伴與技術(shù),在公開徵選時喬泰科技提出了以NVIDIA為核心的整體運用技術(shù),在經(jīng)過了評選之后成為我們的夥伴,歷經(jīng)了多次的討論與修正,終于讓虛擬站務(wù)人員「霏霏」呈現(xiàn)在大家的面前,成為我們桃園捷運旅客服務(wù)的重要里程碑?!?/p>

臺灣第一套基于完整AI互動語音與虛擬分身(Avatar)的客服系統(tǒng),也是首度將AI語音技術(shù)與真人后臺結(jié)合的客服系統(tǒng)。NVIDIA

        臺灣第一套基于完整AI互動語音與虛擬分身(Avatar)的客服系統(tǒng),也是首度將AI語音技術(shù)與真人后臺結(jié)合的客服系統(tǒng)。NVIDIA

喬泰技術(shù)長黃祥麟表示:「我們在向桃園捷運提案時即提出NVIDIA的平臺是實現(xiàn)這套需要同步整合AI、邊緣運算、云端運算與虛擬分身的首選。歸功于NVIDIA多元完善的軟、硬件資源與開發(fā)環(huán)境,團隊得以針對 AI與系統(tǒng)整合進行優(yōu)化,實現(xiàn)這套臺灣首創(chuàng)的落地元宇宙應(yīng)用?!?/p>

霏霏能如真人般與旅客進行實時互動,自動實時識別中、英、日、韓四國語言的提問,正確回答旅客站務(wù)、票據(jù)、乘車信息及周邊旅游景點等相關(guān)諮詢。當(dāng)受到嚴(yán)重噪音干擾或遇到無法解決的問題,霏霏在第一時間也能轉(zhuǎn)由真人客服提供服務(wù),并同步將先前客服對話過程轉(zhuǎn)為文字?jǐn)⑹?,便于真人客服快速厘清旅客問題。

霏霏不僅是臺灣第一套基于完整AI互動語音與虛擬分身(Avatar)的客服系統(tǒng),也是首度將AI語音技術(shù)與真人后臺結(jié)合的客服系統(tǒng)。為桃園機場捷運系統(tǒng)注入科技、年輕化、國際化,以及既簡易便利又高效率的新氣象。該服務(wù)建立在相比點選屏幕更為直覺的AI自然語音互動基礎(chǔ)上,而站務(wù)人力資源則能更加妥善分配至其他站務(wù)所應(yīng)用。

霏霏背后的技術(shù)架構(gòu)是采用分散式運算方式,將不同延遲需求的工作流適時分配給邊緣運算與云端運算處理;邊緣運算使用的是NVIDIA GeForce RTX 3090硬件系統(tǒng),而云端運算則串接到Google Kubernetes (K8S) 平臺,并結(jié)合NVIDIA Triton推論服務(wù)器將霏霏邊緣系統(tǒng)所接收到的AI運算需求分流至邊緣系統(tǒng)與K8S平臺。實際執(zhí)行模式包括幾個重要程序:語言的輸入、語言的文字轉(zhuǎn)換、AI語意理解與找尋問題的答案、結(jié)合虛擬分身與合成語音的解答。

霏霏是在人流量極大、環(huán)境噪音復(fù)雜的交通要點,需利用最新型降躁麥克風(fēng)接收語音,并借助NVIDIA Maxine SDK進行輸入語音降噪,使語音數(shù)據(jù)在進行文字轉(zhuǎn)化前更為乾凈、易于識別,再把數(shù)據(jù)傳遞到基于 AI 的語音與語言模型神經(jīng)網(wǎng)絡(luò)模塊進行語言理解,最后把輸出的回答結(jié)合Unreal Engine進行角色渲染與輸出。

多項NVIDIA重要的自然語言技術(shù)是打造霏霏的核心,包括NVIDIA Riva語音人工智能SDK協(xié)助將旅客的談話識別并轉(zhuǎn)化為文字、NVIDIA NeMo大型語言模型(LLM)模型服務(wù) 做為霏霏提供自然應(yīng)答的AI語言模型,利用NVIDIA Triton推論服務(wù)器進行部署。為實現(xiàn)流暢的AI自然語言互動,以搭載8張V100 GPU的系統(tǒng)執(zhí)行NVIDIA NeMo Framework進行AI語言模型訓(xùn)練,將基礎(chǔ)模型與站務(wù)、票據(jù)與觀光信息等相關(guān)的數(shù)據(jù)投入訓(xùn)練。

霏霏率先證實以AI打造智能車站客服平臺系統(tǒng)的真實可行性,霏霏是一個極佳的車站AI化的開始,未來如霏霏這樣結(jié)合自然語言與虛擬分身的智能服務(wù)系統(tǒng)也將陸續(xù)擴大至更多的大眾運輸系統(tǒng),以提升大眾運輸系統(tǒng)的服務(wù)品質(zhì)。結(jié)合AI運算的高效能GPU技術(shù),同時針對各類AI應(yīng)用率先提供開發(fā)者友善工具且不斷精進的NVIDIA軟硬件技術(shù)與平臺,勢必將是引領(lǐng)此類智能客服與虛擬分身應(yīng)用的關(guān)鍵所在。

*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: NVIDIA AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉