NVIDIA力助桃園機(jī)捷打造互動(dòng)語(yǔ)音AI實(shí)踐無(wú)人客服智能車站

發(fā)布人：12345zhi 時(shí)間：2023-08-14 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

桃園機(jī)場(chǎng)捷運(yùn)互動(dòng)語(yǔ)音AI與虛擬分身「霏霏」。NVIDIA

桃園大眾捷運(yùn)股份有限公司（桃捷公司）為在車站實(shí)現(xiàn)以科技取代真人、提供更優(yōu)質(zhì)的服務(wù)和增強(qiáng)旅客體驗(yàn)，率先在機(jī)場(chǎng)捷運(yùn)系統(tǒng)的A18高鐵桃園站和A20興南站導(dǎo)入虛擬智能站務(wù)人員「霏霏」。桃捷公司透過與臺(tái)灣在地開發(fā)商喬泰科技合作，采用NVIDIA（輝達(dá)）的人工智能（AI）軟、硬件平臺(tái)和開發(fā)環(huán)境，并結(jié)合NVIDIA的技術(shù)諮詢服務(wù)NVIDIA AI Enterprise打造了「霏霏」AI語(yǔ)音客服系統(tǒng)。

桃園捷運(yùn)站務(wù)中心主任謝明融表示：「當(dāng)這個(gè)計(jì)劃構(gòu)想成形以后，最重要的就是如何找到能達(dá)成我們想要效果的合作夥伴與技術(shù)，在公開徵選時(shí)喬泰科技提出了以NVIDIA為核心的整體運(yùn)用技術(shù)，在經(jīng)過了評(píng)選之后成為我們的夥伴，歷經(jīng)了多次的討論與修正，終于讓虛擬站務(wù)人員「霏霏」呈現(xiàn)在大家的面前，成為我們桃園捷運(yùn)旅客服務(wù)的重要里程碑?！?/p>

臺(tái)灣第一套基于完整AI互動(dòng)語(yǔ)音與虛擬分身（Avatar）的客服系統(tǒng)，也是首度將AI語(yǔ)音技術(shù)與真人后臺(tái)結(jié)合的客服系統(tǒng)。NVIDIA

喬泰技術(shù)長(zhǎng)黃祥麟表示：「我們?cè)谙蛱覉@捷運(yùn)提案時(shí)即提出NVIDIA的平臺(tái)是實(shí)現(xiàn)這套需要同步整合AI、邊緣運(yùn)算、云端運(yùn)算與虛擬分身的首選。歸功于NVIDIA多元完善的軟、硬件資源與開發(fā)環(huán)境，團(tuán)隊(duì)得以針對(duì) AI與系統(tǒng)整合進(jìn)行優(yōu)化，實(shí)現(xiàn)這套臺(tái)灣首創(chuàng)的落地元宇宙應(yīng)用?！?/p>

霏霏能如真人般與旅客進(jìn)行實(shí)時(shí)互動(dòng)，自動(dòng)實(shí)時(shí)識(shí)別中、英、日、韓四國(guó)語(yǔ)言的提問，正確回答旅客站務(wù)、票據(jù)、乘車信息及周邊旅游景點(diǎn)等相關(guān)諮詢。當(dāng)受到嚴(yán)重噪音干擾或遇到無(wú)法解決的問題，霏霏在第一時(shí)間也能轉(zhuǎn)由真人客服提供服務(wù)，并同步將先前客服對(duì)話過程轉(zhuǎn)為文字?jǐn)⑹?，便于真人客服快速厘清旅客問題。

霏霏不僅是臺(tái)灣第一套基于完整AI互動(dòng)語(yǔ)音與虛擬分身（Avatar）的客服系統(tǒng)，也是首度將AI語(yǔ)音技術(shù)與真人后臺(tái)結(jié)合的客服系統(tǒng)。為桃園機(jī)場(chǎng)捷運(yùn)系統(tǒng)注入科技、年輕化、國(guó)際化，以及既簡(jiǎn)易便利又高效率的新氣象。該服務(wù)建立在相比點(diǎn)選屏幕更為直覺的AI自然語(yǔ)音互動(dòng)基礎(chǔ)上，而站務(wù)人力資源則能更加妥善分配至其他站務(wù)所應(yīng)用。

霏霏背后的技術(shù)架構(gòu)是采用分散式運(yùn)算方式，將不同延遲需求的工作流適時(shí)分配給邊緣運(yùn)算與云端運(yùn)算處理；邊緣運(yùn)算使用的是NVIDIA GeForce RTX 3090硬件系統(tǒng)，而云端運(yùn)算則串接到Google Kubernetes （K8S）平臺(tái)，并結(jié)合NVIDIA Triton推論服務(wù)器將霏霏邊緣系統(tǒng)所接收到的AI運(yùn)算需求分流至邊緣系統(tǒng)與K8S平臺(tái)。實(shí)際執(zhí)行模式包括幾個(gè)重要程序：語(yǔ)言的輸入、語(yǔ)言的文字轉(zhuǎn)換、AI語(yǔ)意理解與找尋問題的答案、結(jié)合虛擬分身與合成語(yǔ)音的解答。

霏霏是在人流量極大、環(huán)境噪音復(fù)雜的交通要點(diǎn)，需利用最新型降躁麥克風(fēng)接收語(yǔ)音，并借助NVIDIA Maxine SDK進(jìn)行輸入語(yǔ)音降噪，使語(yǔ)音數(shù)據(jù)在進(jìn)行文字轉(zhuǎn)化前更為乾凈、易于識(shí)別，再把數(shù)據(jù)傳遞到基于 AI 的語(yǔ)音與語(yǔ)言模型神經(jīng)網(wǎng)絡(luò)模塊進(jìn)行語(yǔ)言理解，最后把輸出的回答結(jié)合Unreal Engine進(jìn)行角色渲染與輸出。

多項(xiàng)NVIDIA重要的自然語(yǔ)言技術(shù)是打造霏霏的核心，包括NVIDIA Riva語(yǔ)音人工智能SDK協(xié)助將旅客的談話識(shí)別并轉(zhuǎn)化為文字、NVIDIA NeMo大型語(yǔ)言模型（LLM）模型服務(wù) 做為霏霏提供自然應(yīng)答的AI語(yǔ)言模型，利用NVIDIA Triton推論服務(wù)器進(jìn)行部署。為實(shí)現(xiàn)流暢的AI自然語(yǔ)言互動(dòng)，以搭載8張V100 GPU的系統(tǒng)執(zhí)行NVIDIA NeMo Framework進(jìn)行AI語(yǔ)言模型訓(xùn)練，將基礎(chǔ)模型與站務(wù)、票據(jù)與觀光信息等相關(guān)的數(shù)據(jù)投入訓(xùn)練。

霏霏率先證實(shí)以AI打造智能車站客服平臺(tái)系統(tǒng)的真實(shí)可行性，霏霏是一個(gè)極佳的車站AI化的開始，未來(lái)如霏霏這樣結(jié)合自然語(yǔ)言與虛擬分身的智能服務(wù)系統(tǒng)也將陸續(xù)擴(kuò)大至更多的大眾運(yùn)輸系統(tǒng)，以提升大眾運(yùn)輸系統(tǒng)的服務(wù)品質(zhì)。結(jié)合AI運(yùn)算的高效能GPU技術(shù)，同時(shí)針對(duì)各類AI應(yīng)用率先提供開發(fā)者友善工具且不斷精進(jìn)的NVIDIA軟硬件技術(shù)與平臺(tái)，勢(shì)必將是引領(lǐng)此類智能客服與虛擬分身應(yīng)用的關(guān)鍵所在。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

NVIDIA力助桃園機(jī)捷打造互動(dòng)語(yǔ)音AI實(shí)踐無(wú)人客服智能車站

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

NVIDIA力助桃園機(jī)捷 打造互動(dòng)語(yǔ)音AI實(shí)踐無(wú)人客服智能車站

相關(guān)推薦

技術(shù)專區(qū)

NVIDIA力助桃園機(jī)捷打造互動(dòng)語(yǔ)音AI實(shí)踐無(wú)人客服智能車站