NVIDIA力助桃園機(jī)捷 打造互動(dòng)語(yǔ)音AI實(shí)踐無(wú)人客服智能車站
桃園大眾捷運(yùn)股份有限公司(桃捷公司)為在車站實(shí)現(xiàn)以科技取代真人、提供更優(yōu)質(zhì)的服務(wù)和增強(qiáng)旅客體驗(yàn),率先在機(jī)場(chǎng)捷運(yùn)系統(tǒng)的A18高鐵桃園站和A20興南站導(dǎo)入虛擬智能站務(wù)人員「霏霏」。桃捷公司透過與臺(tái)灣在地開發(fā)商喬泰科技合作,采用NVIDIA(輝達(dá))的人工智能(AI)軟、硬件平臺(tái)和開發(fā)環(huán)境,并結(jié)合NVIDIA的技術(shù)諮詢服務(wù)NVIDIA AI Enterprise打造了「霏霏」AI語(yǔ)音客服系統(tǒng)。
桃園捷運(yùn)站務(wù)中心主任謝明融表示:「當(dāng)這個(gè)計(jì)劃構(gòu)想成形以后,最重要的就是如何找到能達(dá)成我們想要效果的合作夥伴與技術(shù),在公開徵選時(shí)喬泰科技提出了以NVIDIA為核心的整體運(yùn)用技術(shù),在經(jīng)過了評(píng)選之后成為我們的夥伴,歷經(jīng)了多次的討論與修正,終于讓虛擬站務(wù)人員「霏霏」呈現(xiàn)在大家的面前,成為我們桃園捷運(yùn)旅客服務(wù)的重要里程碑?!?/p>
喬泰技術(shù)長(zhǎng)黃祥麟表示:「我們?cè)谙蛱覉@捷運(yùn)提案時(shí)即提出NVIDIA的平臺(tái)是實(shí)現(xiàn)這套需要同步整合AI、邊緣運(yùn)算、云端運(yùn)算與虛擬分身的首選。歸功于NVIDIA多元完善的軟、硬件資源與開發(fā)環(huán)境,團(tuán)隊(duì)得以針對(duì) AI與系統(tǒng)整合進(jìn)行優(yōu)化,實(shí)現(xiàn)這套臺(tái)灣首創(chuàng)的落地元宇宙應(yīng)用?!?/p>
霏霏能如真人般與旅客進(jìn)行實(shí)時(shí)互動(dòng),自動(dòng)實(shí)時(shí)識(shí)別中、英、日、韓四國(guó)語(yǔ)言的提問,正確回答旅客站務(wù)、票據(jù)、乘車信息及周邊旅游景點(diǎn)等相關(guān)諮詢。當(dāng)受到嚴(yán)重噪音干擾或遇到無(wú)法解決的問題,霏霏在第一時(shí)間也能轉(zhuǎn)由真人客服提供服務(wù),并同步將先前客服對(duì)話過程轉(zhuǎn)為文字?jǐn)⑹?,便于真人客服快速厘清旅客問題。
霏霏不僅是臺(tái)灣第一套基于完整AI互動(dòng)語(yǔ)音與虛擬分身(Avatar)的客服系統(tǒng),也是首度將AI語(yǔ)音技術(shù)與真人后臺(tái)結(jié)合的客服系統(tǒng)。為桃園機(jī)場(chǎng)捷運(yùn)系統(tǒng)注入科技、年輕化、國(guó)際化,以及既簡(jiǎn)易便利又高效率的新氣象。該服務(wù)建立在相比點(diǎn)選屏幕更為直覺的AI自然語(yǔ)音互動(dòng)基礎(chǔ)上,而站務(wù)人力資源則能更加妥善分配至其他站務(wù)所應(yīng)用。
霏霏背后的技術(shù)架構(gòu)是采用分散式運(yùn)算方式,將不同延遲需求的工作流適時(shí)分配給邊緣運(yùn)算與云端運(yùn)算處理;邊緣運(yùn)算使用的是NVIDIA GeForce RTX 3090硬件系統(tǒng),而云端運(yùn)算則串接到Google Kubernetes (K8S) 平臺(tái),并結(jié)合NVIDIA Triton推論服務(wù)器將霏霏邊緣系統(tǒng)所接收到的AI運(yùn)算需求分流至邊緣系統(tǒng)與K8S平臺(tái)。實(shí)際執(zhí)行模式包括幾個(gè)重要程序:語(yǔ)言的輸入、語(yǔ)言的文字轉(zhuǎn)換、AI語(yǔ)意理解與找尋問題的答案、結(jié)合虛擬分身與合成語(yǔ)音的解答。
霏霏是在人流量極大、環(huán)境噪音復(fù)雜的交通要點(diǎn),需利用最新型降躁麥克風(fēng)接收語(yǔ)音,并借助NVIDIA Maxine SDK進(jìn)行輸入語(yǔ)音降噪,使語(yǔ)音數(shù)據(jù)在進(jìn)行文字轉(zhuǎn)化前更為乾凈、易于識(shí)別,再把數(shù)據(jù)傳遞到基于 AI 的語(yǔ)音與語(yǔ)言模型神經(jīng)網(wǎng)絡(luò)模塊進(jìn)行語(yǔ)言理解,最后把輸出的回答結(jié)合Unreal Engine進(jìn)行角色渲染與輸出。
多項(xiàng)NVIDIA重要的自然語(yǔ)言技術(shù)是打造霏霏的核心,包括NVIDIA Riva語(yǔ)音人工智能SDK協(xié)助將旅客的談話識(shí)別并轉(zhuǎn)化為文字、NVIDIA NeMo大型語(yǔ)言模型(LLM)模型服務(wù) 做為霏霏提供自然應(yīng)答的AI語(yǔ)言模型,利用NVIDIA Triton推論服務(wù)器進(jìn)行部署。為實(shí)現(xiàn)流暢的AI自然語(yǔ)言互動(dòng),以搭載8張V100 GPU的系統(tǒng)執(zhí)行NVIDIA NeMo Framework進(jìn)行AI語(yǔ)言模型訓(xùn)練,將基礎(chǔ)模型與站務(wù)、票據(jù)與觀光信息等相關(guān)的數(shù)據(jù)投入訓(xùn)練。
霏霏率先證實(shí)以AI打造智能車站客服平臺(tái)系統(tǒng)的真實(shí)可行性,霏霏是一個(gè)極佳的車站AI化的開始,未來(lái)如霏霏這樣結(jié)合自然語(yǔ)言與虛擬分身的智能服務(wù)系統(tǒng)也將陸續(xù)擴(kuò)大至更多的大眾運(yùn)輸系統(tǒng),以提升大眾運(yùn)輸系統(tǒng)的服務(wù)品質(zhì)。結(jié)合AI運(yùn)算的高效能GPU技術(shù),同時(shí)針對(duì)各類AI應(yīng)用率先提供開發(fā)者友善工具且不斷精進(jìn)的NVIDIA軟硬件技術(shù)與平臺(tái),勢(shì)必將是引領(lǐng)此類智能客服與虛擬分身應(yīng)用的關(guān)鍵所在。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。