君林科技:聲紋識別前景無限,重點問題亟需解決
近年來,隨著AI的市場需求日益增加、技術(shù)革新以及重大政策利好,人工智能已逐漸普及。根據(jù)各方面的數(shù)據(jù)和報告顯示,智能家居產(chǎn)品銷量與日俱增,智能音箱產(chǎn)品的銷量更是驚人,僅某品牌的智能音箱月銷售量就有數(shù)百萬臺。而人工智能在金融和安防等領(lǐng)域的應(yīng)用同樣越來越廣泛,這些新興力量打破了傳統(tǒng)行業(yè)壁壘,不斷獲得發(fā)展。
本文引用地址:http://m.butianyuan.cn/article/201804/379170.htm這些發(fā)展勢頭迅猛的人工智能有一個共通點,就是非常需要以聲紋識別作為技術(shù)補充。有了聲紋識別,能使彌補這些人工智能的固有缺陷;有了聲紋識別,能提高這些人工智能的性能,使之更為人性化,從而更好地為人類服務(wù)。
以智能家居為例,盡管通過語音控制,它可以為我們的生活提供很多幫助和便利。我們只要說出指令,就可以操縱智能音箱、智能多媒體、智能車載系統(tǒng)等家居生活的必需品。不過,在具體操縱的過程中,人們?nèi)匀粫龅揭恍┝钊祟^疼的問題。
如果聲音環(huán)境比較嘈雜或者混亂,語音識別系統(tǒng)就很難正確識別出用戶發(fā)出的命令。而當(dāng)多個人同時發(fā)出指令或同時發(fā)出類似指令的聲音的時候,也會給系統(tǒng)造成混亂,系統(tǒng)很難識別出應(yīng)該聽取誰的指令。
類似這種問題,最好的解決辦法就是加入聲紋識別技術(shù)。通過聲紋識別技術(shù),可以對人聲進行更準(zhǔn)確地定位和捕捉,同時進行降噪處理,從而讓智能家居系統(tǒng)準(zhǔn)確地識別出發(fā)出指令的用戶。
而在銀行金融領(lǐng)域,現(xiàn)行的智能系統(tǒng)主要是運用于進行遠程身份認(rèn)證。對于銀行借貸、社保資金領(lǐng)取等個人金融項目的操作來說,安全性和便利性都是十分重要的。因此,銀行等金融行業(yè)為民眾提供了一種遠程身份認(rèn)證的操作,可以獨自在家完成認(rèn)證和資金領(lǐng)取。即便距離再遠,也不會耽誤事。但目前主流的身份驗證方式是通過手機短信驗證碼驗證,這種驗證方式的安全性極低,手機一旦丟失或被盜,金融賬戶的損失隨時會很嚴(yán)重。
因此,出于對安全性和便捷性的雙重需求,將聲紋識別作為金融行業(yè)身份驗證的補充手段是十分有必要的。在遠程場合下的金融驗證,有了聲音來防偽,大大提升了安全性。而用戶只需說出指定話語即可完成驗證,操作方式也并不復(fù)雜。
聲紋識別在安防領(lǐng)域的作用就更為突出。沒有聲紋識別的安防系統(tǒng),智能程度越高,其實就越危險。試想一下,當(dāng)說話人的身份不受限制的時候,大到我們的住宅、公司,小到我們的房間、電腦、私人空間,都可以輕易被入侵。入侵者只要像我們一樣,對系統(tǒng)發(fā)出指令,就可以突破安防。
當(dāng)然,有了聲紋識別的安防系統(tǒng),就不必?fù)?dān)心這些問題。因為每個人的聲音本質(zhì)上都是不同的,是很難被模仿或復(fù)制的。即便別有用心的人想通過模仿我們的聲音來入侵安防系統(tǒng),也不能得逞。
所以說,借助聲紋識別,各個行業(yè)的智能系統(tǒng)都可以進一步提升性能,并且,更好地為用戶服務(wù)。不管是從眾多人聲中準(zhǔn)確辨認(rèn)用戶,還是確認(rèn)說話人的身份,聲紋識別對這些智能系統(tǒng)來說都是不可或缺的。
雖然聲紋識別在各行各業(yè)當(dāng)中體現(xiàn)出巨大的價值,但在實操階段,聲紋識別仍面臨著很多困難。其中最顯著的就是聲紋采集的困難和方言、情緒化對聲紋識別的影響問題。
聲紋識別的首要步驟和關(guān)鍵前提就是進行聲紋采集,只有收集到足夠豐富的聲紋信息,建立起完善的數(shù)據(jù)庫,聲紋識別才能夠具備準(zhǔn)確性和可操作性。而且,采集到豐富而多樣化的聲紋信息還有利于機器和系統(tǒng)進行深度學(xué)習(xí),畢竟智能識別系統(tǒng)是通過大量的數(shù)據(jù)來進行訓(xùn)練和學(xué)習(xí)的。但目前聲紋信息的把控權(quán)牢牢掌握在公安和政府部門手中,這就給企業(yè)的聲紋采集工作帶來極大的困難。他們需要通過多個渠道進行大量的前期工作,采集到足夠的聲紋信息,才能建立恰當(dāng)?shù)穆暭y識別系統(tǒng)。
另外,人類的方言、口音差異,以及不同狀態(tài)下的聲音狀況不同,都會對聲紋識別造成一定的影響。如果聲紋識別系統(tǒng)只能夠識別標(biāo)準(zhǔn)的普通話,那說方言和口音重的人的身份可能就很難被識別出來。同樣的道理,說話人的情緒有高漲或低落的時候,在不同的狀態(tài)下,聲音也會有微小的差異,這些差異同樣會導(dǎo)致聲紋識別發(fā)生錯誤。因此,如何在動態(tài)識別中準(zhǔn)確判斷出聲音的本質(zhì)特征對于聲紋識別來說是非常重要,也是非常困難的。
盡管,聲紋識別在各個領(lǐng)域都占有舉足輕重的地位,應(yīng)用也日益廣泛,但具體應(yīng)用仍然存在著很多困難。這些困難和問題是聲紋識別發(fā)展道路上絕對不能夠忽視的,需要我們用多種技術(shù)手段去盡快調(diào)整和解決。
北京君林科技股份有限公司,專業(yè)的電聲企業(yè),打造人工智能時代的金耳朵。面向全球,提供最領(lǐng)先的音頻領(lǐng)域解決方案和專業(yè)服務(wù),基于聲學(xué)推動人工智能技術(shù)產(chǎn)品落地。
公司以打造人工智能領(lǐng)域的音頻硬件平臺及系統(tǒng)平臺,使君林技術(shù)成為人工智能音頻領(lǐng)域不可或缺的環(huán)節(jié)為發(fā)展目標(biāo)。并以此為基礎(chǔ),全面覆蓋聲學(xué)技術(shù)-固件算法-智能硬件-系統(tǒng)驅(qū)動-云服務(wù)-大數(shù)據(jù)-Ai技術(shù)等技術(shù)鏈。
君林科技擁有一整套完整的聲音處理系統(tǒng)解決方案。用戶可以使用已有或者定制的音頻數(shù)據(jù)采集方案,通過君林科技聲紋REST API上傳至云端,由人工智能算法進行建模,識別與認(rèn)證,有效得為企業(yè)創(chuàng)造最大價值。
評論