君林科技：聲紋識別前景無限，重點問題亟需解決

作者：時間：2018-04-27 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　近年來，隨著AI的市場需求日益增加、技術(shù)革新以及重大政策利好，人工智能已逐漸普及。根據(jù)各方面的數(shù)據(jù)和報告顯示，智能家居產(chǎn)品銷量與日俱增，智能音箱產(chǎn)品的銷量更是驚人，僅某品牌的智能音箱月銷售量就有數(shù)百萬臺。而人工智能在金融和安防等領(lǐng)域的應(yīng)用同樣越來越廣泛，這些新興力量打破了傳統(tǒng)行業(yè)壁壘，不斷獲得發(fā)展。

本文引用地址：http://m.butianyuan.cn/article/201804/379170.htm

　　這些發(fā)展勢頭迅猛的人工智能有一個共通點，就是非常需要以聲紋識別作為技術(shù)補充。有了聲紋識別，能使彌補這些人工智能的固有缺陷;有了聲紋識別，能提高這些人工智能的性能，使之更為人性化，從而更好地為人類服務(wù)。

　　以智能家居為例，盡管通過語音控制，它可以為我們的生活提供很多幫助和便利。我們只要說出指令，就可以操縱智能音箱、智能多媒體、智能車載系統(tǒng)等家居生活的必需品。不過，在具體操縱的過程中，人們?nèi)匀粫龅揭恍┝钊祟^疼的問題。

　　如果聲音環(huán)境比較嘈雜或者混亂，語音識別系統(tǒng)就很難正確識別出用戶發(fā)出的命令。而當(dāng)多個人同時發(fā)出指令或同時發(fā)出類似指令的聲音的時候，也會給系統(tǒng)造成混亂，系統(tǒng)很難識別出應(yīng)該聽取誰的指令。

　　類似這種問題，最好的解決辦法就是加入聲紋識別技術(shù)。通過聲紋識別技術(shù)，可以對人聲進行更準(zhǔn)確地定位和捕捉，同時進行降噪處理，從而讓智能家居系統(tǒng)準(zhǔn)確地識別出發(fā)出指令的用戶。

　　而在銀行金融領(lǐng)域，現(xiàn)行的智能系統(tǒng)主要是運用于進行遠程身份認(rèn)證。對于銀行借貸、社保資金領(lǐng)取等個人金融項目的操作來說，安全性和便利性都是十分重要的。因此，銀行等金融行業(yè)為民眾提供了一種遠程身份認(rèn)證的操作，可以獨自在家完成認(rèn)證和資金領(lǐng)取。即便距離再遠，也不會耽誤事。但目前主流的身份驗證方式是通過手機短信驗證碼驗證，這種驗證方式的安全性極低，手機一旦丟失或被盜，金融賬戶的損失隨時會很嚴(yán)重。

　　因此，出于對安全性和便捷性的雙重需求，將聲紋識別作為金融行業(yè)身份驗證的補充手段是十分有必要的。在遠程場合下的金融驗證，有了聲音來防偽，大大提升了安全性。而用戶只需說出指定話語即可完成驗證，操作方式也并不復(fù)雜。

　　聲紋識別在安防領(lǐng)域的作用就更為突出。沒有聲紋識別的安防系統(tǒng)，智能程度越高，其實就越危險。試想一下，當(dāng)說話人的身份不受限制的時候，大到我們的住宅、公司，小到我們的房間、電腦、私人空間，都可以輕易被入侵。入侵者只要像我們一樣，對系統(tǒng)發(fā)出指令，就可以突破安防。

　　當(dāng)然，有了聲紋識別的安防系統(tǒng)，就不必?fù)?dān)心這些問題。因為每個人的聲音本質(zhì)上都是不同的，是很難被模仿或復(fù)制的。即便別有用心的人想通過模仿我們的聲音來入侵安防系統(tǒng)，也不能得逞。

　　所以說，借助聲紋識別，各個行業(yè)的智能系統(tǒng)都可以進一步提升性能，并且，更好地為用戶服務(wù)。不管是從眾多人聲中準(zhǔn)確辨認(rèn)用戶，還是確認(rèn)說話人的身份，聲紋識別對這些智能系統(tǒng)來說都是不可或缺的。

　　雖然聲紋識別在各行各業(yè)當(dāng)中體現(xiàn)出巨大的價值，但在實操階段，聲紋識別仍面臨著很多困難。其中最顯著的就是聲紋采集的困難和方言、情緒化對聲紋識別的影響問題。

　　聲紋識別的首要步驟和關(guān)鍵前提就是進行聲紋采集，只有收集到足夠豐富的聲紋信息，建立起完善的數(shù)據(jù)庫，聲紋識別才能夠具備準(zhǔn)確性和可操作性。而且，采集到豐富而多樣化的聲紋信息還有利于機器和系統(tǒng)進行深度學(xué)習(xí)，畢竟智能識別系統(tǒng)是通過大量的數(shù)據(jù)來進行訓(xùn)練和學(xué)習(xí)的。但目前聲紋信息的把控權(quán)牢牢掌握在公安和政府部門手中，這就給企業(yè)的聲紋采集工作帶來極大的困難。他們需要通過多個渠道進行大量的前期工作，采集到足夠的聲紋信息，才能建立恰當(dāng)?shù)穆暭y識別系統(tǒng)。

　　另外，人類的方言、口音差異，以及不同狀態(tài)下的聲音狀況不同，都會對聲紋識別造成一定的影響。如果聲紋識別系統(tǒng)只能夠識別標(biāo)準(zhǔn)的普通話，那說方言和口音重的人的身份可能就很難被識別出來。同樣的道理，說話人的情緒有高漲或低落的時候，在不同的狀態(tài)下，聲音也會有微小的差異，這些差異同樣會導(dǎo)致聲紋識別發(fā)生錯誤。因此，如何在動態(tài)識別中準(zhǔn)確判斷出聲音的本質(zhì)特征對于聲紋識別來說是非常重要，也是非常困難的。

　　盡管，聲紋識別在各個領(lǐng)域都占有舉足輕重的地位，應(yīng)用也日益廣泛，但具體應(yīng)用仍然存在著很多困難。這些困難和問題是聲紋識別發(fā)展道路上絕對不能夠忽視的，需要我們用多種技術(shù)手段去盡快調(diào)整和解決。

　　北京君林科技股份有限公司，專業(yè)的電聲企業(yè)，打造人工智能時代的金耳朵。面向全球，提供最領(lǐng)先的音頻領(lǐng)域解決方案和專業(yè)服務(wù)，基于聲學(xué)推動人工智能技術(shù)產(chǎn)品落地。

　　公司以打造人工智能領(lǐng)域的音頻硬件平臺及系統(tǒng)平臺，使君林技術(shù)成為人工智能音頻領(lǐng)域不可或缺的環(huán)節(jié)為發(fā)展目標(biāo)。并以此為基礎(chǔ)，全面覆蓋聲學(xué)技術(shù)-固件算法-智能硬件-系統(tǒng)驅(qū)動-云服務(wù)-大數(shù)據(jù)-Ai技術(shù)等技術(shù)鏈。

　　君林科技擁有一整套完整的聲音處理系統(tǒng)解決方案。用戶可以使用已有或者定制的音頻數(shù)據(jù)采集方案，通過君林科技聲紋REST API上傳至云端，由人工智能算法進行建模，識別與認(rèn)證，有效得為企業(yè)創(chuàng)造最大價值。

新聞中心

君林科技：聲紋識別前景無限，重點問題亟需解決

評論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

君林科技：聲紋識別前景無限，重點問題亟需解決

評論

相關(guān)推薦

技術(shù)專區(qū)

君林科技：聲紋識別前景無限，重點問題亟需解決