請(qǐng)給我一個(gè)安全的語音助手!
請(qǐng)給我一個(gè)安全的語音助手!
本文引用地址:http://m.butianyuan.cn/article/201805/379515.htm這句話好像有點(diǎn)像在發(fā)牢騷。但是伴隨著越來越多的語音助手、智能音箱的普及使用,這似乎也成為一個(gè)迫切的需求。
前兩天在抖音上看到了一個(gè)好玩的事兒,有美女用她男同事的手機(jī)像另一個(gè)女同事表白。最開始我還,趕緊掏出我的手機(jī),找了個(gè)女同事實(shí)驗(yàn)了一下,結(jié)果是真的。
這雖然是個(gè)搞笑視頻,但是也暴露出一些值得我們反思的問題:
我的語音助手,真的安全嗎?
還記得在小米社區(qū)看到,有這樣一個(gè)事兒:
一個(gè)用戶在小米社區(qū)發(fā)帖求助“小愛在我不在家的時(shí)候安全性,被別人一句話智能操作執(zhí)行命令了怎么辦”,你不要覺得這個(gè)危言聳聽,但凡有小米音響的,應(yīng)該都遇到這樣的狀況,明明是自己的音響,但是它不認(rèn)識(shí)自己的主人。
所以有人基于此開玩笑的說,說以后犯罪不用帶面具了,因?yàn)樗贿M(jìn)門就可以說:XXX,請(qǐng)幫我關(guān)閉所有的攝像頭。
其實(shí),用過小米音箱的人可能都知道:小米音箱在語音分析上已經(jīng)做的很不錯(cuò),但是在聲紋識(shí)別上,目前還是空白的。換句話講:現(xiàn)在很多語音助手、智能音箱以及各種語音產(chǎn)品,已經(jīng)能聽的到和理解說什么了,但是他不知道誰是他的主人,所以任何人都可以對(duì)他發(fā)號(hào)施令。
當(dāng)然,這里其實(shí)涉及到了2種技術(shù):一個(gè)是語音識(shí)別,一個(gè)是聲紋識(shí)別。
語音識(shí)別就比較好理解,而且我們應(yīng)用的也更多。機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令。最常見的就是,微信發(fā)個(gè)語音可以直接轉(zhuǎn)成文字。除了我們常見的社交軟件上的應(yīng)用外,人機(jī)交互、導(dǎo)航、檢索、還有前幾天翻車的騰訊同傳,這里面都會(huì)涉及到語音識(shí)別技術(shù)。
聲紋識(shí)別,其實(shí)也不是什么新的概念。大家或多或少的也都有接觸,如果我換一個(gè)說法,人臉或者指紋的話,這樣你是不是就覺得好理解很多了,現(xiàn)階段基于人臉是別的各種身份認(rèn)證已經(jīng)被廣泛應(yīng)用,如蘋果手機(jī)、銀行取款等。(但是我不得不吐槽下,為什么我敷面膜,還能打開我的手機(jī)呢。這到底是識(shí)別準(zhǔn)確還是技術(shù)問題,真的是一個(gè)很模糊的界定了。)而聲紋識(shí)別,其實(shí)跟人臉識(shí)別或者指紋識(shí)別一樣,都是生物識(shí)別的一種,可以應(yīng)用的場景也是非常多的了。
而且,這是一個(gè)目前被低估的市場,但是隨著國家大力發(fā)展智能語音平臺(tái),越來越多的公司以及技術(shù)團(tuán)隊(duì)將會(huì)關(guān)注這個(gè)領(lǐng)域。聲紋識(shí)別在所有的生物識(shí)別技術(shù)里,用戶接受度最高,而且易用性、準(zhǔn)確性不輸于人臉識(shí)別,甚至在身份驗(yàn)證方便表現(xiàn)更為出色。國內(nèi)曾經(jīng)有人做過實(shí)驗(yàn),他們找了23對(duì)雙胞胎,而且是同卵雙胞胎的語音數(shù)據(jù),專家去聽,大概分辨準(zhǔn)確率是85%,而通過機(jī)器進(jìn)行聲紋測試,100%全區(qū)分開了。
所以,上面說了那么多,我們用一句話就可總結(jié):語音識(shí)別解決了你說什么的問題,而聲紋識(shí)別解決你是誰的問題。
那么聲紋識(shí)別,都有那些應(yīng)用場景呢?
1.身份識(shí)別
其實(shí)隨著互聯(lián)網(wǎng)的發(fā)展,我們可能都感覺到,傳統(tǒng)的數(shù)字密碼保密性以及安全性不夠,而且眾多復(fù)雜的密碼也難于記憶,特別是隨著平臺(tái)增多,不身份驗(yàn)證變得越來越繁瑣。而利用 “生物特征”來進(jìn)行驗(yàn)證就成了很好的解決方案,由于每個(gè)人的指紋、面部、瞳孔、聲音等特征都不相同,具有唯一性, “活體密碼”的安全性也無疑會(huì)高出許多。而聲紋又以交互自然、具有內(nèi)容變化和使用成本低等特點(diǎn)從眾多的可選方案中脫穎而出,逐漸成為身份識(shí)別領(lǐng)域的一匹“黑馬”。
2.移動(dòng)支付
這個(gè)使用場景其實(shí)大家很多也都接觸過了。
現(xiàn)在某些金融類APP已經(jīng)開始進(jìn)行聲紋識(shí)別認(rèn)證了。此外,如果你擁有一臺(tái)天貓精靈的話,恰巧你也在上面購買過東西的話,是不是覺得語音控制,未來可期呢。
值得說的是,天貓精靈已經(jīng)加入聲紋識(shí)別技術(shù),也就是說有且僅有你才能控制天貓精靈,不用擔(dān)心會(huì)有人通過語音控制你的寶貝,而讓錢包丟失的問題了。
3.工業(yè)預(yù)警
工業(yè)機(jī)器的良好能否運(yùn)行對(duì)一個(gè)企業(yè)至關(guān)重要,簡單來說,如果我們能在機(jī)器完全出故障之前確定機(jī)器問題,能將企業(yè)損失降至最低。
以工廠發(fā)動(dòng)機(jī)為例,在機(jī)器正常運(yùn)轉(zhuǎn)之際發(fā)出的聲音,肯定和其有故障的時(shí)候發(fā)出的聲音是不一致的,根據(jù)周圍環(huán)境,提取固定聲音,將采集聲音進(jìn)行智能分析,提取工業(yè)機(jī)械中的聲音特征,通過聲音大數(shù)據(jù)分析辨別機(jī)器是否正常運(yùn)轉(zhuǎn),并根據(jù)聲音頻率,推測機(jī)器的運(yùn)行狀況。
其實(shí),聲紋可以應(yīng)用的場景還有很多,比如電子病例、智能汽車的權(quán)限控制等等。隨著技術(shù)的普及以及落地,越來越多的應(yīng)用場景被擴(kuò)展開發(fā),相信不久將來,我們可以看到更多使用場景的出現(xiàn)。
那么國內(nèi)有哪些專業(yè)做聲紋的公司呢?
注意,我這里說的是聲紋公司而不是語音公司。舉個(gè)例子,科大訊飛現(xiàn)在也聲紋上頗有研究,但是他之前確實(shí)是個(gè)不折不扣的語音技術(shù)公司。類似的還有思必馳,更多的都是偏向語義分析、語音識(shí)別、語音理解等技術(shù)。
類似于北京君林科技股份有限公司,面向全球,提供最領(lǐng)先的音頻領(lǐng)域解決方案和專業(yè)服務(wù),基于聲學(xué)推動(dòng)人工智能技術(shù)產(chǎn)品落地。公司以打造人工智能領(lǐng)域的音頻硬件平臺(tái)及系統(tǒng)平臺(tái),使君林技術(shù)成為人工智能音頻領(lǐng)域不可或缺的環(huán)節(jié)為發(fā)展目標(biāo)。并以此為基礎(chǔ),全面覆蓋聲學(xué)技術(shù)-固件算法-智能硬件-系統(tǒng)驅(qū)動(dòng)-云服務(wù)-大數(shù)據(jù)-Ai技術(shù)等技術(shù)鏈。君林科技擁有一整套完整的聲音處理系統(tǒng)解決方案。用戶可以使用已有或者定制的音頻數(shù)據(jù)采集方案,通過君林科技聲紋REST API上傳至云端,由人工智能算法進(jìn)行建模,識(shí)別與認(rèn)證,有效為企業(yè)創(chuàng)造最大價(jià)值。公司有聲學(xué)、無線音頻、AI聲學(xué)、聲紋技術(shù)、云端和大數(shù)據(jù)等核心技術(shù)、產(chǎn)品解決方案設(shè)計(jì)會(huì)議、汽車、社保、公安、智能硬件等多個(gè)領(lǐng)域。
評(píng)論