新聞中心

EEPW首頁(yè) > 物聯(lián)網(wǎng)與傳感器 > 業(yè)界動(dòng)態(tài) > 智能家居市場(chǎng) 語(yǔ)音識(shí)別這一密鑰何時(shí)才能被激活?

智能家居市場(chǎng) 語(yǔ)音識(shí)別這一密鑰何時(shí)才能被激活?

作者: 時(shí)間:2018-06-08 來(lái)源:中國(guó)安防展覽網(wǎng) 收藏
編者按:作為一個(gè)時(shí)代的代名詞,人工智能備受矚目,從世界范圍內(nèi)參與其中的知名公司就可窺見(jiàn)一斑。

  在80年代,以數(shù)理邏輯為核心的體制瓦解后,人工智能分化出了五大獨(dú)立學(xué)科。在這五大學(xué)科中,由深度學(xué)習(xí)推動(dòng),并順利從科研實(shí)驗(yàn)室走到人們身邊的智能語(yǔ)音,某種程度上承擔(dān)了人工智能這兩年的大部分熱度。智能語(yǔ)音在2016年被美國(guó)權(quán)威雜志《麻省理工科技評(píng)論》評(píng)為當(dāng)年的十大突破科技,根據(jù)易觀·工信部數(shù)據(jù),2017年中國(guó)語(yǔ)音產(chǎn)業(yè)規(guī)模就將突破百億。

本文引用地址:http://m.butianyuan.cn/article/201806/381288.htm


blob.png


  說(shuō)到智能語(yǔ)音就不能不提。在當(dāng)下的行業(yè),語(yǔ)音基于其交互的自然性,被認(rèn)為是未來(lái)人與家居交互的主要入口路徑,以致業(yè)內(nèi)普遍認(rèn)為,“以語(yǔ)音為入口連接各種服務(wù),構(gòu)建智家生態(tài)”。

  作為人工智能應(yīng)用最成熟的技術(shù)之一,目前語(yǔ)音交互的核心環(huán)節(jié)也取得重大突破,環(huán)節(jié)突破了單點(diǎn)能力,從遠(yuǎn)場(chǎng)識(shí)別,到語(yǔ)音分析和語(yǔ)義理解有了重大突破,呈現(xiàn)一種整體的交互方案。自動(dòng)(ASR)和前端語(yǔ)音處理的最新發(fā)展已使得語(yǔ)音控制相當(dāng)成熟和有效。ASR引擎可以理解多種語(yǔ)言和口音,而語(yǔ)音生物辨識(shí)可用于辨識(shí)系統(tǒng)中預(yù)先登錄的特定用戶,以在環(huán)境中提供不同的權(quán)限。

  不過(guò),雖然大多數(shù)家居可以用語(yǔ)音開(kāi)啟導(dǎo)航,進(jìn)行信息查詢,實(shí)現(xiàn)一些諸如空調(diào)、開(kāi)燈等功能控制,但距離“以語(yǔ)音為入口連接各種服務(wù),構(gòu)建智家生態(tài)”的理想仍然較遠(yuǎn)。目前的技術(shù)仍然限制在5公尺的范圍內(nèi),并且難以在多人同時(shí)交談或吵雜的環(huán)境中操作。

  影響語(yǔ)音控制技術(shù)進(jìn)入到智能家居或其他應(yīng)用領(lǐng)域的原因很多,包括使用者的習(xí)慣是否被建立、是否提供更多“控制”功能以外的附加價(jià)值、是否有更“特別”的應(yīng)用出現(xiàn),以及安全性的問(wèn)題。其中,安全性可說(shuō)是消費(fèi)者最為關(guān)注的部分。

  就像著名電影《蜘蛛俠》中的那句臺(tái)詞:“力量越大,責(zé)任越重。”能量越大,就越需要安全閥門(mén)。首先是聲紋的采集。不管是人工識(shí)別,還是依靠深度學(xué)習(xí)算法進(jìn)行自動(dòng)化識(shí)別,聲紋庫(kù)的建立都是進(jìn)行一切行動(dòng)的前提。當(dāng)前,公安的聲紋鑒別庫(kù)最全,但如果是企業(yè)要想研究聲紋識(shí)別,從公安處入手顯然不可能,因而,企業(yè)智能自行收集聲紋并建立聲紋庫(kù),這是一項(xiàng)十分艱巨的任務(wù)。更重要的是,企業(yè)還要注意如何保障聲紋不被非法利用。

  其次,我們都聽(tīng)說(shuō)過(guò)“無(wú)用輸入,無(wú)用輸出”的說(shuō)法,但你想過(guò)這句話同樣適用于負(fù)責(zé)業(yè)務(wù)的語(yǔ)音識(shí)別嗎?企業(yè)是否有建立污染數(shù)據(jù)安全策略(它能確保攻擊者不會(huì)利用篡改過(guò)的數(shù)據(jù)欺騙人工智能并讓它推薦錯(cuò)誤的決策)嗎?如果設(shè)備根據(jù)錯(cuò)誤的數(shù)據(jù)做出了錯(cuò)誤的決策,那么,企業(yè)需要多長(zhǎng)時(shí)間才能發(fā)現(xiàn)?數(shù)據(jù)污染已經(jīng)是網(wǎng)絡(luò)安全世界中的一個(gè)關(guān)注點(diǎn)。例如,反惡意軟件根據(jù)多重來(lái)源提交的標(biāo)記和樣本進(jìn)行工作,而反惡意軟件供應(yīng)商必須保持警惕,防止攻擊者愚弄這一系統(tǒng)。

  盡管如此,與其他生物特征相比,聲紋識(shí)別的應(yīng)用仍然具有特殊優(yōu)勢(shì),比如聲紋提取可在不知不覺(jué)中完成,因此使用者的接受程度也相對(duì)較高目前,聲紋識(shí)別在全球市場(chǎng)中的占有率達(dá)到15.8%,僅次于指紋和掌紋識(shí)別,并呈現(xiàn)出不斷上升的趨勢(shì),因此,我們有理由相信,聲紋識(shí)別或?qū)⒊蔀檎Z(yǔ)音交互的下一個(gè)風(fēng)口。

  結(jié)語(yǔ):在今天這個(gè)快節(jié)奏的社會(huì)中,語(yǔ)音識(shí)別技術(shù)的誕生,可以說(shuō)是一次偉大的技術(shù)變革。隨著高質(zhì)量數(shù)據(jù)的不斷積累、技術(shù)的不斷突破及硬件平臺(tái)算力的提升,語(yǔ)音識(shí)別正在向我們期待的方向快速發(fā)展。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉