聚焦2016：關(guān)于語音識(shí)別、圖像識(shí)別及大數(shù)據(jù)

作者：時(shí)間：2016-02-16 來源：智能視頻技術(shù)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

編者按：語音識(shí)別和圖像識(shí)別讓我們跟智能設(shè)備之間的交互更自然，基于大數(shù)據(jù)的技術(shù)支持，讓識(shí)別變得主動(dòng)而聰明，將走進(jìn)普通人的世界，讓我們的生活更生動(dòng)。

　　深度學(xué)習(xí)

本文引用地址：http://m.butianyuan.cn/article/201602/286964.htm

　　沒有基礎(chǔ)的技術(shù)實(shí)力，語音和圖像是好玩不起來的，而高級(jí)和低級(jí)的門檻就在深度學(xué)習(xí)的研究上。國(guó)內(nèi)雖然起步較晚，好歹在去年趕上了這波風(fēng)潮，包括圖像識(shí)別和語音識(shí)別在內(nèi)，還有自動(dòng)駕駛、無人機(jī)、環(huán)境還原、機(jī)器人等項(xiàng)目，前段時(shí)間很火的谷歌AlphaGo在圍棋領(lǐng)域擊敗了歐洲二段冠軍，也是歸功于深度學(xué)習(xí)的算法支持。可以說跟用戶有交互行為的產(chǎn)品，都開始進(jìn)行深度學(xué)習(xí)AI的研究了。通過神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)，語音識(shí)別變得更聰明，實(shí)現(xiàn)快速精準(zhǔn)的識(shí)別動(dòng)作以外，還能對(duì)下一句的語境情緒進(jìn)行預(yù)測(cè)，模擬真人對(duì)話。另外，語音識(shí)別大量運(yùn)用在翻譯市場(chǎng)，爭(zhēng)取未來十年內(nèi)在專業(yè)翻譯領(lǐng)域完全替代人類。圖像識(shí)別過去大多是建庫(kù)識(shí)別，深度學(xué)習(xí)釋放了圖像識(shí)別的識(shí)別領(lǐng)域，把識(shí)別對(duì)象的年齡變化記憶下來，實(shí)現(xiàn)動(dòng)態(tài)、多角度、不同光照變化下的識(shí)別。

　　應(yīng)用領(lǐng)域

　　安防市場(chǎng)是要求語音和圖像識(shí)別技術(shù)雙高的行業(yè)之一，未來將不局限在解鎖開門等基礎(chǔ)功能，運(yùn)用圖像識(shí)別技術(shù)，實(shí)現(xiàn)對(duì)象動(dòng)作識(shí)別，根據(jù)威脅等級(jí)進(jìn)行危險(xiǎn)性判斷，提前發(fā)出警報(bào)或報(bào)警。語音識(shí)別的運(yùn)用領(lǐng)域?qū)⒊叨嘶l(fā)展，近年來語音識(shí)別速度屢創(chuàng)新高，在翻譯市場(chǎng)、智能硬件助手、AI輔助，行車幫助等等方面實(shí)現(xiàn)價(jià)值。而娛樂領(lǐng)域的玩法變得多元化，像最近大熱的faceu，運(yùn)用了臉部識(shí)別跟蹤技術(shù)，讓普通的自拍可以DIY。還有video++視頻開放平臺(tái)，可以對(duì)視頻中的明星、衣服同款進(jìn)行識(shí)別搜索，打開了視頻到電商的入口。乘著去年SaaS的風(fēng)口，國(guó)內(nèi)外陸續(xù)出現(xiàn)了語音識(shí)別、圖像識(shí)別的技術(shù)開放平臺(tái)，從專業(yè)到普通領(lǐng)域，語音識(shí)別和圖像識(shí)別將在2016年做到技術(shù)全覆蓋。

　　大數(shù)據(jù)

　　數(shù)據(jù)收集是一個(gè)從被動(dòng)到主動(dòng)的過程，語音識(shí)別從接受指令變成了對(duì)指令使用頻率的分析，進(jìn)而形成用戶的習(xí)慣圖表。圖像識(shí)別亦然，針對(duì)用戶的識(shí)別頻率，分析出用戶的興趣畫像，這將給予廣告主帶來精準(zhǔn)廣告推送的商機(jī)?！　?/p>