從圖像識別到視頻識別 微軟小冰拿什么和谷歌PK人工智能?
1956年的夏天,一場在美國達特茅斯(Dartmouth)大學召開的學術會議,多年以后被認定為全球人工智能研究的起點。2016年的春天,一場AlphaGo與世界頂級圍棋高手李世石的人機世紀對戰(zhàn),把全球推上了人工智能浪潮的新高。
本文引用地址:http://m.butianyuan.cn/article/201607/293647.htm經歷了兩次起伏,人工智能現(xiàn)在進入了全球爆發(fā)的前夜。僅在中國就有上億人直接或間接地觀看了AlphaGo與李世石的比賽,而在2016年初,還有IBM在全球大舉推廣基于IBM Watson的認知計算,Watson的前身就是1997年打敗了國際象棋大師卡斯帕羅夫的“深藍”。而2014年,微軟的人工智能機器人小冰也同樣在社交平臺掀起一股前所未有的“調戲”熱潮。
視頻識別成人工智能的重要突破
當AlphaGo戰(zhàn)勝李世石的消息傳來,有人評價說:“這是人工智能一個時代的開始。”
兩次人機大戰(zhàn)時隔20年,這其中最重要的差別在于象棋與圍棋的復雜度差異巨大。人工智能之所以能夠先戰(zhàn)勝國際象棋冠軍,在于國際象棋可以窮盡接近所有可能的棋局,而圍棋就不一樣了,其運算量接近無窮大。
而與谷歌的選擇不同,微軟則將計算機視覺作為主要突破點。因為微軟相信人工智能要融入人類世界,沒有視覺識別能力的機器人無法真正與外界交互。2015年,在微軟等大公司的推動下,計算機視覺已經逼近全面突破的拐點。微軟不僅在ImageNet全球頂級的計算機視覺挑戰(zhàn)賽奪得冠軍,微軟人工智能機器人小冰還率先發(fā)布了圖像識別技能。在準確的圖像識別的基礎上,結合人工智能自己的觀點,對圖片進行人性化的評論。
而就在這幾天,微軟再次對小冰的視覺感官進行升級,實現(xiàn)了對視頻的識別和評論。率先實現(xiàn)了對人類視覺感官的模擬。從靜態(tài)圖片到動態(tài)視頻,人工智能機器人小冰率先實現(xiàn)了對人類視覺感官的模擬。開辟了一條與谷歌不同的人工智能發(fā)展之路。當然,從圖片識別到視頻識別,這一技術跨越是巨大的。半年前,Google人工智能的兩位軟件工程師在博客上公布了關于人工智能的一些研究成果,其中很重要的一個突破是,能夠初步辨識出動態(tài)視頻的內容。他們的最終目標不僅要分辨出圖像中的物體或人,還要搞清楚他們在干什么。而在前段時間召開的Facebook開發(fā)者大會上,扎克伯格也透露將會把人工智能(AI)巧妙的運用在視頻播放中,根據(jù)視頻中人物的服飾、身材、發(fā)型等識別并標記人物,方便用戶日后檢索。小扎也明確表示,相比靜態(tài)圖像的識別,視頻識別更為困難,對技術的挑戰(zhàn)更大。
視頻識別擴展人工智能的想象空間
巨頭們極力看好并且大力發(fā)展人工智能,根本目的是讓人工智能幫助人類從低效率的重復勞動中解放出來,幫助我們解決很多依靠自身無法很好解決的問題。
在很多經典的美國大片中,我們經??吹骄炜梢酝ㄟ^全國的交通及安防攝像頭追蹤疑犯的動向,從而幫助警察迅速破案。但實際上,受于技術上的限制,現(xiàn)實生活中對視頻內容的分析依然以人工為主,所以經??吹絿鴥刃侣劽襟w報道,某地警察通過調取案發(fā)現(xiàn)場附近監(jiān)控視頻經過數(shù)小時的分析終于確定疑犯容貌從而成功將其抓獲歸案。除了抓疑犯,通過調取監(jiān)控攝像頭數(shù)據(jù)進行分析對于尋找失蹤小孩也是有非常大的幫助,但是目前技術條件下,通過人工分析視頻效率非常低下,讓視頻監(jiān)控的價值大打折扣。
如果人工智能在視頻識別、視頻分析等方面取得重大突破,那么只需要輸入一張照片做參照,即可讓機器從一個地區(qū)數(shù)以千計的視頻監(jiān)控服務器中快速查找定位到相應目標,工作效率及準確度是人工分析根本無法比擬的。這也是為什么微軟小冰視頻識別能力發(fā)布后讓許多人感到興奮的重要原因,這代表著人工智能在視頻分析方面再次取得突破,后面將以此為基礎產生很多具備良好想象空間的應用案例。微軟對于人工智能、計算機視覺的投入正不斷加大,小冰自發(fā)布以來也經歷了脫胎換骨的變化。微軟人工智能的下一步走向哪里,十分值得期待。
評論