王馥芳:面向機器人的大規(guī)模知識引擎
近年來,隨著計算機和網絡技術的快速發(fā)展,諸多大規(guī)模知識引擎的創(chuàng)建在很大程度上改變了人類的知識共享和表征生態(tài)。受此啟發(fā),美國康奈爾大學和斯坦福大學的一些學者通過多模態(tài)大數據挖掘,創(chuàng)建了一種新的、主要面向機器人的、同時能供任何要執(zhí)行任務的設備自由訪問的大規(guī)模知識引擎:機器人大腦(RoboBrain)。
機器人大腦:面向機器人的大規(guī)模知識引擎
在面向人類的知識數據庫中,信息搜索是一件簡單的事情,我們只需在電腦或移動終端上輸入幾個字就可以得到答案,在很多情況下,模糊和缺省檢索也能解決問題。但是,對于機器人來說事情就沒有這么簡單。即便要完成最簡單的任務,機器人都需要詳盡甚而完備的操作細節(jié)。基于面向人類的搜索引擎所得出的搜索結果,機器人難以讀懂。比如,要使機器人讀懂“如何烘焙蛋糕”的搜索結果,除了指出常規(guī)的烘焙過程和步驟之外,還需要提供各種各樣詳盡的相關附帶信息,如雞蛋可以打破;打破雞蛋流出的液體必須裝在器皿如杯子里;杯子只有在杯口朝上的情況下才可以盛裝液體;水來自水龍頭,能夠在壺或者微波爐里加熱,且能夠和蛋液混合等等。因此,要創(chuàng)建一個面向機器人的大規(guī)模知識引擎不是一件簡單的事情。
在人工智能產業(yè)發(fā)展前景被普遍看好的當下,康奈爾大學和斯坦福大學聯合創(chuàng)建了一個面向機器人的大規(guī)模知識引擎——機器人大腦,并為此創(chuàng)建了一個網站。這主要是一個供機器人學習和共享知識表征并執(zhí)行多種任務的大規(guī)模知識引擎。
“機器人大腦”網站的首頁顯示,該知識引擎主要通過搜索互聯網及其他一些數據來源學習各種概念:“它能解釋自然語言文本,意象和錄像;能運用其傳感器來觀察人類;且能通過與它們互動的方式來學習事物?!眲?chuàng)建者相信,通過學習和共享大規(guī)模知識,不同的機器人能夠在各種新情境下更快速敏捷地完成各種任務?!皺C器人大腦”的創(chuàng)建改變了機器人的深度學習方式。傳統(tǒng)上,機器人學習的重心是規(guī)則學習。隨著大數據時代的到來,機器人開始從規(guī)則學習轉向多模態(tài)數據學習。
機器人大腦:使機器人深度學習成為可能
“機器人大腦”本質上是一個大規(guī)模眾源(crowd-sourcing)大數據庫,它所存儲的知識來源多樣,包括機器人在完成各種任務(如感知、計劃和控制等)時所關涉的物理互動、萬維網知識基礎以及領先的機器人研究小組所創(chuàng)建的各種可學習性知識表征。
“機器人大腦”的創(chuàng)建在很大程度上改變了大數據挖掘過度依賴單一文本數據模態(tài)來源的現狀。受制于技術局限性,面向人類的大規(guī)模知識引擎的數據來源主要是萬維網中“結構化”的文本模態(tài)數據,而無法有效挖掘其他一些“非結構化”的數據模態(tài)如符號、圖片、視頻、音頻等?!敖Y構化數據”主要指能被數據庫所理解的、可以被邏輯表征的數據,而“非結構化數據”主要指無法被邏輯表征的數據,主要包括多種數據模態(tài):文本、圖片或圖像、觸感、XML、HTML、各類圖表或報表、音頻和視頻信息等等。
據資料統(tǒng)計,在大數據變革風起云涌的今天,世界約80%的數據都是“非結構化數據”。在云計算出現之前,傳統(tǒng)計算機無法處理這些巨量數據。借助于以云計算為基礎的信息挖掘、存儲、處理和展示技術,我們可以在某種程度上有效地對其進行分析和計算。如此一來,“非結構化數據”的價值得到極大凸顯。由于面向機器人的知識引擎在很大程度上是由“非結構化數據”組成的,而其本質上又是眾源數據,因此,如何有效編碼多種不同的數據模態(tài)并構建一個能與多種數據來源兼容的知識表征構架是“機器人大腦”面臨的最大挑戰(zhàn)。為此,“機器人大腦”訴諸于圖表構架以解決不同數據模態(tài)之間的沖突和不一致問題。
研究小組將“機器人大腦”知識表征構架的創(chuàng)建看作是網絡理論問題。他們把知識表征為定向圖表,其中的節(jié)點以各種各樣的數據模態(tài)體現,如圖像、文本、視頻、觸覺數據或者學術概念等?!皺C器人大腦”是一個“無止境學習”的知識引擎,它不間斷地實時獲取以邊集形式呈現的新信息,這些新信息通過和節(jié)點子集鏈接的方式得到表征。例如,“坐著的人可以使用杯子”這一常識概念可能會鏈接“杯子”、“坐著的人”和“能夠使用”等節(jié)點概念(即檢索的中心概念,以檢索與該概念直接相關的概念)。任何在“機器人大腦”中搜索節(jié)點概念的機器人,都可以通過下載相關邊集和它們所代表的節(jié)點概念來進行深度學習。
“機器人大腦”的核心是,不但讓機器人通過搜索大規(guī)模知識引擎自我深度學習,而且意圖使其將一個情境中學到的知識應用于其他新情境。例如,將“倒水到杯子里”的能力擴展到倒水到其他容器里,如倒洗澡水到澡盆里等?!皺C器人大腦”團隊對于未來有著宏大的計劃:讓該知識引擎納入更加多樣的知識來源,如在線視頻,并設想讓機器人通過查詢在線指引視頻學會如何做各種各樣的家務。
此外,“機器人大腦”著力于解決不同領域的研究挑戰(zhàn):機器學習、大規(guī)模資料處理、語言和對話、感知、人工智能和推理系統(tǒng)、體驗和機器人學以及自動化。該知識引擎的創(chuàng)建有助于三個重要研究領域的工作:基礎自然語言、感知和計劃。這三項工作是很多機器人完成任務的關鍵要素。
機器人大腦:將進一步拓展人工智能產業(yè)前景
“機器人大腦”的創(chuàng)立,標志著人類在人工智能產業(yè)化的道路上又邁出了實質性的一步。雖然其在目前初創(chuàng)階段,還面臨諸多技術難題和構架創(chuàng)建挑戰(zhàn),但是,其在諸多方面的技術潛力無疑將進一步助推人工智能產業(yè)的發(fā)展。
其一,“機器人大腦”試圖對不同數據模態(tài)進行有效編碼和表征,此舉意在試圖實現“非結構化數據”向“結構化數據”的轉換,以使之能被機器人學習、理解,進而運用其完成各種任務。此舉不但極大地拓展了機器人學習的內容、深度以及學習的復雜性,而且革新了機器人的學習方式。經過多模態(tài)數據學習訓練的機器人有望在智能化方面更加“類人化”,從而進一步加快人工智能產業(yè)化的發(fā)展步伐。
其二,“機器人大腦”試圖在一定程度上消除機器人和人類使用者在信息共享中的障礙,此舉有助于進一步增強人機互動的質和量,并加快人工智能和人類智能的進一步融合。
其三,“機器人大腦”試圖把各種機器人任務公式化為各種問題,從而為各種人機交互任務的完成提供一個問題驅動的知識學習和任務訓練數據庫。此舉有助于進一步提高機器人完成任務的概率,并可能催生出新的智能化產品。
其四,由于“機器人大腦”的數據來源多樣,因此,其團隊致力于構建一種能和多種數據來源兼容的圖表表征構架。這個目標的最終達成將在很大程度上解決因多種信息源之間的沖突或不一致而導致的“數據不可讀”問題,并將極大地便利人工智能大數據的挖掘、生成、存儲、管理、查詢、提取、處理以及展示等,從而拓展其產業(yè)化前景。
在“人工智能”已發(fā)展成一個商業(yè)前景廣闊的產業(yè)的背景下,“機器人大腦”的創(chuàng)建無疑為其注入了一針強心劑。
評論