王馥芳：面向機(jī)器人的大規(guī)模知識(shí)引擎

作者：時(shí)間：2015-11-12 來源：《中國社會(huì)科學(xué)報(bào)》

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

近年來，隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展，諸多大規(guī)模知識(shí)引擎的創(chuàng)建在很大程度上改變了人類的知識(shí)共享和表征生態(tài)。受此啟發(fā)，美國康奈爾大學(xué)和斯坦福大學(xué)的一些學(xué)者通過多模態(tài)大數(shù)據(jù)挖掘，創(chuàng)建了一種新的、主要面向機(jī)器人的、同時(shí)能供任何要執(zhí)行任務(wù)的設(shè)備自由訪問的大規(guī)模知識(shí)引擎：機(jī)器人大腦（RoboBrain）。
機(jī)器人大腦：面向機(jī)器人的大規(guī)模知識(shí)引擎
在面向人類的知識(shí)數(shù)據(jù)庫中，信息搜索是一件簡單的事情，我們只需在電腦或移動(dòng)終端上輸入幾個(gè)字就可以得到答案，在很多情況下，模糊和缺省檢索也能解決問題。但是，對于機(jī)器人來說事情就沒有這么簡單。即便要完成最簡單的任務(wù)，機(jī)器人都需要詳盡甚而完備的操作細(xì)節(jié)?；诿嫦蛉祟惖乃阉饕嫠贸龅乃阉鹘Y(jié)果，機(jī)器人難以讀懂。比如，要使機(jī)器人讀懂“如何烘焙蛋糕”的搜索結(jié)果，除了指出常規(guī)的烘焙過程和步驟之外，還需要提供各種各樣詳盡的相關(guān)附帶信息，如雞蛋可以打破；打破雞蛋流出的液體必須裝在器皿如杯子里；杯子只有在杯口朝上的情況下才可以盛裝液體；水來自水龍頭，能夠在壺或者微波爐里加熱，且能夠和蛋液混合等等。因此，要?jiǎng)?chuàng)建一個(gè)面向機(jī)器人的大規(guī)模知識(shí)引擎不是一件簡單的事情。

本文引用地址：http://m.butianyuan.cn/article/282739.htm

在人工智能產(chǎn)業(yè)發(fā)展前景被普遍看好的當(dāng)下，康奈爾大學(xué)和斯坦福大學(xué)聯(lián)合創(chuàng)建了一個(gè)面向機(jī)器人的大規(guī)模知識(shí)引擎——機(jī)器人大腦，并為此創(chuàng)建了一個(gè)網(wǎng)站。這主要是一個(gè)供機(jī)器人學(xué)習(xí)和共享知識(shí)表征并執(zhí)行多種任務(wù)的大規(guī)模知識(shí)引擎。
“機(jī)器人大腦”網(wǎng)站的首頁顯示，該知識(shí)引擎主要通過搜索互聯(lián)網(wǎng)及其他一些數(shù)據(jù)來源學(xué)習(xí)各種概念：“它能解釋自然語言文本，意象和錄像；能運(yùn)用其傳感器來觀察人類；且能通過與它們互動(dòng)的方式來學(xué)習(xí)事物。”創(chuàng)建者相信，通過學(xué)習(xí)和共享大規(guī)模知識(shí)，不同的機(jī)器人能夠在各種新情境下更快速敏捷地完成各種任務(wù)?！皺C(jī)器人大腦”的創(chuàng)建改變了機(jī)器人的深度學(xué)習(xí)方式。傳統(tǒng)上，機(jī)器人學(xué)習(xí)的重心是規(guī)則學(xué)習(xí)。隨著大數(shù)據(jù)時(shí)代的到來，機(jī)器人開始從規(guī)則學(xué)習(xí)轉(zhuǎn)向多模態(tài)數(shù)據(jù)學(xué)習(xí)。
機(jī)器人大腦：使機(jī)器人深度學(xué)習(xí)成為可能
“機(jī)器人大腦”本質(zhì)上是一個(gè)大規(guī)模眾源（crowd-sourcing）大數(shù)據(jù)庫，它所存儲(chǔ)的知識(shí)來源多樣，包括機(jī)器人在完成各種任務(wù)（如感知、計(jì)劃和控制等）時(shí)所關(guān)涉的物理互動(dòng)、萬維網(wǎng)知識(shí)基礎(chǔ)以及領(lǐng)先的機(jī)器人研究小組所創(chuàng)建的各種可學(xué)習(xí)性知識(shí)表征。
“機(jī)器人大腦”的創(chuàng)建在很大程度上改變了大數(shù)據(jù)挖掘過度依賴單一文本數(shù)據(jù)模態(tài)來源的現(xiàn)狀。受制于技術(shù)局限性，面向人類的大規(guī)模知識(shí)引擎的數(shù)據(jù)來源主要是萬維網(wǎng)中“結(jié)構(gòu)化”的文本模態(tài)數(shù)據(jù)，而無法有效挖掘其他一些“非結(jié)構(gòu)化”的數(shù)據(jù)模態(tài)如符號(hào)、圖片、視頻、音頻等?！敖Y(jié)構(gòu)化數(shù)據(jù)”主要指能被數(shù)據(jù)庫所理解的、可以被邏輯表征的數(shù)據(jù)，而“非結(jié)構(gòu)化數(shù)據(jù)”主要指無法被邏輯表征的數(shù)據(jù)，主要包括多種數(shù)據(jù)模態(tài)：文本、圖片或圖像、觸感、XML、HTML、各類圖表或報(bào)表、音頻和視頻信息等等。
據(jù)資料統(tǒng)計(jì)，在大數(shù)據(jù)變革風(fēng)起云涌的今天，世界約80%的數(shù)據(jù)都是“非結(jié)構(gòu)化數(shù)據(jù)”。在云計(jì)算出現(xiàn)之前，傳統(tǒng)計(jì)算機(jī)無法處理這些巨量數(shù)據(jù)。借助于以云計(jì)算為基礎(chǔ)的信息挖掘、存儲(chǔ)、處理和展示技術(shù)，我們可以在某種程度上有效地對其進(jìn)行分析和計(jì)算。如此一來，“非結(jié)構(gòu)化數(shù)據(jù)”的價(jià)值得到極大凸顯。由于面向機(jī)器人的知識(shí)引擎在很大程度上是由“非結(jié)構(gòu)化數(shù)據(jù)”組成的，而其本質(zhì)上又是眾源數(shù)據(jù)，因此，如何有效編碼多種不同的數(shù)據(jù)模態(tài)并構(gòu)建一個(gè)能與多種數(shù)據(jù)來源兼容的知識(shí)表征構(gòu)架是“機(jī)器人大腦”面臨的最大挑戰(zhàn)。為此，“機(jī)器人大腦”訴諸于圖表構(gòu)架以解決不同數(shù)據(jù)模態(tài)之間的沖突和不一致問題。
研究小組將“機(jī)器人大腦”知識(shí)表征構(gòu)架的創(chuàng)建看作是網(wǎng)絡(luò)理論問題。他們把知識(shí)表征為定向圖表，其中的節(jié)點(diǎn)以各種各樣的數(shù)據(jù)模態(tài)體現(xiàn)，如圖像、文本、視頻、觸覺數(shù)據(jù)或者學(xué)術(shù)概念等?！皺C(jī)器人大腦”是一個(gè)“無止境學(xué)習(xí)”的知識(shí)引擎，它不間斷地實(shí)時(shí)獲取以邊集形式呈現(xiàn)的新信息，這些新信息通過和節(jié)點(diǎn)子集鏈接的方式得到表征。例如，“坐著的人可以使用杯子”這一常識(shí)概念可能會(huì)鏈接“杯子”、“坐著的人”和“能夠使用”等節(jié)點(diǎn)概念（即檢索的中心概念，以檢索與該概念直接相關(guān)的概念）。任何在“機(jī)器人大腦”中搜索節(jié)點(diǎn)概念的機(jī)器人，都可以通過下載相關(guān)邊集和它們所代表的節(jié)點(diǎn)概念來進(jìn)行深度學(xué)習(xí)。
“機(jī)器人大腦”的核心是，不但讓機(jī)器人通過搜索大規(guī)模知識(shí)引擎自我深度學(xué)習(xí)，而且意圖使其將一個(gè)情境中學(xué)到的知識(shí)應(yīng)用于其他新情境。例如，將“倒水到杯子里”的能力擴(kuò)展到倒水到其他容器里，如倒洗澡水到澡盆里等?！皺C(jī)器人大腦”團(tuán)隊(duì)對于未來有著宏大的計(jì)劃：讓該知識(shí)引擎納入更加多樣的知識(shí)來源，如在線視頻，并設(shè)想讓機(jī)器人通過查詢在線指引視頻學(xué)會(huì)如何做各種各樣的家務(wù)。
此外，“機(jī)器人大腦”著力于解決不同領(lǐng)域的研究挑戰(zhàn)：機(jī)器學(xué)習(xí)、大規(guī)模資料處理、語言和對話、感知、人工智能和推理系統(tǒng)、體驗(yàn)和機(jī)器人學(xué)以及自動(dòng)化。該知識(shí)引擎的創(chuàng)建有助于三個(gè)重要研究領(lǐng)域的工作：基礎(chǔ)自然語言、感知和計(jì)劃。這三項(xiàng)工作是很多機(jī)器人完成任務(wù)的關(guān)鍵要素。
機(jī)器人大腦：將進(jìn)一步拓展人工智能產(chǎn)業(yè)前景
“機(jī)器人大腦”的創(chuàng)立，標(biāo)志著人類在人工智能產(chǎn)業(yè)化的道路上又邁出了實(shí)質(zhì)性的一步。雖然其在目前初創(chuàng)階段，還面臨諸多技術(shù)難題和構(gòu)架創(chuàng)建挑戰(zhàn)，但是，其在諸多方面的技術(shù)潛力無疑將進(jìn)一步助推人工智能產(chǎn)業(yè)的發(fā)展。
其一，“機(jī)器人大腦”試圖對不同數(shù)據(jù)模態(tài)進(jìn)行有效編碼和表征，此舉意在試圖實(shí)現(xiàn)“非結(jié)構(gòu)化數(shù)據(jù)”向“結(jié)構(gòu)化數(shù)據(jù)”的轉(zhuǎn)換，以使之能被機(jī)器人學(xué)習(xí)、理解，進(jìn)而運(yùn)用其完成各種任務(wù)。此舉不但極大地拓展了機(jī)器人學(xué)習(xí)的內(nèi)容、深度以及學(xué)習(xí)的復(fù)雜性，而且革新了機(jī)器人的學(xué)習(xí)方式。經(jīng)過多模態(tài)數(shù)據(jù)學(xué)習(xí)訓(xùn)練的機(jī)器人有望在智能化方面更加“類人化”，從而進(jìn)一步加快人工智能產(chǎn)業(yè)化的發(fā)展步伐。
其二，“機(jī)器人大腦”試圖在一定程度上消除機(jī)器人和人類使用者在信息共享中的障礙，此舉有助于進(jìn)一步增強(qiáng)人機(jī)互動(dòng)的質(zhì)和量，并加快人工智能和人類智能的進(jìn)一步融合。
其三，“機(jī)器人大腦”試圖把各種機(jī)器人任務(wù)公式化為各種問題，從而為各種人機(jī)交互任務(wù)的完成提供一個(gè)問題驅(qū)動(dòng)的知識(shí)學(xué)習(xí)和任務(wù)訓(xùn)練數(shù)據(jù)庫。此舉有助于進(jìn)一步提高機(jī)器人完成任務(wù)的概率，并可能催生出新的智能化產(chǎn)品。
其四，由于“機(jī)器人大腦”的數(shù)據(jù)來源多樣，因此，其團(tuán)隊(duì)致力于構(gòu)建一種能和多種數(shù)據(jù)來源兼容的圖表表征構(gòu)架。這個(gè)目標(biāo)的最終達(dá)成將在很大程度上解決因多種信息源之間的沖突或不一致而導(dǎo)致的“數(shù)據(jù)不可讀”問題，并將極大地便利人工智能大數(shù)據(jù)的挖掘、生成、存儲(chǔ)、管理、查詢、提取、處理以及展示等，從而拓展其產(chǎn)業(yè)化前景。
在“人工智能”已發(fā)展成一個(gè)商業(yè)前景廣闊的產(chǎn)業(yè)的背景下，“機(jī)器人大腦”的創(chuàng)建無疑為其注入了一針強(qiáng)心劑。

新聞中心

王馥芳：面向機(jī)器人的大規(guī)模知識(shí)引擎

評論

相關(guān)推薦

技術(shù)專區(qū)