新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 超深度學(xué)習(xí):創(chuàng)造新一代人工智能的核心理論

超深度學(xué)習(xí):創(chuàng)造新一代人工智能的核心理論

作者:株式會(huì)社阿波羅日本 首席科學(xué)家 顧澤蒼(中國籍) 時(shí)間:2021-08-03 來源:電子產(chǎn)品世界 收藏

新一代人工智能超深度學(xué)習(xí)( Super  Deep  Learning  SDL)的創(chuàng)新發(fā)展歷程是:早在1991年到1993年,伴隨著大規(guī)集成電路極速發(fā)展的時(shí)期,大規(guī)集成電路的最小面積,最短配線長度,同時(shí)還要考慮電氣特性的多目的最佳化解的獲得,成為當(dāng)時(shí)科學(xué)技術(shù)領(lǐng)域中最為關(guān)注的課題。在那個(gè)時(shí)代,由美國學(xué)界提出的導(dǎo)入“熵”的理論解決最佳化組合問題,這一理論一時(shí)也被世界期待。但是,這個(gè)算法同目前深度學(xué)習(xí)相仿,計(jì)算復(fù)雜度極高。即使一個(gè)最簡單的電路的計(jì)算,要花費(fèi)若干天。面對被世界推崇的理論,我們大膽的提出了“模糊事件概率測度”理論,通過用模糊事件概率測度判斷組合結(jié)果的價(jià)值,獲得了可以快速進(jìn)行大規(guī)模集成電路的最短配線長,最小面積以及電氣特性的多目的組合最佳化的解的方法。

本文引用地址:http://m.butianyuan.cn/article/202108/427338.htm

其實(shí),當(dāng)今的深度學(xué)習(xí)中的“訓(xùn)練”,由于神經(jīng)網(wǎng)絡(luò)之間不像大規(guī)模集成電路具有模塊之間的連接關(guān)系,也不像圍棋具有規(guī)則,可以建立棋子之間的連接關(guān)系,作為不具有連接關(guān)系的神經(jīng)網(wǎng)絡(luò)從組合理論看,就是需要窮舉法才可以獲得最佳訓(xùn)練結(jié)果,黑箱問題的出現(xiàn),其原因就是神經(jīng)網(wǎng)絡(luò)的訓(xùn)練沒有獲得最佳解所造成的。

1994年到1999年,由于已經(jīng)知道傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)的致命問題,為了同當(dāng)時(shí)的神經(jīng)網(wǎng)絡(luò)對抗,我們創(chuàng)建了“概率尺度自組織”的無監(jiān)督機(jī)器學(xué)習(xí)理論。在長期的聲音識別,手寫文字識別,圖像識別等模式識別領(lǐng)域中進(jìn)行了大量的應(yīng)用,證明了概率尺度自組織機(jī)器學(xué)習(xí)理論的特殊的應(yīng)用效果。

2000年到2014年,國際上個(gè)人信息法的制定,成為社會(huì)關(guān)注的焦點(diǎn)。由于當(dāng)時(shí)個(gè)人信息的67%是通過紙介質(zhì)文檔流失的,為此我們在國際上提出了新的代碼符號信息記錄的方法,由此“具有隱形結(jié)構(gòu)的第三代條碼網(wǎng)屏編碼誕生了,可以在A4的一張紙上埋入一本小說的信息被受業(yè)界的關(guān)注。在這十幾年中針對Google眼鏡,我們還提出了,可以把任何圖像直接通過概率尺度自組織的機(jī)器學(xué)習(xí)的手法,變換成不到十個(gè)字節(jié)的1036的代碼,就可以把任何圖像作為網(wǎng)絡(luò)入口,引導(dǎo)從網(wǎng)絡(luò)上下載各種文件,即ITC(Image To Code)理論,顛覆了當(dāng)今流行的AR技術(shù)。在這期間,我們還提出了“可以統(tǒng)一歐幾里德空間與概率空間的距離公式。

2014年到2016年我們將概率尺度自組織同神經(jīng)網(wǎng)絡(luò)理論結(jié)合,提出了分散機(jī)器學(xué)習(xí)的”超深度學(xué)習(xí)“理論,為人工智能的全面普及應(yīng)用給予了理論支持。我們是經(jīng)歷過上一個(gè)人工智能的研究的人,對于當(dāng)今火熱的AI熱潮,親身感到上一個(gè)人工智能的特點(diǎn)是知識庫,其突出的成果是日本成功的實(shí)現(xiàn)了有軌電車的自動(dòng)駕駛,由此在控制理論上產(chǎn)生了模糊控制的新理論。本次人工智能的特點(diǎn)就是機(jī)器學(xué)習(xí),相信本次人工智能高潮的代表性成果一定是自動(dòng)駕駛汽車。因?yàn)闄C(jī)器學(xué)習(xí)可以把人的知識以概率分布的形式進(jìn)行記述,大大的簡化了知識庫的形式,面對復(fù)雜的自動(dòng)駕駛汽車,機(jī)器學(xué)習(xí)可以將人的知識變成機(jī)器的智慧,使復(fù)雜的控制簡化。知識庫只能記述宏觀知識,機(jī)器學(xué)習(xí)在自動(dòng)駕駛汽車中不僅可以高效率的學(xué)習(xí)人的宏觀知識,還可以學(xué)習(xí)微觀知識,一個(gè)以機(jī)器學(xué)習(xí)理論為核心的“機(jī)智獲得”的新的自動(dòng)控制理論將展現(xiàn)在我們面前。

下面我們重點(diǎn)討論深度學(xué)習(xí)所遺留下的問題所在:

2016年初,AlphaGo連續(xù)打敗人類棋手,推崇深度學(xué)習(xí)的熱不斷的升溫。這說明,深度學(xué)習(xí)是在實(shí)際應(yīng)用中被看好的,應(yīng)該肯定走機(jī)器學(xué)習(xí)這條路是時(shí)代發(fā)展的必由之路,必然會(huì)給我們帶來意想不到的應(yīng)用效果,但是,也應(yīng)該清醒的看到深度學(xué)習(xí)目前有很多關(guān)鍵問題不能解決。雖然深度學(xué)習(xí)在圖像識別,聲音識別上確實(shí)具有一定的應(yīng)用效果,但是,在產(chǎn)業(yè)界的應(yīng)用,特別是在控制上的應(yīng)用還存在著很大的問題。

必須要指出的是:深度學(xué)習(xí)的訓(xùn)練結(jié)果,是將目標(biāo)函數(shù)信息通過訓(xùn)練承載到海量的屬于歐幾里德空間的參數(shù)上,即深度學(xué)習(xí)是函數(shù)映射模型,將概率空間的目標(biāo)函數(shù)映射到歐幾里得空間,其結(jié)果需要將概率空間的某一類數(shù)據(jù)的所有可能出現(xiàn)的結(jié)果,用人工標(biāo)注后進(jìn)行接近無限次的訓(xùn)練,例如一個(gè)語音識別的數(shù)據(jù)就需要2400萬美元的人工標(biāo)注費(fèi)用,這是深度學(xué)習(xí)難于普及的致命問題。

由于深度學(xué)習(xí)所構(gòu)造的神經(jīng)網(wǎng)絡(luò),與大腦的機(jī)理又是風(fēng)馬牛不相干的,因此也不能看到在神經(jīng)元的方面會(huì)起到什么作用。得到的結(jié)論是:通過這樣的方式所產(chǎn)生的訓(xùn)練效果,與所投入的硬件開銷不成比例。例如AlphaGo所需要的硬件開銷是1000個(gè)CPU,200個(gè)GPU,還需要20萬W的電力消耗。這樣的硬件開銷如何普及?況且AlphaGo的設(shè)計(jì)者也指出深度學(xué)習(xí)在整個(gè)系統(tǒng)中的作用只占30%是次要地位。其實(shí)深度學(xué)習(xí)在如AlphaGo這種組合理論的應(yīng)用中,是否可以起到作用,目前沒有令人信服的理論依據(jù)。

1627979391442518.png

圖1 深度學(xué)習(xí)需要搞清的幾個(gè)問題

深度學(xué)習(xí)還有需要搞清如圖1所示的目前解釋不了的問題。

首先需要搞清為什么層數(shù)越多訓(xùn)練結(jié)果的圖像越清晰?開始我們曾認(rèn)為是承載目標(biāo)函數(shù)的信息的參數(shù)數(shù)量的提高使記錄的信息的信息量的提高,但是從數(shù)學(xué)上我們可以證明在同等節(jié)點(diǎn)的層與層的訓(xùn)練中必定可以找到一組參數(shù)可使輸入信息完全等于輸出信息,這就說明深度學(xué)習(xí)的層數(shù)越多圖像越清晰與訓(xùn)練的參數(shù)數(shù)量無關(guān),這就剩下一個(gè)可以信服的原因,深度學(xué)習(xí)每一層所訓(xùn)練的結(jié)果實(shí)際獲得的是一組局域最佳解,神經(jīng)網(wǎng)絡(luò)可以用一個(gè)傳遞的函數(shù)模型來描述,可以認(rèn)為每一層訓(xùn)練后的解是比上一層更接近整體最佳解,所以參數(shù)越接近整體最佳解神經(jīng)網(wǎng)絡(luò)的傳輸率越高圖像就越清晰。因此用這個(gè)現(xiàn)象來解釋深度學(xué)習(xí)中間層越多應(yīng)用效果越好不是一個(gè)嚴(yán)謹(jǐn)?shù)目茖W(xué)性的解釋方法。所以包括發(fā)明人Hindon在內(nèi)并沒有人能在數(shù)學(xué)上證明深度學(xué)習(xí)具有突破性應(yīng)用效果的真實(shí)機(jī)理。

那么,深度學(xué)習(xí)的黑箱問題是怎么回事?這里所謂的黑箱問題是涉及兩個(gè)方面的問題?一個(gè)是深度學(xué)習(xí)的不可分析性,出現(xiàn)問題不能依據(jù)一定的理論進(jìn)行分析,這是因?yàn)樯疃葘W(xué)習(xí)屬于函數(shù)映射模型,映射結(jié)果很難反向推理。對于深度學(xué)習(xí)模型的原理實(shí)際上是很清楚的,至于人們把“深度學(xué)習(xí)”的應(yīng)用效果好的機(jī)理作為“天知”,我們在后面會(huì)專題討論。

深度學(xué)習(xí)出現(xiàn)黑箱問題的主要原因:其實(shí)深度學(xué)習(xí)所訓(xùn)練的機(jī)理就是在一個(gè)海量的數(shù)據(jù)空間里進(jìn)行組合,黑箱問題就在于在海量數(shù)據(jù)空間里進(jìn)行窮舉時(shí),會(huì)出現(xiàn)無窮的局域最佳解,其局域最佳解的分布曲線通過數(shù)學(xué)方法無法計(jì)算出,人為的實(shí)驗(yàn)也是目前圖靈機(jī)所做不到的,因此在訓(xùn)練中很可能會(huì)出現(xiàn)一個(gè)參數(shù)稍微改變輸出結(jié)果會(huì)突然崩潰,或者是所訓(xùn)練的結(jié)果并不是按照我們想象的結(jié)果進(jìn)行展開。在組合空間中所獲得的局域最佳解出現(xiàn)在某一個(gè)情況下突然出現(xiàn)令人費(fèi)解的狀態(tài)是正常的,我們在通過規(guī)則解決最佳組合的NP問題中經(jīng)常會(huì)出這種現(xiàn)象,往往是通過程序的規(guī)則的不斷堆積來實(shí)現(xiàn),對于深度學(xué)習(xí)要通過重新改變參數(shù),尋求另一個(gè)局域最佳解的方法來解決。所以只要是知道深度學(xué)習(xí)的訓(xùn)練是數(shù)據(jù)最佳化組合的過程的特點(diǎn),就不難理解深度學(xué)習(xí)的黑箱問題。特別是作為概率空間的目標(biāo)函數(shù)的隨機(jī)性會(huì)引發(fā)黑箱問題的發(fā)生。再有就是在“深度學(xué)習(xí)”的層與層之間節(jié)點(diǎn)的連接中,為了獲得非線性的分類結(jié)果,導(dǎo)入了激勵(lì)函數(shù)(Activation Function)。這也是引發(fā)黑箱問題發(fā)生的重要隱患。

下面的問題就是在模式識別的應(yīng)用上,是特征向量的質(zhì)量重要,還是通過學(xué)習(xí)進(jìn)行分類重要?回答很簡單沒有好的特征向量的質(zhì)量再好的深度學(xué)習(xí)也是無濟(jì)于事的,在許多文章中都把深度學(xué)習(xí)可以直接抽取特征量作為深度學(xué)習(xí)的一大特點(diǎn)。其實(shí)深度學(xué)習(xí)在特征映射的方法上簡直是極其傳統(tǒng)的處理方法,而且并沒有考慮圖像信息并不只是灰度信息,所以深度學(xué)習(xí)在模式識別上的應(yīng)用特點(diǎn)只能停留在大量的學(xué)習(xí)的作用上,下一代的機(jī)器學(xué)習(xí)模型在特征向量抽取質(zhì)量上努力,也一定會(huì)產(chǎn)生更好的突出效果。

最后需要搞清的一個(gè)重要問題:深度學(xué)習(xí)的應(yīng)用效果好的機(jī)理是什么?為使我們所提出的模型可以超越“深度學(xué)習(xí)”,我們對“深度學(xué)習(xí)”的應(yīng)用效果好的機(jī)理做了一些研究,發(fā)現(xiàn)將目標(biāo)函數(shù)映射到大數(shù)據(jù)集上后,數(shù)據(jù)分類中的有效距離被擴(kuò)大了,比如人臉識別,被認(rèn)為是導(dǎo)入深度學(xué)習(xí)后應(yīng)用效果最明顯的案例,人臉的位置的特征信息充其量不過幾百個(gè),傳統(tǒng)的模式識別的效果所以不如深度學(xué)習(xí),這是因?yàn)閮蓚€(gè)最接近的特征向量的總體距離與概率分布的范圍之間的差是固定的,但是如果把人臉位置圖像信息通過深度學(xué)習(xí)的函數(shù)映射,大數(shù)據(jù)集可以“放大”幾百個(gè)人臉位置特征向量所構(gòu)成的距離,由于“深度學(xué)習(xí)”模型每增加一個(gè)中間層,復(fù)雜度為O(nn)就是一個(gè)指數(shù)性的提高,所以數(shù)據(jù)集的規(guī)模不可能無限增加,因此我們所提出的的新的模型的復(fù)雜度O(n2)如果是接近線性的,就一定可以實(shí)現(xiàn)超越深度學(xué)習(xí)的數(shù)據(jù)集規(guī)模的特征數(shù)據(jù)集,就一定可以在應(yīng)用上超越“深度學(xué)習(xí)”的效果。

在“深度學(xué)習(xí)”被神化的高潮中,欺騙了絕大多數(shù)業(yè)界的專家們的一個(gè)問題是:深度學(xué)習(xí)所采用如圖2所示的對損失函數(shù)的SGD評價(jià)方法,所得到的的訓(xùn)練結(jié)果是組合理論中的一個(gè)局域的最佳解,這一點(diǎn)深度學(xué)習(xí)的研究者在當(dāng)時(shí)并不理解,其實(shí)這么一個(gè)高次的組合空間不可能只有一個(gè)局域的最佳解。

image.png

圖2 隨機(jī)梯度下降法SDG示意圖

其實(shí)如圖3所示,深度學(xué)習(xí)的訓(xùn)練存在著復(fù)數(shù)個(gè)局域最佳解的事實(shí),20多年前已經(jīng)被一些例如Hopfild等的早期人工智能科學(xué)家所認(rèn)識,力圖用組合理論的最短路徑訪問的方法進(jìn)行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,

image.png

圖3 Hopfild的聯(lián)想記憶與最佳組合理論示意圖

遺憾的是神經(jīng)網(wǎng)絡(luò)的組合空間規(guī)模之大,屬于圖靈機(jī)不可解的NP問題,所以這些科學(xué)家的努力沒能成功,可是清楚的告訴我們后人傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)是走不下去的。

針對深度學(xué)習(xí)存在的上述問題,超深度學(xué)習(xí)一舉將深度學(xué)習(xí)所存在的所有問題全部給予解決。超深度學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)就是公式1所示的一個(gè)基于概率尺度的自組織的機(jī)器學(xué)習(xí)算法。

公式1

image.png

這里,給定一個(gè)屬于集合G的一組隨機(jī)分布的數(shù)值pi (i=1,2,…,m),某一集合Gn-1中必然存在一個(gè)最大概率值A(chǔ)n-1,以及可以標(biāo)定最大概率空間的尺度Mn-1,如果把最大概率空間看成是新的一集合Gn,就可以通過迭代,獲得最終可以超越統(tǒng)計(jì)學(xué)公式化的解,為了區(qū)別于傳統(tǒng)的統(tǒng)計(jì)學(xué)的結(jié)果,我們可以把An-1稱為最大幾率值,把Mn-1,稱為最大幾率空間的尺度。這就是概率尺度自組織的模型。

概率尺度自組織在圖像識別中,可以從一個(gè)小區(qū)域的若干個(gè)像素灰度值通過概率尺度自組織得到一個(gè)最大幾率值,用于表達(dá)該區(qū)域的圖像特征。概率尺度自組織還具有遷移特性,可以自律的朝著大概率的方向遷移,當(dāng)圖像移位時(shí)可以自動(dòng)的遷移,這是傳統(tǒng)模式識別所做不到的。

圖4是概率尺度自組織具有向大概率方向遷移的特性。 如圖4所示,概率尺度自組織在給定的任何地方,只要是初步滿足一定條件,通過迭代就可以自律的朝著大概率的方向遷移,中間遇到小概率的擾動(dòng),也可以跨越小概率的阻擋最終落在大概率的位置上。

image.png

圖4 概率尺度自組織具有向大概率方向遷移的特性示意圖

在自動(dòng)駕駛的車道線識別與障礙物的3D識別的應(yīng)用中,還可以驗(yàn)證概率尺度自組織可以無訓(xùn)練的將圖像中最大概率分布的目標(biāo)圖像直接識別出,還可以按照圖像中的各個(gè)最大概率的分布狀態(tài)進(jìn)行特征抽出,可以得到結(jié)構(gòu)化的特征信息抽出結(jié)果,從而實(shí)現(xiàn)圖像理解的識別效果。

例如圖5所示進(jìn)行人臉識別時(shí)可以自動(dòng)的尋找到概率分布最集中的人的臉部。傳統(tǒng)的摸著石頭過河的程序搜索方法存在一個(gè)嚴(yán)重的問題是需要對人臉膚色的事先定義,這樣不同膚色在程序規(guī)則上就要調(diào)整,需要大量的程序進(jìn)行規(guī)則堆積,嚴(yán)重影響人臉識別精度的提高,采用概率尺度自組織按照人臉圖像的顏色分布,在整個(gè)圖像中是最大的概率,可以直接通過概率尺度自組織的遷移特性直接獲得人臉位置。

image.png

圖5 用概率尺度自組織的遷移特性獲得人臉位置示意圖

概率尺度自組織的遷移軌跡,以及最終的結(jié)果需要嚴(yán)格的對應(yīng)數(shù)據(jù)空間,用一維的概率尺度衡量二維空間的數(shù)據(jù)就會(huì)產(chǎn)生錯(cuò)誤的結(jié)果。另外概率尺度自組織的解也符合最佳化解的特性,遷移路徑與結(jié)果具有一定的邊界條件。

在模式識別中需要計(jì)算樣本數(shù)據(jù)與學(xué)習(xí)后登錄數(shù)據(jù)之間的距離,我們在實(shí)際大量應(yīng)用中所接觸的數(shù)據(jù)證明概率空間一定是存在于歐幾里得空間的,也就是說在歐幾里德空間存在著無數(shù)個(gè)概率空間,因此如何找到一個(gè)跨越歐幾里得空間與概率空間的距離是提高模式識別的關(guān)鍵。這里我們提出了公式2的概率空間的距離的定義方法,設(shè) 與是兩個(gè)集合的要素, 與 分別是集合要素 與 的復(fù)數(shù)個(gè)學(xué)習(xí)數(shù)據(jù),通過多次的概率尺度自組織機(jī)器學(xué)習(xí)所得到的最大幾率空間的尺度,則從 的概率空間到 (j=1,2,…,n)的概率空間的跨越歐幾里得空間與概率空間的距離G可定義如下:

公式2

image.png

公式2雖然是定義出來的,但是可以嚴(yán)格證明其正確性,因?yàn)楦怕士臻g是測度等于1的空間,在概率空間中的距離誤差是概率密度,也可以證明最大幾率空間尺度就是概率密度的近似值。

下面具體介紹超深度學(xué)習(xí)的架構(gòu),超深度學(xué)習(xí)與普通的深度學(xué)習(xí)最大的不同是,傳統(tǒng)的深度學(xué)習(xí)是通過層與層之間的復(fù)雜連接關(guān)系產(chǎn)生海量數(shù)據(jù),這種人為的將問題復(fù)雜化恐怕是典型學(xué)界的做法,這種做法可以引起眾多的學(xué)者們的興趣,是起到推動(dòng)人工智能在理論上的完善必不可少的過程,幾乎科學(xué)技術(shù)的發(fā)展都需要這個(gè)過程,當(dāng)發(fā)展到一定程度時(shí),必定有人出來從另一條路出發(fā)將多年積累的理論顛覆,產(chǎn)生可以實(shí)際應(yīng)用的新理論。人工智能也一定要走這一道路。超深度學(xué)習(xí)就是拋磚引玉引發(fā)新一代人工智能創(chuàng)出的理論之一,同深度學(xué)習(xí)不同的是超深度學(xué)習(xí)是概率模型,可直接對數(shù)據(jù)進(jìn)行概率尺度自組織機(jī)器學(xué)習(xí),可以定量的對輸入的隨機(jī)分布信息進(jìn)行分析,對數(shù)據(jù)進(jìn)行分類,沉淀深層信息,最終產(chǎn)生定量化的識別與分類,使傳統(tǒng)的系統(tǒng)只有通過實(shí)際數(shù)據(jù)的驗(yàn)證才可以知道識別精度與數(shù)據(jù)分類精度,成為識別結(jié)果的精度可計(jì)算性的系統(tǒng),從而使模式識別與數(shù)據(jù)分類進(jìn)入一個(gè)嶄新的時(shí)代。

1627979530269297.png

圖6 超深度學(xué)習(xí)架構(gòu)示意圖

超深度學(xué)習(xí)始終基于最大概率尺度的自組織,所以是一個(gè)新的無監(jiān)督學(xué)習(xí)模型,無需海量數(shù)據(jù)來承載目標(biāo)函數(shù)的信息,是對具有隨機(jī)特性的輸入數(shù)據(jù)的直接學(xué)習(xí),可以產(chǎn)生非常高效率的處理效果,無需巨大的硬件支持,一個(gè)最低的硬件配置就完全可以實(shí)現(xiàn)各種的人工智能的應(yīng)用,可做到的最佳分類,最佳的模式識別處理結(jié)果。

超深度學(xué)習(xí)如圖6所示;超深度學(xué)習(xí)的每一個(gè)功能單元是由輸入層,腦神經(jīng)層,以及腦皮層組成的新型神經(jīng)網(wǎng)絡(luò)。在輸入層與腦神經(jīng)層之間的節(jié)點(diǎn)與節(jié)點(diǎn)之間直接連接著大量的概率尺度的自組織機(jī)器學(xué)習(xí),構(gòu)成了分散機(jī)器學(xué)習(xí)處理系統(tǒng)。

在超深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)的層數(shù)是與大腦一致,在圖像識別時(shí),提取的是圖像最大概率的特征值,判斷每一個(gè)特征值是否屬于某個(gè)已登陸的特征向量,是以最大幾率空間的尺度為依據(jù),相當(dāng)于最大幾率空間的尺度是一個(gè)神經(jīng)元的閥值,所對應(yīng)的腦神經(jīng)層的節(jié)點(diǎn)就產(chǎn)生一個(gè)腦神經(jīng)信號輸入到腦皮層,以最大幾率空間的尺度為基準(zhǔn)值刺激腦皮層,腦皮層被刺激的信號越多越興奮,依據(jù)腦皮層的興奮程度決定是否為目標(biāo)函數(shù)信息,這豈不是與大腦的機(jī)理非常接近嗎?最大幾率空間的尺度就相當(dāng)于腦神經(jīng)的閥值,并不是深度學(xué)習(xí)中人為定義的參數(shù),因此大腦機(jī)理應(yīng)該建立在概率空間的模型上,通過超深度學(xué)習(xí)的架構(gòu)終于搞清楚了,這也是通過算法仿真生物神經(jīng)的機(jī)理的一個(gè)重要的成果。

1627979561436467.png

圖7 在如何深入上超深度學(xué)習(xí)與深度學(xué)習(xí)的比較

下面讀者會(huì)問超深度學(xué)習(xí)只有三層如何深入,當(dāng)今的潮流是大模型,大數(shù)據(jù),大硬件構(gòu)成的大系統(tǒng)是主流。如圖7所示;深度學(xué)習(xí)是靠大量的增加層數(shù),由于復(fù)雜度是指數(shù)性的,其結(jié)果使系統(tǒng)很快就超負(fù)荷了。超深度學(xué)習(xí)是按照導(dǎo)入解決復(fù)雜系統(tǒng)問題的空間映射原理,可以把任何的復(fù)雜系統(tǒng)的目標(biāo)函數(shù)映射到任意多的子空間,針對每一個(gè)子空間的目標(biāo)函數(shù)的信息用增加輸入層的節(jié)點(diǎn)的方法進(jìn)行深入,這使超深度學(xué)習(xí)可以把目標(biāo)函數(shù)的處理無限的深入下去,卻不增加系統(tǒng)的復(fù)雜度O(n2)。利用這個(gè)特點(diǎn)可以無限的增加特征數(shù)據(jù)集的規(guī)模,深度學(xué)習(xí)的數(shù)據(jù)集只能幾百萬個(gè),而超深度學(xué)習(xí)可以達(dá)到數(shù)萬以至數(shù)億個(gè)以上,隨著系統(tǒng)應(yīng)用的需要可以無限的增加機(jī)器學(xué)習(xí)的數(shù)量,可以預(yù)測今后的人工智能系統(tǒng)用的能力指標(biāo)將以有多少個(gè)機(jī)器學(xué)習(xí)來計(jì)算。50年來的計(jì)算機(jī)由簡單的門電路組成發(fā)展至今原理沒有任何變化,使用的門電路的規(guī)模卻發(fā)生了巨大的變化,計(jì)算機(jī)的性能也出現(xiàn)了驚人的提高,相信未來的人工智能系統(tǒng)由眾多的機(jī)器學(xué)習(xí)組成的,其能力不管如何過高的估計(jì)也不會(huì)過分。

再有在目標(biāo)函數(shù)概率分布模型的優(yōu)勢上,通過小數(shù)據(jù)的訓(xùn)練可以獲得目標(biāo)函數(shù)的概率分布,可以相當(dāng)于無窮的函數(shù)映射的效果。這也是深度學(xué)習(xí)所望塵莫及的。由于超深度學(xué)習(xí)可以構(gòu)造比深度學(xué)習(xí)還大規(guī)模的分散機(jī)器學(xué)習(xí)模型,可以通過小數(shù)據(jù)的訓(xùn)練獲得超過深度學(xué)習(xí)的還要大規(guī)模的特征數(shù)據(jù)集,以及無限多的機(jī)器學(xué)習(xí)所構(gòu)成的大的分散處理硬件系統(tǒng),因此超深度學(xué)習(xí)更加適應(yīng)時(shí)代潮流。

超深度學(xué)習(xí)的實(shí)際應(yīng)用的例子之一是如圖8所示;

1627979589109650.png

圖8超深度學(xué)習(xí)實(shí)現(xiàn)圖像變換代碼的例子

將任意一個(gè)圖像通過手機(jī)拍照后,通過超深度學(xué)習(xí)變換成一個(gè)1036的代碼,導(dǎo)入了超深度學(xué)習(xí)無需通過噴印標(biāo)記的方式構(gòu)成光學(xué)可讀性二維碼,而是靠圖像的灰度的自然分布,自組織成一個(gè)二維碼,也就是說可以通過手機(jī)拍攝商品標(biāo)識,直接生成一個(gè)可以連接網(wǎng)絡(luò)的二維碼,讓全世界的商品一夜之間就可連接網(wǎng)絡(luò)。

超深度學(xué)習(xí)的圖像直接生成代碼,是對市場流行的開源程序AR圖像識別技術(shù)的顛覆,AR技術(shù)是通過傳統(tǒng)的圖像輪廓識別,產(chǎn)生一個(gè)將近10兆字節(jié)識別結(jié)果的文件,由于識別結(jié)果所占用的容量,遠(yuǎn)比圖像本身的容量要大,所以一般識別引擎是放到網(wǎng)絡(luò)服務(wù)器上,用手機(jī)將被識別的圖像送到網(wǎng)上,網(wǎng)絡(luò)服務(wù)器識別圖像后將網(wǎng)絡(luò)下載的結(jié)果送回手機(jī),這樣的應(yīng)用如果網(wǎng)絡(luò)環(huán)境差,就得不到很好的用戶體驗(yàn)。超深度學(xué)習(xí)克服了由于手機(jī)在不同情況下拍攝的圖像所產(chǎn)生的非常大的隨機(jī)分布信息,通過概率尺度的自組織變換成一個(gè)穩(wěn)定的代碼,這個(gè)代碼不到十個(gè)字節(jié),可以把識別引擎放到手機(jī)上做在線圖像變換代碼的應(yīng)用。

超深度學(xué)習(xí)與深度學(xué)習(xí)在機(jī)理上的比較表1.

image.png

超深度學(xué)習(xí)與普通的深度學(xué)習(xí)的對比如表1所示;首先從方法上進(jìn)行比較:

深度學(xué)習(xí)是在歐幾里得空間里訓(xùn)練出海量的參數(shù),用海量的參數(shù)承載目標(biāo)函數(shù)的信息,超深度學(xué)習(xí)是直接針對輸入的隨機(jī)分布數(shù)據(jù)進(jìn)行概率空間的自組織機(jī)器學(xué)習(xí),將隨機(jī)分布的數(shù)據(jù)進(jìn)行去偽存真的處理,得出定量的并且穩(wěn)定的最大概率的解,以及可以提煉出深層的信息。

在前面已經(jīng)討論了,深度學(xué)習(xí)是將目標(biāo)函數(shù)映射到數(shù)據(jù)集的模型,因此面對具有隨機(jī)特性的數(shù)據(jù),需要數(shù)百萬次的訓(xùn)練,需要付出巨大的數(shù)據(jù)標(biāo)注費(fèi)用。超深度學(xué)習(xí)是概率模型,通過概率分布信息可以將小數(shù)據(jù)的訓(xùn)練生成具有無限映射效果的概率分布。

在計(jì)算復(fù)雜度上兩種模型具有截然不同的區(qū)別,因此在硬件開銷上差距很大,在相同硬件環(huán)境下,超深度學(xué)習(xí)具有超越深度學(xué)習(xí)的應(yīng)用效果是不可置疑的。

深度學(xué)習(xí)是把概率空間的數(shù)據(jù)映射到歐幾里得空間的,所以要對概率空間的隨機(jī)數(shù)據(jù)進(jìn)行全部的訓(xùn)練,致使應(yīng)用成本巨大不易普及。

特別是深度學(xué)習(xí)的應(yīng)用效果是靠數(shù)據(jù)集的規(guī)模所產(chǎn)生的,超深度學(xué)習(xí)不僅在概率模型上優(yōu)于深度學(xué)習(xí),在特征集的規(guī)模上同樣可以超越深度學(xué)習(xí)的數(shù)據(jù)規(guī)模,因此超深度學(xué)習(xí)在應(yīng)用效果上超越深度學(xué)習(xí)是名副其實(shí)的。

超深度學(xué)習(xí)與深度學(xué)習(xí)在應(yīng)用效果上的比較表2.

image.png

如表2所示;在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)上深度學(xué)習(xí)是數(shù)十層乃至數(shù)百層,這樣就使問題的復(fù)雜度急劇擴(kuò)大,造成組合的空間無窮的大,導(dǎo)致不可能得到最佳組合的解,因此出現(xiàn)黑箱問題等,超深度學(xué)習(xí)同大腦的構(gòu)造近似,只有輸入層,腦神經(jīng)層,以及腦皮層三層,而且數(shù)學(xué)模型很接近大腦的機(jī)理,證明超深度學(xué)習(xí)符合大腦的機(jī)理。

再有,在模型能力擴(kuò)大的方法上深度學(xué)習(xí)是靠增加隱藏層的數(shù)量來實(shí)現(xiàn)的!超深度學(xué)習(xí)是靠增加輸入層的節(jié)點(diǎn)的個(gè)數(shù),通過將復(fù)雜系統(tǒng)空間的映射,把目標(biāo)函數(shù)變換成若干子空間,并把子空間的特征分量對應(yīng)輸入層的各個(gè)節(jié)點(diǎn),通過擴(kuò)大節(jié)點(diǎn)的個(gè)數(shù)達(dá)到深入學(xué)習(xí)的目的。

下面準(zhǔn)備介紹一下我和我的團(tuán)隊(duì)正在進(jìn)行的超深度學(xué)習(xí)視覺芯片的開發(fā)情況。

圖9是超深度學(xué)習(xí)視覺芯片的構(gòu)成,這個(gè)項(xiàng)目是同由日立,NEC以及三菱電機(jī),三個(gè)公司的半導(dǎo)體事業(yè)部剝離組建的日本最大的芯片公司RENESAS公司聯(lián)合開發(fā)的,采用硬件加軟件的形式。對于非常占用處理時(shí)間的顏色變換,以及為盡可能獲取圖像的本來信息,針對圖像的空間映射等采用硬件處理,算法用軟件處理。超深度學(xué)習(xí)獨(dú)特的兩種對抗學(xué)習(xí)以及無監(jiān)督學(xué)習(xí)的算法均在這一款芯片里搭載,因此,可以使這一芯片在圖像感知方面做到傳統(tǒng)的算法無可比擬的天衣無縫的精度與應(yīng)用效果。

image.png

圖9 超深度學(xué)習(xí)視覺芯片的構(gòu)成

我們的超深度學(xué)習(xí)的研發(fā)戰(zhàn)略是,首先從算法上布局,既然已經(jīng)證實(shí),導(dǎo)入超深度學(xué)習(xí)可以顛覆傳統(tǒng)的統(tǒng)計(jì)學(xué)的兩大參數(shù),那么與這兩大參數(shù)有關(guān)的相關(guān)分析,回歸分析等等大量的統(tǒng)計(jì)學(xué)的數(shù)學(xué)模型,將成為超深度學(xué)習(xí)的重要架構(gòu),這些成果可以分別通過論文的形式發(fā)表。同時(shí)將深度學(xué)習(xí)理論作為一個(gè)鏡子,逐一的將深度學(xué)習(xí)的一些特殊的算法在超深度學(xué)習(xí)上實(shí)現(xiàn),在應(yīng)用上從圖像感知,語音感知到預(yù)測推論等的應(yīng)用可視化,在推廣上從提供SDK程序,SDL應(yīng)用電路板,SDL芯片以及開源平臺(tái),聯(lián)合開發(fā)等等分別進(jìn)行,我們是原創(chuàng)單位因此不同我們的用戶競爭,我們的角色是技術(shù)提供與服務(wù),以及基礎(chǔ)性開發(fā),因此不獨(dú)立的進(jìn)行具體項(xiàng)目的開發(fā),可以為從事AI事業(yè)的創(chuàng)業(yè)公司進(jìn)行技術(shù)合作以及技術(shù)入股。

作為我們奉獻(xiàn)社會(huì)的超深度學(xué)習(xí),由于不是通過組合方式訓(xùn)練海量的參數(shù)的,是直接對隨機(jī)分量的數(shù)據(jù)進(jìn)行概率自組織的學(xué)習(xí),因此不存在黑箱問題。而且,最大的特點(diǎn)是硬件要求門檻極低,普通一個(gè)芯片,任何一個(gè)移動(dòng)終端都可以立即應(yīng)用。超深度學(xué)習(xí)的基礎(chǔ)理論概念清楚,算法簡單易懂,是可以大量普及的一個(gè)為大眾服務(wù)的AI算法。人工智能是國家戰(zhàn)略,自動(dòng)駕駛汽車是反映人工智能的國家水平的標(biāo)準(zhǔn)。為了證明超深度學(xué)習(xí)的能力,我們在社會(huì)的廣泛支持下,正在自動(dòng)駕駛汽車的開發(fā)上驗(yàn)證超深度學(xué)習(xí)的應(yīng)用效果。目前所有的自動(dòng)駕駛研發(fā)團(tuán)隊(duì),都因?yàn)榭刂七^于復(fù)雜沒有現(xiàn)成的人工智能模型的支持,而處于停滯不前的現(xiàn)狀。我們寄托超深度學(xué)習(xí)可以沖破自動(dòng)駕駛的難關(guān),使L4級別的自動(dòng)駕駛不再是偽命題。

我是中國人,我愿意將我發(fā)明的超深度學(xué)習(xí)在中國產(chǎn)業(yè)化,為中國及世界的人工智能發(fā)展服務(wù)。我現(xiàn)在是中國軟件行業(yè)協(xié)會(huì)嵌入式系統(tǒng)分會(huì)和中國嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟的理事、擔(dān)任著中國嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟新一代人工智能專業(yè)委員會(huì)主任職務(wù)。為促進(jìn)超深度學(xué)習(xí)在中國的產(chǎn)業(yè)化,我已將超深度學(xué)習(xí)的宣傳和產(chǎn)業(yè)化的代理授權(quán)給中國嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟的負(fù)責(zé)人。希望通過中國嵌入式系統(tǒng)產(chǎn)業(yè)聯(lián)盟的積極組織,加快進(jìn)行超深度學(xué)習(xí)的產(chǎn)業(yè)化工作。我衷心的希望國家有關(guān)部門和相關(guān)的企事業(yè)單位大力支持超深度學(xué)習(xí)的產(chǎn)業(yè)化。歡迎從事人工智能的研究和應(yīng)用的單位及專家、學(xué)者、技術(shù)人員加入到超深度學(xué)習(xí)的研究與推廣隊(duì)伍中來,共同為早日實(shí)現(xiàn)超深度學(xué)習(xí)的產(chǎn)業(yè)化做努力!



關(guān)鍵詞:

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉