中美人工智能領(lǐng)域的差距實際有多大?(一)
從現(xiàn)在開始我想聊一聊大家最關(guān)心的這個題目。
本文引用地址:http://m.butianyuan.cn/article/202405/458765.htm談到中美兩國在AI領(lǐng)域的差距時我想絕大多數(shù)人都會認為我們一定是落后于美國。這種觀念是無可非議的。從本次AI高潮主流算法的深度學習模型就是美國的,當今的基礎(chǔ)大模型的發(fā)展來看,確實也是美國遙遙領(lǐng)先。
在這種情況下我國的研究人員感到無能為力!那么必定我國的AI就一定趕不上美國嗎?
我認為要趕上美國首先就要調(diào)整我們的創(chuàng)造意識!AI的思路被美國牽引著,跟隨美國的AI模型的發(fā)展,我們就不可能超越美國!
比如深度學習模型,依靠深度神經(jīng)網(wǎng)絡(luò)的學習,可以提高識別精度,這已經(jīng)被業(yè)界認可了。但是,深度神經(jīng)網(wǎng)絡(luò)的效率極低,無功消耗極大!這種模型出自于連接主義的神經(jīng)網(wǎng)絡(luò)學派,是被數(shù)學上的NP問題所綁架。
事實上應(yīng)用效果的好壞與網(wǎng)絡(luò)連接的規(guī)模無關(guān)。
無需復(fù)雜鏈接,依靠高智慧密度的訓(xùn)練數(shù)據(jù),依靠把握被識別對象的真實的物理世界的全貌,依靠核函數(shù)的高維平面分類,依靠概率尺度自組織可對被識別的數(shù)據(jù)的進行最大概率的選擇,可以做到如同人類識別物體那樣一回生二回熟越識別精度越高。這樣的屬于AGI時代的自動機器學習模型自然會遙遙領(lǐng)先于目前的深度學習模型的。
那么目前流行的生成式AI一定要消耗巨大的能源嗎?其實,從理論上講根本不需要!
還在被機器學習模型束縛的Transformer算法,在NLP上比起把類似的單詞捆綁在一起通過深度學習訓(xùn)練出詞向量的算法相比具有突破性的進步。但是,NLP的處理不像模式識別那樣需要具有很好的泛化能力,從網(wǎng)絡(luò)上訓(xùn)練的相同語意的單詞的頻率的大小是相對確定性的,語言的語法關(guān)系也是相對確定性的,因此不需要做到模式識別所需要的泛化能力。特別是在兩個矩陣的之間注意力機制的計算通過矩陣乘法才能獲得,這是很笨的方法。生成式AI的效果完全取決于所訓(xùn)練出的語言數(shù)據(jù)的參數(shù)的多少!因此回避復(fù)雜連接的神經(jīng)網(wǎng)絡(luò),使用低能耗的邏輯推理模型照樣可以訓(xùn)練出超越傳統(tǒng)生成式AI的數(shù)據(jù)參數(shù)的數(shù)量,一定可以獲得接近人的大腦的功耗,而超越大模型的生成式AI的效果!從生成式AI的機理上搞清楚了就一定可以成功的。
僅舉如上的兩個例子足以說明,只要我們改變思路就一定可以超越美國的AI水平。
特別是神經(jīng)網(wǎng)絡(luò)學派堅持復(fù)雜連接,這是愚蠢的違背科學的,必然走不下去的,美國推崇的生成式AI僅僅一個自然語言的應(yīng)用就出現(xiàn)能源危機,這是違背科學的結(jié)果。我們只要堅持科學的方法論,悶頭走自己的路,當美國的AI領(lǐng)域研究者發(fā)現(xiàn)自己走不下去的時候,我們已經(jīng)在AGI的時代里奮勇直前。
評論