機器學(xué)習(xí)的基礎(chǔ)圖表?。?)
來源:機器之心、深度學(xué)習(xí)愛好者
[ 導(dǎo)讀 ] 四大會計師事務(wù)所之一的普華永道(PwC)發(fā)布了多份解讀機器學(xué)習(xí)基礎(chǔ)的圖表,其中介紹了機器學(xué)習(xí)的基本概念、原理、歷史、未來趨勢和一些常見的算法。為便于讀者閱讀,我們對這些圖表進(jìn)行了編譯和拆分,分三大部分對這些內(nèi)容進(jìn)行了呈現(xiàn),希望能幫助你進(jìn)一步擴展閱讀。
一、機器學(xué)習(xí)概覽
1. 什么是機器學(xué)習(xí)?
機器通過分析大量數(shù)據(jù)來進(jìn)行學(xué)習(xí)。比如說,不需要通過編程來識別貓或人臉,它們可以通過使用圖片來進(jìn)行訓(xùn)練,從而歸納和識別特定的目標(biāo)。
2. 機器學(xué)習(xí)和人工智能的關(guān)系
機器學(xué)習(xí)是一種重在尋找數(shù)據(jù)中的模式并使用這些模式來做出預(yù)測的研究和算法的門類。機器學(xué)習(xí)是人工智能領(lǐng)域的一部分,并且和知識發(fā)現(xiàn)與數(shù)據(jù)挖掘有所交集。
3. 機器學(xué)習(xí)的工作方式
①選擇數(shù)據(jù):將你的數(shù)據(jù)分成三組:訓(xùn)練數(shù)據(jù)、驗證數(shù)據(jù)和測試數(shù)據(jù)。
②模型數(shù)據(jù):使用訓(xùn)練數(shù)據(jù)來構(gòu)建使用相關(guān)特征的模型。
③驗證模型:使用你的驗證數(shù)據(jù)接入你的模型。
④測試模型:使用你的測試數(shù)據(jù)檢查被驗證的模型的表現(xiàn)。
⑤使用模型:使用完全訓(xùn)練好的模型在新數(shù)據(jù)上做預(yù)測。
⑥調(diào)優(yōu)模型:使用更多數(shù)據(jù)、不同的特征或調(diào)整過的參數(shù)來提升算法的性能表現(xiàn)。
4. 機器學(xué)習(xí)所處的位置
①傳統(tǒng)編程:軟件工程師編寫程序來解決問題。首先存在一些數(shù)據(jù)→為了解決一個問題,軟件工程師編寫一個流程來告訴機器應(yīng)該怎樣做→計算機遵照這一流程執(zhí)行,然后得出結(jié)果。
②統(tǒng)計學(xué):分析師比較變量之間的關(guān)系。
③機器學(xué)習(xí):數(shù)據(jù)科學(xué)家使用訓(xùn)練數(shù)據(jù)集來教計算機應(yīng)該怎么做,然后系統(tǒng)執(zhí)行該任務(wù)。首先存在大數(shù)據(jù)→機器會學(xué)習(xí)使用訓(xùn)練數(shù)據(jù)集來進(jìn)行分類,調(diào)節(jié)特定的算法來實現(xiàn)目標(biāo)分類→該計算機可學(xué)習(xí)識別數(shù)據(jù)中的關(guān)系、趨勢和模式。
④智能應(yīng)用:智能應(yīng)用使用人工智能所得到的結(jié)果,如圖是一個精準(zhǔn)農(nóng)業(yè)的應(yīng)用案例示意,該應(yīng)用基于無人機所收集到的數(shù)據(jù)。
5. 機器學(xué)習(xí)的實際應(yīng)用
機器學(xué)習(xí)有很多應(yīng)用場景,這里給出了一些示例,你會怎么使用它?
快速三維地圖測繪和建模:要建造一架鐵路橋,PwC 的數(shù)據(jù)科學(xué)家和領(lǐng)域?qū)<覍C器學(xué)習(xí)應(yīng)用到了無人機收集到的數(shù)據(jù)上。這種組合實現(xiàn)了工作成功中的精準(zhǔn)監(jiān)控和快速反饋。
增強分析以降低風(fēng)險:為了檢測內(nèi)部交易,PwC 將機器學(xué)習(xí)和其它分析技術(shù)結(jié)合了起來,從而開發(fā)了更為全面的用戶概況,并且獲得了對復(fù)雜可疑行為的更深度了解。
預(yù)測表現(xiàn)最佳的目標(biāo):PwC 使用機器學(xué)習(xí)和其它分析方法來評估 Melbourne Cup 賽場上不同賽馬的潛力。
二、機器學(xué)習(xí)的演化
幾十年來,人工智能研究者的各個「部落」一直以來都在彼此爭奪主導(dǎo)權(quán)?,F(xiàn)在是這些部落聯(lián)合起來的時候了嗎?他們也可能不得不這樣做,因為合作和算法融合是實現(xiàn)真正通用人工智能(AGI)的唯一方式。這里給出了機器學(xué)習(xí)方法的演化之路以及未來的可能模樣。
1. 五大流派
①符號主義:使用符號、規(guī)則和邏輯來表征知識和進(jìn)行邏輯推理,最喜歡的算法是:規(guī)則和決策樹
②貝葉斯派:獲取發(fā)生的可能性來進(jìn)行概率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫
③聯(lián)結(jié)主義:使用概率矩陣和加權(quán)神經(jīng)元來動態(tài)地識別和歸納模式,最喜歡的算法是:神經(jīng)網(wǎng)絡(luò)
④進(jìn)化主義:生成變化,然后為特定目標(biāo)獲取其中最優(yōu)的,最喜歡的算法是:遺傳算法
⑤Analogizer:根據(jù)約束條件來優(yōu)化函數(shù)(盡可能走到更高,但同時不要離開道路),最喜歡的算法是:支持向量機
2. 演化的階段
1980 年代
主導(dǎo)流派:符號主義
架構(gòu):服務(wù)器或大型機
主導(dǎo)理論:知識工程
基本決策邏輯:決策支持系統(tǒng),實用性有限
1990 年代到 2000 年
主導(dǎo)流派:貝葉斯
架構(gòu):小型服務(wù)器集群
主導(dǎo)理論:概率論
分類:可擴展的比較或?qū)Ρ龋瑢υS多任務(wù)都足夠好了
2010 年代早期到中期
主導(dǎo)流派:聯(lián)結(jié)主義
架構(gòu):大型服務(wù)器農(nóng)場
主導(dǎo)理論:神經(jīng)科學(xué)和概率
識別:更加精準(zhǔn)的圖像和聲音識別、翻譯、情緒分析等
3. 這些流派有望合作,并將各自的方法融合到一起
2010 年代末期
主導(dǎo)流派:聯(lián)結(jié)主義+符號主義
架構(gòu):許多云
主導(dǎo)理論:記憶神經(jīng)網(wǎng)絡(luò)、大規(guī)模集成、基于知識的推理
簡單的問答:范圍狹窄的、領(lǐng)域特定的知識共享
2020 年代+
主導(dǎo)流派:聯(lián)結(jié)主義+符號主義+貝葉斯+……
架構(gòu):云計算和霧計算
主導(dǎo)理論:感知的時候有網(wǎng)絡(luò),推理和工作的時候有規(guī)則
簡單感知、推理和行動:有限制的自動化或人機交互
2040 年代+
主導(dǎo)流派:算法融合
架構(gòu):無處不在的服務(wù)器
主導(dǎo)理論:最佳組合的元學(xué)習(xí)
感知和響應(yīng):基于通過多種學(xué)習(xí)方式獲得的知識或經(jīng)驗采取行動或做出回答
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。