史無前例!蘋果開誠布公談機器學習
即使是如此重視保密的蘋果,現(xiàn)在隨著時勢的改變,一些東西也和過去不一樣了,最明顯的莫過于它對人工智能和機器學習技術的態(tài)度。我們已經(jīng)看到了一個更加開放的蘋果,它在機器學習這個領域的進展如何呢?今天大家已經(jīng)可以清楚地了解了。
本文引用地址:http://m.butianyuan.cn/article/201707/362056.htm我們都知道蘋果是一家特別注重保密文化的公司,基本上只有在新產(chǎn)品公開的那一刻,你才會真正從官方的口中了解到它是什么樣的,而它又使用了些什么材料和什么技術。這樣的文化曾經(jīng)為我們帶來無數(shù)驚喜,但時過境遷,堅持這種作風的蘋果似乎遇到了新的困境。
所以近兩年來,我們看到了一個和過去不太一樣的蘋果。它比起以往,似乎更加愿意和外界分享自己的科技成果。當然了,保密策略肯定是主旋律,但好歹是有了例外 —— 比如說機器學習。
在這一段時間里,我們看到了蘋果高管們更多地拋頭露面,向媒體談及他們對人工智能和機器學習的看法。在蘋果的發(fā)布會中,“機器學習”成為了一個高頻詞匯。前一陣子,高管們還集體在訪談中放聲“我們的機器學習技術也很先進”,并透露了公司一直以來對該技術的應用實例。
在這之后,蘋果宣布旗下的人工智能團隊可以參與相關的學術討論,并允許研究者發(fā)表論文。不久前蘋果的人工智能專家湯姆·格魯伯還在 TED 大會上,闡述了蘋果如何看待這種技術。對粉絲們來說,蘋果這么做在過去幾乎是不可想象的。
似乎是為了證明它之前的那些承諾真的不是空話,蘋果就在剛剛開放了一個博客,專門刊載公司的機器學習進度。這前所未有的決定,將讓我們看到蘋果怎樣的機器學習成就呢?
蘋果的技術進展
我們都知道,人工智能有一項很重要的應用就是圖像識別,而這也是蘋果在最近幾次系統(tǒng)升級中著重強調的,通過照片的自動整理分類,事實上我們也已經(jīng)用上了這些技術。
那么要如何讓設備能夠準確判斷圖片上的東西究竟是什么呢?那就需要訓練了。人類首先要找好大量被手動標注是某樣物體的,確定無誤的圖片,比如最簡單的“貓”、“狗”、“眼睛”這些,然后讓機器去學習和辨認,這樣它才能開始嘗試自己識別類似的圖片。
蘋果表示,這樣的過程成本實在是太高,因為要提高機器識別的準確率,圖片數(shù)量必須非常龐大,據(jù)了解目前是 100 萬張起步,如果還要再多人工標注就幾乎不可能。而且,這些圖片還得擁有足夠的多樣性,畢竟可以被標注為“貓”、“狗”、“眼睛”的圖片種類太多了,太過單一,機器如果遇到更復雜的情況就可能會認不出了。
當然還有一種辦法:既然人工標注圖片數(shù)量越多越難實現(xiàn),那么可以使用模擬的手段,自動生成海量自動被標注好的圖片,讓機器去不斷進行識別。然而這種解決方案也有一個大問題,那就是自動生成的圖片往往不夠真實,這樣會極大影響到人工智能識別圖片的準確性。蘋果的第一篇博文,就是嘗試去解決這個難題的。
其實蘋果的思路很簡單:如果模擬器生成的圖片不夠真實,那就讓它變得更真實就好了。有趣的是,研究者們?yōu)榇擞衷O計了一套學習網(wǎng)絡。
根據(jù)博文所說,蘋果為達到這個目的,開發(fā)出了所謂的精制器(Refiner R)和辨別器(Discriminator D)。當模擬器生成圖片后,精制器 R 負責讓它變得更加真實,以通過辨別器的考驗。辨別器的數(shù)據(jù)庫中有大量的真實圖片(有趣的是,蘋果表示這些圖片可以是未標注的 —— 又省一筆人工費),它負責根據(jù)這些真實圖片,辨別精制器給它的圖片是否為真。
精制器千方百計要騙過辨別器,而后者則要努力認清前者的“鬼把戲”。兩個機制在不斷地“斗法”中提升著自己的能力,直到辨別器再也分不清,學習過程就算完成了。這樣,就能夠在不需要人工標注的情況下,生成海量接近真實的圖片讓人工智能不斷去學習了,如此就可以大量減少成本。
還有一點很重要,那就是蘋果必須要保證整個學習過程不“跑偏”。因為在精制器和辨別器不停較量和升級的過程中,難保會因為各種各樣的因素,讓精制器修改的圖片和辨別器認定的標準開始走極端,讓最終得到的圖片直接變形。所以蘋果加入了一些規(guī)范機制。
首先蘋果將一幅圖片分成許多部分,然后根據(jù)這些部分中的像素特征,對較量中出現(xiàn)的失真進行統(tǒng)計,失真偏差越大,判定損失就越大。除了局部的判定外,還有一個整體的自我規(guī)范損失機制,建立一個生成圖片修改前后的差異對比。局部和整體結合,保證了圖片不會在這個過程中發(fā)生很大的異變。除此之外辨別器本身也有記憶功能,能夠記住那些之前已經(jīng)被判定為假的圖片。
還有一點很有趣,那就是蘋果暫時還沒有找到讓系統(tǒng)自動判定學習中止的辦法,目前只能是保存學習過程中的所有圖片,人工目測生成圖像已經(jīng)和真實非常接近時中止學習。
采用了這樣的解決方案,據(jù)說效果還是非常不錯的。蘋果曾邀請志愿者接受測試,10 位志愿者看了 1000 組圖片,分別有真實圖片和經(jīng)過精制器修改的生成圖片。成功分辨出真實圖片的有 517 組,概率上接近 50%,說明人們無法確定圖片真假,更多是 2 選 1 的概率。而當志愿者們去看真實圖片和原始生成圖片時,200 組圖片他們成功分辨出了多達 162 組。
好戲還在后頭
從蘋果的這第一篇博文中,我們可以清楚地看到它在機器學習領域的進展和思路,可以說是史無前例的開誠布公。它這么做,自然是為了表明自己在人工智能領域并沒有落后,希望能夠因此吸引更多人才。
人工智能和機器學習作為蘋果未來技術發(fā)展和產(chǎn)品功能開發(fā)的重頭戲,我們會在越來越多的發(fā)布會上看到它們的身影。如果你對此曾經(jīng)也有疑慮,那么蘋果現(xiàn)在就是在不斷表明自己的態(tài)度,讓人們放心。
博客開了,這也只是第一篇博文而已??上攵?,未來蘋果還會公布更多它的技術進展。在解決了圖像識別的問題后,接下來它還會用機器學習來實現(xiàn)什么呢?這實在是讓人期待啊。
評論