DeepMind與Waymo合作提高AI精度加速模型訓(xùn)練

作者：時(shí)間：2019-07-31 來源：新浪科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

據(jù)美國科技媒體Venturebeat報(bào)道，谷歌的兩家兄弟公司——Waymo與DeepMind正在合作。他們最近在一篇博客文章中透露，雙方共同開發(fā)受進(jìn)化生物啟發(fā)的技術(shù)。

本文引用地址：http://m.butianyuan.cn/article/201907/403242.htm

Waymo解釋說，AI算法通過反復(fù)試驗(yàn)和試錯(cuò)來自我改進(jìn)。模型被賦予一個(gè)任務(wù)，需要通過根據(jù)其收到的反饋，持續(xù)嘗試和調(diào)整，來學(xué)習(xí)如何完成任務(wù)。任務(wù)的完成情況很大程度上取決于訓(xùn)練的方案，而尋找最合適的訓(xùn)練方案經(jīng)常是經(jīng)驗(yàn)豐富的研究人員和工程師的工作。他們精心挑選接受培訓(xùn)的AI模型，剔除表現(xiàn)最差的模型并釋放資源，從零開始訓(xùn)練新算法。

DeepMind在PBT（基于人口的訓(xùn)練）中設(shè)計(jì)了一種勞動(dòng)密集度較低的方法，該方法從隨機(jī)變量（超參數(shù)）生成的多個(gè)機(jī)器學(xué)習(xí)模型開始。模型定期進(jìn)行評估，并以進(jìn)化的方式互相競爭，從而表現(xiàn)不佳的模型會(huì)被“后代”取代（具有微量變異變量的表現(xiàn)更好的模型的副本）。PBT不需要從零開始重新訓(xùn)練，因?yàn)槊總€(gè)后代都會(huì)繼承父網(wǎng)絡(luò)的狀態(tài)，并且整個(gè)訓(xùn)練過程中會(huì)積極更新超參數(shù)。最終結(jié)果是，PBT可以將其大量資源用于訓(xùn)練“好的”超參數(shù)值。

PBT并不完美——它傾向于優(yōu)化當(dāng)前，但并不考慮長期結(jié)果，這就不利于后期發(fā)展的AI模型。為了緩解這種情況，DeepMind的研究人員培訓(xùn)了大量模型（“人口”）并創(chuàng)建稱為“利基”的子人口，其中算法只會(huì)跟他們自己子群中的模型競爭。

在最近數(shù)項(xiàng)研究中，DeepMind和Waymo已嘗試將PBT應(yīng)用于行人、自行車和摩托車的識別任務(wù)，目的是調(diào)查算法是否進(jìn)一步提升。最終，兩家公司希望訓(xùn)練處一個(gè)AI模型，可以保持99%以上的總體障礙物識別率，并減少誤報(bào)。

Waymo表示，這些實(shí)驗(yàn)為評估真實(shí)世界模型的穩(wěn)健性提供了一個(gè)“現(xiàn)實(shí)的”框架，這反過來又為PBT的算法選擇競爭提供了依據(jù)。他們還稱，實(shí)驗(yàn)還反應(yīng)了用快速評估支持進(jìn)化競爭的需求；PBT模型可以每15分鐘評估一次。

結(jié)果令人印象深刻。Waymo表示，PBT算法可以實(shí)現(xiàn)更好的精度，與手工調(diào)整的等效物相比，誤報(bào)率可以減少24%，而識別率仍舊維持在較高水平。此外，PBT算法還可以節(jié)省時(shí)間和資源。

Waymo稱，其已經(jīng)將PBT直接納入Waymo的技術(shù)基礎(chǔ)架構(gòu)，使得公司的研究人員都可以通過點(diǎn)擊按鈕來應(yīng)用該算法。公司在博客中寫道：“PBT可以讓我們超越用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的更新規(guī)則，并向著能夠優(yōu)化我們需要之功能的復(fù)雜指標(biāo)?！?/p>

新聞中心

DeepMind與Waymo合作提高AI精度加速模型訓(xùn)練

評論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

DeepMind與Waymo合作提高AI精度 加速模型訓(xùn)練

評論

相關(guān)推薦

技術(shù)專區(qū)

DeepMind與Waymo合作提高AI精度加速模型訓(xùn)練