谷歌TPU秘密武器,6小時(shí)完成芯片布局!新AI算法登Nature
作者 | 心緣
編輯 | 漠影
芯東西6月10日報(bào)道,谷歌用人工智能提高芯片設(shè)計(jì)速度的研究,已發(fā)表于國際頂級期刊Nature。原本人類專家需要花費(fèi)數(shù)周時(shí)間的芯片布局設(shè)計(jì),通過一種深度強(qiáng)化學(xué)習(xí)方法,平均6小時(shí)內(nèi)就能完成這個(gè)過程。這項(xiàng)工作并不完全新穎,包括谷歌人工智能負(fù)責(zé)人Jeff Dean在內(nèi)的谷歌工程師團(tuán)隊(duì),在一年前發(fā)表的一篇預(yù)印版論文中已經(jīng)提到了這一技術(shù)。谷歌博客:
https://ai.googleblog.com/2020/04/chip-design-with-deep-reinforcement.html而在Nature最新發(fā)表的論文中,谷歌原始研究團(tuán)隊(duì)稱其已微調(diào)該技術(shù),來設(shè)計(jì)即將推出的、以前未宣布的谷歌張量處理單元(TPU)的生成,專門用于加速人工智能(AI)。
該論文題目為《一個(gè)快速芯片設(shè)計(jì)的布圖布局方法》(A graph placement methodology for fast chip design)。如果這一技術(shù)公開,或有助于讓資金受限的初創(chuàng)企業(yè)開發(fā)滿足特定需求的自家芯片,并縮短芯片設(shè)計(jì)周期,使硬件更好地適應(yīng)快速發(fā)展的研究。
芯片設(shè)計(jì)自動化挑戰(zhàn)大,性能難達(dá)人類水準(zhǔn)
微芯片面積約為幾十到數(shù)百毫米平方,容納數(shù)千個(gè)組件,如內(nèi)存、邏輯和處理單元,外加許多公里的超薄電線將這些組件連接在一起。設(shè)計(jì)過程中,全局布線是最復(fù)雜和耗時(shí)的階段之一,這涉及研究這些組件的最佳放置位置,就像建筑師設(shè)計(jì)建筑的內(nèi)部空間一樣,如何以最好的規(guī)劃容納所有所需的固定裝置和配件。在這項(xiàng)研究中,谷歌研究人員提出了一種基于深度強(qiáng)化學(xué)習(xí)的芯片布局方法,目標(biāo)是將電路組件和標(biāo)準(zhǔn)單元的網(wǎng)表節(jié)點(diǎn)映射到一個(gè)芯片畫布上,從而優(yōu)化功率、性能和面積(PPA),同時(shí)遵守對布局密度和布線擁塞的限制。自20世紀(jì)60年代以來,提出了許多自動化的芯片平面圖方法,但沒有一種方法達(dá)到人類專家上手所能實(shí)現(xiàn)的性能。此外,芯片復(fù)雜性的指數(shù)增長,使這些技術(shù)難以在現(xiàn)代芯片上使用。人類芯片設(shè)計(jì)師往往必須使用電子設(shè)計(jì)自動化(EDA)工具迭代數(shù)月,對芯片網(wǎng)表進(jìn)行RTL描述,并手動將該網(wǎng)表放置在芯片畫布上。基于這種長達(dá)72小時(shí)的反饋,設(shè)計(jì)師要么得出結(jié)論,認(rèn)為設(shè)計(jì)標(biāo)準(zhǔn)已經(jīng)達(dá)到,要么向上游RTL設(shè)計(jì)師提供反饋,后者然后修改低級代碼,使放置任務(wù)更容易。而谷歌提出的深度強(qiáng)化學(xué)習(xí)方法,是一種具有泛化能力的芯片布局方法。通過領(lǐng)域自適應(yīng)策略,它能夠跨芯片進(jìn)行推廣,可以自行從經(jīng)驗(yàn)中學(xué)習(xí),使其芯片布局設(shè)計(jì)能力變得更好、更快。
用游戲系統(tǒng)、10000個(gè)芯片布局訓(xùn)練
訓(xùn)練跨芯片推廣的AI驅(qū)動設(shè)計(jì)系統(tǒng)具有挑戰(zhàn)性,因?yàn)樗枰獙W(xué)會優(yōu)化將所有可能的芯片凈列表放置在所有可能的畫布上。芯片平面圖類似于具有各種部件、板塊和獲勝條件的游戲,因此可以用包含狀態(tài)、動作、狀態(tài)轉(zhuǎn)移、獎勵四個(gè)關(guān)鍵要素的強(qiáng)化學(xué)習(xí)方法,通過訓(xùn)練一個(gè)智能體,用累計(jì)獎勵最大化,讓AI優(yōu)化芯片布局的能力持續(xù)增強(qiáng)。從空芯片開始,谷歌團(tuán)隊(duì)的系統(tǒng)按順序放置組件,直到實(shí)現(xiàn)一個(gè)完全布局的網(wǎng)表。為了指導(dǎo)系統(tǒng)選擇首先放置的組件,組件按降序由大到小排序;首先放置較大的組件會減少以后沒有可行放置的可能性。
訓(xùn)練該系統(tǒng)需要創(chuàng)建一個(gè)包含10000個(gè)芯片布局的數(shù)據(jù)集,其中輸入是與給定布局相關(guān)的狀態(tài),標(biāo)簽是布局的獎勵(即線長和擁塞)。研究人員首先選擇了5個(gè)不同的芯片凈網(wǎng)表,并用AI算法為每個(gè)網(wǎng)表創(chuàng)建2000個(gè)不同的布局位置。該系統(tǒng)花了48個(gè)小時(shí)在英偉達(dá)Volta顯卡和10個(gè)CPU上“預(yù)訓(xùn)練”,每個(gè)CPU都有2GB的RAM。在一項(xiàng)測試中,谷歌研究人員將他們的系統(tǒng)建議與手動基線——谷歌TPU物理設(shè)計(jì)團(tuán)隊(duì)創(chuàng)建的上一代TPU芯片設(shè)計(jì)——進(jìn)行比較。結(jié)果顯示,系統(tǒng)和人類專家均生成符合時(shí)間和擁塞要求的可行位置,而AI系統(tǒng)在面積、功率和電線長度方面優(yōu)于或媲美手動布局,同時(shí)滿足設(shè)計(jì)標(biāo)準(zhǔn)所需的時(shí)間要少得多。
未來工作:或?yàn)樾酒O(shè)計(jì)全自動化奠定基礎(chǔ)
谷歌稱其系統(tǒng)推廣和生成“高質(zhì)量”解決方案的能力具有“重大影響”,為與芯片設(shè)計(jì)過程的早期階段進(jìn)行優(yōu)化提供了機(jī)會。大規(guī)模的架構(gòu)探索以前是不可能的,因?yàn)樵u估給定的架構(gòu)需要數(shù)月的努力。谷歌團(tuán)隊(duì)認(rèn)為,修改芯片的設(shè)計(jì)或?qū)π阅墚a(chǎn)生巨大影響,并可能為芯片設(shè)計(jì)過程的完全自動化奠定基礎(chǔ)。此外,雖然谷歌團(tuán)隊(duì)的系統(tǒng)被用于設(shè)計(jì)下一代谷歌TPU,但研究人員認(rèn)為,它可以應(yīng)用于芯片設(shè)計(jì)以外的有影響力的放置規(guī)劃問題,包括城市規(guī)劃、疫苗測試分發(fā)和大腦皮層映射等一系列應(yīng)用。
結(jié)語:減少設(shè)計(jì)芯片時(shí)間,或優(yōu)化供應(yīng)鏈流程
Nature社論認(rèn)為,谷歌這一研究大大縮短設(shè)計(jì)芯片所需的時(shí)間,將極大地幫助提速供應(yīng)鏈,但技術(shù)專長必須廣泛共享,以確保公司的“生態(tài)系統(tǒng)”真正全球化。產(chǎn)業(yè)必須確保節(jié)省時(shí)間的技術(shù)不會趕走擁有必要核心技能的人。更易訪問、更高效的微芯片將為自動駕駛汽車、5G通信和AI的發(fā)展提供動力,這些機(jī)會不容錯(cuò)過。但重要的是,要考慮使用自動化設(shè)計(jì)技術(shù)的更廣泛影響,特別是需要具有相關(guān)技能和專業(yè)知識的人,和提高目前手動完成流程的人的技能。芯片布局無論是手動還是自動化,都需要計(jì)算、電子工程和設(shè)備物理方面的專業(yè)知識。這些技能需要時(shí)間來學(xué)習(xí),在一個(gè)生產(chǎn)微芯片以外許多其他產(chǎn)品的行業(yè)中,同樣非常需要這些技能。至關(guān)重要的是,相關(guān)公司要理解這一點(diǎn),并采取適當(dāng)步驟來滿足其本地和全球的技能需求。自動化往往加劇了人們對裁員的擔(dān)憂。事實(shí)上,保持電子行業(yè)的勢頭,需要有遠(yuǎn)見的人和公司來創(chuàng)造下一代微芯片。來源:Nature,VentureBeat
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)霍爾傳感器相關(guān)文章:霍爾傳感器工作原理
電度表相關(guān)文章:電度表原理
霍爾傳感器相關(guān)文章:霍爾傳感器原理