硅谷:設(shè)計(jì)師利用生成式AI輔助芯片設(shè)計(jì)

作者：時(shí)間：2023-11-01 來(lái)源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

芯片工程師展示了一個(gè)高度專(zhuān)業(yè)化的行業(yè)如何使用 NVIDIA NeMo 來(lái)定制大語(yǔ)言模型，以獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。

本文引用地址：http://m.butianyuan.cn/article/202311/452359.htm

快訊配圖1：硅谷：設(shè)計(jì)師利用生成式 AI 輔助芯片設(shè)計(jì).png

10 月 31 日，NVIDIA 發(fā)布的一篇研究論文描述了生成式 AI 如何助力芯片設(shè)計(jì)，后者是當(dāng)今最復(fù)雜的工程工作之一。

這項(xiàng)工作展示了高度專(zhuān)業(yè)化領(lǐng)域的公司如何利用內(nèi)部數(shù)據(jù)訓(xùn)練大語(yǔ)言模型，從而開(kāi)發(fā)提高生產(chǎn)力的 AI 助手。

像半導(dǎo)體設(shè)計(jì)這樣如此具有挑戰(zhàn)性的工作并不多見(jiàn)。在顯微鏡下，NVIDIA H100 Tensor Core GPU（上圖）這樣最先進(jìn)的芯片看起來(lái)就像一個(gè)精心規(guī)劃的大都市，由數(shù)百億個(gè)晶體管組成，把它們連接起來(lái)的線(xiàn)比人的頭發(fā)絲還細(xì) 1 萬(wàn)倍。

多個(gè)工程團(tuán)隊(duì)進(jìn)行協(xié)作，需要長(zhǎng)達(dá)兩年的時(shí)間才能構(gòu)建出這樣一個(gè)數(shù)字化超級(jí)大都市。

一些小組定義芯片的整體架構(gòu)，一些小組負(fù)責(zé)各種超小型電路的設(shè)計(jì)與布局，還有一些小組負(fù)責(zé)測(cè)試工作。每項(xiàng)工作都需要采取專(zhuān)門(mén)的方法、軟件程序和計(jì)算機(jī)語(yǔ)言。

大語(yǔ)言模型廣闊的前景

該論文的主要作者、NVIDIA 研究總監(jiān) Mark Ren 表示：“我相信，隨著時(shí)間的推移，大語(yǔ)言模型將全面助力所有流程?！?/p>

在同日舉行的國(guó)際計(jì)算機(jī)輔助設(shè)計(jì)會(huì)議上，NVIDIA 首席科學(xué)家 Bill Dally 發(fā)表主題演講并公布了這篇論文。這個(gè)年度盛會(huì)每年都會(huì)吸引數(shù)百名電子設(shè)計(jì)自動(dòng)化（EDA）領(lǐng)域的工程師參加。

此次會(huì)議在舊金山舉行。Dally 在會(huì)上表示：“這標(biāo)志著在將大語(yǔ)言模型用于復(fù)雜的半導(dǎo)體設(shè)計(jì)方面邁出了重要一步。這項(xiàng)工作表明，即使高度專(zhuān)業(yè)化的領(lǐng)域也可以利用內(nèi)部數(shù)據(jù)來(lái)訓(xùn)練極具價(jià)值的生成式 AI 模型。”

ChipNeMo浮出水面

這篇論文詳細(xì)介紹了 NVIDIA 工程師如何創(chuàng)建名為 ChipNeMo 的定制大語(yǔ)言模型，供內(nèi)部使用。該模型使用公司內(nèi)部數(shù)據(jù)進(jìn)行訓(xùn)練并生成和優(yōu)化軟件，以更好地協(xié)助人類(lèi)設(shè)計(jì)師。

Ren 在 EDA 領(lǐng)域從業(yè)超過(guò) 20 多年，他表示，從長(zhǎng)遠(yuǎn)來(lái)看，工程師們希望生成式 AI 能夠用于芯片設(shè)計(jì)的各個(gè)階段，從而大幅提升整體生產(chǎn)力。

在針對(duì)可能的使用場(chǎng)景對(duì) NVIDIA 工程師進(jìn)行調(diào)研之后，研究團(tuán)隊(duì)一開(kāi)始選擇了三個(gè)場(chǎng)景：聊天機(jī)器人、代碼生成器和分析工具。

初始用例

維護(hù)已知 bug 的更新描述需要耗費(fèi)大量時(shí)間，而上述分析工具中的后者能夠?qū)崿F(xiàn)此類(lèi)任務(wù)的自動(dòng)化，并已得到廣泛的采用。

一個(gè)聊天機(jī)器人原型可以回答有關(guān) GPU 架構(gòu)和設(shè)計(jì)的問(wèn)題，并且已經(jīng)幫助許多工程師在早期測(cè)試中快速找到技術(shù)文檔。

快訊配圖2：硅谷：設(shè)計(jì)師利用生成式 AI 輔助芯片設(shè)計(jì).gif

代碼生成器將幫助設(shè)計(jì)者編寫(xiě)芯片設(shè)計(jì)軟件。

一個(gè)正在開(kāi)發(fā)中的代碼生成器（如上圖所演示）已經(jīng)用兩種芯片設(shè)計(jì)師專(zhuān)用語(yǔ)言創(chuàng)建了大約 10-20 行軟件的片段。它將與現(xiàn)有工具集成，為工程師們提供一個(gè)方便的助手來(lái)進(jìn)行設(shè)計(jì)。

使用NVIDIA NeMo定制AI模型

這篇論文主要關(guān)注該團(tuán)隊(duì)收集設(shè)計(jì)數(shù)據(jù)并使用這些數(shù)據(jù)創(chuàng)建專(zhuān)門(mén)的生成式 AI 模型，這個(gè)過(guò)程可以移植到任何行業(yè)。

作為起點(diǎn)，該團(tuán)隊(duì)選擇了一個(gè)基礎(chǔ)模型，并使用 NVIDIA NeMo 對(duì)其進(jìn)行了定制。作為 NVIDIA AI Enterprise 軟件平臺(tái)的一部分，NVIDIA NeMo 是一個(gè)用于構(gòu)建、定制和部署生成式 AI 模型的框架。定的 NeMo 模型具有 430 億個(gè)參數(shù)，這衡量了它對(duì)模式的理解力。它使用超過(guò)一萬(wàn)億個(gè)文本和軟件中的 token、單詞和符號(hào)進(jìn)行了訓(xùn)練。

快訊配圖3：硅谷：設(shè)計(jì)師利用生成式 AI 輔助芯片設(shè)計(jì).png

ChipNeMo 提供了一個(gè)技術(shù)團(tuán)隊(duì)如何用自己的數(shù)據(jù)改進(jìn)預(yù)訓(xùn)練模型的示例。

然后，該團(tuán)隊(duì)在兩輪訓(xùn)練中完善了該模型。第一輪使用了相當(dāng)于大約 240 億個(gè) token 的內(nèi)部設(shè)計(jì)數(shù)據(jù)，第二輪使用了約 13 萬(wàn)個(gè)對(duì)話(huà)和設(shè)計(jì)示例。

這項(xiàng)工作是半導(dǎo)體行業(yè)進(jìn)行生成式 AI 概念研究和印證的幾個(gè)例子之一，這一趨勢(shì)剛剛開(kāi)始在實(shí)驗(yàn)室興起。

分享經(jīng)驗(yàn)

Ren 的團(tuán)隊(duì)學(xué)到的一個(gè)最重要的經(jīng)驗(yàn)就是定制大語(yǔ)言模型的重要性。

在芯片設(shè)計(jì)任務(wù)中，只有 130 億個(gè)參數(shù)的定制 ChipNeMo 模型的性能達(dá)到或超過(guò)了更大的通用大語(yǔ)言模型（例如包含 700 億個(gè)參數(shù)的 LLaMA2）。在某些使用場(chǎng)景中，ChipNeMo 模型甚至好很多。

他補(bǔ)充道，在這一過(guò)程中，用戶(hù)需要謹(jǐn)慎地確定他們收集什么數(shù)據(jù)以及如何清理數(shù)據(jù)以用于訓(xùn)練。

最后，Ren 建議用戶(hù)及時(shí)了解可以加快和簡(jiǎn)化工作的最新工具。

NVIDIA Research 在全球各地?fù)碛袛?shù)百名科學(xué)家和工程師，專(zhuān)注于 AI、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)、自動(dòng)駕駛汽車(chē)、機(jī)器人學(xué)等領(lǐng)域。近期的其它半導(dǎo)體項(xiàng)目包括使用 AI 設(shè)計(jì)更小、更快的電路，以及優(yōu)化大型模塊的布局。

希望構(gòu)建自己的定制大語(yǔ)言模型的企業(yè)現(xiàn)在可以從使用 GitHub 和 NVIDIA NGC 目錄中的 NeMo 框架開(kāi)始。

新聞中心

硅谷:設(shè)計(jì)師利用生成式AI輔助芯片設(shè)計(jì)

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)