Meta 首次披露自研 AI 芯片:專供內部使用
北京時間 5 月 19 日早間消息,據報道,Meta 公司開發(fā)了一些定制電腦芯片來幫助其執(zhí)行人工智能和電子游戲任務,該公司本周首次與外界溝通了這些產品。
本文引用地址:http://m.butianyuan.cn/article/202305/446742.htm這家社交媒體巨頭在本周早些時候首次披露了該公司的內部芯片項目,此后又在周四晚間的虛擬活動上探討了他們對人工智能技術基礎架構的投資。
Meta 此前宣布今年為“效率之年”,不僅裁員至少 2.1 萬人,還大幅壓縮各種成本。在此之后,投資者一直在密切關注 Meta 對人工智能及相關數據中心硬件的投資。
盡管對一家公司而言,自主設計和開發(fā)電腦芯片的成本十分高昂,但 Meta 基礎架構副總裁亞歷克西斯?博喬林(Alexis Bjorlin)表示,Meta 相信,只要能提高公司業(yè)績,便可證明這筆投資的意義。該公司還一直在調整其數據中心的設計,以便將更多精力集中在具有能耗效率的技術上,比如液冷技術和減少過熱。
其中一款名為 Meta 可擴展視頻處理器(MSVP)的電腦芯片可以處理視頻,并將其傳輸給用戶,同時減少能耗。博喬林表示,“沒有任何商用產品”可以像 Meta 渴望的那樣高效地處理和傳輸每天 40 億段視頻。
另外一款處理器則是該公司的 Meta 訓練和推理加速器(MTIA)家族中的首款芯片,其目的是幫助 Meta 處理各種專門的人工智能任務。新的 MTIA 芯片專門處理“推理”,也就是利用已經訓練好的人工智能模型做出預測或采取行動。
博喬林表示,新的人工智能推理芯片有助于加強 Meta 的推薦算法,這種算法可以決定用戶的信息流中顯示哪些內容和廣告。她拒絕回答這款芯片的制造商,但一篇博文透露,該處理器“采用臺積電的 7 納米工藝制造”,表明這款處理器由臺積電代工。
博喬林還表示,Meta 為其人工智能芯片家族制定了“好幾代路線圖”,包括用于訓練人工智能模型的任務,但她拒絕提供除新款推理芯片之外的更多細節(jié)。之前有報道稱,Meta 取消了一個人工智能推理芯片項目,并啟動了另外一個項目,但卻要到 2025 年才能推出具體的產品。博喬林拒絕對此置評。
由于 Meta 并未像 Alphabet 和微軟一樣出售云計算服務,所以該公司沒有太大動力公開討論其內部數據中心芯片項目。
“看看我們分享的內容,這是我們首批開發(fā)的兩款芯片,肯定能夠借此一窺我們在內部從事的項目。”她說,“我們沒有宣傳這些事情,也不需要宣傳,但你知道,全世界都很感興趣?!?/p>
Meta 工程副總裁阿帕納?拉馬尼(Aparna Ramani)表示,該公司的新硬件是為了與其自主開發(fā)的 PyTorch 軟件高效配合,后者已經成為第三方開發(fā)者開發(fā)人工智能應用時最常用的工具之一。
這款新硬件最終可以用于執(zhí)行與元宇宙相關的任務,比如虛擬現實和增強現實,還能用于新興的生成式人工智能技術。生成式人工智能是一種統稱,指的是能夠創(chuàng)造有吸引力的文本、圖像和視頻的人工智能軟件。
拉馬尼還表示,Meta 為該公司的程序員開發(fā)了生成式人工智能編程助手,幫助其簡化軟件開發(fā)和運營過程。這款新的助手類似于微軟 2021 年在人工智能創(chuàng)業(yè)公司 OpenAI 的幫助下推出的 GitHub Copilot 工具。
除此之外,Meta 還宣布,該公司的超級計算機 Research SuperCluster(簡稱“RSC”)已經進入到第二階段,也就是最后一個階段。這臺超級計算機包含 1.6 萬個英偉達 A100 GPU,Meta 使用這臺超級計算機訓練其 LLaMA 大語言模型及其他技術。
拉馬尼表示,Meta 依然堅持自己的信念,希望通過為開源技術和人工智能研究做出貢獻來推動科技領域的發(fā)展。該公司透露,其最大的 LLaMA 大語言模型 LLaMA 65B 包含 650 億個參數,使用 1.4 萬億個令牌訓練。令牌指的是用于訓練人工智能的數據。
OpenAI 和谷歌等公司均未公開披露各自大語言模型的相似指標,但本周有媒體披露,谷歌的 PaLM 2 模型使用 3.6 萬億個令牌,包含 3400 億個參數。
與其他科技公司不同,Meta 將其 LLaMA 大語言模型發(fā)布給研究人員,使之可以研究這項技術。但 LLaMA 大語言模型隨后被泄露給了更多人,使得許多開發(fā)者在自己的應用中整合了這項技術。
拉馬尼表示,Meta“仍在考慮我們所有的開源合作,當然,我想重申,我們的理念仍是開放科學和交叉合作?!?/p>
評論