低電壓測試，AI技術(shù)熱潮背后算力核心的重要支撐

—— 【探索前沿測試為先】

作者：時間：2024-02-27 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

_____

本文引用地址：http://m.butianyuan.cn/article/202402/455748.htm

2023什么最火？無疑是以ChatGPT為代表的AGI (通用人工智能)了，甚至被稱之為第四次工業(yè)革命的推動者。比爾·蓋茨說，“ChatGPT像互聯(lián)網(wǎng)發(fā)明一樣重要，將會改變世界?！?/p>

加速爆發(fā)的AI無處不在

AI芯片和AI服務(wù)器–掀起大規(guī)模建設(shè)熱潮

ChatGPT的強大讓很多人看到了AI所帶來的無限可能，國內(nèi)外互聯(lián)網(wǎng)公司紛紛入場，掀起了建設(shè)大模型建設(shè)的熱潮，一座座數(shù)據(jù)中心拔地而起，高算力顯卡被炒到了天價，仍然一卡難求。相關(guān)媒體數(shù)據(jù)顯示，2023年全球最大的社交網(wǎng)絡(luò)公司購買了多達15萬塊NVIDIA GPU，而其它IT知名巨頭可能只拿到了5萬塊左右。新年之初扎克伯格發(fā)文稱，計劃年底前向英偉達再購買35萬個H100 GPU芯片，從而使該公司的GPU總量達到約60萬個。

AI PC–未來每個人擁有一個專屬自己的AI PC

IDC預(yù)測， AI PC在中國PC市場中新機的裝配比例將在未來幾年中快速攀升，將在2024年暴增到55%，在2027年達到85%。2024年將成為AI PC元年。

2023年底，聯(lián)想集團與IDC聯(lián)合發(fā)布了首份《AI PC產(chǎn)業(yè)（中國）白皮書》。出于數(shù)據(jù)安全和隱私保護的考慮，以及更高效率、更低成本響應(yīng)用戶需求的考慮，人們既希望獲得公共大模型強大的通用服務(wù)，又希望AI能夠真正理解自己、提供專屬個人的服務(wù)，并且能夠充分保障個人數(shù)據(jù)和隱私安全。未來，每個個體都可以擁有一個專屬于自己的AI PC，運行屬于自己的“個人大模型”。

AI手機–AI+手機成為行業(yè)共識，未來有望將手機行業(yè)帶入第三階段

AI大模型的火熱，也讓手機廠商看到了在軟件體驗上實現(xiàn)革新的可能。一方面，AI的進化有望提升智能手機的使用體驗，另一方面跳出硬件互“卷”的怪圈，尋求新的競爭點，現(xiàn)在“AI+手機”這一概念已經(jīng)成為了行業(yè)共識。隨著三星新一代旗艦S24系列的正式發(fā)布，喊出“開啟移動AI新時代”的口號，在新機中引入視頻AI處理、AI聊天機器人、影像畫面處理、通話實時翻譯等多項AI功能，AI手機正式成為國內(nèi)外手機廠商共同的“進化趨勢”。此前，國內(nèi)手機的兩場發(fā)布會以及幾家公司的自演模型，都非常默契地鎖定了AI能力在新手機和新系統(tǒng)上的落地。業(yè)界大佬稱，2024 年是 AI 手機元年，未來五年AI 對手機行業(yè)的影響，完全可以比肩當年智能手機替代功能機。AI 手機也將成為繼功能機、智能手機之后，手機行業(yè)的第三階段。

AI賦能汽車–繼家庭和辦公場所外的第三空間

作為繼家庭和辦公場所之外的“第三空間”，汽車正在變成一個新型智能終端。ChatGPT到來了之后，車機關(guān)系也受到了更多的影響。從整個參與的車企來看，其發(fā)展大模型的方向和側(cè)重點并不相同。從功能上來看其主要可以分為以下兩類：

● 一類是用于人工智能交流對話領(lǐng)域，多數(shù)應(yīng)用在智能座艙上。車載大模型語音助手，可以處理完整的對話，如追問，并能保持對前后文的理解，形成較為良好的語音交互體驗。駕駛員未來有望通過車載系統(tǒng)完成預(yù)訂餐廳、預(yù)訂電影票等任務(wù)，極大地豐富智能汽車與人之間的交互體驗。

● 另一類是聚焦智能駕駛的大模型應(yīng)用。幫助解決認知決策問題，最終實現(xiàn)端到端的自動駕駛；或者擺脫對高清地圖的依賴，讓汽車做到更接近人類司機的駕駛表現(xiàn)。

事實上，AI 已經(jīng)無處不在。在CES 2024上，我們看到了眼花繚亂的AI產(chǎn)品。AI步行鞋幫助人們實現(xiàn)2.5倍步行速度，AI地毯實時收集寵物健康和環(huán)境數(shù)據(jù)，AI智能腰帶幫助盲人進行環(huán)境監(jiān)測和路線導(dǎo)航，AI 枕頭幫助用戶解決打鼾問題，AI牙刷檢測刷牙習(xí)慣和牙齒健康并實時給出語音建議，AI鏡子會告訴你當前的精神狀態(tài)并提供個性化建議。2月中，Open AI在文本模型ChatGPT、圖像模型Dall-E大殺四方后，又祭出爆炸性的大殺器 - 視頻模型Sora。Sora可以根據(jù)一段描述性文字生成長達一分鐘的視頻。無論多天馬行空的想法，AI 都可以給你表達出來，長達60秒。業(yè)內(nèi)分析指出，這將對于廣告業(yè)、電影預(yù)告片、短視頻行業(yè)帶來巨大的顛覆。

AI背后的強大算力和通信芯片需要更低的工作電壓

Sora也好，ChatGPT也好，大模型訓(xùn)練的背后是由高算力芯片所組成的大規(guī)模運算網(wǎng)絡(luò)。Meta等巨頭一出手就是幾十萬個高算力芯片，近千億的投資來建設(shè)數(shù)據(jù)中心。而作為終端的AI產(chǎn)品，比如AI PC、AI 手機、AI汽車、AI智能家居，依賴的就是終端產(chǎn)品內(nèi)的算力芯片。

晶體管是芯片的基礎(chǔ)組成單元，晶體管的數(shù)量越多，芯片的性能越強。各大芯片設(shè)計廠家和晶圓廠，就是想方設(shè)法在有限的空間里，通過更小的工藝尺寸(如3nm)，來堆積更多的晶體管。

晶體管工作的時候需要變化的電壓，代表邏輯1和邏輯0，進而實現(xiàn)計算或控制。由于開關(guān)損耗、短路功耗和漏電功耗的存在，晶體管在工作的時候會消耗掉電源功率，產(chǎn)生熱量。晶體管數(shù)量越來越龐大之后，散熱這個很現(xiàn)實的問題就擺在芯片和系統(tǒng)設(shè)計師的面前。處理器芯片每平方厘米的面積上，就能產(chǎn)生300瓦的峰值功率，算下是150瓦/平方厘米，已經(jīng)超過了典型的核反應(yīng)堆的功率密度了。現(xiàn)在的數(shù)據(jù)中心很多都已經(jīng)使用浸沒式液冷來進行散熱，把服務(wù)器和算力芯片浸沒在絕緣的、導(dǎo)熱性良好的液體里面，通過液體的流動快速帶走熱量，比傳統(tǒng)的風(fēng)扇散熱效率更高，但這還遠遠不夠。

圖1 典型的8 x GPU算力系統(tǒng)（圖片來源NVIDIA）

圖2 Chiplet封裝示意圖，存儲單元可以多層堆疊而算力單元只能平鋪

散熱和工藝尺寸一樣，是制約晶體管的密度和規(guī)模增加的難題之一。解決散熱的其中一個方案，就是從源頭想辦法，降低電壓。使用更低的工作電壓，將每一顆晶體管的功耗降下來，就可以堆疊更多的晶體管。早期算力芯片工作電壓是5V，慢慢演化到3.3V，1.8V，1.5V，如今，算力芯片和高速接口芯片的工作電壓基本都在1V左右，甚至更低。這就對電源設(shè)計和測量提出了更高的要求。

低電壓條件下電源紋波和噪聲的測試挑戰(zhàn)與解決方案

電源是算力芯片的能量來源，是邏輯狀態(tài)的參考基準。如果電源的紋波和噪聲過大，會給高速變化的邏輯信號上產(chǎn)生大量抖動，進而產(chǎn)生誤碼(注: 誤碼即錯誤的碼元, 將邏輯1當成邏輯0, 或者將0當成1)，影響芯片的性能，甚至導(dǎo)致芯片無法正常工作。高速信號驗證中非常重要的隨機抖動和低頻的周期性抖動，就是由于電源的噪聲和紋波所引入的。

圖3 電源紋波和噪聲

電源的紋波和噪聲測量，一直都是電源工程師們最關(guān)注的問題之一。算力芯片更低的工作電壓，導(dǎo)致電源留給紋波和噪聲的裕度變得更小了，給設(shè)計和測試都帶來了難題。設(shè)計上，算力芯片普遍采用POL的降壓方式，將DC-DC變壓器盡可能靠近負載端，可以有效避免傳輸鏈路上引入的外部干擾。測試上，使用更高精度、更低底噪的示波器，和專用的電源紋波探頭，降低測量系統(tǒng)引入的噪聲，才能更準確地測量電源紋波和噪聲。

泰克的MSO6B系列示波器的底噪性能非常優(yōu)異，底噪的有效值在20MHZ帶寬下低至8.68uV，1G帶寬下低至51.5uV，是測量電源紋波和噪聲的最佳選擇。如果電源電壓是1V，示波器的底噪稍微高一點，裕量還有很大空間，是可行的嗎？這里需要了解兩個問題:

1. 儀器的底噪指標用的都是有效值。而電源紋波和噪聲的測量規(guī)范，一般都是用峰峰值。峰峰值和測量樣本數(shù)相關(guān)，測量的樣本數(shù)越多，峰峰值越大，我們可以近似的認為峰峰值是有效值的10倍以上。

2. 電源工程師測量底噪和紋波都會使用探頭，而探頭會引入額外的底噪。為什么一定要用探頭呢？有幾個方面的原因，一是探頭使用便捷，二是探頭提供較高的輸入阻抗，對待測電路的影響小，三是探頭提供較大的偏置電壓，可以在測量噪聲和紋波的同時，觀察到電源直流電壓的變化。尤其當芯片的負載處于動態(tài)變化時，電源的直流電壓也會隨之改變。

示波器加上探頭，再去測量一下底噪的峰峰值，你會發(fā)現(xiàn)原來底噪并不小。手上有示波器和探頭的工程師不妨試試看，將示波器接上探頭，不接任何待測信號。在示波器上打開峰峰值測量，測量結(jié)果就是系統(tǒng)底噪。

常規(guī)的示波器和探頭，系統(tǒng)底噪峰峰值在5 mV以上。而有些算力芯片和通信芯片，要求電源噪聲的峰峰值必須小于3 mV。測量系統(tǒng)的底噪都這么大，測量結(jié)果怎么可能Pass呢！

為了更準確的測量電源紋波和噪聲，泰克推出了專用的電源軌探頭TPR系列，20MHZ帶寬下的底噪的峰峰值(注意是峰峰值) 低至 300uV，即便在4GHZ的全帶寬下，底噪的峰峰值依然只有1.3 mV。而且TPR探頭還支持高達60V的偏置電壓，多種多樣的探頭附件，不僅測得準，用起來還很方便。