AI計(jì)算時(shí)代,25年工齡的RRAM漸入佳境
RRAM,一個(gè)非易失性新型存儲(chǔ)器,突然火了。
該新型存儲(chǔ)器是以非導(dǎo)性材料的電阻在外加電場(chǎng)作用下,在高阻態(tài)和低阻態(tài)之間實(shí)現(xiàn)可逆轉(zhuǎn)換為原理制造而成的存儲(chǔ)器。由于結(jié)構(gòu)簡(jiǎn)單、集成度高、低功耗等優(yōu)點(diǎn),一直被認(rèn)為是最有可能突破傳統(tǒng)器件限制的新型器件。
而RRAM一路走來,卻萬分坎坷。從開始“上班”到不被看好,再到小有名氣,RRAM花了25年:
2008年,惠普公司提出一種被稱為憶阻器(memristor)的 RRAM,將其用在面向未來的系統(tǒng)“The Machine”上。但惠普在這項(xiàng)技術(shù)上努力多年之后卻轉(zhuǎn)向了一種更加傳統(tǒng)的內(nèi)存方案,退出了憶阻器的道路。
對(duì)于一項(xiàng)新型技術(shù)來說,大廠長(zhǎng)時(shí)間堅(jiān)持后未果并拋棄,最為致命,更何況是兩個(gè):
2014年前后,自2011年開始與索尼一同開發(fā)RRAM的美光退出項(xiàng)目,轉(zhuǎn)而開始與英特爾合作重點(diǎn)開發(fā)另一種存儲(chǔ)技術(shù) 3D XPoint。
從1990s到2010s,RRAM走過了功能機(jī)時(shí)代,跨過了智能終端時(shí)代,一直被研究,從未被大規(guī)模應(yīng)用,幾乎被時(shí)代遺忘。
而現(xiàn)如今,RRAM又被大廠“相中”,同時(shí)多了一大批堅(jiān)定的擁護(hù)者:
2022年11月,英飛凌和臺(tái)積電宣布,兩家公司正準(zhǔn)備將臺(tái)積電的電阻式RAM(RRAM)非易失性存儲(chǔ)器(NVM)技術(shù)引入英飛凌的下一代AURIX?微控制器(MCU)。
國(guó)內(nèi)外多個(gè)半導(dǎo)體初創(chuàng)公司一心撲在RRAM上:
● 成立于2015年的Weebit Nano,試圖利用RRAM,滿足物聯(lián)網(wǎng)(IoT)設(shè)備、機(jī)器人、5G通信和人工智能等一系列新電子產(chǎn)品中對(duì)更高性能和更低功耗內(nèi)存解決方案日益增長(zhǎng)的需求。
● 成立于2019年的昕原半導(dǎo)體,打造基于RRAM技術(shù)的新型存儲(chǔ)產(chǎn)品及相關(guān)衍生品,服務(wù)于AIoT、人工智能、數(shù)據(jù)中心、智能汽車等新興應(yīng)用。
● 成立于2020年的億鑄科技,研發(fā)基于RRAM的全數(shù)字存算一體大算力AI芯片,服務(wù)于云端數(shù)據(jù)中心、智能駕駛等對(duì)算力密度、能效比需求很高的應(yīng)用場(chǎng)景。
······
本文想要探討的是:RRAM為何在現(xiàn)在讓大廠回心轉(zhuǎn)意?RRAM要如何完成自己的逆襲之路?
“團(tuán)寵”RRAM
逆襲始于2021年。
過去業(yè)內(nèi)對(duì)于RRAM最大的質(zhì)疑,無外乎“工藝不成熟、商業(yè)化遲遲不能落地”。
而在2021年,晶圓代工廠臺(tái)積電現(xiàn)身,為RRAM站臺(tái):宣布40nmRRAM進(jìn)入量產(chǎn),28nm和22nmRRAM準(zhǔn)備量產(chǎn)。
隨后,國(guó)內(nèi)同樣傳來利好消息:2022年2月,昕原半導(dǎo)體主導(dǎo)建設(shè)的RRAM 12寸中試生產(chǎn)線順利完成了自主研發(fā)裝備的裝機(jī)驗(yàn)收工作,實(shí)現(xiàn)中試線工藝流程的通線,并成功流片(試生產(chǎn))。
質(zhì)疑被一步步打破,RRAM正式迎來自己的逆襲之路。
首先是在學(xué)界,RRAM存在感直線上升,從探討其潛力、可行性轉(zhuǎn)變到證明其可靠性。
在2008-2016年前后,學(xué)界的文章關(guān)于RRAM的描述大多是“有潛能”,團(tuán)隊(duì)大多是提出解決方案:
● 2009年,惠普實(shí)驗(yàn)室論證了利用 Crosslatch 系統(tǒng)可以較為簡(jiǎn)單的實(shí)現(xiàn)堆棧,形成立體的內(nèi)存結(jié)構(gòu),RRAM在速度、密度等方面均具有極大的潛能,能有效替代目前的存儲(chǔ)單元。
● 2016年,在VLSI(超大規(guī)模集成電路)國(guó)際研討會(huì)上,中國(guó)科學(xué)院微電子研究所劉明院士的團(tuán)隊(duì)提出了自對(duì)準(zhǔn)高性能自選通RRAM結(jié)構(gòu),為高密度、低成本三維垂直交叉陣列的制備提供解決方案。
······
而在2022年,大多文章是在推動(dòng)RRAM的快速落地,通過設(shè)計(jì)、實(shí)驗(yàn)證明其有著足夠的優(yōu)勢(shì):
● 在2022年度ISSCC會(huì)議上,臺(tái)積電發(fā)表六篇關(guān)于存內(nèi)計(jì)算存儲(chǔ)器IP的論文,大力推進(jìn)基于RRAM的存內(nèi)計(jì)算方案。
● 在中國(guó)半導(dǎo)體十大研究進(jìn)展候選推薦(2022-025)中,有著RRAM的身影:
以中國(guó)科學(xué)院微電子研究所微電子劉明院士、張鋒研究員為主導(dǎo)的團(tuán)隊(duì),首次設(shè)計(jì)實(shí)現(xiàn)了基于三維垂直結(jié)構(gòu)阻變存儲(chǔ)器的存算一體宏單元芯片,實(shí)驗(yàn)表明三維阻變存儲(chǔ)器不但可以完整的實(shí)現(xiàn)存算一體技術(shù),同時(shí)證明了其在低功耗以及高算力、高密度方面的優(yōu)勢(shì)。
其次是在產(chǎn)界,芯片設(shè)計(jì)、制造廠商紛紛將RRAM納入到自己的規(guī)劃之中:
在代工廠方面,臺(tái)積電、Crossbar、聯(lián)電、中芯國(guó)際以及昕原半導(dǎo)體等均已建立了可量產(chǎn)的商業(yè)化RRAM產(chǎn)線:
例如2022年6月,昕原半導(dǎo)體宣布其RRAM新型存儲(chǔ)技術(shù)通過嚴(yán)苛測(cè)試,“昕·山文”安全存儲(chǔ)系列RRAM產(chǎn)品成功交付工控領(lǐng)域頭部企業(yè)禾川科技,實(shí)現(xiàn)在工業(yè)自動(dòng)化控制核心部件的商用量產(chǎn)。
在商業(yè)化方面,RRAM在市面上主要有兩大應(yīng)用方向,分別是存儲(chǔ)應(yīng)用與存算應(yīng)用。
在存儲(chǔ)應(yīng)用上,目前有英特爾、松下等大廠將RRAM用于MCU領(lǐng)域:
● 2013年7月,松下推出了8位MCU,該MCU集成了0.18微米R(shí)RAM技術(shù),成為第一個(gè)將RRAM技術(shù)商業(yè)化的大廠;
● 2022年11月,英特爾宣布,將非易失性存儲(chǔ)器RRAM引入英飛凌的下一代 AURIX ?微控制器 (MCU)
除此之外,在去年的各大展會(huì)、論壇上,也有多家初創(chuàng)企業(yè)認(rèn)可了RRAM的發(fā)展?jié)摿Γ岢鲇?jì)劃使用或者轉(zhuǎn)向RRAM作為其未來發(fā)展AI芯片的存儲(chǔ)介質(zhì)。
在存算應(yīng)用上,目前僅有國(guó)內(nèi)的億鑄科技,試圖基于RRAM通過存算一體架構(gòu)實(shí)現(xiàn)AI大算力芯片,將其應(yīng)用在中心側(cè)與邊緣側(cè)的應(yīng)用場(chǎng)景中,著眼于解決目前AI芯片“能效比不理想、算力密度不滿足市場(chǎng)要求、軟件部署成本高及效率低”等痛點(diǎn)。
學(xué)界、產(chǎn)界正將RRAM推向“C位”,視為團(tuán)寵,這背后是AI市場(chǎng)的驅(qū)動(dòng)。
現(xiàn)階段,自動(dòng)駕駛、智算中心、AR/VR元宇宙、ChatGPT等高密度計(jì)算場(chǎng)景的蓬勃發(fā)展,帶動(dòng)了以AI芯片為首的一大批新型半導(dǎo)體技術(shù)的爆發(fā)。
機(jī)會(huì)與挑戰(zhàn)并存,隨著AI算力需求走向100Tops、1000Tops甚至更高水平,以及對(duì)于能效比需求走向10TOPS/W、甚至100TOPS/W以上,傳統(tǒng)馮·諾伊曼架構(gòu)“招架不住”了。
這是因?yàn)樵隈T·諾伊曼架構(gòu)之下,芯片的存儲(chǔ)、計(jì)算區(qū)域是分離的。計(jì)算時(shí),數(shù)據(jù)需要在兩個(gè)區(qū)域之間來回搬運(yùn),而隨著神經(jīng)網(wǎng)絡(luò)模型層數(shù)、規(guī)模以及數(shù)據(jù)處理量的不斷增長(zhǎng),數(shù)據(jù)已經(jīng)面臨“跑不過來”的境況,成為高效能計(jì)算性能和功耗的瓶頸,也就是業(yè)內(nèi)俗稱的“存儲(chǔ)墻”。
存儲(chǔ)墻相應(yīng)地也帶來了能耗墻、編譯墻(生態(tài)墻)的問題。例如編譯墻問題,是由于大量的數(shù)據(jù)搬運(yùn)容易發(fā)生擁塞,編譯器無法在靜態(tài)可預(yù)測(cè)的情況下對(duì)算子、函數(shù)、程序或者網(wǎng)絡(luò)做整體的優(yōu)化,只能手動(dòng)、一個(gè)個(gè)或者一層層對(duì)程序進(jìn)行優(yōu)化,耗費(fèi)了大量時(shí)間。
這“三堵墻”導(dǎo)致算力無謂浪費(fèi):據(jù)統(tǒng)計(jì),在大算力的AI應(yīng)用中,數(shù)據(jù)搬運(yùn)操作消耗90%的時(shí)間和功耗,數(shù)據(jù)搬運(yùn)的功耗是運(yùn)算的650倍。
于是,能夠打破這三堵墻的“存算一體架構(gòu)”漸入人們的視野。該架構(gòu)將存儲(chǔ)和計(jì)算的融合,徹底消除了訪存延遲,并極大降低了功耗。同時(shí),由于計(jì)算完全耦合于存儲(chǔ),因此可以開發(fā)更細(xì)粒度的并行性,獲得更高的性能和能效。
目前,實(shí)現(xiàn)存算一體有兩種存儲(chǔ)器件的選擇:
● 第一種是基于易失性存儲(chǔ)器,例如DRAM和SRAM,但由于DRAM制造工藝和邏輯計(jì)算單元的制造工藝不同,無法實(shí)現(xiàn)良好的片上融合,而SRAM難以進(jìn)行片上大規(guī)模集成,同時(shí),因?yàn)镾RAM和DRAM是易失性存儲(chǔ)器,需要持續(xù)供電來保存數(shù)據(jù),仍存在功耗的問題。
● 第二種是結(jié)合非易失性新型存儲(chǔ)器。新型存儲(chǔ)器通過阻值變化來存儲(chǔ)數(shù)據(jù),而存儲(chǔ)器加載的電壓等于電阻和電流的乘積,相當(dāng)于每個(gè)單元可以實(shí)現(xiàn)一個(gè)乘法運(yùn)算,再匯總相加便可以實(shí)現(xiàn)矩陣乘法。在這種情況下,同一單元就可以完成數(shù)據(jù)存儲(chǔ)和計(jì)算,消除了數(shù)據(jù)訪存帶來的延遲和功耗,是真正意義上的存算一體。
另外,傳統(tǒng)存儲(chǔ)器所具有的易失性、微縮性差等問題可以被新型非易失性存儲(chǔ)器很好地解決。RRAM在AI大算力場(chǎng)景下似乎更具優(yōu)勢(shì):
目前可用于存算一體的成熟存儲(chǔ)器有NOR FLASH、SRAM、DRAM、RRAM、MRAM等。相比之下,RRAM具備低功耗、高計(jì)算精度、高能效比和制造兼容CMOS工藝等優(yōu)勢(shì):
也就是說,AI計(jì)算整體市場(chǎng)的驅(qū)動(dòng),引發(fā)了RRAM在存算一體這一方向的爆發(fā)。隨著人工智能市場(chǎng)規(guī)模不斷擴(kuò)大,屬于RRAM的市場(chǎng)爆發(fā)很快就會(huì)到來,學(xué)界、產(chǎn)界難免要“蜂擁而至”。
AI大算力,RRAM的“用武之地”
當(dāng)我們回顧存儲(chǔ)器的發(fā)展時(shí)發(fā)現(xiàn),目前主流的存儲(chǔ)介質(zhì)NOR FLASH,同樣經(jīng)歷了不被看好階段:
2000年前后的功能機(jī)時(shí)代,手機(jī)對(duì)內(nèi)存的要求不高,NOR Flash憑借著NOR+PSRAM的XIP架構(gòu),更快的讀取速度、可隨機(jī)訪問等特點(diǎn),得到快速發(fā)展。
好景不長(zhǎng),沒過幾年NOR Flash市場(chǎng)便不斷萎縮:
2009—2016 年 NOR Flash 市場(chǎng)規(guī)模一路下降至低于20億美元,存儲(chǔ)大廠三星、美光等公司都逐步退出NOR市場(chǎng)。這是因?yàn)?,到了智能機(jī)時(shí)代,大量吃內(nèi)存的APP涌現(xiàn),NOR的容量小、成本高的缺點(diǎn)無法被掩蓋,逐漸被容量充足、成本更低的NAND給取代。
但就在各大廠商關(guān)停NOR產(chǎn)線的同時(shí),NOR Flash喜迎“第二春”。最主要的原因是,下游需求旺盛的AMOLED急需NOR Flash來“救場(chǎng)”。
隨著手機(jī)廠商蘋果選擇了AMOLED屏幕,AMOLED的滲透率得到了大幅提升,AMOLED相較于LCD而言,優(yōu)點(diǎn)眾多,但亮度不均勻、存在殘像仍是它面臨的兩個(gè)主要難題,也就需要用到補(bǔ)償技術(shù)。
業(yè)內(nèi)紛紛選擇外部補(bǔ)償模式(內(nèi)部補(bǔ)償模式成本過高,技術(shù)難以達(dá)到):掛一個(gè)存儲(chǔ)器隨時(shí)解決AMOLED面板的藍(lán)色光會(huì)隨時(shí)間消退的問題。
此時(shí),NOR Flash的高可靠性、快速讀取使其比NAND Flash更為合適,且在外部補(bǔ)償模式下,屏幕對(duì)于容量的要求并不高。
于是,NOR Flash的需求又被快速帶動(dòng)起來,華邦、兆易創(chuàng)新(目前國(guó)內(nèi)NOR Flash龍頭)迅速崛起。
可以看到,找到合適的賽道,是以往存儲(chǔ)器大放光彩的轉(zhuǎn)折點(diǎn)。
RRAM與AI大算力賽道,也同樣如此。
原先,大家對(duì)RRAM的期望是純存儲(chǔ)應(yīng)用,希望其成為下一代主流存儲(chǔ)技術(shù)。但其容量和閃存相比,差別還很大,故在存儲(chǔ)應(yīng)用領(lǐng)域,RRAM并不是最佳的選擇,也就一直“被耽誤”。
如今,在AI大算力時(shí)代,由于存算一體架構(gòu)解決了存儲(chǔ)墻等問題,可以極大降低功耗,提升運(yùn)算能效比。同時(shí),RRAM工藝逐漸成熟,可以支持大算力芯片的量產(chǎn)。此時(shí),RRAM具備的“低功耗、低延遲性、高密度”等優(yōu)勢(shì)愈發(fā)凸顯,通過將RRAM存儲(chǔ)技術(shù)與存算一體架構(gòu)結(jié)合,無疑會(huì)產(chǎn)生1+1>2的效果,從而打造高算力、高能效比的AI芯片。
而在AI時(shí)代的多個(gè)應(yīng)用中,RRAM更適用于AI大算力賽道。
AI大算力賽道,正面臨著“井噴”的需求:
根據(jù)IDC、浪潮信息聯(lián)合發(fā)布的《2022-2023中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》顯示,2021年中國(guó)智能算力規(guī)模達(dá)到155.2EFLOPS,預(yù)計(jì)2026年將達(dá)到127.4EFLOPS,年復(fù)合增長(zhǎng)率達(dá)到52.3%。
這是因?yàn)?,隨著技術(shù)的突破、模型規(guī)模的不斷增長(zhǎng),需要消化更大規(guī)模的數(shù)據(jù),也意味著更高的算力需求。據(jù)OpenAI統(tǒng)計(jì),從2012年到2020年,人工智能模型訓(xùn)練消耗的算力增長(zhǎng)了30萬倍,平均每3.4個(gè)月翻一番超過了摩爾定律的每18個(gè)月翻番的增速。
故,為滿足對(duì)算力的要求,各行各業(yè)各地都在建設(shè)智算中心:
1月11日,由國(guó)家信息中心聯(lián)合浪潮信息發(fā)布的《智能計(jì)算中心創(chuàng)新發(fā)展指南》顯示,當(dāng)前全國(guó)范圍形成智算中心建設(shè)的熱潮:全國(guó)目前有超過30個(gè)城市正在建設(shè)或提出建設(shè)智算中心,整體布局以東部地區(qū)為主,并逐漸向中西部地區(qū)拓展。
AI大算力的下游市場(chǎng)“嗷嗷待哺”,基礎(chǔ)設(shè)施正快馬加鞭地建設(shè),RRAM“大顯身手”指日可待:
據(jù)國(guó)內(nèi)基于RRAM設(shè)計(jì)存算一體AI大算力芯片的億鑄科技創(chuàng)始人、董事長(zhǎng)兼CEO熊大鵬博士介紹,基于RRAM的存算一體AI大算力芯片可以在不增加物理空間的前提下,大大提升算力密度,大幅度降低能耗,減少采購和運(yùn)維成本。
假以時(shí)日,RRAM將在AI大算力賽道上造就下一個(gè)里程碑。
評(píng)論