AI計(jì)算時(shí)代,25年工齡的RRAM漸入佳境

作者：時(shí)間：2023-02-14 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

本文引用地址：http://m.butianyuan.cn/article/202302/443341.htm

RRAM，一個(gè)非易失性新型存儲(chǔ)器，突然火了。

該新型存儲(chǔ)器是以非導(dǎo)性材料的電阻在外加電場(chǎng)作用下，在高阻態(tài)和低阻態(tài)之間實(shí)現(xiàn)可逆轉(zhuǎn)換為原理制造而成的存儲(chǔ)器。由于結(jié)構(gòu)簡(jiǎn)單、集成度高、低功耗等優(yōu)點(diǎn)，一直被認(rèn)為是最有可能突破傳統(tǒng)器件限制的新型器件。

而RRAM一路走來，卻萬(wàn)分坎坷。從開始“上班”到不被看好，再到小有名氣，RRAM花了25年：

2008年，惠普公司提出一種被稱為憶阻器（memristor）的 RRAM，將其用在面向未來的系統(tǒng)“The Machine”上。但惠普在這項(xiàng)技術(shù)上努力多年之后卻轉(zhuǎn)向了一種更加傳統(tǒng)的內(nèi)存方案，退出了憶阻器的道路。

對(duì)于一項(xiàng)新型技術(shù)來說，大廠長(zhǎng)時(shí)間堅(jiān)持后未果并拋棄，最為致命，更何況是兩個(gè)：

2014年前后，自2011年開始與索尼一同開發(fā)RRAM的美光退出項(xiàng)目，轉(zhuǎn)而開始與英特爾合作重點(diǎn)開發(fā)另一種存儲(chǔ)技術(shù) 3D XPoint。

從1990s到2010s，RRAM走過了功能機(jī)時(shí)代，跨過了智能終端時(shí)代，一直被研究，從未被大規(guī)模應(yīng)用，幾乎被時(shí)代遺忘。

而現(xiàn)如今，RRAM又被大廠“相中”，同時(shí)多了一大批堅(jiān)定的擁護(hù)者：

2022年11月，英飛凌和臺(tái)積電宣布，兩家公司正準(zhǔn)備將臺(tái)積電的電阻式RAM（RRAM）非易失性存儲(chǔ)器（NVM）技術(shù)引入英飛凌的下一代AURIX?微控制器（MCU）。

國(guó)內(nèi)外多個(gè)半導(dǎo)體初創(chuàng)公司一心撲在RRAM上：

● 成立于2015年的Weebit Nano，試圖利用RRAM，滿足物聯(lián)網(wǎng)（IoT）設(shè)備、機(jī)器人、5G通信和人工智能等一系列新電子產(chǎn)品中對(duì)更高性能和更低功耗內(nèi)存解決方案日益增長(zhǎng)的需求。

● 成立于2019年的昕原半導(dǎo)體，打造基于RRAM技術(shù)的新型存儲(chǔ)產(chǎn)品及相關(guān)衍生品，服務(wù)于AIoT、人工智能、數(shù)據(jù)中心、智能汽車等新興應(yīng)用。

● 成立于2020年的億鑄科技，研發(fā)基于RRAM的全數(shù)字存算一體大算力AI芯片，服務(wù)于云端數(shù)據(jù)中心、智能駕駛等對(duì)算力密度、能效比需求很高的應(yīng)用場(chǎng)景。

······

本文想要探討的是：RRAM為何在現(xiàn)在讓大廠回心轉(zhuǎn)意？RRAM要如何完成自己的逆襲之路？

“團(tuán)寵”RRAM

逆襲始于2021年。

過去業(yè)內(nèi)對(duì)于RRAM最大的質(zhì)疑，無外乎“工藝不成熟、商業(yè)化遲遲不能落地”。

而在2021年，晶圓代工廠臺(tái)積電現(xiàn)身，為RRAM站臺(tái)：宣布40nmRRAM進(jìn)入量產(chǎn)，28nm和22nmRRAM準(zhǔn)備量產(chǎn)。

隨后，國(guó)內(nèi)同樣傳來利好消息：2022年2月，昕原半導(dǎo)體主導(dǎo)建設(shè)的RRAM 12寸中試生產(chǎn)線順利完成了自主研發(fā)裝備的裝機(jī)驗(yàn)收工作，實(shí)現(xiàn)中試線工藝流程的通線，并成功流片（試生產(chǎn)）。

質(zhì)疑被一步步打破，RRAM正式迎來自己的逆襲之路。

首先是在學(xué)界，RRAM存在感直線上升，從探討其潛力、可行性轉(zhuǎn)變到證明其可靠性。

在2008-2016年前后，學(xué)界的文章關(guān)于RRAM的描述大多是“有潛能”，團(tuán)隊(duì)大多是提出解決方案：

● 2009年，惠普實(shí)驗(yàn)室論證了利用 Crosslatch 系統(tǒng)可以較為簡(jiǎn)單的實(shí)現(xiàn)堆棧，形成立體的內(nèi)存結(jié)構(gòu)，RRAM在速度、密度等方面均具有極大的潛能，能有效替代目前的存儲(chǔ)單元。

● 2016年，在VLSI（超大規(guī)模集成電路）國(guó)際研討會(huì)上，中國(guó)科學(xué)院微電子研究所劉明院士的團(tuán)隊(duì)提出了自對(duì)準(zhǔn)高性能自選通RRAM結(jié)構(gòu)，為高密度、低成本三維垂直交叉陣列的制備提供解決方案。

······

而在2022年，大多文章是在推動(dòng)RRAM的快速落地，通過設(shè)計(jì)、實(shí)驗(yàn)證明其有著足夠的優(yōu)勢(shì)：

● 在2022年度ISSCC會(huì)議上，臺(tái)積電發(fā)表六篇關(guān)于存內(nèi)計(jì)算存儲(chǔ)器IP的論文，大力推進(jìn)基于RRAM的存內(nèi)計(jì)算方案。

● 在中國(guó)半導(dǎo)體十大研究進(jìn)展候選推薦（2022-025）中，有著RRAM的身影：

以中國(guó)科學(xué)院微電子研究所微電子劉明院士、張鋒研究員為主導(dǎo)的團(tuán)隊(duì)，首次設(shè)計(jì)實(shí)現(xiàn)了基于三維垂直結(jié)構(gòu)阻變存儲(chǔ)器的存算一體宏單元芯片，實(shí)驗(yàn)表明三維阻變存儲(chǔ)器不但可以完整的實(shí)現(xiàn)存算一體技術(shù)，同時(shí)證明了其在低功耗以及高算力、高密度方面的優(yōu)勢(shì)。

其次是在產(chǎn)界，芯片設(shè)計(jì)、制造廠商紛紛將RRAM納入到自己的規(guī)劃之中：

在代工廠方面，臺(tái)積電、Crossbar、聯(lián)電、中芯國(guó)際以及昕原半導(dǎo)體等均已建立了可量產(chǎn)的商業(yè)化RRAM產(chǎn)線：

例如2022年6月，昕原半導(dǎo)體宣布其RRAM新型存儲(chǔ)技術(shù)通過嚴(yán)苛測(cè)試，“昕·山文”安全存儲(chǔ)系列RRAM產(chǎn)品成功交付工控領(lǐng)域頭部企業(yè)禾川科技，實(shí)現(xiàn)在工業(yè)自動(dòng)化控制核心部件的商用量產(chǎn)。

在商業(yè)化方面，RRAM在市面上主要有兩大應(yīng)用方向，分別是存儲(chǔ)應(yīng)用與存算應(yīng)用。

在存儲(chǔ)應(yīng)用上，目前有英特爾、松下等大廠將RRAM用于MCU領(lǐng)域:

● 2013年7月，松下推出了8位MCU，該MCU集成了0.18微米R(shí)RAM技術(shù)，成為第一個(gè)將RRAM技術(shù)商業(yè)化的大廠；

● 2022年11月，英特爾宣布，將非易失性存儲(chǔ)器RRAM引入英飛凌的下一代 AURIX ?微控制器 (MCU)

除此之外，在去年的各大展會(huì)、論壇上，也有多家初創(chuàng)企業(yè)認(rèn)可了RRAM的發(fā)展?jié)摿?，提出?jì)劃使用或者轉(zhuǎn)向RRAM作為其未來發(fā)展AI芯片的存儲(chǔ)介質(zhì)。

在存算應(yīng)用上，目前僅有國(guó)內(nèi)的億鑄科技，試圖基于RRAM通過存算一體架構(gòu)實(shí)現(xiàn)AI大算力芯片，將其應(yīng)用在中心側(cè)與邊緣側(cè)的應(yīng)用場(chǎng)景中，著眼于解決目前AI芯片“能效比不理想、算力密度不滿足市場(chǎng)要求、軟件部署成本高及效率低”等痛點(diǎn)。

學(xué)界、產(chǎn)界正將RRAM推向“C位”，視為團(tuán)寵，這背后是AI市場(chǎng)的驅(qū)動(dòng)。

現(xiàn)階段，自動(dòng)駕駛、智算中心、AR/VR元宇宙、ChatGPT等高密度計(jì)算場(chǎng)景的蓬勃發(fā)展，帶動(dòng)了以AI芯片為首的一大批新型半導(dǎo)體技術(shù)的爆發(fā)。

機(jī)會(huì)與挑戰(zhàn)并存，隨著AI算力需求走向100Tops、1000Tops甚至更高水平，以及對(duì)于能效比需求走向10TOPS/W、甚至100TOPS/W以上，傳統(tǒng)馮·諾伊曼架構(gòu)“招架不住”了。

這是因?yàn)樵隈T·諾伊曼架構(gòu)之下，芯片的存儲(chǔ)、計(jì)算區(qū)域是分離的。計(jì)算時(shí)，數(shù)據(jù)需要在兩個(gè)區(qū)域之間來回搬運(yùn)，而隨著神經(jīng)網(wǎng)絡(luò)模型層數(shù)、規(guī)模以及數(shù)據(jù)處理量的不斷增長(zhǎng)，數(shù)據(jù)已經(jīng)面臨“跑不過來”的境況，成為高效能計(jì)算性能和功耗的瓶頸，也就是業(yè)內(nèi)俗稱的“存儲(chǔ)墻”。

存儲(chǔ)墻相應(yīng)地也帶來了能耗墻、編譯墻（生態(tài)墻）的問題。例如編譯墻問題，是由于大量的數(shù)據(jù)搬運(yùn)容易發(fā)生擁塞，編譯器無法在靜態(tài)可預(yù)測(cè)的情況下對(duì)算子、函數(shù)、程序或者網(wǎng)絡(luò)做整體的優(yōu)化，只能手動(dòng)、一個(gè)個(gè)或者一層層對(duì)程序進(jìn)行優(yōu)化，耗費(fèi)了大量時(shí)間。

這“三堵墻”導(dǎo)致算力無謂浪費(fèi)：據(jù)統(tǒng)計(jì)，在大算力的AI應(yīng)用中，數(shù)據(jù)搬運(yùn)操作消耗90%的時(shí)間和功耗，數(shù)據(jù)搬運(yùn)的功耗是運(yùn)算的650倍。

于是，能夠打破這三堵墻的“存算一體架構(gòu)”漸入人們的視野。該架構(gòu)將存儲(chǔ)和計(jì)算的融合，徹底消除了訪存延遲，并極大降低了功耗。同時(shí)，由于計(jì)算完全耦合于存儲(chǔ)，因此可以開發(fā)更細(xì)粒度的并行性，獲得更高的性能和能效。

目前，實(shí)現(xiàn)存算一體有兩種存儲(chǔ)器件的選擇：

● 第一種是基于易失性存儲(chǔ)器，例如DRAM和SRAM，但由于DRAM制造工藝和邏輯計(jì)算單元的制造工藝不同，無法實(shí)現(xiàn)良好的片上融合，而SRAM難以進(jìn)行片上大規(guī)模集成，同時(shí)，因?yàn)镾RAM和DRAM是易失性存儲(chǔ)器，需要持續(xù)供電來保存數(shù)據(jù)，仍存在功耗的問題。

● 第二種是結(jié)合非易失性新型存儲(chǔ)器。新型存儲(chǔ)器通過阻值變化來存儲(chǔ)數(shù)據(jù)，而存儲(chǔ)器加載的電壓等于電阻和電流的乘積，相當(dāng)于每個(gè)單元可以實(shí)現(xiàn)一個(gè)乘法運(yùn)算，再匯總相加便可以實(shí)現(xiàn)矩陣乘法。在這種情況下，同一單元就可以完成數(shù)據(jù)存儲(chǔ)和計(jì)算，消除了數(shù)據(jù)訪存帶來的延遲和功耗，是真正意義上的存算一體。

另外，傳統(tǒng)存儲(chǔ)器所具有的易失性、微縮性差等問題可以被新型非易失性存儲(chǔ)器很好地解決。RRAM在AI大算力場(chǎng)景下似乎更具優(yōu)勢(shì)：

目前可用于存算一體的成熟存儲(chǔ)器有NOR FLASH、SRAM、DRAM、RRAM、MRAM等。相比之下，RRAM具備低功耗、高計(jì)算精度、高能效比和制造兼容CMOS工藝等優(yōu)勢(shì)：

也就是說，AI計(jì)算整體市場(chǎng)的驅(qū)動(dòng)，引發(fā)了RRAM在存算一體這一方向的爆發(fā)。隨著人工智能市場(chǎng)規(guī)模不斷擴(kuò)大，屬于RRAM的市場(chǎng)爆發(fā)很快就會(huì)到來，學(xué)界、產(chǎn)界難免要“蜂擁而至”。

AI大算力，RRAM的“用武之地”

當(dāng)我們回顧存儲(chǔ)器的發(fā)展時(shí)發(fā)現(xiàn)，目前主流的存儲(chǔ)介質(zhì)NOR FLASH，同樣經(jīng)歷了不被看好階段：

2000年前后的功能機(jī)時(shí)代，手機(jī)對(duì)內(nèi)存的要求不高，NOR Flash憑借著NOR+PSRAM的XIP架構(gòu)，更快的讀取速度、可隨機(jī)訪問等特點(diǎn)，得到快速發(fā)展。

好景不長(zhǎng)，沒過幾年NOR Flash市場(chǎng)便不斷萎縮：

2009—2016 年 NOR Flash 市場(chǎng)規(guī)模一路下降至低于20億美元，存儲(chǔ)大廠三星、美光等公司都逐步退出NOR市場(chǎng)。這是因?yàn)?，到了智能機(jī)時(shí)代，大量吃內(nèi)存的APP涌現(xiàn)，NOR的容量小、成本高的缺點(diǎn)無法被掩蓋，逐漸被容量充足、成本更低的NAND給取代。

但就在各大廠商關(guān)停NOR產(chǎn)線的同時(shí)，NOR Flash喜迎“第二春”。最主要的原因是，下游需求旺盛的AMOLED急需NOR Flash來“救場(chǎng)”。

隨著手機(jī)廠商蘋果選擇了AMOLED屏幕，AMOLED的滲透率得到了大幅提升，AMOLED相較于LCD而言，優(yōu)點(diǎn)眾多，但亮度不均勻、存在殘像仍是它面臨的兩個(gè)主要難題，也就需要用到補(bǔ)償技術(shù)。

業(yè)內(nèi)紛紛選擇外部補(bǔ)償模式（內(nèi)部補(bǔ)償模式成本過高，技術(shù)難以達(dá)到）：掛一個(gè)存儲(chǔ)器隨時(shí)解決AMOLED面板的藍(lán)色光會(huì)隨時(shí)間消退的問題。

此時(shí)，NOR Flash的高可靠性、快速讀取使其比NAND Flash更為合適，且在外部補(bǔ)償模式下，屏幕對(duì)于容量的要求并不高。

于是，NOR Flash的需求又被快速帶動(dòng)起來，華邦、兆易創(chuàng)新（目前國(guó)內(nèi)NOR Flash龍頭）迅速崛起。

可以看到，找到合適的賽道，是以往存儲(chǔ)器大放光彩的轉(zhuǎn)折點(diǎn)。

RRAM與AI大算力賽道，也同樣如此。

原先，大家對(duì)RRAM的期望是純存儲(chǔ)應(yīng)用，希望其成為下一代主流存儲(chǔ)技術(shù)。但其容量和閃存相比，差別還很大，故在存儲(chǔ)應(yīng)用領(lǐng)域，RRAM并不是最佳的選擇，也就一直“被耽誤”。

如今，在AI大算力時(shí)代，由于存算一體架構(gòu)解決了存儲(chǔ)墻等問題，可以極大降低功耗，提升運(yùn)算能效比。同時(shí)，RRAM工藝逐漸成熟，可以支持大算力芯片的量產(chǎn)。此時(shí)，RRAM具備的“低功耗、低延遲性、高密度”等優(yōu)勢(shì)愈發(fā)凸顯，通過將RRAM存儲(chǔ)技術(shù)與存算一體架構(gòu)結(jié)合，無疑會(huì)產(chǎn)生1+1>2的效果，從而打造高算力、高能效比的AI芯片。

而在AI時(shí)代的多個(gè)應(yīng)用中，RRAM更適用于AI大算力賽道。

AI大算力賽道，正面臨著“井噴”的需求：

根據(jù)IDC、浪潮信息聯(lián)合發(fā)布的《2022-2023中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》顯示，2021年中國(guó)智能算力規(guī)模達(dá)到155.2EFLOPS，預(yù)計(jì)2026年將達(dá)到127.4EFLOPS，年復(fù)合增長(zhǎng)率達(dá)到52.3%。

這是因?yàn)椋S著技術(shù)的突破、模型規(guī)模的不斷增長(zhǎng)，需要消化更大規(guī)模的數(shù)據(jù)，也意味著更高的算力需求。據(jù)OpenAI統(tǒng)計(jì)，從2012年到2020年，人工智能模型訓(xùn)練消耗的算力增長(zhǎng)了30萬(wàn)倍，平均每3.4個(gè)月翻一番超過了摩爾定律的每18個(gè)月翻番的增速。

故，為滿足對(duì)算力的要求，各行各業(yè)各地都在建設(shè)智算中心：

1月11日，由國(guó)家信息中心聯(lián)合浪潮信息發(fā)布的《智能計(jì)算中心創(chuàng)新發(fā)展指南》顯示，當(dāng)前全國(guó)范圍形成智算中心建設(shè)的熱潮：全國(guó)目前有超過30個(gè)城市正在建設(shè)或提出建設(shè)智算中心，整體布局以東部地區(qū)為主，并逐漸向中西部地區(qū)拓展。

AI大算力的下游市場(chǎng)“嗷嗷待哺”，基礎(chǔ)設(shè)施正快馬加鞭地建設(shè)，RRAM“大顯身手”指日可待：

據(jù)國(guó)內(nèi)基于RRAM設(shè)計(jì)存算一體AI大算力芯片的億鑄科技創(chuàng)始人、董事長(zhǎng)兼CEO熊大鵬博士介紹，基于RRAM的存算一體AI大算力芯片可以在不增加物理空間的前提下，大大提升算力密度，大幅度降低能耗，減少采購(gòu)和運(yùn)維成本。

假以時(shí)日，RRAM將在AI大算力賽道上造就下一個(gè)里程碑。