GPU,加速計(jì)算光刻
計(jì)算光刻技術(shù)是通過(guò)對(duì)掩膜、光源的正向或反演優(yōu)化,降低因光波衍射影響光刻效果的程度。計(jì)算光刻是采用計(jì)算機(jī)模擬、仿真光刻工藝的光化學(xué)反應(yīng)和物理過(guò)程,從理論上指導(dǎo)光刻工藝參數(shù)的優(yōu)化。計(jì)算光刻通常包括光學(xué)鄰近效應(yīng) 修正(OPC)、光源-掩膜協(xié)同優(yōu)化技術(shù)(SMO)、多重圖形技術(shù)(MPT)、 反演光刻技術(shù)(ILT)等四大技術(shù)。
本文引用地址:http://m.butianyuan.cn/article/202502/467280.htm在制造現(xiàn)代半導(dǎo)體器件方面存在許多挑戰(zhàn),整個(gè)行業(yè)能夠克服這些挑戰(zhàn)本身就令人驚嘆。從基礎(chǔ)物理到制造工藝再到開(kāi)發(fā)流程,都不乏棘手的問(wèn)題需要解決。其中一些最大的挑戰(zhàn)出現(xiàn)在用于深亞微米芯片的光刻技術(shù)中。最近的一篇文章概述了光刻技術(shù)的主要趨勢(shì),并總結(jié)了幾個(gè)挑戰(zhàn)和新興解決方案。這篇文章聚焦于另一個(gè)關(guān)鍵挑戰(zhàn)——光刻計(jì)算需求的大幅增加——并討論了圖形處理單元(GPU)如何幫助滿(mǎn)足這一需求。
計(jì)算需求增加的原因在于通過(guò)衍射或工藝效應(yīng)來(lái)補(bǔ)償光刻過(guò)程中引入的圖像誤差,隨著芯片設(shè)計(jì)的日益密集,這個(gè)過(guò)程需要更長(zhǎng)的時(shí)間。如果不進(jìn)行校正,刻在硅上的圖案將無(wú)法精確再現(xiàn)設(shè)計(jì)者繪制的形狀。角落可能會(huì)被圓化,線寬可能與預(yù)期不同。處理這一問(wèn)題的傳統(tǒng)方法是使用光學(xué)鄰近校正(OPC),它調(diào)整邊緣和多邊形,以?xún)?yōu)化刻蝕特征,盡可能接近設(shè)計(jì)意圖。
OPC 需要大量的計(jì)算,但這通常不是一個(gè)主要的問(wèn)題,因?yàn)榛诜侄蔚膬?yōu)化,可進(jìn)行并行處理。更大的問(wèn)題是,OPC 提供了有限的自由度,在復(fù)雜的糾正形狀和用于糾正他們的技術(shù)。近年來(lái),逆光刻技術(shù)(ILT)作為一種更靈活的方法出現(xiàn)。模式被轉(zhuǎn)換為像素,以便可以使用基于像素的優(yōu)化技術(shù)。ILT 可以處理更廣泛的形狀和圖案,但它比 OPC 需要更多的計(jì)算能力。并行處理被廣泛使用,但用戶(hù)報(bào)告說(shuō),一個(gè) ILT 掩碼可以在多天內(nèi)消耗超過(guò) 10K 個(gè) CPU 核心。
計(jì)算光刻的需求不斷增長(zhǎng)。每個(gè)新的節(jié)點(diǎn)意味著每個(gè)掩模有更多的多邊形,先進(jìn)的工藝需要更多的掩模,而使用的形狀變得越來(lái)越復(fù)雜。鑒于 GPU 提供了巨大的并行性并成功加速了芯片開(kāi)發(fā)過(guò)程中的其他幾個(gè)步驟,人們自然會(huì)想知道它們是否能加速 ILT 的計(jì)算。用戶(hù)很清楚他們的愿望:使用合理的資源,計(jì)算時(shí)間不到一天。NVIDIA、臺(tái)積電和 Synopsys 之間的近期合作提供了顯著的證據(jù),表明 GPU 可以幫助實(shí)現(xiàn)這一目標(biāo)。這項(xiàng)工作涉及光刻代碼從 CPU 到 GPU 的三個(gè)主要轉(zhuǎn)換:
一些基于圖像的操作自然適合通過(guò)直接重寫(xiě)來(lái)實(shí)現(xiàn) GPU 并行化,包括 FFT、卷積和圖像處理。這些操作在下圖中的綠色橢圓形中顯示。
從多邊形/邊/點(diǎn)迭代到基于像素計(jì)算的算法,如新模型形式等都被轉(zhuǎn)移到了 GPU 適配的領(lǐng)域。這些算法如下圖中藍(lán)色橢圓所示。將非 GPU 友好型數(shù)據(jù)結(jié)構(gòu)(如基于多邊形的布爾值和交互、用于創(chuàng)建水平集的多邊形-2-像素算法以及輪廓繪制)遷移到 GPU 代碼。這需要大量的研究、創(chuàng)新和軟件工程。這些結(jié)構(gòu)如下圖中紅色橢圓所示。
過(guò)去,基于 CPU 的算法和計(jì)算服務(wù)器硬件的改進(jìn)為計(jì)算光刻技術(shù)提供了 2-4 倍的速度提升。2020 年使用 GPU 的初步實(shí)驗(yàn)表明,ILT 仿真功能的速度提高了 10 倍。如上圖所示,隨后的工作發(fā)現(xiàn)許多其他計(jì)算,如多邊形和非基于圖像的操作,都適合 GPU。其中一些操作既可用于 OPC,也可用于 ILT,這表明 GPU 可以加快這兩種類(lèi)型的掩模優(yōu)化。
NVIDIA、臺(tái)積電(TSMC)和 Synopsys 還共同開(kāi)發(fā)了一個(gè)新的 GPU 光刻庫(kù),用于 OPC 和 ILT。該庫(kù)具有基于多邊形和邊緣的幾何算法、多邊形光柵化、FFT、卷積等特性。在某些類(lèi)型的功能上,速度比 CPU 快高達(dá) 40 倍。從 CPU 到 GPU 的總體加速比,對(duì)于單個(gè) ILT「配方」在幾個(gè)模板上累積的總運(yùn)行時(shí)間超過(guò) 15 倍。使用較少的并行機(jī)器,多天的 CPU 運(yùn)行時(shí)間可以縮短到不到一天。
計(jì)算光刻技術(shù)仍然是一個(gè)非常活躍的研究、開(kāi)發(fā)和部署領(lǐng)域。更多流程和功能將繼續(xù)為 GPU 啟用,人工智能機(jī)器學(xué)習(xí)(ML)的應(yīng)用也在不斷增加,更有效的 CPU+GPU 協(xié)同優(yōu)化也在不斷推進(jìn)。
評(píng)論