計(jì)算光刻究竟是個(gè)啥?和光刻是什么關(guān)系?
關(guān)鍵詞: 臺(tái)積電 ASML 計(jì)算機(jī)光刻
2023春季GTC上,NVIDIA與TSMC(臺(tái)積電)、ASML 和Synopsys聯(lián)合宣布,完成全新的 AI 加速計(jì)算光刻技術(shù) cuLitho。cuLitho可以將下一代芯片計(jì)算光刻度提高 40 倍以上,極大降低了光掩膜版開發(fā)的時(shí)間和成本。
cuLitho的成功,幫助摩爾定律前進(jìn)到2nm掃平了一些外在障礙,同時(shí)也證明在傳統(tǒng)CPU占據(jù)的領(lǐng)域,GPU完全可以依靠其并行計(jì)算的價(jià)值,將生產(chǎn)力提升至新高度。
NVIDIA CEO黃仁勛表示,“芯片行業(yè)是世界上幾乎所有其他行業(yè)的基礎(chǔ),隨著光刻技術(shù)達(dá)到物理極限,NVIDIA 推出 cuLitho 并與我們的合作伙伴 TSMC、ASML 和 Synopsys 合作,使晶圓廠能夠提高產(chǎn)量、減少碳足跡并為 2nm 及更高工藝奠定基礎(chǔ)?!?br style="white-space: normal; color: rgb(102, 102, 102); font-family: 宋體; font-size: 12px;"/>
實(shí)際上,盡管OPC是個(gè)非常小眾的市場(chǎng),但是正如光刻機(jī)一樣,可以影響到未來(lái)摩爾定律的演進(jìn)。同時(shí),計(jì)算光刻也是芯片設(shè)計(jì)和制造過程中的最大計(jì)算工作負(fù)載。黃仁勛表示,計(jì)算光刻每年消耗數(shù)百億CPU工作,這項(xiàng)投入占了芯片制造總投入的相當(dāng)大的比重。
光刻與計(jì)算光刻
對(duì)于光刻其實(shí)不必花太多筆墨做介紹了。這是芯片制造過程中最重要的一個(gè)步驟,就像是用“光刀”在晶圓上“雕刻”一樣。“雕刻”當(dāng)然是要“刻”出特定的圖案的。這個(gè)圖案首先要呈現(xiàn)在光掩膜(photomask)上。掩膜板就像是漏字板,激光一照,通過鏡頭,“漏字板”上的圖案也就落到了硅片上,如下圖。

晶體管、器件、互聯(lián)線路都需要經(jīng)過這樣的光刻步驟。實(shí)操當(dāng)然比這三兩句話的形容要復(fù)雜得多,比如現(xiàn)在的芯片上上下下那么多層,不同的層就需要不同的光刻和掩膜板;而且某些層如果器件間距很小,就可能需要多次光刻。
這里面還有個(gè)很反常識(shí)的事,就是在我們的認(rèn)知里,比如要光刻上面這個(gè)圖案,幾個(gè)長(zhǎng)方形——那么掩膜板要做成圖中左邊鏤空的樣子,則光源照射以后,落在硅片上就變成了圖中右側(cè)的樣子。但實(shí)際情況卻并不是這樣的。光掩膜其實(shí)要做成下面這樣:

這掩膜板復(fù)雜成這樣,是不是挺反直覺的?光一照,刻到晶圓上會(huì)變成下面這樣?英偉達(dá)先進(jìn)技術(shù)副總裁Vivek Singh解釋說(shuō),半導(dǎo)體發(fā)展的過去幾十年,晶體管和互聯(lián)間距變得越來(lái)越小——原本一切發(fā)展都還算順利。但“大概30年前,晶體管的尺寸變得比(光刻機(jī)所用的)激光波長(zhǎng)還要小,于是衍射效應(yīng)就產(chǎn)生了,晶體管成像就會(huì)變得模糊”。
對(duì)光學(xué)或者攝影有了解的同學(xué),對(duì)衍射效應(yīng)這個(gè)詞應(yīng)該不會(huì)陌生。對(duì)于相機(jī)而言,當(dāng)光圈小到某種程度以后,照片受到衍射效應(yīng)的影響就會(huì)顯著增大,導(dǎo)致畫面解析力的大幅下降;實(shí)際上,超高像素(或小像素)也受制于衍射效應(yīng)。這一點(diǎn)體現(xiàn)在比相機(jī)精密很多的光刻機(jī)上,也是類似的。Vivek就把光刻機(jī)稱作是“fancy camera”。
當(dāng)然,我們知道光刻機(jī)所用光源也有過幾次大的迭代,到現(xiàn)在談?wù)撟疃嗟木褪荄UV和EUV。尤其EUV極紫外光刻是波長(zhǎng)顯著變小的一代光源了。不過即便是昂貴的EUV,其波長(zhǎng)與器件間距之間的差異,也變得比過去更小。換句話說(shuō),光刻圖案未來(lái)將一步步走向模糊——或者說(shuō)沒有很高的保真度。
這就是計(jì)算光刻切入的契機(jī)——至少藉由計(jì)算光刻要緩解這方面的像差,對(duì)于芯片制造產(chǎn)生的不良影響。
此前我們探訪ASML中國(guó),就聽ASML聊起過計(jì)算光刻。計(jì)算光刻是ASML的“鐵三角”業(yè)務(wù)之一。ASML告訴我們,計(jì)算光刻是通過軟件,對(duì)整個(gè)光刻過程來(lái)做建模和仿真,對(duì)工藝流程做優(yōu)化;比如說(shuō)形貌優(yōu)化、掩膜板修正等。舉個(gè)例子,比如ASML有個(gè)“自由形狀照明(freeform illumination)”,就是通過改變照明形態(tài)來(lái)提高成像的解析力。

這就是上面那張圖,光掩膜看起來(lái)如此奇怪的原因。即為消除光刻過程中,小尺寸器件“模糊”的問題,就需要對(duì)光路上的組成部分做修改。這就好像:在要求得到某個(gè)結(jié)果(這一例也就是幾個(gè)長(zhǎng)方形的圖案)時(shí),算出光源、光掩膜需要做哪些調(diào)整。這個(gè)過程就是計(jì)算光刻。
問題來(lái)了,計(jì)算光刻越來(lái)越難
但是現(xiàn)在問題來(lái)了,據(jù)NVIDIA先進(jìn)技術(shù)集團(tuán)副總裁Vivek K Singh的說(shuō)法:“我在1993年加入光刻工作時(shí),如果你想在晶圓上印一個(gè)十字,你只需要在掩模上印一個(gè)十字就行。但是很快情況就變了,光的擴(kuò)散會(huì)影響分辨率,導(dǎo)致模糊或失真 ,這意味著可能會(huì)遺漏芯片的重要元素。如下圖所示,一些可愛的狗耳朵和雙髻鯊開始出現(xiàn)在掩膜上,以此來(lái)彌補(bǔ)光學(xué)衍射。但這還遠(yuǎn)遠(yuǎn)不夠,我們不得不采用完全成熟的基于光學(xué)接近校正(OPC)的模型,后來(lái)又開始通過基于規(guī)則的輔助功能來(lái)增強(qiáng)它。從最簡(jiǎn)單的一些粉飾到逐漸扭曲的掩膜,最終的結(jié)果還是要在晶圓上印下那個(gè)十字,只不過是在很小的晶圓尺寸上?!?/span>

由此可以看出,當(dāng)芯片的關(guān)鍵尺寸小于光源波長(zhǎng)的時(shí)候,所需要的掩模版越來(lái)越復(fù)雜。幾十年來(lái),為芯片在制造過程中制作掩膜一直是半導(dǎo)體制造中的關(guān)鍵環(huán)節(jié)。
尤其是芯片逐漸來(lái)到3nm及以下,不僅需要更加精準(zhǔn)的光刻計(jì)算,光刻計(jì)算所需的時(shí)間也越來(lái)越長(zhǎng)。計(jì)算光刻是涉及電磁物理、光化學(xué)、計(jì)算幾何、迭代優(yōu)化和分布式計(jì)算的復(fù)雜計(jì)算,沒有更強(qiáng)大的計(jì)算光刻很難實(shí)現(xiàn)這樣復(fù)雜的掩模版設(shè)計(jì)。
像臺(tái)積電這樣的代工廠需要有大量的數(shù)據(jù)中心來(lái)處理相關(guān)計(jì)算和仿真運(yùn)行,代工廠的數(shù)據(jù)中心通常是以CPU為核心。下圖是Vivek Singh估算的每年CPU工作的小時(shí)數(shù),左側(cè)y軸顯示了隨著工藝節(jié)點(diǎn)不斷微縮,光學(xué)鄰近修正(OPC)在2nm、1nm差不多需要CPU來(lái)計(jì)算幾百萬(wàn)小時(shí)。右側(cè)Y軸上是不同工藝節(jié)點(diǎn)所用的數(shù)據(jù)中心的數(shù)量,5nm節(jié)點(diǎn)差不多需要3個(gè)大的數(shù)據(jù)中心,每個(gè)數(shù)據(jù)中心需要處理10個(gè)掩膜。3nm節(jié)點(diǎn)的時(shí)候需要6個(gè)數(shù)據(jù)中心,如果繼續(xù)這樣下去,到1nm則很有可能需要100個(gè)數(shù)據(jù)中心?!澳悴荒芤恢痹黾訑?shù)據(jù)中心,有些東西必須舍棄,洛杉磯已經(jīng)開始下雪了?!盫ivek Singh如是說(shuō)道。再者,現(xiàn)在的計(jì)算能力在未來(lái)很可能不夠。
所以,在半導(dǎo)體制造中的超大型工作負(fù)載所需的計(jì)算時(shí)間成本,已經(jīng)使得摩爾定律不再具有經(jīng)濟(jì)性。計(jì)算光刻這一步驟也成為將新的納米技術(shù)節(jié)點(diǎn)和計(jì)算機(jī)架構(gòu)推向市場(chǎng)的瓶頸。
2020年臺(tái)積電在一次會(huì)議上提到,采用GPU可以將反向光刻(ILT)仿真時(shí)間減少10倍以上。ppt的最后臺(tái)積電提了一個(gè)很重要的問題,GPU庫(kù)可以用于多邊形操作嗎?
英偉達(dá)改變了游戲規(guī)則
今天英偉達(dá)證明了,可以。為什么GPU可以用于計(jì)算光刻,因?yàn)橛?jì)算光刻技術(shù)中至少一半的OPC和ILT是由前成像組成的,而且它幾乎完全是由卷積運(yùn)算組成的,這些正是GPU擅長(zhǎng)的。
在近日的GTC大會(huì)上,英偉達(dá)在GPU之上構(gòu)建了cuLitho計(jì)算光刻技術(shù)軟件庫(kù),這是英偉達(dá)四年秘密研發(fā)的成果。在cuLitho計(jì)算光刻軟件庫(kù)中有多項(xiàng)技術(shù),如下圖所示,cuDOP用于衍射光學(xué),cuCompGeo用于計(jì)算幾何,cuOASIS用于優(yōu)化,cuHierarchy用于AI。
cuLitho已被EDA工具廠商新思采用,cuLitho已集成到新思科技Proteus全芯片掩模合成解決方案和Proteus ILT逆光刻技術(shù)。一般情況下,晶圓廠在改變工藝時(shí)需要修改OPC,因此會(huì)遇到瓶頸。cuLitho不僅可以幫助突破這些瓶頸,還可以提供曲線式光掩模、High-NA EUV光刻、亞原子光刻膠建模等新技術(shù)節(jié)點(diǎn)所需的新型解決方案和創(chuàng)新技術(shù)。
cuLitho的核心是一組并行算法,由英偉達(dá)科學(xué)家發(fā)明,計(jì)算光刻工藝的所有部分都可以并行運(yùn)行,原來(lái)需要4萬(wàn)個(gè)CPU系統(tǒng)才能完成的工作,現(xiàn)在僅需用500個(gè)NVIDIA DGX H100系統(tǒng)即可完成,這不僅大大加速了目前每年消耗數(shù)百億CPU小時(shí)的大規(guī)模計(jì)算工作負(fù)載,而且降低了耗電和對(duì)環(huán)境的影響。
cuLitho在組件級(jí)別上平均加速了一次連續(xù)的CPU操作,基于Ampere組件上提升了138倍,在Hopper結(jié)構(gòu)上提高了254倍。在端到端的OPC項(xiàng)目中,結(jié)合Ampere提升了23倍,在Hopper上提升了42倍。
使用cuLitho的晶圓廠每天的光掩模產(chǎn)量可增加3-5倍,而耗電量可以比當(dāng)前配置降低9倍。英偉達(dá)表示,基于GPU的cuLitho計(jì)算光刻技術(shù),其性能比當(dāng)前光刻技術(shù)工藝提高了40倍,原本需要兩周時(shí)間才能完成的光掩模現(xiàn)在可以在一夜之間完成。例如英偉達(dá)H100 GPU需要89塊掩膜板,在CPU上運(yùn)行時(shí),處理單個(gè)掩膜板需要兩周時(shí)間,而在GPU上運(yùn)行cuLitho只需8小時(shí)。
從長(zhǎng)遠(yuǎn)來(lái)看,cuLitho將帶來(lái)更好的設(shè)計(jì)規(guī)則、更高的密度和產(chǎn)量以及AI驅(qū)動(dòng)的光刻技術(shù),使晶圓廠能夠提高產(chǎn)量、減少碳足跡并為2納米及更高工藝奠定基礎(chǔ)。
cuLitho計(jì)算光刻技術(shù)軟件庫(kù),目前已得到了臺(tái)積電、ASML的合作。cuLitho將于6月在臺(tái)積電開始使用,臺(tái)積電用其來(lái)部署反演光刻技術(shù)、深度學(xué)習(xí)等;ASML計(jì)劃在所有計(jì)算光刻軟件產(chǎn)品中加入對(duì)GPU的支持,cuLitho的優(yōu)勢(shì)在High-NA EUV光刻時(shí)代將變得尤為明顯;EDA工具供應(yīng)商Synopsys OPC軟件將在cuLitho平臺(tái)上運(yùn)行。
下圖是一個(gè)chromeless face shift掩膜,如果把它放進(jìn)ASML最新的光刻機(jī)中,會(huì)出來(lái)怎樣一個(gè)圖案呢?
答案是,NVIDIA cuLitho。
目前的cuLitho計(jì)算光刻技術(shù)還只是一個(gè)于麥克斯韋方程組的數(shù)學(xué)工具,但英偉達(dá)表示,基于人工智能的計(jì)算光刻技術(shù)“正在開發(fā)中”。想象一些如果AI技術(shù)引入計(jì)算光刻又將如何?
寫在最后
沒有計(jì)算光刻技術(shù)的支撐,芯片制造商就不可能制造出最新的技術(shù)節(jié)點(diǎn)。cuLitho計(jì)算光刻庫(kù)軟件的發(fā)布,不僅為芯片的繼續(xù)演進(jìn)提供了一項(xiàng)革新技術(shù),也再次發(fā)揮了GPU的潛力——從最初的圖形處理到AI芯片、再到數(shù)據(jù)中心、乃至芯片的未來(lái),老黃贏麻了。
借用《軟硬件融合》圖書和公眾號(hào)作者,上海矩向科技創(chuàng)始人兼CEO黃朝波對(duì)該發(fā)布的點(diǎn)評(píng):“老黃是非常成功的,但其實(shí)本質(zhì)上老黃就只做了一件事情(并行計(jì)算)和兩個(gè)方面(GPU是并行計(jì)算平臺(tái),CUDA是為了更好的并行計(jì)算編程)。”
每次當(dāng)芯片演變出現(xiàn)瓶頸,總會(huì)有新技術(shù)出現(xiàn),例如FinFET晶體管技術(shù)的發(fā)明給摩爾定律續(xù)命了十幾年。現(xiàn)在,為了讓芯片繼續(xù)微縮下去,各種新材料、新架構(gòu)、新封裝、新互聯(lián)等技術(shù)層出不窮。