英特爾18A首秀!Panther Lake重塑AI PC體驗:CPUGPU性能暴漲50%!
關(guān)鍵詞: 英特爾 Intel 18A Panther Lake AI PC 異構(gòu)協(xié)同

盡管遭遇重重挑戰(zhàn),但在“Make Intel Great Again”的目標(biāo)牽引下,英特爾正重新踏上復(fù)興之路。
新CEO治下的藍色巨人,內(nèi)部經(jīng)歷大刀闊斧的變革,外部展現(xiàn)合縱連橫的開放。而即將在今年Q4量產(chǎn)的Inte 18A,則成為其在產(chǎn)品和技術(shù)創(chuàng)新側(cè)的奮力一搏。
日前,英特爾在美國亞利桑那舉行的“Tech Tour ”活動上,宣布推出由Intel 18A工藝打造,代號“Pather Lake”的新一代AI PC芯片架構(gòu)。
Intel 18A代表著當(dāng)前集成電路領(lǐng)域先進工藝和晶圓制造水平的天花板,作為全球首個利用Ribbon FET和背部供電的工藝節(jié)點下的首款產(chǎn)品,Panther Lake憑借性能、能效、AI能力等方面的全方位提升,推動AI PC體驗的重塑,而英特爾也借此“秀出肌肉、擊碎質(zhì)疑”,引領(lǐng)晶圓制造進入全新時代。
靈活可擴展:Panther Lake的架構(gòu)雄心
Panther Lake繼承了前兩代Lunar Lake和Arrow Lake在架構(gòu)方面的創(chuàng)新,以及所帶來的能效和性能上的表現(xiàn),英特爾為Panther Lake在架構(gòu)設(shè)計上賦予了極大的靈活度。

Fabric Gen2是英特爾在Lunar lake上推出的新一代片內(nèi)部互聯(lián)技術(shù),主要用于連接計算模塊(Compute Tile)與平臺控制模塊(Platform Controller Tile),以及模塊內(nèi)部各功能單元(如 CPU、GPU、NPU),其核心目標(biāo)是在低功耗與高效通信之間取得平衡。
同時,通過統(tǒng)一的可擴展協(xié)議,F(xiàn)abric Gen2可以CPU、GPU、NPU等核心IP模塊無需與制造和封裝工藝綁定,而是可以根據(jù)需求實現(xiàn)“混搭”,從而突破單一制程和IP體系的限制,這極大增強了架構(gòu)上的可擴展性和靈活度。

Panther Lake繼承了Arrow Lake上獨立GPU模塊的設(shè)計思路(Lunar中GPU位于計算模塊中),計算模塊與GPU模塊通過D2D連接,這為GPU的Xe內(nèi)核的更新以及數(shù)量增加提供便利,也有利于未來實現(xiàn)跨廠商的GPU IP模塊集成。

Panther Lake的架構(gòu)包括計算(集成主要的計算引擎)、GPU、Base、Filler、平臺控制(所有I/O接口IP)、Foveros(Foveros 2.5D封裝)和Package等主要的模塊。

在存儲方面,采用板載內(nèi)存的形式,Panther Lake支持LPDDR5X最高9600MT/s以及最高96GB的容量,DDR5最高支持7200MT/s以及最高128GB的容量。
在封裝技術(shù)方面,F(xiàn)overos-S(2.5D封裝)是英特爾目前在Meteor Lake、Arrow Lake和Panther Lake等產(chǎn)品中正在使用的技術(shù)。所有產(chǎn)品均采用同一封裝形式,也便于客戶進行產(chǎn)品設(shè)計。

整體而言,Panther Lake在架構(gòu)上的靈活性,為平臺設(shè)計提供更多選擇。這有助于Panther Lake作為一個長周期節(jié)點(至少三代產(chǎn)品,英特爾預(yù)計在2030年達到產(chǎn)能和需求的高點)在后續(xù)演進上的迭代,為OEM推出跨越不同價格段的產(chǎn)品在設(shè)計上預(yù)留足夠空間。此外,這種靈活的設(shè)計方式也有助于同更加開放的英特爾代工戰(zhàn)略協(xié)同,吸引外部客戶參與其代工生態(tài)。這也是為何英特爾對于Panther Lake強調(diào)“架構(gòu)雄心”的意義所在。
在Panther Lake的計算模塊,采用的Intel 18A工藝,而對于其他模塊則采用外部工藝、Intel3等,對此,英特爾公司客戶端計算事業(yè)部副總裁兼中國區(qū)總經(jīng)理高嵩解釋稱,在選擇制程時,會權(quán)衡價格、實現(xiàn)時間、團隊具體安排等多種因素,英特爾會根據(jù)產(chǎn)品需求,靈活選擇代工服務(wù)和制程。
Intel 18A:達到量產(chǎn)良率
英特爾18A工藝(1.8 納米級)作為其IDM 2.0戰(zhàn)略的核心技術(shù)突破,不僅承載著英特爾重返技術(shù)領(lǐng)先地位的厚望,更有望通過技術(shù)創(chuàng)新和戰(zhàn)略布局重塑全球半導(dǎo)體競爭格局。
Intel 18A是全球首個利用Ribbon FET和背部供電的工藝節(jié)點。
RibbonFET 全環(huán)繞柵極(GAA)技術(shù)實現(xiàn)了晶體管架構(gòu)的顛覆式創(chuàng)新。通過垂直堆疊的納米帶(Nanoribbons)結(jié)構(gòu),Ribbon FET實現(xiàn)三維電流控制,相比傳統(tǒng) FinFET,門電路控制能力更加優(yōu)秀,驅(qū)動電流增強20%,開關(guān)速度提升15%,漏電率降低30%。這種設(shè)計使晶體管尺寸進一步微縮至1.8 納米級,芯片密度較Intel 3工藝提升30%,能效比提升15%。同時,對于芯片設(shè)計而言也更具靈活性和擴展性。
Intel 18A的背部供電技術(shù),則是業(yè)界首個將供電網(wǎng)絡(luò)完全轉(zhuǎn)移至芯片背面的量產(chǎn)方案。實現(xiàn)了超過10%的芯片密度提升,同時使封裝到晶體管的IR drop(壓降)減少30%,帶來更好的能耗表現(xiàn)。同時,Intel 18A通過集成背部供電技術(shù),帶來了更優(yōu)秀的成本控制。同intel3相比,在EUV光刻過程中,可以使光罩數(shù)量減少44%,步驟減少42%。
得益于Ribbon FET和背部供電技術(shù),Intel 18A相比于Intel3,每瓦性能提升15%,芯片集成度提升1.3倍,功耗降低25%。
對于Intel 18A的良率一直是外界關(guān)心的話題,在此次活動上,英特爾也對此進行了回應(yīng)。按照英特爾的說法,Intel 18A的良率接近甚至超過過去15年的關(guān)鍵技術(shù)節(jié)點,已達到量產(chǎn)良率水平。10月9日,英特爾亞利桑那州的FAB52工廠將實現(xiàn)滿載運營,Panther Lake今年Q4也將實現(xiàn)量產(chǎn)。
針對不同類型芯片設(shè)計要求,英特爾選用不同封裝技術(shù)組合,其中包括EMIB、Foveros and Foveros Direct等。
Foveros屬于靈活的的chiplet封裝技術(shù),能夠適應(yīng)不同產(chǎn)品需求變化。針對不同芯片面積和設(shè)計周期能夠靈活拓展。Panther Lake采用的是Foveros-S,經(jīng)過多年發(fā)展,更加成熟,此次Panther Lake系列的所有產(chǎn)品均采用同一封裝形式,便于客戶進行產(chǎn)品設(shè)計。
三箭齊發(fā):GPU性能大漲50%
Panther Lake通過采用新的核IP。包括代號為Cougar Cove的P核和代號為Darkmont的E核和LPE核,均為18A特別設(shè)計和優(yōu)化,能夠以低功耗實現(xiàn)高性能,同時也對IPC進行了額外的優(yōu)化。

此次推出的Panther Lake系列包括三款不同的配置,其中8核、16核版本最高支持4核Xe GPU,而16核(12Xe)版本最高支持12個Xe核。
從目前配置策略看,8核版本應(yīng)為面向普通商用市場,16核(4核Xe GPU)版則面向企業(yè)級市場,同時,該版本也能夠支持獨顯;而16核(12核Xe GPU)則面向游戲、高性能輕薄本等市場。

全新的Xe3 GPU是Panther Lake的一大亮點,Panther Lake最多支持12個Xe3核心,最大16MB的L2緩存,最多12個光追單元以及120TOPS的算力。
Xe3相較于Lunar Lake的性能表現(xiàn)提升了50%,相較于Arrow Lake H的每瓦性能高出40%。此前英特爾在Tiger Lake、Meteor Lake等代際產(chǎn)品中,也實現(xiàn)過GPU的性能顯著升級,但像Xe3這樣達到50%的巨幅提升是近年來罕見的。

相較于一般的CPU選型“高U低顯”或“高顯低U”的配置,16核(12核Xe GPU)版本將CPU和GPU的配置拉滿。對此,高嵩表示,16核(12核Xe GPU)是此次的一個亮點,提供了全新的配置選項,在實際核心的配置上,英特爾的策略是希望堅持CPU和GPU雙強并進,已提供卓越的性能體驗,力求達到最佳的平衡表現(xiàn)。
高嵩指出,在當(dāng)前很多支持AI應(yīng)用方面,有超過一半的AI負載跑在GPU上,20%左右跑在NPU上,10%跑在CPU上,通過12Xe可以支持更多的內(nèi)容創(chuàng)作工作,而如果是游戲場景,也有NPU和GPU做支持。
“例如我們跟逗逗、新智慧芯做的游戲助手,是將多的算法放到了NPU上,然后讓GPU接著去跑游戲。盡管異構(gòu)硬件架構(gòu)并非英特爾獨有,但目前只有我們通過深度的軟件優(yōu)化,真正實現(xiàn)了CPU、GPU、NPU的協(xié)同增效?!备哚哉f。
XPU協(xié)同:180TOPS算力應(yīng)對AI挑戰(zhàn)
Panther Lake集成了全新的NPU5,架構(gòu)目標(biāo)是面積效率以及為最新的負載優(yōu)化。

相較Lunar Lake,Panther Lake的NPU5算力密度提升超過40%,最高50TOPS算力,相較于Arrow Laker-H算力提高3.8倍。在量化方面,Panther Lake實現(xiàn)原生支持FP8,使其對大語言模型的支持更好。值得一提的是,NPU5在面積上實現(xiàn)的顯著縮小,對降低制造成本和集成度具有重要意義。
在AI能力上,Panther Lake平臺總共擁有180TOPS的算力,CPU、NPU、GPU三個AI加速器分別擁有10TOPS、50TOPS、120TOPS,以用于不同的工作負載。
目前,行業(yè)對于AI性能的評測集中在模型參數(shù)。英特爾中國區(qū)技術(shù)部總經(jīng)理高宇指出,Panther Lake能夠支持70B的模型,但30B的MOE的模型,才是既有智能表現(xiàn)又有良好用戶體驗的選擇。而這正是英特爾Panther Lake,包括Arrow Lake所能支持的最佳甜蜜點。在提供了如此大的顯存后,除了能夠運行30B的MOE模型,還能支持非常長的上下文處理。
“在進行AI性能評測時,應(yīng)該將重點放在這些實際的用戶體驗和創(chuàng)新應(yīng)用上,而不是僅僅追求能夠運行多大的模型,因為那樣跟實際意義是有一定差距的?!备哂钫f。
高宇表示,英特爾堅持深耕XPU的路線,強調(diào)CPU、GPU、NPU的協(xié)同。CPU擅長快速響應(yīng),適合處理語音轉(zhuǎn)文字等應(yīng)用,GPU因為有足夠的吞吐量和帶寬支持,適合高并發(fā)和高帶寬需求的應(yīng)用,而NPU因為能效比很高,適合追求能效的應(yīng)用。

在IPU方面,全新的IPU7.5在圖像處理上帶來了顯著升級。新增的Staggered HDR功能,能夠?qū)崿F(xiàn)硬件加速、雙重曝光、自適應(yīng)曝光控制、AI光學(xué)降噪等創(chuàng)新功能,能夠大幅改進暗光場景下的圖片和視頻質(zhì)量。
英特爾在AI圖像應(yīng)用方面一直走在前沿,例如AI局部調(diào)色等創(chuàng)新功能,都有著出色成果。之所以非常重視前置攝像頭的能力,在于ISP與AI應(yīng)用有著密不可分的關(guān)系。
“攝像頭作為重要的傳感器,與AI結(jié)合之后,能夠極大拓展應(yīng)用邊界。合作伙伴也提出針對于會議場景的攝像頭智能記錄,甚至捕捉參會人員實時反應(yīng)的需求。此外,對于習(xí)慣用紙筆記錄會議摘要的用戶,一個結(jié)合AI技術(shù)的高性能攝像頭,能夠?qū)⑹謱憙?nèi)容轉(zhuǎn)化為可編輯的電子文檔等。因此,對于IPU的提升將顯著增強包括視頻會議和通話在內(nèi)的使用體驗,解鎖更多AI應(yīng)用的可能性。”高嵩說。
而對于提升IPU能力所可能造成的成本挑戰(zhàn)。高宇解釋稱,PC上通常配置的攝像頭像素范圍在500萬到1300萬之間,遠未達到4800萬像素級別,因此攝像頭本身的硬件成本可控。關(guān)鍵在于,即使是相同的攝像頭硬件,通過英特爾IPU的驅(qū)動和優(yōu)化,其整體成像效果將遠超采用外掛USB驅(qū)動的方案。

在多媒體顯示方面,XeMedia Engine支持廣泛的編解碼,包括最新的AVC、AC1、XAVC-H等,據(jù)了解,該項技術(shù)的創(chuàng)新主要由中國團隊完成。
連接不妥協(xié):支持Wi-Fi 7(R2)
在連接方面,Panther Lake采用的是業(yè)界領(lǐng)先的Wi-Fi 7(R2)。因為Wi-Fi 7標(biāo)準(zhǔn)本身比較靈活,目前很多Wi-Fi 7技術(shù)只使用了R1版本中的部分特性,而英特爾在支持Wi-Fi標(biāo)準(zhǔn)時,是按照最嚴(yán)格的要求來支持,這也帶來了更快的速度,更高的穩(wěn)定性和安全性,這一點特別對于企業(yè)級用戶而言非常重要。
Panther Lake支持藍牙6,特別是其Auracast功能。Auracast允許用戶的耳機在不干擾他人的情況下,共享同一音頻源,同時,也能夠?qū)崿F(xiàn)對于低功耗藍牙(LE Audio)的支持,顯著降低設(shè)備功耗。
在有線連接方面,Panther Lake配備了三個Thunderbolt端口,Thunderbolt 5需要獨立的芯片,而Thunderbolt 4則已集成到主控中。
毫無疑問,上述在連接方面的更強性能,對于AI PC而言將顯著優(yōu)化用戶體驗。
領(lǐng)先能效:CPU多線程功耗降低30%
除了領(lǐng)先的性能外,Panther Lake在一系列創(chuàng)新技術(shù)的加持下,所表現(xiàn)出的極致能效也令人印象深刻。
LPE核心首次在Meteor Lake中引入,并僅在酷睿Ultra高端型號中率先集成,并在后續(xù)的Lunar Lake和Arrow Lake中被使用。
在Panther Lake中,采用了4個LPE核,這可能反映出LPE核心性能上的提升,以及英特爾在管理和調(diào)度上的成熟和完善。
比如針對一些負載任務(wù),同早期Arrow Lake和Raptor Lake先從P核開始,再根據(jù)負載轉(zhuǎn)移的調(diào)度策略不同,自Meteor Lake和Lunar Lake開始,英特爾轉(zhuǎn)向LPE核優(yōu)先。
在Lunar Lake上,任務(wù)將優(yōu)先在LPE核高效執(zhí)行,如果LPE核能夠處理,任務(wù)會迅速完成;如果需要更高性能,系統(tǒng)會智能地拉起四個P核和四個E核協(xié)同工作,待任務(wù)完成后再返回LPE核,以實現(xiàn)能效最大化。面對更重負載,所有核心將全面啟動,以提供最強性能。
這種情況,在DC(直流供電,即電池供電)模式將非常明顯,在此模式下,系統(tǒng)認為續(xù)航優(yōu)先,會積極地將資源配置為效率區(qū)(efficiency zone)模式,并盡可能地將工作負載優(yōu)先分配給LPE核,以最大限度地延長電池使用時間。
以B站重彈幕視頻播放為例,任務(wù)首先在LPE核運行,遇到重負載時P核介入,負載降低后再返回LPE核。另一個案例是Teams應(yīng)用,這是一個輕負載,在Lunar Lake上,通過Windows WPA工具分析可以看到,負載基本上都在LPE側(cè),P核的線程調(diào)度上只有零星部分,大概在幾十或者是幾百微秒。

此外,為了更好地獲得時延、帶寬和能效表現(xiàn),Panther Lake還采用Memory side cache(內(nèi)存?zhèn)染彺妫┘夹g(shù)(8MB物理緩存),這是能效提升的另一個重要原因。
簡要而言,內(nèi)存?zhèn)染彺婕夹g(shù)就是把數(shù)據(jù)緩存放到離處理器更近的地方,減少DRAM擁堵和功耗,使數(shù)據(jù)被抓取成功的概率更高,傳輸距離更短,縮短延遲提升帶寬。這項技術(shù)也是在目前Windows PC領(lǐng)域英特爾的獨家技術(shù)。

除了硬件層面外,在軟件方面,Panther Lake采用了進一步優(yōu)化的硬件線程調(diào)度器,其扮演著連接操作系統(tǒng)和硬件之間的橋梁角色,能夠根據(jù)實時監(jiān)控到的指令集,對CPU上的所有線程進行分類,上報給操作系統(tǒng),結(jié)合OS控制區(qū)的切換,會將不同工作負載放在不同的核心,在辦公、游戲、加電或者不插電等場景下,對應(yīng)算法不同。
這和前幾代產(chǎn)品中的調(diào)度邏輯有顯著區(qū)別,這種優(yōu)化實際上體現(xiàn)了Intel對軟件硬件一體持續(xù)優(yōu)化的考量,核心目標(biāo)則是確保更合適的負載能夠被調(diào)度到更適合的核心上運行,從而保證最佳的能效和性能。
而在電源管理技術(shù)方面,通過在DTT中加入API,Panther Lake允許OEM廠商根據(jù)自身的產(chǎn)品定位和用戶需求,靈活地選擇工作負載的調(diào)度策略,為OEM提供更大自主權(quán),能夠根據(jù)具體場景,決定優(yōu)先保障能效或追求極致性能,從而打造出更具差異化產(chǎn)品。
得益于內(nèi)存?zhèn)染彺妗⒂布€程調(diào)度器、電源管理等技術(shù)創(chuàng)新,Panther Lake繼承了Lunar Lake在能效上的優(yōu)勢,同時,憑借在此基礎(chǔ)上的8個E核的加持,Panther Lake跟Arrow Lake相比不僅能效更高,還實現(xiàn)了性能的顯著提升。
和Lunar Lake相比,Panther Lake CPU在相同功耗下的單線程性能提升超過10%。
和Lunar Lake以及Arrow Lake相比,CPU在相同功耗情況下,多線程能力提升超過50%。
和Arrow Lake相比,CPU在相同多線程性能的同時功耗降低30%。
和Lunar Lake以及Arrow Lake相比,GPU的性能表現(xiàn)提升50%。
同Lunar Lake相比,NPU算力密度提升超過40%,IPU功耗降低1.5W。
同Lunar Lake相比,SoC的能耗提升10%;同Arrow Lake相比,SoC具有40%的能耗降低。
結(jié)語
Panther Lake作為英特爾18A工藝的首發(fā)產(chǎn)品,是其技術(shù)復(fù)興與IDM 2.0戰(zhàn)略落地的關(guān)鍵載體。依托 Ribbon FET與背部供電技術(shù),以及多項革命性的創(chuàng)新技術(shù),將性能與能效的優(yōu)化帶到新高度,精準(zhǔn)匹配了新時代下AI PC的需求。同時,其架構(gòu)上的靈活可擴展性的理念,也展現(xiàn)出英特爾更加開放,注重客戶意見和用戶體驗的全新姿態(tài)。

Panther Lake驗證了Intel 18A工藝的量產(chǎn)能力,擊碎外界對其技術(shù)滯后的質(zhì)疑,重新定義了AI PC體驗。Panther Lake的量產(chǎn)不僅是英特爾重奪市場優(yōu)勢的希望,也引領(lǐng)著全球半導(dǎo)體進入 “先進制程+異構(gòu)協(xié)同” 的新紀(jì)元。