近日消息,OpenAI首次使用“非英偉達(dá)”芯片,租用谷歌TPU,以降低推理計(jì)算成本并減少對(duì)微軟數(shù)據(jù)中心的依賴。這一舉措標(biāo)志著OpenAI在算力布局上的戰(zhàn)略調(diào)整,也反映了其在AI芯片市場(chǎng)中逐步擺脫對(duì)英偉達(dá)的依賴。
OpenAI長(zhǎng)期以來一直是英偉達(dá)GPU的重要客戶,用于模型訓(xùn)練和推理任務(wù)。然而,隨著AI模型的復(fù)雜性增加,以及對(duì)算力需求的激增,OpenAI在微軟的推理服務(wù)器上面臨巨大壓力。特別是ChatGPT圖像生成工具的爆紅,使得OpenAI在推理計(jì)算上的成本大幅上升。
據(jù)悉,OpenAI去年在服務(wù)器上的支出超過40億美元,其中訓(xùn)練和推理成本各占一半,預(yù)計(jì)2025年在AI芯片服務(wù)器上的支出將接近140億美元。因此,OpenAI尋求更高效、更經(jīng)濟(jì)的算力解決方案。
谷歌TPU的引入是OpenAI降低推理成本的重要舉措。谷歌TPU在能效比方面具有優(yōu)勢(shì),尤其在大規(guī)模并行計(jì)算任務(wù)中,單位算力成本更低。此外,通過引入異構(gòu)算力架構(gòu),OpenAI正逐步降低對(duì)微軟云基礎(chǔ)設(shè)施的依賴,這不僅有助于分散供應(yīng)鏈風(fēng)險(xiǎn),也為未來可能的云服務(wù)商切換預(yù)留了空間。
盡管存在競(jìng)爭(zhēng)關(guān)系,谷歌仍與OpenAI合作,以推動(dòng)TPU的商業(yè)化進(jìn)程。不過,谷歌并未向OpenAI提供其最高性能的TPU。谷歌云員工透露,谷歌保留了最強(qiáng)大的TPU用于內(nèi)部開發(fā),如Gemini模型。
除了OpenAI,蘋果、Safe Superintelligence和Cohere等公司也一直租用谷歌云的TPU,部分原因是這些公司的一些員工曾在谷歌工作,熟悉TPU的運(yùn)作方式。此外,據(jù)知情人士透露,同樣是全球最大AI芯片客戶之一的Meta近期也考慮使用TPU。
這一趨勢(shì)表明,越來越多的科技公司正在尋找替代英偉達(dá)的解決方案,以降低對(duì)英偉達(dá)芯片的依賴并減少成本。而TPU的設(shè)計(jì)目標(biāo)是為深度學(xué)習(xí)任務(wù)提供更高效的計(jì)算能力,尤其在大規(guī)模語言模型和推薦系統(tǒng)的訓(xùn)練中表現(xiàn)出色。
OpenAI此次租用谷歌TPU,不僅是對(duì)算力成本的優(yōu)化,更是其在AI芯片市場(chǎng)中尋求多元化的重要一步。通過引入非英偉達(dá)芯片,OpenAI有望提升谷歌TPU的知名度,使其成為英偉達(dá)GPU的經(jīng)濟(jì)高效替代方案。這表明OpenAI正在逐步擺脫對(duì)微軟的依賴,轉(zhuǎn)向更廣泛的云基礎(chǔ)設(shè)施。
此外,OpenAI還計(jì)劃在未來幾個(gè)月內(nèi)完成首款自研AI芯片的設(shè)計(jì),并計(jì)劃送往臺(tái)積電進(jìn)行制造。這一芯片將采用臺(tái)積電先進(jìn)的3納米工藝,具備高帶寬內(nèi)存和廣泛的網(wǎng)絡(luò)功能,旨在減少對(duì)英偉達(dá)芯片的依賴。
OpenAI的這一系列舉措,不僅反映了其在AI芯片領(lǐng)域的野心,也預(yù)示著AI算力基礎(chǔ)設(shè)施的進(jìn)一步多元化和競(jìng)爭(zhēng)格局的重塑。