OpenAI租用谷歌TPU：算力布局調(diào)整，首次嘗試非“英偉達(dá)”芯片

2025-07-01 來源：電子工程專輯

605

關(guān)鍵詞： OpenAI 英偉達(dá) 谷歌TPU 算力成本自研芯片

OpenAI的這一系列舉措，不僅反映了其在AI芯片領(lǐng)域的野心，也預(yù)示著AI算力基礎(chǔ)設(shè)施的進(jìn)一步多元化和競(jìng)爭(zhēng)格局的重塑。

近日消息，OpenAI首次使用“非英偉達(dá)”芯片，租用谷歌TPU，以降低推理計(jì)算成本并減少對(duì)微軟數(shù)據(jù)中心的依賴。這一舉措標(biāo)志著OpenAI在算力布局上的戰(zhàn)略調(diào)整，也反映了其在AI芯片市場(chǎng)中逐步擺脫對(duì)英偉達(dá)的依賴。

OpenAI長(zhǎng)期以來一直是英偉達(dá)GPU的重要客戶，用于模型訓(xùn)練和推理任務(wù)。然而，隨著AI模型的復(fù)雜性增加，以及對(duì)算力需求的激增，OpenAI在微軟的推理服務(wù)器上面臨巨大壓力。特別是ChatGPT圖像生成工具的爆紅，使得OpenAI在推理計(jì)算上的成本大幅上升。

據(jù)悉，OpenAI去年在服務(wù)器上的支出超過40億美元，其中訓(xùn)練和推理成本各占一半，預(yù)計(jì)2025年在AI芯片服務(wù)器上的支出將接近140億美元。因此，OpenAI尋求更高效、更經(jīng)濟(jì)的算力解決方案。

谷歌TPU的引入是OpenAI降低推理成本的重要舉措。谷歌TPU在能效比方面具有優(yōu)勢(shì)，尤其在大規(guī)模并行計(jì)算任務(wù)中，單位算力成本更低。此外，通過引入異構(gòu)算力架構(gòu)，OpenAI正逐步降低對(duì)微軟云基礎(chǔ)設(shè)施的依賴，這不僅有助于分散供應(yīng)鏈風(fēng)險(xiǎn)，也為未來可能的云服務(wù)商切換預(yù)留了空間。

盡管存在競(jìng)爭(zhēng)關(guān)系，谷歌仍與OpenAI合作，以推動(dòng)TPU的商業(yè)化進(jìn)程。不過，谷歌并未向OpenAI提供其最高性能的TPU。谷歌云員工透露，谷歌保留了最強(qiáng)大的TPU用于內(nèi)部開發(fā)，如Gemini模型。

除了OpenAI，蘋果、Safe Superintelligence和Cohere等公司也一直租用谷歌云的TPU，部分原因是這些公司的一些員工曾在谷歌工作，熟悉TPU的運(yùn)作方式。此外，據(jù)知情人士透露，同樣是全球最大AI芯片客戶之一的Meta近期也考慮使用TPU。

這一趨勢(shì)表明，越來越多的科技公司正在尋找替代英偉達(dá)的解決方案，以降低對(duì)英偉達(dá)芯片的依賴并減少成本。而TPU的設(shè)計(jì)目標(biāo)是為深度學(xué)習(xí)任務(wù)提供更高效的計(jì)算能力，尤其在大規(guī)模語言模型和推薦系統(tǒng)的訓(xùn)練中表現(xiàn)出色。

OpenAI此次租用谷歌TPU，不僅是對(duì)算力成本的優(yōu)化，更是其在AI芯片市場(chǎng)中尋求多元化的重要一步。通過引入非英偉達(dá)芯片，OpenAI有望提升谷歌TPU的知名度，使其成為英偉達(dá)GPU的經(jīng)濟(jì)高效替代方案。這表明OpenAI正在逐步擺脫對(duì)微軟的依賴，轉(zhuǎn)向更廣泛的云基礎(chǔ)設(shè)施。

此外，OpenAI還計(jì)劃在未來幾個(gè)月內(nèi)完成首款自研AI芯片的設(shè)計(jì)，并計(jì)劃送往臺(tái)積電進(jìn)行制造。這一芯片將采用臺(tái)積電先進(jìn)的3納米工藝，具備高帶寬內(nèi)存和廣泛的網(wǎng)絡(luò)功能，旨在減少對(duì)英偉達(dá)芯片的依賴。

責(zé)編：Jimmy.zhang