馬斯克AI公司開(kāi)發(fā)“世界模型”,從英偉達(dá)挖專(zhuān)家將推游戲
關(guān)鍵詞: xAI 世界模型 AI游戲 圖像和視頻生成模型 馬斯克

xAI
北京時(shí)間10月12日,據(jù)《金融時(shí)報(bào)》報(bào)道,埃隆·馬斯克(Elon Musk)旗下xAI公司正加緊構(gòu)建所謂的“世界模型”,與Meta和谷歌等對(duì)手一同角逐下一代AI系統(tǒng)。這些系統(tǒng)能夠?qū)崿F(xiàn)對(duì)物理環(huán)境的自主導(dǎo)航與設(shè)計(jì)。
根據(jù)英偉達(dá)的官方介紹,世界模型是一種生成式AI模型,能夠理解現(xiàn)實(shí)世界的動(dòng)態(tài)特征,包括物理屬性和空間特性。這類(lèi)模型利用文字、圖像、視頻以及動(dòng)作在內(nèi)的輸入數(shù)據(jù)來(lái)生成影片。
今年夏天,xAI從英偉達(dá)挖來(lái)了專(zhuān)家,研發(fā)這類(lèi)新一代AI模型。這些模型通過(guò)學(xué)習(xí)視頻以及來(lái)自機(jī)器人的數(shù)據(jù),理解現(xiàn)實(shí)世界。世界模型有望將AI的能力提升到超越大語(yǔ)言模型的水平。目前,大模型主要接受文本訓(xùn)練,是ChatGPT以及xAI自家Grok等熱門(mén)AI工具的技術(shù)基礎(chǔ)。
兩位知情人士稱(chēng),該公司正在研發(fā)世界模型,計(jì)劃將其應(yīng)用于游戲領(lǐng)域,用于生成可交互的3D環(huán)境。其中一位知情人士補(bǔ)充說(shuō),這類(lèi)模型未來(lái)也可能應(yīng)用于機(jī)器人AI系統(tǒng)。
xAI已從英偉達(dá)聘請(qǐng)了兩位具備世界模型研發(fā)經(jīng)驗(yàn)的AI研究員:澤尚·帕特爾(Zeeshan Patel)與何宜暉(Ethan He)。憑借能夠創(chuàng)建并運(yùn)行模擬環(huán)境的Omniverse平臺(tái),英偉達(dá)始終在該技術(shù)領(lǐng)域保持領(lǐng)先地位。
一些科技公司對(duì)世界模型寄予厚望,認(rèn)為它或許能將AI應(yīng)用從軟件和計(jì)算機(jī)拓展到實(shí)體產(chǎn)品,例如人形機(jī)器人。上個(gè)月,英偉達(dá)對(duì)《金融時(shí)報(bào)》表示,世界模型的潛在市場(chǎng)規(guī)??赡芙咏?dāng)前全球經(jīng)濟(jì)總量。
馬斯克在X上發(fā)帖稱(chēng),xAI計(jì)劃在明年年底前推出“一款由AI生成的優(yōu)秀游戲”,重申了他在去年設(shè)定的目標(biāo)。
周二,xAI推出了最新的圖像和視頻生成模型,并表示該模型進(jìn)行了“重大升級(jí)”,并且免費(fèi)向用戶開(kāi)放使用。
當(dāng)前,OpenAI旗下Sora等視頻生成模型,主要通過(guò)從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到的模式進(jìn)行預(yù)測(cè),從而逐幀生成視頻圖像。但是世界模型則會(huì)向前邁進(jìn)一大步,因?yàn)樗軐?shí)時(shí)理解物理世界的因果關(guān)系,掌握物體在不同環(huán)境中的實(shí)時(shí)互動(dòng)機(jī)制。
巨大挑戰(zhàn)
除了xAI外,谷歌、Meta等領(lǐng)先的AI實(shí)驗(yàn)室也在研發(fā)這類(lèi)系統(tǒng)。
然而,世界模型仍面臨巨大的技術(shù)挑戰(zhàn)。要找到足夠的數(shù)據(jù)來(lái)模擬現(xiàn)實(shí)世界并訓(xùn)練這些模型,已被證明既困難又成本昂貴。
《博德之門(mén)3》開(kāi)發(fā)商拉瑞安工作室的發(fā)行主管邁克爾·道斯(Michael Douse)本周在X上直言,AI無(wú)法解決游戲行業(yè)面臨的“重大問(wèn)題”,即“領(lǐng)導(dǎo)力與遠(yuǎn)見(jiàn)的缺失”。
他補(bǔ)充說(shuō),游戲行業(yè)并不需要“更多由算法生成、經(jīng)心理學(xué)訓(xùn)練的玩法循環(huán),而是需要更多能夠讓玩家投入或愿意投入其中的世界呈現(xiàn)方式”。
截至發(fā)稿,xAI及帕特爾、何宜暉尚未就此置評(píng)。