[樂游網(wǎng)導(dǎo)讀]Roblox Cube:用AI重新定義3D創(chuàng)作的游戲開發(fā)者新“魔方”3月18日,全球最大的UGC游戲平臺Roblox扔出一顆“技術(shù)炸彈”——正式推出首個基于生成式AI的3D建模工具Cube,并宣布將開源其核心模型。這不僅讓數(shù)百萬創(chuàng)作者能用一句話生成3D物體,更向整個行業(yè)開放了“造物主”級能力。
Roblox Cube:用AI重新定義3D創(chuàng)作的游戲開發(fā)者新“魔方”3月18日,全球最大的UGC游戲平臺Roblox扔出一顆“技術(shù)炸彈”——正式推出首個基于生成式AI的3D建模工具Cube,并宣布將開源其核心模型。這不僅讓數(shù)百萬創(chuàng)作者能用一句話生成3D物體,更向整個行業(yè)開放了“造物主”級能力。
Roblox Cube下載:點擊下載
Roblox官宣Cube開源AI模型!一鍵生成3D物體,3.8 億月活用戶或?qū)⒂瓉砣掠螒蝮w驗。
Roblox官宣Cube開源AI模型!一鍵生成3D物體,引爆AI+3D UGC生態(tài)
Roblox周一宣布推出其首個AI生3D的基礎(chǔ)模型:名為"Cube",允許創(chuàng)作者使用生成式AI創(chuàng)建3D對象。該公司還發(fā)布了開源版本,使平臺外的任何人都可以基于它進(jìn)行構(gòu)建。
目前處于測試階段的Cube 3D Mesh生成功能,使創(chuàng)作者能夠通過單個提示生成"網(wǎng)格"(即物體的3D表示)。例如,"生成一輛帶黑色條紋的橙色賽車"。創(chuàng)作者可以在Roblox Studio中進(jìn)一步調(diào)整游戲內(nèi)物品。
Cube 3D的開源版本允許任何人定制、創(chuàng)建插件或使用自己的數(shù)據(jù)集訓(xùn)練模型以滿足其需求。
Roblox還宣布了三個額外的AI工具——文本生成、文本轉(zhuǎn)語音和語音轉(zhuǎn)文本。這些功能將在未來幾個月內(nèi)推出。
文本生成工具讓開發(fā)者能夠在游戲中添加基于文本的AI功能。這包括給玩家提供與交互式非玩家角色(NPCs)進(jìn)行對話的選項。
與此同時,文本轉(zhuǎn)語音功能讓開發(fā)者可以添加旁白、讓NPC說話或在游戲中包含語音字幕。語音轉(zhuǎn)文本則允許玩家使用語音命令,比如指揮角色向前移動。
該公司未來的其他計劃包括為更"復(fù)雜"的對象推出網(wǎng)格生成和場景生成功能。例如,場景生成工具將允許創(chuàng)作者提示AI制作完整的森林場景,并將樹上的綠葉變成秋季顏色以展示季節(jié)變化。
正如Roblox去年所述,長期目標(biāo)是使3D對象和場景完全功能化,稱之為"4D創(chuàng)作"。"第四維是指物體、環(huán)境和人之間的互動,"Roblox工程副總裁Nick Tornow表示。
與任何探索生成式AI工具的公司一樣,Roblox相信Cube將幫助創(chuàng)作者更快地工作,使獨(dú)立開發(fā)者能夠承擔(dān)更大的項目。該公司已經(jīng)發(fā)布了多種AI工具,包括用于紋理生成和頭像創(chuàng)建的工具。
https://corp.roblox.com/newsroom/2025/03/introducing-roblox-cube
元宇宙巨頭Roblox發(fā)布AI生3D大模型!還開源,建模的時代來了!
去年秋天,我們宣布了一個雄心勃勃的項目,旨在構(gòu)建一個開源的3D基礎(chǔ)模型,用于在Roblox上創(chuàng)建3D對象和場景。本周,我們開源了該模型的首個版本,使其可供Roblox平臺內(nèi)外的任何人使用。我們將這個模型命名為Cube 3D。我們還推出了它的首個功能,即網(wǎng)格生成API的測試版。Cube將成為我們未來幾年開發(fā)的許多AI工具的基礎(chǔ),包括高度復(fù)雜的場景生成工具。它最終將成為一個多模態(tài)模型,接受文本、圖像、視頻和其他類型的輸入進(jìn)行訓(xùn)練,并將與我們現(xiàn)有的AI創(chuàng)作工具集成。
Cube 3D直接通過文本(未來還將包括圖像輸入)生成3D模型和環(huán)境。目前,最先進(jìn)的3D生成技術(shù)使用圖像和重建方法來構(gòu)建3D對象。當(dāng)沒有足夠的3D訓(xùn)練數(shù)據(jù)時,這是一個很好的選擇。然而,得益于我們平臺的特性,我們可以直接使用原生3D數(shù)據(jù)進(jìn)行訓(xùn)練。生成的對象完全兼容當(dāng)今的游戲引擎,并且可以擴(kuò)展使對象具有功能性。
這種差異類似于賽道電影布景。在電視上,你可能會看到一個看似功能齊全的賽道,有看臺、車庫和冠軍通道。但如果你在那個布景上走動,你會很快意識到這些結(jié)構(gòu)實際上是平面的。構(gòu)建一個真正身臨其境的3D世界需要完整、功能性的結(jié)構(gòu),有可以開車進(jìn)入的車庫,可以坐的看臺,以及有功能性領(lǐng)獎臺的冠軍通道。
為了實現(xiàn)這一目標(biāo),我們從最先進(jìn)的模型中汲取靈感,這些模型通過文本標(biāo)記(或字符集)進(jìn)行訓(xùn)練,以便它們能夠預(yù)測下一個標(biāo)記來形成句子。我們的創(chuàng)新基于同樣的核心理念。我們構(gòu)建了對3D對象進(jìn)行標(biāo)記化和理解形狀為標(biāo)記的能力,并訓(xùn)練Cube 3D預(yù)測下一個形狀標(biāo)記,以構(gòu)建完整的3D對象。當(dāng)我們將此擴(kuò)展到完整場景生成時,Cube 3D會預(yù)測布局,并遞歸地預(yù)測形狀以完成該布局。
任何人都可以對Cube 3D進(jìn)行微調(diào)、開發(fā)插件或使用自己的數(shù)據(jù)進(jìn)行訓(xùn)練,以滿足其需求。我們相信AI工具應(yīng)建立在開放性和透明度之上,這就是為什么我們成為開源AI社區(qū)的忠實合作伙伴。我們發(fā)布了我們的一個AI安全模型,因為我們強(qiáng)烈認(rèn)為分享AI安全領(lǐng)域的進(jìn)步有助于整個行業(yè)加速創(chuàng)新和技術(shù)進(jìn)步。出于這個原因,我們還幫助創(chuàng)立了ROOST,這是一個致力于通過開源安全工具解決數(shù)字安全重要領(lǐng)域的新非營利組織。通過開源Cube 3D,我們的目標(biāo)是使研究人員、開發(fā)者和更廣泛的AI社區(qū)能夠學(xué)習(xí)、增強(qiáng)和推進(jìn)整個行業(yè)的3D生成技術(shù)。
我們之前曾談到AI如何加速3D資產(chǎn)、配件和體驗的創(chuàng)作。最終,AI將實現(xiàn)更具沉浸感和個性化的游戲和連接。我們在創(chuàng)作周期的每個階段投資基礎(chǔ)設(shè)施以支持AI——既為這些體驗的開發(fā)者,也為在其中花時間的用戶。我們設(shè)想未來開發(fā)者將通過在他們的體驗中啟用AI,為用戶提供新的創(chuàng)作方式。這將AI的力量交到超過8500萬日活躍用戶手中,作為他們游戲體驗的一部分。
在過去一年中,我們通過Roblox Studio內(nèi)的AI驅(qū)動助手引入了幾項新功能,為開發(fā)者提供所需的工具和能力,以創(chuàng)作和消除數(shù)小時的手動工作。通過Cube,我們打算使3D創(chuàng)作更加高效。通過3D網(wǎng)格生成,開發(fā)者可以快速探索新的創(chuàng)意方向,并通過快速決定推進(jìn)哪些方向來提高生產(chǎn)力。
想象一下構(gòu)建一個賽道游戲。今天,你可以在助手中使用網(wǎng)格生成API,輸入一個簡短的提示,如"/生成一輛摩托車"或"/生成橙色安全錐"。幾秒鐘內(nèi),API就會生成這些對象的網(wǎng)格版本。然后可以為它們添加紋理、顏色等。使用此API,你可以更快地建模道具或設(shè)計空間——無需花費(fèi)數(shù)小時建模簡單對象。它讓你專注于有趣的事情,比如設(shè)計賽道布局和調(diào)整汽車操控性。這個API為每個創(chuàng)建的對象節(jié)省數(shù)小時,并讓你有時間嘗試新想法,而不必?fù)?dān)心花費(fèi)太多時間或精力。長期來看,我們計劃支持更復(fù)雜和功能性的對象,甚至是場景。
這項技術(shù)延伸到每天在Roblox上玩耍和連接的數(shù)千萬創(chuàng)意人士。我們看到一個未來,開發(fā)者使他們的用戶能夠使用AI成為創(chuàng)作者。啟用網(wǎng)格生成API后,玩家可以將他們能想象的任何東西變?yōu)楝F(xiàn)實。如果玩家想要一輛未來感十足的汽車,他們只需輸入"帶側(cè)翼的紅色未來汽車"或"黑色皮革摩托車夾克",就能看到它被生成。這種游戲內(nèi)AI生成將解鎖全新的創(chuàng)造力水平。玩家可以以開發(fā)者從未想象過的方式個性化他們的體驗,這將使游戲更具吸引力。
技術(shù)細(xì)節(jié):3D與文本/圖像標(biāo)記之間的交叉注意力
關(guān)鍵技術(shù)挑戰(zhàn)是將文本和圖像與3D形狀連接起來。我們的核心技術(shù)突破是3D標(biāo)記化,它允許我們將3D對象表示為標(biāo)記,就像文本可以表示為標(biāo)記一樣。這使我們能夠預(yù)測下一個形狀,就像語言模型預(yù)測句子中的下一個詞一樣。
為了實現(xiàn)3D生成,我們設(shè)計了一個統(tǒng)一的架構(gòu),用于單個對象的自回歸生成、形狀補(bǔ)全和多對象/場景布局生成。自回歸變換器是使用先前輸入來預(yù)測下一個組件的神經(jīng)網(wǎng)絡(luò)。這種架構(gòu)提供了可擴(kuò)展性和多模態(tài)兼容性,因此隨著模型的擴(kuò)展,它將適用于多種不同類型的輸入(文本、視覺、音頻和3D)。我們正在開源這個模型。在初始階段,創(chuàng)作者將能夠基于文本提示生成3D對象。未來,我們希望創(chuàng)作者能夠基于多模態(tài)輸入生成整個場景。
為了訓(xùn)練用于形狀生成的生成式預(yù)訓(xùn)練變換器(GPT),我們使用離散的3D形狀標(biāo)記并將它們與文本提示對齊。這種新穎的方法為我們開創(chuàng)了可玩的3D場景生成世界。
Cube的未來發(fā)展方向
今天,世界上大多數(shù)人使用AI進(jìn)行文本處理,預(yù)測句子中的詞語。許多人也將其用于圖像,預(yù)測像素。當(dāng)創(chuàng)建場景時,所有這些元素匯集在一起并需要在相互關(guān)聯(lián)的環(huán)境中工作,這變得更加復(fù)雜。例如,想象一個可以描述為"在賽道前有樹木的摩托車上的avatar"的簡單場景體驗。
構(gòu)建這一體驗需要許多元素。樹木是兩個3D網(wǎng)格的組合,摩托車是一個帶有細(xì)節(jié)和三角形的密集網(wǎng)格,建筑物由Roblox部件組成。摩托車上的avatar在身體、肢體和頭部有更復(fù)雜的幾何特征。最后,我們需要一種方法將所有這些聯(lián)系在一起形成布局。為此,我們需要邊界框,它概述了一個對象以定義其大小和位置,以知道如何安排這種幾何結(jié)構(gòu)。這是一個艱巨的過程,但AI能夠幫助完成每一步。通過AI,創(chuàng)作者可以更快地完成第一個版本,有更多時間測試新想法或完善他們的場景。
當(dāng)我們實現(xiàn)這一目標(biāo)時,我們希望我們創(chuàng)建的3D對象和場景能夠完全發(fā)揮功能。我們稱之為4D創(chuàng)作,其中第四維是對象、環(huán)境和人之間的互動。實現(xiàn)這一點不僅需要構(gòu)建沉浸式3D對象和場景的能力,還需要理解這些對象之間的上下文和關(guān)系。這就是我們通過Cube所要達(dá)到的目標(biāo)。
除了網(wǎng)格生成的首個用例外,我們計劃擴(kuò)展到場景生成和理解。我們將能夠為用戶提供他們最感興趣的體驗,并通過在上下文中添加對象來增強(qiáng)場景。例如,在一個森林場景的體驗中,開發(fā)者可以要求助手將樹上所有茂盛的綠葉替換為秋季落葉,以表示季節(jié)的變化。我們的AI助手工具響應(yīng)開發(fā)者的請求,幫助他們快速創(chuàng)建、調(diào)整和擴(kuò)展他們的體驗。
專業(yè)的游戲下載、綜合門戶網(wǎng)站
Copyright 2009-2016 www.i95191.cn 版權(quán)所有
鄂ICP備17018784號-1
熱門評論
最新評論
發(fā)表評論 查看所有評論()