Pirmais spēlējamais, reāllaika, atvērtās pasaules AI modelis, kas ģenerē spēli katrā kadrā, izstrādājis Decart AI.
Oasis AI Minecraft, ko Decart AI izstrādāja sadarbībā ar Etched, ir revolucionārs sasniegums AI spēļu tehnoloģijā. Tā ir interaktīva videospēle, ko no gala līdz galam ģenerē transformators pa kadram.
Atšķirībā no tradicionālajām spēlēm, Oasis izmanto lietotāja tastatūras un peles ievadi un ģenerē reāllaika spēli, iekšēji simulējot fiziku, spēles noteikumus un grafiku. Modelis iemācījās ļaut lietotājiem pārvietoties, lēkt, paņemt priekšmetus, lauzt blokus un veikt citas darbības, tieši skatoties spēli.
Šis revolucionārais projekts apvieno progresīvu AI pētniecību ar progresīvu aparatūras optimizāciju, iezīmējot pirmo soli ceļā uz pamata modeļiem, kas simulē sarežģītākas interaktīvās pasaules, potenciāli aizstājot klasiskos spēļu dzinējus AI vadītā nākotnē.
Mēs veicām simtiem arhitektūras un datu eksperimentu, lai noteiktu labāko arhitektūru ātrai autoregresīvai interaktīvai video ģenerēšanai. Atšķirībā no tradicionālajiem divvirzienu modeļiem, mūsu arhitektūra ir īpaši izstrādāta reāllaika, kadru pa kadram ģenerēšanai ar lietotāja ievades regulēšanu.
Oasis ViT DiT arhitektūra ar transformatora bāzes variācijas automātisko kodētāju un paātrinātu telpisko un laika uzmanību
Oasis izmanto difūzijas apmācības un transformatoru modeļu kombināciju, ko iedvesmojuši uzlaboti lielo valodu modeļi (LLM). Modelis ģenerē video pa vienam kadram, ko nosaka lietotāja darbības katrā mirklī.
Arhitektūrai ir uz transformatoriem balstīts variācijas autokodētājs (ViT VAE), lai saspiestu attēla izmēru un ļautu difūzijai koncentrēties uz augstāka līmeņa raksturlielumiem, kā arī paātrinātu aksiālo, cēloņsakarības telpisko un temporālo uzmanības mehānismu.
Atšķirībā no divvirzienu modeļiem, Oasis ģenerē kadrus autoregresīvi, ar iespēju katru kadru pielāgot spēles ievadei. Tādējādi lietotāji var mijiedarboties ar pasauli reāllaikā, nevis tikai atveidot videoklipus ar atpakaļejošu datumu.
Modelis izmanto difūzijas piespiešanas paņēmienus un ietver papildu laika uzmanības slāņus, kas ir iejaukti starp telpiskās uzmanības slāņiem, lai nodrošinātu kontekstu no iepriekšējiem kadriem.
Komanda aktīvi strādā pie modeļa un datu kopu mērogošanas, kā arī izstrādā papildu optimizācijas metodes, lai nodrošinātu efektīvu liela mēroga apmācību.
Papildus spēlēm Oasis mērķis ir paplašināties līdz pilnīgai interaktīvai multimodāla video paaudzei, potenciāli mainot mūsu mijiedarbību ar digitālo saturu un izklaides platformām.