Pirmasis žaidžiamas realaus laiko atviro pasaulio AI modelis, kuris generuoja žaidimą po kadro, sukurtas Decart AI.
„Oasis AI Minecraft“, sukurta Decart AI bendradarbiaudama su „Etched“, yra novatoriškas AI žaidimų technologijos pasiekimas. Tai interaktyvus vaizdo žaidimas, kurį transformatorius generuoja kiekvieną kadrą.
Skirtingai nuo tradicinių žaidimų, „Oasis“ priima vartotojo klaviatūros ir pelės įvestį ir generuoja žaidimo eigą realiuoju laiku, viduje imituodama fiziką, žaidimo taisykles ir grafiką. Modelis išmoko leisti vartotojams judėti, šokinėti, pasiimti daiktus, laužyti blokus ir dar daugiau – visa tai tiesiogiai stebint žaidimą.
Šis revoliucinis projektas apjungia pažangiausius dirbtinio intelekto tyrimus su pažangiu aparatinės įrangos optimizavimu, o tai ženklina pirmąjį žingsnį link pagrindinių modelių, imituojančių sudėtingesnius interaktyvius pasaulius, galinčius pakeisti klasikinius žaidimų variklius dirbtinio intelekto pagrįstoje ateityje.
Atlikome šimtus architektūrinių ir duomenų eksperimentų, kad nustatytų geriausią greito autoregresyvaus interaktyvaus vaizdo generavimo architektūrą. Skirtingai nuo tradicinių dvikrypčių modelių, mūsų architektūra yra specialiai sukurta generuoti realiuoju laiku, kadras po kadro su vartotojo įvesties kondicionavimu.
„Oasis“ ViT DiT architektūra su transformatoriumi pagrįstu variaciniu automatiniu koduotuvu ir pagreitintu erdvėlaikiniu dėmesiu
Oasis naudoja difuzijos mokymo ir transformatorių modelių derinį, įkvėptą pažangių didelių kalbų modelių (LLM). Modelis generuoja vaizdo įrašą po kadro, kurį kiekvieną akimirką lemia vartotojo veiksmai.
Architektūra pasižymi transformatoriumi pagrįstu variaciniu automatiniu koduotuvu (ViT VAE), kuris sumažina vaizdo dydį ir leidžia sklaidai sutelkti dėmesį į aukštesnio lygio charakteristikas, kartu su pagreitintu ašiniu, priežastiniu erdvėlaikio dėmesio mechanizmu.
Skirtingai nuo dvikrypčių modelių, „Oasis“ generuoja kadrus autoregresyviai, su galimybe kiekvieną kadrą nustatyti pagal žaidimo įvestį. Tai leidžia vartotojams bendrauti su pasauliu realiuoju laiku, o ne tik atkurti vaizdo įrašus atgaline data.
Modelyje naudojami difuzijos privertimo metodai ir papildomi laiko dėmesio sluoksniai, išdėstyti tarp erdvinio dėmesio sluoksnių, kad būtų pateiktas kontekstas iš ankstesnių kadrų.
Komanda aktyviai dirba modelio ir duomenų rinkinių mastelio keitimo srityje, taip pat kuria papildomus optimizavimo metodus, kad būtų galima efektyviai vykdyti didelio masto mokymus.
Be žaidimų, „Oasis“ siekia išplėsti iki visiško interaktyvaus daugiarūšio vaizdo generavimo, potencialiai pakeisdama mūsų sąveiką su skaitmeniniu turiniu ir pramogų platformomis.