Decart AI tarafından geliştirilen, kare kare oyun deneyimi yaratan ilk oynanabilir, gerçek zamanlı, açık dünya yapay zeka modeli.
Decart AI tarafından Etched ile işbirliği içinde geliştirilen Oasis AI Minecraft, AI oyun teknolojisinde çığır açan bir başarıyı temsil ediyor. Bir transformatör tarafından kare kare uçtan uca oluşturulan etkileşimli bir video oyunudur.
Geleneksel oyunların aksine Oasis, kullanıcı klavyesi ve fare girdisini alır ve fizik, oyun kuralları ve grafikleri dahili olarak simüle ederek gerçek zamanlı oyun üretir. Model, kullanıcıların doğrudan oyunu izleyerek hareket etmelerine, zıplamalarına, öğeleri toplamalarına, blokları kırmalarına ve daha fazlasına olanak sağlamayı öğrendi.
Bu devrim niteliğindeki proje, en son yapay zeka araştırmalarını gelişmiş donanım optimizasyonuyla birleştirerek daha karmaşık etkileşimli dünyaları simüle eden temel modellere doğru ilk adımı atıyor ve potansiyel olarak yapay zeka odaklı bir gelecekte klasik oyun motorlarının yerini alıyor.
Hızlı otoregresif etkileşimli video üretimi için en iyi mimariyi belirlemek amacıyla yüzlerce mimari ve veri deneyi gerçekleştirdik. Geleneksel çift yönlü modellerden farklı olarak mimarimiz, kullanıcı girişi koşullandırmasıyla gerçek zamanlı, kare kare oluşturma için özel olarak tasarlanmıştır.
Oasis'in Transformer tabanlı varyasyonel otomatik kodlayıcı ve hızlandırılmış uzay-zamansal dikkat içeren ViT DiT mimarisi
Oasis, gelişmiş geniş dil modellerinden (LLM'ler) esinlenerek, yayılma eğitimi ve transformatör modellerinin bir kombinasyonunu kullanır. Model, her andaki kullanıcı eylemlerine göre koşullandırılan, kare kare video üretiyor.
Mimari, hızlandırılmış eksenel, nedensel uzay-zamansal dikkat mekanizmasının yanı sıra görüntü boyutunu sıkıştırmak ve difüzyonun daha yüksek düzeydeki özelliklere odaklanmasını sağlamak için Transformer tabanlı bir varyasyonel otomatik kodlayıcıya (ViT VAE) sahiptir.
Çift yönlü modellerden farklı olarak Oasis, her kareyi oyun girdisine göre koşullandırma yeteneğiyle kareleri otoregresif olarak oluşturur. Bu, kullanıcıların videoları geriye dönük olarak oluşturmak yerine dünyayla gerçek zamanlı olarak etkileşime girmesine olanak tanır.
Model, yayılmayı zorlayan teknikleri kullanıyor ve önceki karelerden bağlam sağlamak için mekansal dikkat katmanları arasına serpiştirilmiş ek zamansal dikkat katmanları içeriyor.
Ekip, verimli büyük ölçekli eğitim sağlamak için ek optimizasyon teknikleri geliştirmenin yanı sıra modeli ve veri kümelerini ölçeklendirmek için aktif olarak çalışıyor.
Oasis, oyunun ötesinde, dijital içerik ve eğlence platformlarıyla etkileşim şeklimizde potansiyel olarak devrim yaratarak tam etkileşimli, çok modlu video üretimine doğru genişlemeyi hedefliyor.