โมเดล AI โลกเปิดแบบเรียลไทม์ที่สามารถเล่นได้ตัวแรกที่สร้างการเล่นเกมแบบเฟรมต่อเฟรม พัฒนาโดย Decart AI
Oasis AI Minecraft พัฒนาโดย Decart AI ร่วมกับ Etched แสดงถึงความสำเร็จครั้งยิ่งใหญ่ในเทคโนโลยีเกม AI เป็นวิดีโอเกมแบบโต้ตอบที่สร้างขึ้นจากต้นทางถึงปลายทางโดยหม้อแปลงไฟฟ้าแบบเฟรมต่อเฟรม
แตกต่างจากเกมทั่วไป Oasis ใช้คีย์บอร์ดและเมาส์ของผู้ใช้และสร้างการเล่นเกมแบบเรียลไทม์ จำลองฟิสิกส์ กฎของเกม และกราฟิกภายใน โมเดลเรียนรู้เพื่อให้ผู้ใช้สามารถเคลื่อนที่ กระโดด หยิบไอเท็ม ทำลายบล็อก และอื่นๆ อีกมากมายได้โดยการรับชมการเล่นเกมโดยตรง
โครงการปฏิวัตินี้ผสมผสานการวิจัย AI ที่ล้ำสมัยเข้ากับการเพิ่มประสิทธิภาพฮาร์ดแวร์ขั้นสูง ถือเป็นก้าวแรกสู่โมเดลพื้นฐานที่จำลองโลกเชิงโต้ตอบที่ซับซ้อนยิ่งขึ้น ซึ่งอาจเข้ามาแทนที่เอนจิ้นเกมคลาสสิกในอนาคตที่ขับเคลื่อนด้วย AI
เราทำการทดสอบสถาปัตยกรรมและข้อมูลหลายร้อยครั้งเพื่อระบุสถาปัตยกรรมที่ดีที่สุดสำหรับการสร้างวิดีโอโต้ตอบอัตโนมัติแบบถดถอยที่รวดเร็ว สถาปัตยกรรมของเราได้รับการออกแบบมาโดยเฉพาะสำหรับการสร้างแบบเรียลไทม์แบบเฟรมต่อเฟรมด้วยการปรับเงื่อนไขอินพุตของผู้ใช้ ต่างจากโมเดลสองทิศทางแบบดั้งเดิม
สถาปัตยกรรม ViT DiT ของ Oasis นำเสนอตัวเข้ารหัสอัตโนมัติแบบแปรผันที่ใช้ Transformer และความสนใจเชิงพื้นที่ที่เร่งขึ้น
Oasis ใช้การผสมผสานระหว่างการฝึกแบบแพร่กระจายและโมเดลหม้อแปลง ซึ่งได้รับแรงบันดาลใจจากโมเดลภาษาขนาดใหญ่ขั้นสูง (LLM) โมเดลจะสร้างวิดีโอแบบเฟรมต่อเฟรม โดยขึ้นอยู่กับการกระทำของผู้ใช้ในแต่ละขณะ
สถาปัตยกรรมนี้มีตัวเข้ารหัสอัตโนมัติแบบแปรผันที่ใช้ Transformer (ViT VAE) เพื่อบีบอัดขนาดภาพและทำให้การแพร่กระจายสามารถมุ่งเน้นไปที่คุณลักษณะระดับสูงกว่า พร้อมด้วยกลไกความสนใจเชิงพื้นที่เชิงสาเหตุเชิงแกนแบบเร่ง
ต่างจากโมเดลแบบสองทิศทางตรงที่ Oasis สร้างเฟรมแบบถดถอยอัตโนมัติ โดยมีความสามารถในการกำหนดเงื่อนไขแต่ละเฟรมในอินพุตเกม ช่วยให้ผู้ใช้สามารถโต้ตอบกับโลกได้แบบเรียลไทม์ แทนที่จะเรนเดอร์วิดีโอย้อนหลัง
แบบจำลองนี้ใช้เทคนิคการบังคับการแพร่กระจาย และรวมเลเยอร์ความสนใจชั่วคราวเพิ่มเติมที่แทรกอยู่ระหว่างเลเยอร์ความสนใจเชิงพื้นที่ เพื่อให้บริบทจากเฟรมก่อนหน้า
ทีมงานกำลังทำงานอย่างแข็งขันในการปรับขนาดโมเดลและชุดข้อมูล ควบคู่ไปกับการพัฒนาเทคนิคการปรับให้เหมาะสมเพิ่มเติมเพื่อให้สามารถฝึกอบรมขนาดใหญ่ได้อย่างมีประสิทธิภาพ
นอกเหนือจากการเล่นเกม Oasis ตั้งเป้าที่จะขยายไปสู่การสร้างวิดีโอแบบโต้ตอบหลายรูปแบบเต็มรูปแบบ ซึ่งอาจปฏิวัติวิธีที่เราโต้ตอบกับเนื้อหาดิจิทัลและแพลตฟอร์มความบันเทิง