https://youtu.be/PDKhUknuQDg

구글 딥마인드가 텍스트 프롬프트만으로 실시간 상호작용이 가능한 3D 환경을 생성하는 AI 모델 'Genie 3'를 공개. 


이는 기존 Genie 2의 대폭 개선된 버전으로, 720p 해상도에서 초당 24프레임으로 작동하며 몇 분간 일관된 세계를 유지할 수 있어.


Genie 3의 주요 개선사항은 실시간 상호작용 지원. 기존 Genie 2가 360p 해상도에서 10-20초만 안정적으로 작동했던 것과 달리, Genie 3는 720p 고해상도에서 수 분간 일관성을 유지. 또한 사용자가 화면에서 벗어난 객체나 지형을 최대 1분간 기억하는 '시각적 메모리' 기능을 갖춰.


새로운 '프롬프트 가능한 월드 이벤트' 기능도 주목할 만해. 사용자는 생성된 세계 안에서 텍스트 명령을 통해 날씨를 바꾸거나 새로운 캐릭터를 추가할 수 있어. 실제 시연에서는 스키를 타는 장면에 사슴 떼를 실시간으로 추가하는 모습이 공개.


구글 딥마인드는 Genie 3를 게임 개발보다는 AI 연구 도구로 포지셔닝하고 있어. 특히 자율주행차가 보행자를 안전하게 피하는 방법을 학습하는 등 'What if' 시나리오 훈련에 활용할 수 있다고 설명. 현재는 소수의 학계 연구자와 창작자들에게만 제한적으로 제공되고 있으며, 향후 더 많은 테스터에게 확대할 계획.

이 기술은 게임 산업에도 큰 변화를 가져올 전망. 기존에는 게임 개발자들이 현실적인 게임 월드를 구축하는 데 수년이 걸렸지만, Genie 3와 같은 기술이 발전하면 간단한 프롬프트만으로 다양한 스타일의 게임 월드를 즉석에서 생성할 수 있게 될 것.


소스:

  • Google DeepMind 공식 블로그: https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/
  • Engadget: https://www.engadget.com/ai/google-deepminds-genie-3-can-dynamically-alter-the-state-of-its-simulated-worlds-140052124.html