구글 딥마인드 ”게임으로 AI 키웠다”
Source: Byline Network
구글 딥마인드가 바라보는 게임의 가치는 조금 달랐다. 게임을 단순한 오락이 아니라 범용인공지능(AGI) 연구를 위한 핵심 기반이자, 현실 세계를 이해하기 위한 ‘최소 모델’로 인식했다. 실제 구글은 게임을 통해 다양한 AI 연구를 발전시켜 왔으며, 최근에는 범용 에이전트 시마(SIMA)와 월드모델 지니(Genie)를 양대 축으로 AGI를 고도화 중이다.
알렉상드르 무파렉(Alexandre Moufarek) 구글 딥마인드 디렉터는 17일 경기도 성남시 판교 경기창조경제혁신센터에서 열린 넥슨개발자컨퍼런스(NDC) 2026에서 “딥마인드의 목표는 인류에게 도움이 되는 AI를 책임감 있게 만드는 것”이라며 “게임은 이런 연구를 위한 핵심 기반이 됐다”고 말했다. 그러면서 “게임은 더 복잡한 현실 세계를 이해하기 위한 최소 모델을 제공하기 때문이다”라고 전했다.
무파렉 디렉터에 따르면 딥마인드는 게임을 기반으로 다양한 AI 연구를 이어왔다. 초기에는 아타리 게임으로 다양한 게임에서 작동하는 DQN 알고리즘을 개발했다. 이후 알파고를 통해 바둑과 같은 경기에서 복잡한 문제를 다루는 새로운 알고리즘을 선보였다. 알파제로에서는 이를 체스와 일본 장기로 확장했다.
딥마인드는 한발 더 나아가 RTS 장르 스타크래프트를 통한 AI 연구까지 도달했다. 그는 “우리는 더 어려운 환경을 원했기에 스타크래프트를 선택했다”며 “실시간 게임인 스타크래프트는 여러 유닛을 동시에 조작해야 하고, 전장의 안개 때문에 상대가 무엇을 하고 있는지 항상 알 수 없는 불완전 정보 게임이다”라고 설명했다. AI는 제한된 정보 속에서 상대 전략을 추론하고, 새로운 정보가 들어올 때마다 계획을 수정해야 한다. 딥마인드는 이러한 환경에서 AI 프로젝트 ‘알파스타’를 진행하며 복잡한 의사결정 능력을 연구했다.
알렉상드르 무파렉(Alexandre Moufarek) 구글 딥마인드 디렉터가 17일 경기도 성남시 판교 경기창조경제혁신센터에서 열린 넥슨개발자컨퍼런스(NDC) 2026에서 세션 발표 중이다. (출처=바이라인네트워크)
딥마인드의 다음 연구 단계는 서로 다른 게임에서 작동하는 범용 AI를 만드는 것이다. 이를 위해 여러 게임 개발사와 협력해 범용 에이전트 ‘시마’ 개발 프로젝트를 시작했다. 시마는 3D 세계에서 자연어를 이해하고 명령을 이행하는 AI 에이전트다.
시마는 플레이어와 동일한 방식으로 게임을 인식하고 조작한다. 화면의 픽셀만을 입력값으로 활용하며 사람과 같은 키보드와 마우스 입력을 사용한다. 예를 들어 사용자가 ‘우주선에 타서 날아가’라고 지시하면 화면을 인식해 직접 조작하며 목표를 수행하는 식이다. 무파렉 디렉터는 “3D 세계(게임)에서의 발견이 결국 현실과 로보틱스로 이어질 것”이라며 “게임은 AI 연구를 위한 안전한 실험장”이라고 강조했다.
딥마인드는 시마와 함께 또다른 AI 연구의 축으로 월드모델 지니를 소개했다. 월드모델은 특정 환경의 작동 원리를 이해하고 시뮬레이션하는 시스템이다. 이를 통해 어떤 행동이 무슨 결과를 가져오는지 예측할 수 있다. 회사는 지난 2024년 지니 1을 선보였지만 한계가 명확했다. 2D 환경만 구축 가능했고 시뮬레이션 가능 시간은 10초 내외였다.
9개월 뒤 딥마인드는 지니 2를 공개했다. 기존 세대와 달리 3D 환경을 생성할 수 있게 됐다. 지속 시간도 분 단위로 길어졌고 조명, 중력, 반사 등 다양한 물리현상을 구현했다. 다음 세대인 지니 3는 사진과 같이 현실적인 가상 세계를 실시간 생성하는 단계에 도달했다. 텍스트 한 줄만 입력하면 최대 720p 해상도와 24fps 수준으로 작동하는 세계를 구현할 수 있게 됐다는 설명이다. 특히 사용자의 행동과 세계의 변화를 기억하는 ‘월드 메모리’ 기능까지 갖췄다.
딥마인드는 게임으로 시작한 AI 연구에서 범용 에이전트, 월드모델 단계까지 나아갔다. 회사는 앞으로 시마와 지니를 결합해 AI가 스스로 학습하고 개선되는 플라이휠(Flywheel) 구조를 구축할 방침이다. 무파렉 디렉터는 “우리는 시마라는 범용 에이전트, 지니라는 범용 월드모델을 갖게 됐다”며 “에이전트는 월드모델 안에서 학습하고, 월드모델은 에이전트를 통해 개선될 것”이라고 강조했다.
무파렉 디렉터는 이제까지는 게임을 활용한 AI 연구가 진행됐지만 앞으로는 AI 연구가 게임에 어떤 영향을 미칠지 주목해야 한다고 전했다. 그는 “AI 없이는 불가능했던 새로운 경험과 감정, 플레이를 만들어낼 수 있다고 믿는다”라며 “단순히 기존 게임을 자동화하는 것이 아니라 AI를 통해 이전에 존재하지 않았던 경험을 발견할 것”이라고 말했다.
글. 바이라인네트워크