광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

[AI는 게임을 할 때 경쟁플레이 하지 않고 협동플레이를 한다] SIMA(확장 가능하고 교육 가능한 다중 세계 에이전트) 프로젝트는 AI가 인간의 지시에 따라 작동함에 따라 경쟁 플레이에서 협동 플레이로의 전환을 의미

https://www.freethink.com/robots-ai/why-ai-playing-video-games-is-a-big-deal

JM Kim | 기사입력 2024/05/09 [00:00]

[AI는 게임을 할 때 경쟁플레이 하지 않고 협동플레이를 한다] SIMA(확장 가능하고 교육 가능한 다중 세계 에이전트) 프로젝트는 AI가 인간의 지시에 따라 작동함에 따라 경쟁 플레이에서 협동 플레이로의 전환을 의미

https://www.freethink.com/robots-ai/why-ai-playing-video-games-is-a-big-deal

JM Kim | 입력 : 2024/05/09 [00:00]

 

AI는 게임을 할 때 경쟁플레이 하지 않고 협동플레이를 한다.

 

Google AI 연구소인 DeepMind는 게임을 통해 AI의 능력을 과시하고 그 과정에서 인간 상대를 제압한 역사를 가지고 있다. 2016년 알파고는 바둑 세계챔피언 이세돌을 꺾었다. 2019년에 AlphaStar는 프로 StarCraft II 선수인 Grzegorz “MaNa” Komincz 5-0으로 이길 수 있을 만큼 충분한 추가 철탑을 건설했다. 그리고 2020년에 Atari57 57개의 Atari 2600 게임에서 일반 인간 플레이어보다 더 나은 점수를 얻었다.

 

하지만 연구실의 최신 AI 뉴스는 뭔가 다르다. 단일 게임을 마스터하기 위한 모델을 설계하는 대신 DeepMind는 브리티시 컬럼비아 대학교의 연구원들과 협력하여 완전히 다른 게임을 플레이할 수 있는 AI 에이전트를 개발했다. SIMA(확장 가능하고 교육 가능한 다중 세계 에이전트 Scalable Instructable Multi-World Agent)라고 불리는 이 프로젝트는 AI가 인간의 지시에 따라 작동함에 따라 경쟁 플레이에서 협동 플레이로의 전환을 의미한다.

 

하지만 SIMA는 단순히 졸린 플레이어가 레벨을 갈거나 자원을 확보할 수 있도록 돕기 위해 만들어진 것이 아니다. 대신 연구원들은 SIMA가 가상 놀이터에서 어떻게 학습하는지 더 잘 이해함으로써 AI 에이전트가 현실 세계에서 더욱 협력적이고 도움이 되도록 만들 수 있기를 바라고 있다.

 

 

자신만의 AI 모험을 선택하라.

DeepMind는 개발자 스튜디오와 협력하여 9개의 다양한 비디오 게임에서 SIMA를 교육하고 테스트했다. 여기에는 거대한 (때로는 지루하지만) 우주 탐험 게임 노 멘스 스카이(No Man's Sky), 바이킹 생존 게임 발헤임(Valheim), 공상 과학 공장 건설 게임인 Satisfactory, 심지어 Goat Simulator 3도 있다. 이 게임에서는 플레이어가 가상의 남부 캘리포니아 도시를 가로질러 소란을 퍼뜨리고 소란을 피우는 염소를 플레이하는 게임이다.

 

다양한 게임 포트폴리오가 있지만 DeepMind AI만이 외계인과 제트팩을 타는 염소로부터 우리를 보호할 수 있는 미래를 두려워하기 때문에 이 9개를 선택하지 않았다. 오히려 이러한 게임은 중요한 면에서 현실 세계와 유사한 특성을 공유한다. , 플레이어의 행동과 관계없이 실시간으로 변화하는 3D 환경에서 진행된다. 또한 단순히 승리하는 것 이상의 다양한 잠재적 결정과 개방형 상호작용이 특징이다.

 

SIMA에게 이러한 세계에서 이동하는 방법을 가르치기 위해 연구원들은 간단한 게임 플레이 비디오부터 시작하여 AI가 언어 기반 지침을 이해하도록 훈련했다. 일부 영상에서는 두 명의 플레이어가 함께 게임을 했다. 한 플레이어가 지시를 내리면 다른 플레이어는 그에 따라 지시를 따른다. 다른 비디오에서는 플레이어가 게임을 자유롭게 플레이했으며, 연구원들은 나중에 화면상의 동작을 설명하는 서면 지침을 비디오에 주석으로 달았다. 두 경우 모두 목표는 언어가 게임의 행동 및 행동과 어떻게 연결되는지 파악하는 것이었다.

 

SIMA 개요. (제공: DeepMind / Google)

SIMA의 기술이 훈련된 환경뿐만 아니라 모든 3D 환경으로 이전될 수 있도록 하기 위해 연구원들은 몇 가지 추가 설계 과제를 부과했다. 여기에는 다음이 포함된다.

SIMA가 다음 작업을 여유롭게 결정할 수 있도록 환경이 느려지지 않았다. 게임 내에서 일정한 속도로 작동해야 했다.

SIMA는 화면의 이미지와 텍스트에만 접근할 수 있었으며, 이는 인간 플레이어가 처리할 수 있는 동일한 정보였다. 예를 들어 게임 소스 코드로부터 특권 정보를 받지 못했다.

SIMA는 키보드와 마우스에 해당하는 도구를 통해서만 게임과 상호 작용할 수 있었다.

 

마지막으로, 게임에서 SIMA의 목표는 인간 플레이어가 자연어 지침을 사용하여 실시간으로 제공해야 했다. AI는 특정하고 미리 결정된 목표를 달성할 때까지 단순히 게임을 계속해서 플레이하는 것이 허용되지 않았다. , SIMA는 수천 번의 게임 시도를 통해 시행착오를 겪으면서가 아니라 인간 파트너와 협력하여 플레이하는 방법을 배워야 했다.

 

예를 들어, 발헤임(Valheim)의 가장 최근 게임 내 목표가 목재 10개를 수집하는 것이었지만 인간 사용자가 SIMA에게 대신 바위 10개를 수집하라고 지시한 경우 SIMA는 나무를 자르는 대신 근처의 바위 채굴을 시작해야 한다.

 

연구원들은이것은 일반적으로 AI의 중요한 목표이다.”라고 말한다. "대규모 언어 모델(ChatGPT와 같은 LLM)이 세상에 대한 지식을 포착하고 계획을 생성할 수 있는 강력한 시스템을 탄생시켰지만 현재는 우리를 대신하여 조치를 취할 수 있는 능력이 부족하기 때문이다."

 

 

다섯 가지 비디오 게임에서 사용자 지침을 따르는 SIMA의 스크린샷. (제공: DeepMind / Google)

모든 거래의 잭, 다가올 숙달

SIMA 9개 기술 범주에 걸쳐 총 1,485개의 고유한 작업에 대해 평가되었다. 기술 범주는 탐색, 건설, 개체 사용과 같은 게임 전반에 걸쳐 더 일반화되었지만 작업 자체는 "배로 이동", "발전기 만들기" 또는 ""와 같이 게임 환경에 더 구체적일 수 있다.”

 

전반적으로 SIMA는 언어 기반 지침을 성공적으로 이해했다. 성공률은 작업 및 기술 범주에 따라 다르지만 평가에 사용된 다른 AI 에이전트보다 훨씬 더 나은 성능을 보였다.

예를 들어 단일 환경에서 훈련된 AI보다 성능이 뛰어나 평균 67%의 향상을 보였다. 연구원들은 또한 하나를 제외한 모든 데이터 세트에 대해 일부 버전의 SIMA를 교육했다. 이러한 버전의 SIMA는 부재 게임을 수행할 때 단일 환경 AI와 거의 비슷한 성능을 보였다. 이러한 결과는 SIMA의 기술이 다양한 3D 환경에서 이전될 수 있음을 시사한다.

 

SIMA의 텍스트 지침 데이터 세트를 보여주는 계층 구조이다. (제공: DeepMind / Google)

연구원들은 또한 언어 입력 없이 훈련된 AI 에이전트와 SIMA를 비교했다. 예를 들어 No Man's Sky에서 SIMA의 성공률은 평균 34%였다. 다른 AI는 평균 11%에 불과했는데, 연구원들은 이 성능을 "적절하지만 목적이 없다"고 표현했다. 이러한 결과는 언어가 SIMA 성과의 중요한 구성 요소임을 더욱 시사한다.

 

연구진은이번 연구는 에이전트가 광범위한 게임 세계를 이해하고 자연어 지침에 따라 작업을 수행할 수 있음을 입증한 최초의 사례이다.”라고 연구원은 지적한다.

그렇다면 SIMA가 특히 까다로운 게임을 조만간 이길 수 있도록 도와줄 것이라고 기대하지 말라. No Man's Sky에서는 엄격한 심사 기준에도 불구하고 인간 플레이어가 60%의 성공률을 달성했다.

 

마찬가지로, 이러한 게임은 종종 주어진 순간에 수백 개의 개체와 수십 개의 잠재적 상호 작용을 결합하는 복잡하기 때문에 연구원들은 지침을 " 10초 이내에 완료"할 수 있는 것으로 제한했다. SIMA의 향후 버전이 매주 토요일 밤에 평균적인 중학교 마이크래프트 플레이어 그룹이 관리하는 장기적이고 다층적인 계획을 관리할 수 있는지는 아직 알 수 없다.

 

팀은 연구 결과를 기술 보고서로 발표했다.

 

 

SIMA의 스킬 카테고리별 평균 성공률이다. (제공: DeepMind / Google)

 

게임 너머의 생각

SIMA는 진행 중인 작업이며 앞으로 연구원들은 SIMA의 기능을 확장하기 위해 새로운 3D 환경과 더 큰 데이터 세트를 포함하도록 게임 포트폴리오를 확장하기를 희망한다. 그럼에도 불구하고 그들은 예비 결과가 유망하다고 생각한다.

“비디오 게임 하나를 플레이하는 방법을 배우는 것은 AI 시스템의 기술적인 업적이지만, 다양한 게임 설정에서 지침을 따르는 방법을 배우면 모든 환경에서 더 유용한 AI 에이전트를 잠금 해제할 수 있다. 우리의 연구는 언어 인터페이스를 통해 고급 AI 모델의 기능을 유용하고 실제적인 작업으로 변환할 수 있는 방법을 보여준다.”

 

 

AI가 자동차든 로봇이든 세상에 존재하고 작동하기를 원한다면 가상 환경은 연구자가 이러한 시스템을 테스트할 수 있는 더 안전하고 덜 낭비적인 수단을 제공한다.

AI가 가상 세계에서 운전을 학습하는 자동차와 충돌하는 경우 학습을 학습한 후 다시 시도할 수 있다. 현실 세계에서 자동차에 충돌이 발생하면 치명적이지 않은 결과라도 훨씬 더 많은 비용이 든다. 일단 훈련되면 동일한 언어 지침을 사용하여 AI를 가상 환경 외부로 안내할 수 있다. 잠재적으로 AI가 염소로 훈련된 경우에도 마찬가지이다.

 

연구원들은 "우리는 그렇게 함으로써 SIMA를 복잡한 환경에서 안전하게 접지 언어 및 사전 훈련된 모델에 대한 최첨단 연구를 수행할 수 있는 이상적인 플랫폼으로 만들어 AGI의 근본적인 과제를 해결하는 데 도움이 될 것이라고 믿는다"라고 결론지었다.

 

 

 

 

 

 
인공지능, AI 게임, 협동플레이, 가상세계 관련기사목록
광고
광고
광고
광고
광고
광고
많이 본 기사
AIbio소식 많이 본 기사
최신기사