광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

[인공지능] AI는 인간에게 알려진 가장 복잡한 게임 중 일부를 마스터해서 종종 경쟁에서 탁월하지만 협력은 자연스럽게 이루어지지 않는다. 이제 Meta의 AI가 다른 플레이어와 협력하여 승리해야 하는 Diplomacy 게임을 마스터했다. Meta의 새로운 AI는 게임 Diplomacy에서 상위 10%에 올랐고 인간 플레이어는 아무도 현명하지 않았다.

https://singularityhub.com/2022/11/28/meta-created-an-ai-that-beat-humans-at-diplomacy/

JM Kim | 기사입력 2022/11/30 [00:00]

[인공지능] AI는 인간에게 알려진 가장 복잡한 게임 중 일부를 마스터해서 종종 경쟁에서 탁월하지만 협력은 자연스럽게 이루어지지 않는다. 이제 Meta의 AI가 다른 플레이어와 협력하여 승리해야 하는 Diplomacy 게임을 마스터했다. Meta의 새로운 AI는 게임 Diplomacy에서 상위 10%에 올랐고 인간 플레이어는 아무도 현명하지 않았다.

https://singularityhub.com/2022/11/28/meta-created-an-ai-that-beat-humans-at-diplomacy/

JM Kim | 입력 : 2022/11/30 [00:00]

Google Go 게임 숙달은 AI의 주요 이정표로 환영받았지만 부인할 수 없는 복잡성에도 불구하고 여러 면에서 기계의 논리를 계산하는 추위에 매우 적합하다. 상대방의 움직임을 완전히 볼 수 있는 완벽한 정보 게임이며, 이기는 것은 단순히 다른 플레이어를 능가할 수 있다는 것을 의미한다.

 

반면에 Diplomacy는 훨씬 더 지저분한 일이다. 이 보드 게임은 최대 7명의 플레이어가 유럽의 군사력을 장악하고 군대를 사용하여 전략적 도시를 장악하는 것을 본다. 그러나 플레이어는 완전한 지배를 추구하기 위해 동맹을 형성하고 깨기 위해 서로 협상할 수 있다.

 

게다가 모든 플레이어의 이동은 매 턴마다 동시에 이루어지기 때문에 단순히 다른 플레이어의 행동에 반응할 수 없다. , 게임에서 이기려면 전략적 사고, 다른 플레이어와 협력하는 능력, 설득력 있는 협상 기술의 복잡한 조합이 필요하다. AI는 이미 순수한 전략을 마스터했지만 다른 기술은 복제하기가 훨씬 더 까다로운 것으로 판명되었다.

 

하지만 Meta의 연구원들이 설계한 새로운 AI는 그 방향으로 큰 발걸음을 내디뎠을 것이다. 지난 주 Science에 발표된 논문에서 그들은 온라인 Diplomacy 리그에서 플레이어의 상위 10%에 속하고 인간 플레이어 평균 점수의 두 배 이상을 달성한 Cicero라는 시스템을 설명한다.

 

"Cicero는 회복력이 있고 무자비하며 인내심이 강하다." 외교 세계 챔피언 3회 우승자인 Andrew Goff Meta에서 제작한 비디오에서 말했다. “때때로 나쁜 결정을 내리게 만드는 인간적인 감정이 많이 없이 재생된다. 상황을 평가하고 상황뿐만 아니라 함께 일하는 사람들을 위해 최선의 결정을 내린다.”

 

Cicero를 만들려면 Meta 연구원이 전략적 추론과 자연어 처리라는 두 가지 하위 분야의 최첨단 AI 방법을 결합해야 했다. 시스템의 핵심에는 다른 플레이어의 움직임을 예측하고 이를 사용하여 자체 전략을 결정하는 계획 알고리즘이 있다. 이 알고리즘은 인간이 게임을 하는 방식을 모방하면서 AI가 계속해서 스스로 게임을 하도록 함으로써 훈련되었다.

 

연구원들은 이미 이 계획 모듈만으로도 게임의 단순화된 버전에서 인간 전문가를 이길 수 있음을 보여주었다. 그러나이 최신 연구에서 팀은 인터넷에서 방대한 양의 텍스트로 훈련된 대규모 언어 모델과 결합한 다음 40,000 온라인 Diplomacy 게임의 대화를 사용하여 미세 조정했다. 이를 통해 업그레이드된 Cicero는 다른 플레이어의 메시지를 해석하고 자체 메시지를 작성하여 함께 작업하도록 설득할 수 있다.

 

결합된 시스템은 보드의 현재 상태와 과거 대화를 사용하여 각 플레이어가 무엇을 할 가능성이 있는지 예측하는 것으로 시작한다. 그런 다음 의도를 설명하고 다른 플레이어의 협력을 보장하도록 설계된 메시지를 생성하기 전에 자체 및 파트너 모두를 위한 행동 계획을 제시한다.

 

온라인 토너먼트에서 40개 이상의 게임에서 Cicero 82명의 다른 플레이어와 효과적으로 의사 소통하여 의도를 설명하고 조치를 조정하며 동맹을 협상했다. 결정적으로 연구원들은 게임 내 메시지에서 인간 플레이어가 AI와 팀을 이루고 있다고 의심했다는 증거를 보지 못했다고 말했다.

 

그러나 모델의 의사 소통 능력은 완벽하지 않았다. 무의미한 메시지나 목표와 일치하지 않는 메시지를 뱉어낼 수 있기 때문에 연구원들은 움직일 때마다 여러 후보 메시지를 생성한 다음 다양한 필터링 메커니즘을 사용하여 쓰레기를 걸러내야 했다. 그럼에도 불구하고 연구원들은 때때로 비논리적인 메시지가 빠져나갔다는 것을 인정한다.

 

이것은 Cicero의 중심에 있는 언어 모델이 여전히 무슨 일이 일어나고 있는지 실제로 이해하지 못하고 단순히 그럴듯하게 들리는 메시지를 생성한 다음 원하는 결과를 얻기 위해 확인해야 하는 메시지를 생성하고 있음을 시사한다.

 

The Conversation에서 호주 뉴사우스웨일스 대학의 AI 연구원 Toby Walsh Cicero가 대부분의 인간 플레이어와 달리 한치의 오차도 없이 정직하다고 언급했다. 이것은 놀라울 정도로 효과적인 전략이지만, 경쟁자가 상대방이 결코 자신을 속이려 하지 않을 것이라는 점을 알게 되면 큰 약점이 될 수 있다.

 

그럼에도 불구하고 이러한 발전은 중요한 것이며 Facebook은 보드 게임을 훨씬 넘어서는 응용 프로그램을 가질 수 있기를 희망한다. 블로그 게시물에서 연구자들은 계획 알고리즘을 사용하여 언어 생성을 제어하는 ​​기능을 통해 AI 챗봇과 훨씬 더 길고 풍부한 대화를 나누거나 플레이어의 행동에 적응할 수 있는 비디오 게임 캐릭터를 만들 수 있다고 말한다.

 

이미지: MabelAmber / 4008

 

 
인공지능, AI 게임, Meta 관련기사목록
광고
광고
광고
광고
광고
광고
광고
많이 본 기사
AIbio소식 많이 본 기사
최신기사