[인공지능] AI는 협업 로봇 및 드론 팀 훈련을 지원한다. 일리노이 대학 그레인저 공과대학의 연구원 팀은 인공지능(AI)을 사용하여 함께 작동하도록 로봇 및 드론과 같은 여러 에이전트를 훈련시키는 새로운 방법을 개발했다. 에이전트는 머신러닝 기술의 주요 유형 중 하나인 강화 학습에 의존한다.
[인공지능] AI는 협업 로봇 및 드론 팀 훈련을 지원한다. 일리노이 대학 그레인저 공과대학의 연구원 팀은 인공지능(AI)을 사용하여 함께 작동하도록 로봇 및 드론과 같은 여러 에이전트를 훈련시키는 새로운 방법을 개발했다. 에이전트는 머신러닝 기술의 주요 유형 중 하나인 강화 학습에 의존한다.
Huy Tran은 "에이전트가 서로 대화할 수 있으면 더 쉽다."라고 말했다. "하지만 우리는 분산된 방식으로 이 작업을 수행하고 싶었다. 즉, 서로 대화하지 않는다는 의미이다. 우리는 또한 에이전트의 다른 역할이나 직무가 무엇인지 명확하지 않은 인용에 초점을 맞췄다.”
Tran에 따르면 이 시나리오는 한 에이전트가 다른 에이전트에 대해 무엇을 해야 하는지 명확하지 않기 때문에 더 복잡하다.
"흥미로운 질문은 시간이 지남에 따라 함께 작업을 수행하는 방법을 배우는 것이다."라고 그는 말했다.
강화 학습 기법
팀은 이 문제를 해결하기 위해 강화 학습이라는 머신러닝 기술에 의존했다. 이를 통해 에이전트가 팀에 유용한 작업을 수행할 때 알려주는 유틸리티 기능을 만들 수 있었다.
Tran은 "팀 목표로 누가 승리에 기여했는지 알기가 어렵다."라고 말했다. “우리는 개별 에이전트가 글로벌 팀 목표에 기여한 시점을 식별할 수 있는 머신러닝 기술을 개발했다. 스포츠 측면에서 보면 축구 선수 한 명이 득점할 수 있지만 다른 팀원들이 어시스트와 같이 골로 이어진 행동에 대해서도 알고 싶다. 이러한 지연 효과를 이해하기 어렵다.”
연구원의 알고리즘은 에이전트나 로봇이 목표에 어긋나는 일을 하거나 목표에 기여하지 않는 경우도 식별한다.
그는 “로봇이 잘못된 일을 선택한 것이 아니라 최종 목표에 유용하지 않은 일을 선택한 것”이라고 말했다.
알고리즘은 스타크래프트와 같은 시뮬레이션 게임을 사용하여 테스트되었다.
"스타크래프트는 조금 더 예측할 수 없다. 우리의 방법이 이 환경에서도 잘 작동하는 것을 보게 되어 기쁘다."
이러한 유형의 알고리즘은 다양한 실제 상황에 적용할 수 있다고 팀은 말한다. 잠재적인 응용 프로그램에는 군사 감시, 창고의 로봇, 교통 신호 제어, 배달을 조정하는 자율 차량 및 전력망 제어가 포함된다.
이 획기적인 연구를 수행한 팀에는 김승현, Neale Van Stralen 및 Girish Chowdhary가 포함되었다. 자율 에이전트 및 다중 에이전트 시스템 동료 리뷰 컨퍼런스에서 발표되었다.