광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

[자가 개선 로봇] DeepMind의 새로운 자가 개선 로봇은 새로운 기술에 빠르게 적응하고 학습한다. 인공지능의 급속한 발전에도 불구하고 로봇은 완고하게 멍청하다. 그러나 DeepMind의 새로운 연구는 대규모 언어 모델(LLM) 뒤에 있는 동일한 기술이 로봇 팔을 위한 더 적응력 있는 두뇌를 만드는 데 도움이 될 수 있다고 제안한다.

https://singularityhub.com/2023/06/25/deepminds-new-robot-uses-ai-to-learn-without-supervision/

JM Kim | 기사입력 2023/06/27 [00:00]

[자가 개선 로봇] DeepMind의 새로운 자가 개선 로봇은 새로운 기술에 빠르게 적응하고 학습한다. 인공지능의 급속한 발전에도 불구하고 로봇은 완고하게 멍청하다. 그러나 DeepMind의 새로운 연구는 대규모 언어 모델(LLM) 뒤에 있는 동일한 기술이 로봇 팔을 위한 더 적응력 있는 두뇌를 만드는 데 도움이 될 수 있다고 제안한다.

https://singularityhub.com/2023/06/25/deepminds-new-robot-uses-ai-to-learn-without-supervision/

JM Kim | 입력 : 2023/06/27 [00:00]

자율 로봇이 실험실을 벗어나 현실 세계로 이동하기 시작했지만 여전히 취약하다. 환경이나 조명 조건의 약간의 변화는 이를 제어하는 AI를 쉽게 버릴 수 있으며 이러한 모델은 유용한 작업을 수행하기 전에 특정 하드웨어 구성에 대해 광범위하게 훈련되어야 한다.

 

이것은 종종 익숙하지 않은 상황에서 광범위한 작업에 대한 기술을 일반화하는 데 능숙한 것으로 입증된 최신 LLM과 극명한 대조를 이룬다. 이로 인해 변압기로 알려진 아키텍처인 기본 기술이 로봇 공학의 혁신으로 이어질 수 있는지 여부에 대한 관심이 높아지고 있다.

 

새로운 결과에서 DeepMind의 연구원들은 RoboCat이라는 변압기 기반 AI가 광범위한 기술을 배울 수 있을 뿐만 아니라 다른 로봇 본체 사이를 쉽게 전환하고 평소보다 훨씬 빠르게 새로운 기술을 습득할 수 있음을 보여주었다. 아마도 가장 중요한 것은 자체 교육 데이터를 생성하여 학습을 가속화할 수 있다는 것이다.

 

연구원들은 블로그 게시물에서 "RoboCat의 기술을 독립적으로 배우고 빠르게 자가 개선할 수 있는 능력은 특히 다른 로봇 장치에 적용할 때 더욱 도움이 되는 범용 로봇 에이전트의 새로운 세대를 향한 길을 닦는 데 도움이 될 것"이라고 블로그 게시물에 있다.

 

새로운 AIDeepMind 연구원들이 지난달 공개한 가토(Gato) 모델을 기반으로 한다. 이미지 캡션부터 비디오 게임, 심지어 로봇 팔 제어까지 다양한 작업을 해결할 수 있다. 이를 위해서는 텍스트에서 이미지, 로봇 제어 데이터에 이르기까지 모든 것을 포함하는 다양한 데이터 세트에 대한 교육이 필요했다.

 

그러나 RoboCat의 경우 팀은 특히 로봇 공학 과제에 초점을 맞춘 데이터 세트를 만들었다. 그들은 색깔 있는 벽돌을 올바른 순서로 쌓거나 바구니에서 올바른 과일을 고르는 것과 같은 수백 가지의 다른 작업을 수행하는 4개의 다른 로봇 팔에 대한 수만 번의 시연을 생성했다.

 

이러한 시연은 로봇 팔을 원격 조작하는 인간과 가상 환경에서 시뮬레이션된 로봇 팔을 제어하는 작업별 AI에 의해 제공되었다. 이 데이터는 단일 대형 모델을 교육하는 데 사용되었다.

연구원들은 arXiv에 게시된 논문에서 변환기 기반 아키텍처의 주요 이점 중 하나는 이전 형태의 AI보다 훨씬 더 많은 데이터를 수집할 수 있는 능력이라고 지적한다. 거의 같은 방식으로 방대한 양의 텍스트에 대한 교육을 통해 LLM은 일반적인 언어 능력을 개발할 수 있었다. 연구원들은 다양한 하드웨어 구성을 사용하여 광범위한 로봇 작업을 처리할 수 있는 "일반" 에이전트를 만들 수 있었다고 말한다.

 

또한 연구원들은 이 모델이 인간이 제어하는 로봇 팔에서 100~1,000번의 시연을 미세 조정하여 새로운 작업을 선택할 수 있음을 보여주었다. 이는 일반적으로 작업을 훈련하는 데 필요한 것보다 훨씬 적은 데모이며, 모델이 처음부터 시작하는 것이 아니라 보다 일반적인 로봇 제어 기술 위에 구축되고 있음을 시사한다.

"이 기능은 인간 감독 교육의 필요성을 줄이고 범용 로봇을 만드는 데 중요한 단계이므로 로봇 연구를 가속화하는 데 도움이 될 것이다."고 연구원은 썼다.

 

그러나 가장 흥미롭게도 연구원들은 RoboCat의 자체 개선 능력을 시연했다. 그들은 특정 작업에 대해 미세 조정된 여러 스핀오프 모델을 만든 다음 이 모델을 사용하여 작업에 대한 약 10,000개의 추가 데모를 생성했다. 그런 다음 이를 기존 데이터 세트에 추가하고 향상된 성능으로 RoboCat의 새 버전을 교육하는 데 사용했다.

 

RoboCat의 첫 번째 버전이 이전에 볼 수 없었던 작업에 대한 500개의 데모를 표시했을 때 36%의 시간 동안 성공적으로 완료할 수 있었다. 그러나 여러 차례의 자기 개선과 새로운 작업에 대한 교육을 거친 후 이 수치는 74%로 두 배 이상 증가했다.

 

인정하건대, 이 모델은 여러 작업에서 50% 미만의 성공률과 한 가지 작업에서 13%만 득점하는 등 특정 문제에서 여전히 훌륭하지 않다. 그러나 RoboCat의 다양한 도전 과제를 해결하고 새로운 도전 과제를 빠르게 선택하는 능력은 더 적응력이 뛰어난 로봇 두뇌가 그리 멀지 않을 수도 있음을 시사한다.

 

이미지 출처: Deepmind

 
인공지능, 로봇, 자가 개선 로봇, 자율 로봇 관련기사목록
광고
광고
광고
광고
광고
광고
많이 본 기사
AI로봇, 그레이스 아인슈타인 많이 본 기사
최신기사