새로운 AI 시스템은 로봇의 실제 세계 공간 적응을 혁신한다.
로봇 분야는 오랫동안 중요한 과제에 직면해 왔다. 로봇이 역동적이고 실제 환경에서 효과적으로 기능하도록 훈련하는 것이다. 로봇은 조립 라인과 같은 구조화된 환경에서는 뛰어나지만, 예측할 수 없는 가정과 공공 공간을 탐색하도록 가르치는 것은 어려운 과제임이 입증되었다. 가장 큰 장애물은 무엇일까? 이러한 기계를 훈련하는 데 필요한 다양한 실제 데이터가 부족하다는 것이다.
RialTo: 로봇 훈련을 위한 디지털 트윈 생성
RialTo라는 이름의 첫 번째 시스템은 로봇 훈련 환경을 만드는 새로운 접근 방식을 소개한다. RialTo를 사용하면 사용자는 스마트폰만 사용하여 실제 공간의 가상 복제본인 "디지털 트윈"을 생성할 수 있다.
워싱턴 대학교 폴 G. 앨런 컴퓨터 과학 및 공학 대학의 조교수이자 이 연구의 공동 수석 저자인 아비섹 굽타 박사는 이 프로세스를 다음과 같이 설명한다. "사용자는 스마트폰으로 공간을 빠르게 스캔하여 기하학을 기록할 수 있다. 그런 다음 RialTo는 공간의 "디지털 트윈" 시뮬레이션을 생성한다."
이 디지털 트윈은 단순한 정적 3D 모델이 아니다. 사용자는 시뮬레이션과 상호 작용하여 공간의 다양한 객체가 어떻게 기능하는지 정의할 수 있다. 예를 들어 서랍이 열리는 방식이나 가전제품이 작동하는 방식을 보여줄 수 있다. 이러한 상호 작용성은 로봇 훈련에 필수적이다.
디지털 트윈이 생성되면 가상 로봇은 이 시뮬레이션된 환경에서 작업을 반복적으로 연습할 수 있다. 강화 학습이라는 프로세스를 통해 로봇은 잠재적인 중단이나 환경의 변화를 고려하더라도 작업을 효과적으로 수행하는 방법을 학습한다.
RialTo의 장점은 이 가상 학습을 물리적 세계로 전환하는 능력에 있다. 굽타 박사는 "그러면 로봇이 그 학습을 물리적 환경으로 전환할 수 있으며, 실제 주방에서 훈련된 로봇과 거의 같은 정확도를 보인다."라고 말한다.
URDFormer: 인터넷 이미지에서 시뮬레이션 생성
RialTo가 특정 환경에 대한 매우 정확한 시뮬레이션을 만드는 데 중점을 두는 반면, 두 번째 시스템인 URDFormer는 더 광범위한 접근 방식을 취한다. URDFormer는 광범위한 일반 시뮬레이션을 빠르고 비용 효율적으로 생성하는 것을 목표로 한다.
워싱턴 대학교 박사 과정생이자 URDFormer 연구의 주 저자인 조이 첸은 이 시스템의 고유한 접근 방식을 다음과 같이 설명한다. "URDFormer는 인터넷에서 이미지를 스캔하여 예를 들어 주방 서랍과 캐비닛이 어떻게 움직일지에 대한 기존 모델과 페어링한다. 그런 다음 초기 실제 이미지에서 시뮬레이션을 예측한다."
이 방법을 사용하면 연구자는 수백 가지의 다양한 시뮬레이션 환경을 빠르게 생성할 수 있다. 이러한 시뮬레이션은 RialTo에서 만든 시뮬레이션만큼 정확하지 않을 수 있지만 중요한 이점인 규모를 제공한다. 광범위한 시나리오에서 로봇을 훈련할 수 있는 기능은 다양한 실제 상황에 대한 적응력을 크게 향상시킬 수 있다.
첸은 특히 가정 환경에서 이 접근 방식의 중요성을 강조한다. "가정은 독특하고 끊임없이 변화한다. 다양한 사물, 작업, 평면도, 그리고 그 사이를 움직이는 사람들이 있다. 바로 여기서 AI가 로봇공학자에게 정말 유용해진다.”
URDFormer는 인터넷 이미지를 활용하여 이러한 시뮬레이션을 생성함으로써 훈련 환경을 생성하는 데 필요한 비용과 시간을 획기적으로 줄인다. 이를 통해 다양한 실제 환경에서 기능할 수 있는 로봇의 개발을 가속화할 수 있다.
로봇 훈련의 민주화
RialTo와 URDFormer의 도입은 로봇 훈련의 민주화를 향한 중요한 도약을 나타낸다. 이러한 시스템은 로봇을 실제 환경에 맞게 준비하는 데 드는 비용을 획기적으로 줄여 연구자, 개발자, 심지어 최종 사용자까지도 기술을 더 쉽게 이용할 수 있게 할 수 있는 잠재력이 있다.
굽타 박사는 이 기술의 민주화 잠재력을 강조한다. "휴대폰으로 스캔하기만 하면 집에서 로봇을 작동시킬 수 있다면, 그것은 기술을 민주화하는 것이다." 이러한 접근성은 가정용 로봇의 개발과 도입을 가속화하여 가정용 로봇이 스마트폰만큼 흔한 미래에 더 가까이 다가갈 수 있다.
가정용 로봇에 대한 의미는 특히 흥미롭다. 가정은 다양하고 끊임없이 변화하는 특성으로 인해 로봇에게 가장 어려운 환경 중 하나이기 때문에 이러한 새로운 훈련 방법은 게임 체인저가 될 수 있다. 로봇이 개별 가정 구조와 일상에 대해 학습하고 적응할 수 있도록 함으로써 광범위한 작업을 수행할 수 있는 진정으로 도움이 되는 새로운 세대의 가정용 조수를 볼 수 있을 것이다.
보완적 접근 방식: 사전 훈련 및 특정 배치
RialTo와 URDFormer는 로봇 훈련의 과제에 대해 서로 다른 각도에서 접근하지만 상호 배타적이지는 않다. 사실, 이 시스템은 로봇에 대한 보다 포괄적인 훈련 체계를 제공하기 위해 함께 작동할 수 있다.
"두 가지 접근 방식은 서로를 보완할 수 있다."고 굽타 박사가 설명한다. "URDFormer는 수백 가지 시나리오에 대한 사전 훈련에 정말 유용하다. RialTo는 이미 로봇을 사전 훈련했고 이제 누군가의 집에 배치하여 95% 정도 성공하도록 하려는 경우에 특히 유용하다."
이 보완적 접근 방식은 2단계 훈련 프로세스를 허용한다. 첫째, 로봇은 URDFormer의 빠르게 생성된 시뮬레이션을 사용하여 다양한 시나리오에 노출될 수 있다. 이 광범위한 노출은 로봇이 다양한 환경과 작업에 대한 일반적인 이해를 개발하는 데 도움이 된다. 그런 다음 특정 배치의 경우 RialTo를 사용하여 로봇이 작동할 정확한 환경에 대한 매우 정확한 시뮬레이션을 만들어 기술을 미세 조정할 수 있다.
앞으로 연구자들은 이러한 훈련 방법을 더욱 개선할 방법을 모색하고 있다. 굽타 박사는 미래 연구 방향을 언급한다. "앞으로 RialTo 팀은 사람들의 집에 시스템을 배치하고 싶어한다(대부분 실험실에서 테스트되었다)." 이 실제 테스트는 시스템을 개선하고 다양한 가정 환경에서 효과를 보장하는 데 중요할 것이다.
과제와 미래 전망
유망한 발전에도 불구하고 로봇 훈련 분야에는 여전히 과제가 남아 있다. 연구자들이 씨름하는 핵심 문제 중 하나는 실제 세계와 시뮬레이션 데이터를 효과적으로 결합하는 방법이다.
굽타 박사는 이러한 과제를 인정한다. "우리는 여전히 실제 세계에서 직접 수집한 데이터(비용이 많이 들지만)와 시뮬레이션에서 수집한 데이터(비용은 적게 들지만 약간 틀림)를 결합하는 가장 좋은 방법을 알아내야 한다." 목표는 시뮬레이션의 비용 효율성을 활용하면서 실제 세계 데이터가 제공하는 정확성을 유지하는 최적의 균형을 찾는 것이다.
로봇 산업에 미치는 잠재적 영향은 상당하다. 이러한 새로운 훈련 방법은 보다 유능하고 적응력 있는 로봇의 개발을 가속화하여 가정 지원에서 의료 및 그 이상의 분야에서 획기적인 진전을 이룰 수 있다.
게다가 이러한 훈련 방법이 더욱 정교해지고 접근 가능해짐에 따라 로봇 산업에 변화가 생길 수 있다. 소규모 회사와 개인 개발자조차도 정교한 로봇을 훈련할 수 있는 도구를 보유하여 혁신적인 로봇 응용 분야의 붐을 일으킬 수 있다.
미래의 전망은 흥미진진하며, 잠재적인 응용 분야는 현재의 사용 사례를 훨씬 넘어 확장된다. 로봇이 실제 환경을 탐색하고 상호 작용하는 데 더 능숙해짐에 따라, 우리는 로봇이 집, 사무실, 병원 및 공공 장소에서 점점 더 복잡한 작업을 수행하는 것을 볼 수 있다.