광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고

AI넷

마인드봇[NVIDIA도 로봇생산, 인간형 로봇 시대가 열린다: Figure AI의 야심찬 도전] 테슬라, 로봇을 위한 새로운 AI 비전 공개] 테슬라가 또 한번 로봇 기술의 지평을 넓혔다. 이번에는 카메라 입력만을 활용하여 자율 로봇이 주변 환경을 인식하고 탐색하는 방식을 혁신적으로 바꿀 수 있는 AI 기반 비전 시스템 특허를 출원했다.

박영숙세계미래보고서저자 | 기사입력 2024/08/09 [14:32]

마인드봇[NVIDIA도 로봇생산, 인간형 로봇 시대가 열린다: Figure AI의 야심찬 도전] 테슬라, 로봇을 위한 새로운 AI 비전 공개] 테슬라가 또 한번 로봇 기술의 지평을 넓혔다. 이번에는 카메라 입력만을 활용하여 자율 로봇이 주변 환경을 인식하고 탐색하는 방식을 혁신적으로 바꿀 수 있는 AI 기반 비전 시스템 특허를 출원했다.

박영숙세계미래보고서저자 | 입력 : 2024/08/09 [14:32]

 

NVIDIA, 시그라프(SIGGRAPH)에서 로보틱스 및 AI의 새로운 발전 발표

엔비디아 코퍼레이션(NVIDIA Corporation)은 덴버에서 열린 시그라프(SIGGRAPH)에서 시뮬레이션, 생성형 인공지능(Generative AI) 및 로보틱스 분야의 획기적인 연구와 혁신을 소개했다. 이 회사는 로봇 공학 및 AI 개발자가 "차세대 휴머노이드 로봇 공학을 개발, 훈련 및 구축"할 수 있도록 설계된 포괄적인 서비스, 모델 및 컴퓨팅 플랫폼 제품군을 발표했다.

엔비디아의 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 "AI의 다음 물결은 로보틱스이며, 가장 흥미로운 개발 중 하나는 휴머노이드 로봇"이라고 말했다. 우리는 전체 엔비디아 로보틱스 스택을 발전시키며 전 세계 휴머노이드 로보틱스 개발자와 기업이 자신의 요구에 가장 적합한 플랫폼, 가속 라이브러리, AI 모델을 사용할 수 있도록 하고 있습니다"라고 말했다.

NVIDIA는 시그라프(SIGGRAPH)에서 20편의 연구 논문을 발표했다. 옴니버스(Omniverse) 및 가상화 전략 담당 부사장인 레브 라바레디안(Rev Labaredian)은 2001년부터 그래픽 연구 분야에서 오랫동안 진행해온 NVIDIA의 업적을 강조하며 그래픽, 시뮬레이션, 로보틱스와의 확고한 관계를 강조했다.

NVIDIA NIM: 디지털 트윈 개발과 그 그 이상

NVIDIA 추론 소프트웨어를 사용하여 사전 구축된 컨테이너인 NVIDIA의 NIM 마이크로서비스를 이제 서비스로 사용할 수 있다. 이러한 마이크로서비스는 모델 배포 시간을 몇 주에서 몇 분으로 크게 단축하여 로봇과 로봇 환경의 설계 및 교육을 지원할 수 있다.

엔비디아의 생성형 AI 소프트웨어 제품 관리 부사장 카리 브리스키(Kari Briski)는 "지금이 생성형 AI를 적용할 시기지만, 이는 벅찰 수 있는 일이 될 수 있다"고 말했다. "기업은 투자 수익을 위해 생산에 대한 빠른 경로가 필요합니다. … 이로 인해 NVIDIA NIM은 AI 모델 배포를 표준화할 수 있게 됐으며, CUDA를 기반으로 즉시 사용할 수 있게 됐습니다."

두 가지 새로운 AI 마이크로서비스인 미믹젠 NIM(MimicGen NIM)과 로보카사 NIM은 엔비디아 옴니버스(NVIDIA Omniverse) 플랫폼에 구축된 로보틱스 시뮬레이션을 위한 레퍼런스 애플리케이션인 엔비디아 아이작 심(Isaac Sim)에서 생성형 물리 AI를 위한 시뮬레이션 워크플로우를 개선했다. 미믹젠 NIM은 애플 비전 프로(Apple Vision Pro)와 같은 공간 컴퓨팅 디바이스를 사용해 원격 운영 기록을 기반으로 합성 모션 데이터를 생성하고, 로보카사 NIM은 엔비디아의 오픈USD 프레임워크에서 로봇 작업과 시뮬레이션 지원 환경을 생성한다.

NVIDIA는 또한 대규모 NVIDIA RTX 레이 트레이싱 데이터 세트를 Apple Vision Pro로 스트리밍하기 위한 디지털 트윈 및 USD 커넥터 개발을 지원하는 NIM 마이크로서비스를 발표했다. 현재 사용 가능한 NVIDIA OSMO는 로봇 훈련 및 시뮬레이션 워크플로우를 간소화하여 배포 및 개발 주기 시간을 몇 개월에서 일주일 미만으로 단축하는 관리형 클라우드 서비스이다.

엔비디아는 "OSMO는 로봇 트레이닝과 시뮬레이션 워크플로우를 대폭 간소화해 배포 및 개발 주기 시간을 수개월에서 일주일 미만으로 단축했다"고 말했다. "사용자는 합성 데이터 생성, 모델 훈련, 강화 학습 수행, 휴머노이드, 자율 모바일 로봇(AMR) 및 산업용 매니퓰레이터에 대한 대규모 소프트웨어 인 더 루프(software-in-the-loop) 테스트 구현과 같은 작업을 시각화하고 관리할 수 있습니다."

휴머노이드 및 기타 로봇을 위한 교육 기반 모델

NVIDIA의 새로운 워크플로우는 AI와 Omniverse를 활용하여 개발자가 더 작은 데이터 세트로 로봇을 훈련할 수 있도록 했다. 개발자는 Apple Vision Pro를 사용하여 원격 운영 시연을 캡처하고, Isaac Sim에서 녹음을 시뮬레이션하고, MimicGen NIM을 사용하여 합성 데이터셋을 생성할 수 있다. 이 접근 방식을 사용하면 실제 및 합성 데이터를 모두 사용하여 Project GR00T 휴머노이드 기반 모델을 훈련할 수 있어 시간과 비용을 절약할 수 있다.

로보틱스트는 Isaac Lab 프레임워크 내에서 Robocasa NIM을 사용하여 로봇 모델 재훈련을 위한 경험을 생성할 수 있다. 워크플로우 전반에 걸쳐 NVIDIA OSMO는 컴퓨팅 작업을 다양한 리소스에 할당하여 몇 주에 걸친 관리 작업을 없애준다.

"휴머노이드 로봇을 개발하는 것은 매우 복잡하며, 현실 세계에서 지루하게 캡처한 엄청난 양의 실제 데이터가 필요합니다"라고 Fourier의 CEO인 Alex Gu는 말했다. 엔비디아의 새로운 시뮬레이션 및 생성형 AI 개발자 도구는 모델 개발 워크플로우를 부트스트랩하고 가속화하는 데 도움이 될 것입니다"라고 말했다.

NVIDIA의 새로운 휴머노이드 로봇 개발자 프로그램(Humanoid Robot Developer Program)은 Omniverse, Isaac Lab, Jetson Thor 컴퓨트, Project GR00T 파운데이션 모델에서 NVIDIA Isaac Sim의 최신 릴리스뿐만 아니라 NIM과 OSMO에 대한 조기 액세스를 제공한다. 이 프로그램의 얼리 어답터로는 1X, Boston Dynamics, ByteDance Research, Field AI, Figure, Fourier, Galbot, LimX Dynamics, Mentee, Neura Robotics, RobotEra, Skild AI 등이 있다.

보스턴 다이내믹스의 최고기술책임자(CTO) 애런 손더스(Aaron Saunders)는 "보스턴 다이내믹스와 엔비디아는 로보틱스에서 가능한 것의 경계를 넓히기 위해 오랫동안 긴밀한 협력을 해왔다"고 말했다. "우리는 이 작업의 결실이 업계 전반을 가속화하는 것을 보게 되어 매우 기쁘며, 조기 액세스 프로그램은 동급 최고의 기술에 액세스할 수 있는 환상적인 방법입니다."

엔비디아가 시그라프(SIGGRAPH)에서 개최하는 행사에는 로보틱스와 AI가 산업 디지털화에 미치는 영향에 대한 후앙 CEO와 와이어드(Wired)의 선임 기자 로렌 구드(Lauren Goode)의 노변담화, 메타(Meta)의 마크 저커버그(Mark Zuckerberg)와의 대화 등이 포함된다. 

 

인간형 로봇 시대가 열린다: Figure AI의 야심찬 도전

 

인간형 로봇, 이제 현실이 되다

인간의 모습을 한 로봇, 즉 휴머노이드 로봇이 더 이상 공상과학 영화 속 이야기가 아닌 현실로 다가오고 있습니다. 다양한 기업들이 인간의 노동력을 보완하고 생산성을 높일 수 있는 휴머노이드 로봇 개발에 박차를 가하고 있는 가운데, Figure AI가 선두에 서서 주목받고 있습니다.

Figure AI, 범용 휴머노이드 로봇 Figure 01 공개

2022년 설립된 Figure AI는 단 6개월 만에 범용 휴머노이드 로봇 Figure 01을 개발하며 업계를 놀라게 했습니다. Figure 01은 제조, 물류, 창고 등 다양한 산업 현장에서 활용될 수 있도록 설계되었으며, 인간이 수행하기 어렵거나 위험한 작업을 대신 수행하여 생산성을 높이고 안전을 확보하는 데 기여할 것으로 기대됩니다.

탄탄한 기술력과 파트너십

Figure AI는 뛰어난 기술력을 바탕으로 빠른 성장을 이루고 있습니다. 40명의 로봇 전문가로 구성된 팀과 함께 OpenAI, NVIDIA, Microsoft, Intel Capital 등 글로벌 기업들의 투자를 유치하며 기술 개발에 박차를 가하고 있습니다. 특히, OpenAI의 GPT-4V 모델과의 긴밀한 협력을 통해 Figure 01의 지능을 더욱 향상시키고 있습니다.

치열해지는 휴머노이드 로봇 경쟁

Figure AI뿐만 아니라, 테슬라, 보스턴 다이내믹스 등 다양한 기업들이 휴머노이드 로봇 개발에 뛰어들면서 경쟁이 더욱 치열해지고 있습니다. 이들은 각자의 강점을 바탕으로 차별화된 로봇을 개발하며 시장을 선점하기 위해 노력하고 있습니다.

  • 테슬라: 테슬라 옵티머스를 통해 전기차 생산 라인에서 활용될 수 있는 로봇을 개발하고 있습니다.
  • 보스턴 다이내믹스: Atlas라는 이름의 인간형 로봇을 통해 뛰어난 동작 능력을 선보이며 기술력을 입증하고 있습니다.

휴머노이드 로봇의 미래

휴머노이드 로봇은 단순히 인간의 노동력을 대체하는 것을 넘어, 인간과 함께 살아가는 동반자로서 역할을 수행할 것으로 기대됩니다. 제조업뿐만 아니라, 의료, 서비스 등 다양한 분야에서 활용될 가능성이 있으며, 우리의 삶을 더욱 편리하고 풍요롭게 만들어 줄 것입니다.

결론

Figure AI를 비롯한 다양한 기업들의 노력으로 인해 휴머노이드 로봇 시대가 빠르게 다가오고 있습니다. 이러한 기술 발전은 인류에게 새로운 가능성을 열어주는 동시에, 새로운 사회적 문제를 야기할 수도 있습니다. 따라서 우리는 휴머노이드 로봇 기술의 발전을 지켜보면서, 이 기술이 인류에게 긍정적인 영향을 미칠 수 있도록 노력해야 합니다.

 

기술 및 AI 분야의 유명 기업의 지원을 받음으로써, Adcock은 이전에 Archer Aviation과 채용 마켓플레이스 Vettery 등의 스타트업을 설립한 기업가로, 2022년에 Figure AI를 설립했다. 2023년 3월, Figure는 스텔스 모드에서 벗어나 제조, 물류, 창고, 소매 등 다양한 산업에서 작업을 수행하여 글로벌 노동력 부족 문제를 해결하도록 설계된 범용 휴머노이드 로봇인 Figure 01을 출시했다.

CTO인 Dr. Jerry Pratt를 포함한 40명의 업계 전문가로 구성된 팀과 함께 Figure AI는 단 6개월 만에 휴머노이드의 전체 규모 빌드를 완료했다. Adcock은 로봇이 안전하지 않고 바람직하지 않은 작업을 수행하여 생산성과 안전을 향상시키고 궁극적으로 더 자동화되고 효율적인 미래에 기여할 것이라고 생각하지만, 결코 무기화되지 않을 것이라고 주장하고 있다.

OpenAI 외에도 NVidia, Microsoft, Intel Capital, Bezos Expeditions(아마존 창립자 Jeff Bezos의 사모펀드) 등의 투자자와 후원을 받는 이 회사는 올해 초 BMW Manufacturing과 계약을 체결했다. 또한 OpenAI의 새로운 주력 제품인 GPT-4o와 GPT-4o mini 출시에 앞서 OpenAI의 GPT-4V 또는 Figure 01 로봇 내부의 비전 모델과의 인상적인 통합을 선보였다. 아마도 Figure 02는 이러한 최신 OpenAI 모델 중 하나가 움직임과 상호 작용을 안내할 것이라 예상된다.

휴머노이드 로봇 개발 경쟁은 치열해지고 있다. Figure는 다른 회사들이 데뷔하여 창고, 공장, 산업 플랜트, 물류 센터, 노인 요양원, 소매점, 의료 시설, 개인 주택 등에서 인간을 도울 수 있는 AI가 주입된 인간형 로봇에 대한 디자인을 선보이는 동안 최근에는 다소 잠잠했다. 휴머노이드 로봇은 오랫동안 공상과학 소설에서 꿈이었지만, 상업적 제품으로 데뷔하는 데는 시간이 오래 걸렸고 주로 연구 설정에 국한된 값비싼 디자인으로 인해 망가졌다. 하지만 생성 AI 덕분에 상황이 바뀌고 있다. 라이브 비디오와 오디오 입력을 빠르게 분석하고 인간과 같은 오디오와 움직임으로 응답할 수 있는 대규모 언어 모델(LLM)과 멀티모달 AI 모델 덕분이다.

실제로 얼마 전 억만장자이자 여러 회사의 사장인 일론 머스크는 특유의 시끄러운 허세와 야심찬 목표 설정으로 지구상에 100억 대가 넘는 휴머노이드 로봇에 대한 시장이 있다고 밝혔다. 그는 자신의 전기 자동차 및 AI 회사인 테슬라 모터스(테슬라 모터스는 테슬라 옵티머스라는 이름의 경쟁 휴머노이드 로봇을 개발 중이다)를 통해 이 로봇을 통제하거나 적어도 일부를 차지하기를 바랐다.

또한, 엔비디아는 Apple Vision Pro 헤드셋을 인간 원격 작업자가 착용하여 로봇을 올바른 동작으로 안내하는 Project GR00T를 통해 인간형 로봇을 안내하는 AI를 훈련하기 위한 새로운 개선 사항을 선보였다. 그 전에는 인간형 로봇 분야의 초창기 개척자인 보스턴 다이내믹스가 유압 액추에이터를 전기 모터로 대체하여 더 저렴하고 조용하며 신뢰성과 견고성이 향상된 Atlas 인간형 로봇의 업데이트 버전을 선보였다.

따라서 이 부문의 경쟁은 치열해지고 있는 듯하다. 하지만 이렇게 큰 후원자와 앞으로의 추진력을 바탕으로 Figure는 이 분야에서 자체적인 노력을 계속 발전시킬 준비가 된 듯하다.

 

Figure AI의 휴머노이드 로봇과 관련된 몇 가지 이미지이다:

  1. Figure AI
  2. Figure AI - Funding Talks
  3. Figure Humanoid Robot
  4. OpenAI Bets Big on Humanoid Robots
  5. Figure Humanoid
  6. Bezos, Microsoft join OpenAI
  7. Figure Startup Valuation
  8. Figure AI Valuation
  9. Figure Unveils Its Humanoid Robot Prototype

이 이미지를 통해 Figure AI의 최신 기술과 로봇 프로토타입에 대한 정보를 확인할 수 있다.

 

2월 마지막 라운드에서 OpenAI 등으로부터 6억 7,500만 달러를 지원받은 회사인 Figure가 최신 모델인 Figure 02에 대한 예고편 영상을 공개하면서 전 세계의 가정과 직장에 AI 기반 휴머노이드 로봇을 도입하려는 경쟁이 새로운 국면을 맞았다. Figure 02는 2024년 8월 6일 출시일과 함께 오늘 새로운 전환점을 맞이했다.

영상에서 볼 수 있듯이 구체적인 내용은 적지만 분위기와 클로즈업이 많고, 로봇 관절과 팔다리로 보이는 모습과 로봇 본체의 흥미롭고 유연할 수 있는 메시 디자인, 최대 150Nm(뉴턴 미터, Google의 AI 개요에 따르면 "1m 길이의 레버 암 끝에 수직으로 1뉴턴의 힘을 가했을 때 생성되는 토크")의 토크 등급과 최대 195도(총 360도 중)의 "움직임 범위"인 "ROM"에 대한 라벨이 나와 있다.

 

창립자 Brett Adcock은 또한 자신의 개인 X/Twitter 계정에 Figure 02가 "지구상에서 가장 진보된 휴머노이드 로봇"이라고 게시했다.

기술 및 AI 분야의 유명 기업의 지원을 받음

이전에 Archer Aviation과 채용 마켓플레이스 Vettery 등의 스타트업을 설립한 기업가인 Adcock은 2022년에 Figure AI를 설립했다.

2023년 3월, Figure는 스텔스 모드에서 벗어나 제조, 물류, 창고, 소매 등 다양한 산업에서 작업을 수행하여 글로벌 노동력 부족 문제를 해결하도록 설계된 범용 휴머노이드 로봇인 Figure 01을 출시했다.

CTO인 Dr. Jerry Pratt를 포함한 40명의 업계 전문가로 구성된 팀과 함께 Figure AI는 단 6개월 만에 휴머노이드의 전체 규모 빌드를 완료했다. Adcock은 로봇이 안전하지 않고 바람직하지 않은 작업을 수행하여 생산성과 안전을 향상시키고 궁극적으로 더 자동화되고 효율적인 미래에 기여할 것이라고 생각하지만, 결코 무기화되지 않을 것이라고 주장한다.

OpenAI 외에도 NVidia, Microsoft, Intel Capital, Bezos Expeditions(Amazon 창립자 Jeff Bezos의 사모펀드) 등의 투자자와 후원을 받는 이 회사는 올해 초 BMW Manufacturing과 계약을 체결하고 OpenAI 의 새로운 주력 제품인 GPT-4o 와 GPT-4o mini 출시에 앞서 OpenAI의 GPT-4V 또는 Figure 01 로봇 내부의 비전 모델과의 인상적인 통합을 선보였다 .

아마도 그림 02는 이러한 최신 OpenAI 모델 중 하나가 움직임과 상호 작용을 안내할 것이며, 이는 주요 이름 중 하나이다.

인간형 로봇 개발 경쟁 치열해져

Figure는 다른 회사들이 데뷔하여 창고, 공장, 산업 플랜트, 물류 센터, 노인요양원, 소매점, 의료 시설, 물론 개인 주택과 같은 환경에서 인간을 도울 수 있기를 바라는 AI가 주입된 인간형 로봇에 대한 디자인을 선보이는 동안에도 최근에는 다소 잠잠했다.

휴머노이드 로봇은 오랫동안 공상과학 소설에서 꿈이었지만, 상업적 제품으로 데뷔하는 데는 시간이 오래 걸렸고 주로 연구 설정에 국한된 값비싼 디자인으로 인해 망가졌다. 하지만 생성 AI 덕분에, 더 구체적으로는 라이브 비디오와 오디오 입력을 빠르게 분석하고 인간과 같은 오디오와 움직임으로 응답할 수 있는 대규모 언어 모델(LLM)과 멀티모달 AI 모델 덕분 에 상황이 바뀌고 있다.

실제로 얼마 전 억만장자이자 여러 회사의 사장인 일론 머스크는 특유의 시끄러운 허세와 야심찬 목표 설정으로 지구상에 100억 대가 넘는 휴머노이드 로봇에 대한 시장이 있다고 밝혔다. 그는 자신의 전기 자동차 및 AI 회사인 테슬라 모터스(테슬라 모터스는 테슬라 옵티머스라는 이름 의 경쟁 휴머노이드 로봇을 개발 중)를 통해 이 로봇을 통제하거나 적어도 일부를 차지하기를 바랐다 .

또한, 엔비디아는 Apple Vision Pro 헤드셋을 인간 원격 작업자가 착용하여 로봇을 올바른 동작으로 안내하는 Project GR00T를 통해 인간형 로봇을 안내하는 AI를 훈련하기 위한 새로운 개선 사항을 선보였다 .

그 전에는 인간형 로봇 분야의 초창기 개척자인 보스턴 다이내믹스 가 유압 액추에이터를 전기 모터로 대체하여 더 저렴하고 조용하며 신뢰성과 견고성이 향상된 Atlas 인간형 로봇의 업데이트 버전을 선보였다 .

따라서 이 부문의 경쟁은 치열해지고 있는 듯합니다. 하지만 이렇게 큰 후원자와 앞으로의 추진력을 바탕으로 Figure는 이 분야에서 자체적인 노력을 계속 발전시킬 준비가 된 듯하다.

 

테슬라, 카메라만으로 자율 로봇 혁신 이끌 특허 출원

 

테슬라가 또 한번 로봇 기술의 지평을 넓혔다. 이번에는 카메라 입력만을 활용하여 자율 로봇이 주변 환경을 인식하고 탐색하는 방식을 혁신적으로 바꿀 수 있는 AI 기반 비전 시스템 특허를 출원했다.

 

기존의 자율 로봇 시스템은 LiDAR나 레이더와 같은 추가적인 센서를 필요로 했다. 하지만 테슬라의 새로운 시스템은 카메라 입력과 온보드 처리만으로도 로봇이 다양한 환경을 효율적으로 탐색하고 실시간으로 변화에 적응할 수 있도록 한다. 이를 통해 광범위한 사전 매핑 작업이 필요 없어지고, 저렴하고 자율적인 로봇의 시대가 더욱 가까워질 것으로 기대된다.

 

핵심 기술

  • 단일 신경망: 카메라 데이터를 처리하고 LiDAR나 레이더 없이도 상세한 3D 환경 정보를 출력하는 단일 신경망을 사용한다.
  • 3D 폭셀 분할: 공간을 3D 폭셀로 나누어 각 공간의 점유, 모양, 의미 데이터, 동작을 실시간으로 예측한다.
  • 온보드 처리: 로봇에 장착된 컴퓨터에서 시스템이 실행되어 즉각적인 의사 결정이 가능하다.

활용 가능성

이 기술은 테슬라 차량뿐만 아니라 옵티머스와 같은 인간형 로봇에도 적용될 수 있다. 즉, 테슬라는 자율주행차와 로봇 양쪽 모두에서 AI 기반 비전 시스템을 통해 더욱 발전된 자율성을 구현하려는 것이다.

 

시사점

테슬라의 이번 특허는 자율 로봇 기술의 새로운 가능성을 보여준다. 카메라만으로도 주변 환경을 정확하게 인식하고 복잡한 작업을 수행할 수 있는 로봇의 등장은 다양한 산업 분야에 큰 변화를 가져올 것으로 예상된다. 특히, 물류, 제조, 서비스 등 로봇 활용이 확대될 수 있는 분야에서 혁신적인 변화가 기대된다.

 

결론

테슬라의 AI 기반 비전 시스템은 자율 로봇 기술의 새로운 장을 열었다고 할 수 있다. 이 기술은 로봇의 지능을 한 단계 더 높이고, 우리 삶을 더욱 편리하게 만들어 줄 것으로 기대된다. 앞으로 테슬라가 이 기술을 바탕으로 어떤 혁신적인 로봇 제품을 선보일지 귀추가 주목된다.

 

테슬라는 카메라 입력만을 사용하여 자율 로봇의 환경 인식과 탐색 방식을 바꿀 수 있는 AI 기반 비전 시스템에 대한 특허를 출원했다. 이 새로운 비전 시스템은 카메라 입력과 온보드 처리에만 의존하여 로봇이 다양한 환경을 더 효율적으로 탐색하고 실시간으로 변화에 적응할 수 있도록 한다. 이를 통해 광범위한 사전 매핑의 필요성이 없어지고 저렴하고 자율적인 로봇의 도래가 가속화될 것이다.

 

이 시스템은 단일 신경망을 사용하여 카메라 데이터를 처리하고 LiDAR나 레이더 없이도 자세한 3D 환경 정보를 출력한다. 공간을 3D 폭셀로 나누어 각 공간의 점유, 모양, 의미 데이터, 동작을 실시간으로 예측한다.

 

이 기술은 로봇에 장착된 컴퓨터에서 실행되도록 설계되어 즉각적인 의사 결정이 가능하다. 테슬라는 이 시스템을 테슬라 차량과 옵티머스 같은 인간형 로봇에 모두 구현할 수 있다고 했다.

 

 

테슬라는 방금 카메라 입력만을 사용하여 자율 로봇이 주변 환경을 인식하고 탐색하는 방식을 바꿀 수 있는 AI 기반 비전 시스템에 대한 특허를 출원했다. 카메라 입력과 온보드 처리에만 의존함으로써 테슬라의 새로운 비전 시스템은 로봇이 다양한 환경을 더 효율적으로 탐색하고 실시간으로 변화에 적응할 수 있도록 할 수 있다. 이를 통해 광범위한 사전 매핑의 필요성이 없어지고 저렴하고 자율적인 로봇의 도래가 가속화될 것이라 밝혔다.

이 시스템은 단일 신경망을 사용하여 카메라 데이터를 처리하고 LiDAR나 레이더 없이도 자세한 3D 환경 정보를 출력한다. 공간을 3D 폭셀로 나누어 각 공간의 점유, 모양, 의미 데이터, 동작을 실시간으로 예측한다. 이 기술은 로봇에 장착된 컴퓨터에서 실행되도록 설계되어 즉각적인 의사 결정이 가능하다.

이 시스템은 테슬라 차량과 옵티머스 같은 인간형 로봇에 모두 구현될 수 있다.

 

 테슬라의 AI 기반 비전 시스템과 관련된 몇 가지 이미지이다:

  1. Tesla Vision Park Assist Measurement System
  2. A Computer Vision–Based Teleoperation System
  3. 컴퓨터 비전 데이터에 대한 모든 것
  4. Elon Musk Promotes New 'Tap to Park' Tesla Feature

이 이미지를 통해 테슬라의 최신 기술을 확인할 수 있다.

 

OpenAI가 지원하는 인간형 로봇 회사가 방금 업그레이드되었다. 8월 8일

가장 자금이 풍부하고 , 진보적이며, 단연코 가장 멋진 휴머노이드 로봇(인간의 일을 할 수 있는 로봇이라고 생각하시면 된다) 중 하나가 업그레이드되었다. 바로 Figure 02다 . 

창립자 Brett Adcock에 따르면, 그들은 Figure 02를 처음부터 다시 구축하여 다음을 추가했다.

  • 6개의 카메라와 "시각적 언어 모델"(무엇을 보고 결정을 내리기 위해)

  • 배터리 수명이 50% 더 길어졌다( 인간의 교대근무 시간처럼 5시간 동안 작동!)

  • OpenAI가 제공하는 통합 음성 대 음성 추론 기능(사용자와 대화할 수 있음)  

음성 대 음성 추론에 대해 이야기해 보겠다. Figure 02 로봇은 OpenAI의 맞춤형 AI 모델과 온보드 스피커 및 마이크를 사용하여 실시간으로 사용자와 대화를 나눈다. 어쨌든 챗봇이 사용자를 "이해"하는 것만큼 사용자를 이해할 수 있다. 

이게 왜 중요할까? 이 로봇들은 말 그대로 지금 일하고 있다. BMW는 사우스 캐롤라이나에서 로봇으로  성공적인 테스트를 방금 마쳤다 .

그리고 Figure는 혼자가 아니다. 휴머노이드 로봇 경쟁이 뜨거워지고 있다. 

NVIDIA는 휴머노이드 로봇을 만들고 싶어하는 사람들을 위한 새로운 개발자 프로그램을 발표했다. Nvidia가 관여한다면 휴머노이드 로봇이 크게 될 거라는 걸 안다! 

데모에서 가장 흥미로운 부분: 엔딩 크레딧. Figure 02는 "직장과 집에서 인간과 같은 작업"을 수행하도록 설계되었다. 

홈 로봇이 부상하고 있다 . 집안일을 해줄 새로운 홈 로봇(부분적으로 NVIDIA로 구동!)이나 작은 경비원 같은 Amazon의 Astro Home Robot을 확인해 보자 .

여기서 중요한 것은 소프트웨어다 ... ChatGPT Advanced Voice Mode 데모가 얼마나 인상적인지 생각해보자. 스마트 스피커, 둥지, 휴머노이드 쵸어봇 9,000이든 기술과  자연스럽게 대화할 수 있다면 정말 대단할 것.

 

Figure 02: 역사상 가장 똑똑한 로봇? 

그림 02: 역사상 가장 똑똑한 로봇?

보고서: 로봇 회사 Figure AI가 최신 휴머노이드 로봇 Figure 02(작년에 출시된 Figure 01의 후속 모델)를 공개했다. 이 로봇은 " 상당한 기술적 진보 "를 거쳤으며, 이를 통해 로봇은 복잡한 작업을 자율적으로 완료하고, 실수를 스스로 수정하며, 작업자와 양방향 대화를 할 수 있다. 이 로봇은 " 시장에서 가장 진보된 휴머노이드 로봇 "이 될 것다.

  • 그림 02는 내장 마이크/스피커를 AI 모델(아마도 GPT-o4?)과 결합하여 통신 기능을 개선했으며, 더 강력한 카메라 시스템을 갖추어 더 빠르고 직관적인 시각적 추론이 가능하다.

  • 이 로봇은 사람과 같은 힘과 협응력을 지닌 인간 크기의 손을 가지고 있어 , 최대 55파운드(65인치 TV 수준) 무게의 물체를 들어올려 밀리미터 단위까지 올바른 위치에 내려놓을 수 있다.

  • 업그레이드된 배터리를 사용하면 그림 01보다 작동 시간이 50% 더 길어지고 BMW 스파르탄버그 공장에서 테스트가 진행 중인데 , 초기 결과에 따르면 판금 조각과 같은 물체를 필요한 위치에 놓을 수 있는 것으로 나타났다.

🤔 관심을 가져야 하는 이유 : Figure 02의 광범위한 출시에 대한 일정은 없지만 Figure AI는 공장 환경에서 " 육체적으로 힘들고 안전하지 않은 작업 "에 이상적일 것이라고 밝혔다. 로봇이 곧 인간 근로자를 대체하여 낮은 기술의 수동 작업이 불필요해질 것이라는 우려가 커지고 있다. 이는 이미 Amazon에서 예측한다. Amazon은 75만 대의 로봇을 도입한 후 직원을 10만 명 감축했다. 

 

 

테슬라, 로봇을 위한 새로운 AI 비전 공개

이미지 출처: 테슬라

테슬라는 방금 카메라 입력만을 사용하여 자율 로봇이 주변 환경을 인식하고 탐색하는 방식을 바꿀 수 있는 AI 기반 비전 시스템에 대한 특허를 출원했다카메라 입력과 온보드 처리에만 의존함으로써 Tesla의 새로운 비전 시스템은 로봇이 다양한 환경을 더 효율적으로 탐색하고 실시간으로 변화에 적응할 수 있도록 할 수 있다. 이를 통해 광범위한 사전 매핑의 필요성이 없어지고 저렴하고 자율적인 로봇의 도래가 가속화될 것.

  • 이 시스템은 단일 신경망을 사용하여 카메라 데이터를 처리하고 LiDAR나 레이더 없이도 자세한 3D 환경 정보를 출력한다.

  • 공간을 3D 폭셀로 나누어 각 공간의 점유, 모양, 의미 데이터, 동작을 실시간으로 예측한다.

  • 이 기술은 로봇에 장착된 컴퓨터에서 실행되도록 설계되어 즉각적인 의사 결정이 가능하다.

  • 이 시스템은 테슬라 차량과 옵티머스 같은 인간형 로봇에 모두 구현될 수 있다.

 

 
 
광고
광고
광고
광고
광고
광고
광고
많이 본 기사
AiMindbot과 미래 우주 많이 본 기사