Figure, 음성 명령 처리하는 로봇 Helix 공개
가정 내 로봇 활용 위한 새로운 모델 도입
로봇 개발 기업 Figure가 집안에서 음성 명령을 처리하고 가사를 돕는 새로운 기계 학습 모델을 발표했다. 이 모델은 ‘Helix’라는 이름의 비전-언어-행동(Vision-Language-Action, VLA) 모델로, 음성 명령과 시각 정보를 조합해 로봇을 실시간으로 제어할 수 있도록 설계됐다.
Helix, 시각 및 언어 정보를 결합해 동작
Helix는 사용자의 자연어 명령을 이해하고 이를 바탕으로 다양한 물체를 집어 이동시키는 능력을 갖췄다. 예를 들어, 사용자가 “오른쪽의 로봇에게 쿠키 봉지를 넘겨줘”라는 지시를 내리면, 로봇이 이를 정확히 수행할 수 있다. 이는 Helix가 사물의 형상, 크기, 색상, 재질 등의 특징을 감지하고 분석하는 능력을 갖추고 있기 때문이다.
새로운 행동을 즉각 생성하는 기술 필수
가정 내 로봇이 실용적으로 활용되려면 새로운 동작을 즉시 학습하고 수행할 수 있어야 한다. 전통적으로 로봇이 새로운 행동을 익히려면 수천 번의 시연과 복잡한 프로그래밍 과정이 필요했다. 하지만 Helix는 이러한 한계를 극복하고, 즉각적인 환경 적응과 새로운 행동 생성을 목표로 개발되고 있다.
다양한 가정 내 환경 적응 필요
Figure는 로봇이 주방, 거실, 욕실 등 다양한 가정 내 공간에서 원활히 작동할 수 있도록 연구를 진행 중이다. 각각의 공간은 서로 다른 환경적 요소를 갖고 있어 로봇이 복잡한 가사 업무를 수행하려면 이에 적응해야 한다.
현재 Helix의 기술은 초기 개발 단계로, 향후 더 많은 엔지니어들의 연구와 협업을 통해 발전할 전망이다.
의견
Helix는 가정에서 활용될 수 있는 로봇 기술을 한 단계 더 발전시키기 위한 중요한 도전 과제에 직면해 있다. 특히 음성 명령과 시각 정보를 결합하는 방식은 로봇이 보다 직관적으로 인간과 상호작용할 수 있는 가능성을 열어준다. 다만, 로봇이 가정 내 다양한 환경에 적응하고 즉각적인 행동을 수행하려면 여전히 많은 기술적 개선이 필요하다. 앞으로 Helix가 실제 생활에서 얼마나 효과적으로 활용될 수 있을지 기대된다.