구글 딥마인드, 차세대 로봇 AI 모델 ‘제미니 로보틱스’ 공개
구글 딥마인드가 실세계 로봇의 행동 능력을 향상시키기 위한 새로운 인공지능(AI) 모델 ‘제미니 로보틱스(Gemini Robotics)’를 발표했다. 이 모델은 로봇이 주변 환경을 이해하고 사물과 상호작용할 수 있도록 설계됐다.
음성 명령으로 종이 접고 안경 케이스 닫는다
딥마인드는 시연을 통해 제미니 로보틱스 기반 로봇이 종이를 접고, 안경을 집어 케이스에 넣는 등의 작업을 음성 명령에 따라 수행하는 모습을 공개했다. 단순한 지령에도 로봇이 실제 환경에서 적응해 행동할 수 있는 수준에 이르렀다는 점이 주목된다.
다양한 하드웨어 간 동작 일반화 능력 구현
제미니 로보틱스의 특징 중 하나는 다양한 로봇 하드웨어에 적용 가능한 범용성이다. 이는 훈련 데이터에 포함되지 않은 환경에서도 로봇이 자연스럽게 행동할 수 있게 해준다. 시각적으로 인식한 물체와 실행 가능한 동작 간 연계를 학습해, 기존보다 유연한 판단이 가능하다.
경량화 모델 및 평가 기준 함께 공개
딥마인드는 연구자들이 자율적으로 제어 모델을 개발·실험할 수 있도록 경량화 버전인 ‘제미니 로보틱스-ER’을 함께 선보였다. 또한, AI 기반 로봇의 행동 위험성과 신뢰성을 평가하기 위한 새로운 기준 ‘아시모프(Asimov)’도 함께 발표됐다.
의견
이번 딥마인드의 발표는 AI가 실물 로봇과 더욱 자연스럽게 통합되는 방향으로 나아가고 있음을 보여주는 중요한 진전이다. 음성 명령을 통해 실제 작동하는 로봇은 산업용뿐 아니라 일상생활에도 큰 변화를 가져올 가능성을 지녔다. 특히 다양한 하드웨어 간 동작을 일반화할 수 있는 능력은 미래 다목적 로봇 개발에 핵심적인 역할을 할 것으로 보인다.