[방송기술저널 전숙희 기자] 오토RT(AutoRT)는 구글 딥마인드가 지난 1월 공개한 로봇 학습·제어 시스템으로, 대규모 언어 모델(Large Language Model, LLM), 시각 언어 모델(Visual Language Model, VLM), 로봇 제어 모델을 결합해 탄생했다.
오토RT을 적용한 로봇은 특정한 행동을 하도록 프로그래밍한 기존 로봇과 달리 “축구공을 농구공 옆에 놓아라”, “책상에서 떨어지기 쉬운 가방을 집어라”와 같이 평소에 사용하는 일상어 명령도 이해하고 그에 맞는 행동을 할 수 있다. 또한, 훈련 데이터에 없는 물체나 행동도 주변 상황을 파악해 할 수 있다. 예를 들어 이전에 보지 못한 장난감을 주고 장난감을 치우라고 명령하면 물체가 장난감인지 아닌지 판단해 반응하는 것이다.
여기에서 더 나아가 오토RT는 자율적으로 명령어를 생성할 수 있다. 구글 딥마인드가 선보인 시연에서 오토RT는 아무렇게나 널브러진 상자를 보고 ‘상자를 겹쳐 쌓는다’는 명령어를 생성해 시행했다. 사람의 개입 없이 로봇 스스로 필요한 데이터를 수집해 상황을 판단하고 유연하게 대처한 것이다.
이러한 자율성 때문에 구글 딥마인드는 ‘안전성’을 강조하면서 사람과 로봇 자신에게 위해를 가하는 상황을 막는 안전 규칙을 오토RT에 적용했다. 이 안전 규칙은 사람을 다치게 해서는 안 된다는 제1원칙을 포함해 칼과 같은 날카로운 물체와 상호 작용 금지, 로봇의 허용 한계 이상의 무거운 물체 조작 금지 등의 내용을 담고 있다.