구글, 돌고래 언어 분석 위한 AI '돌핀제마' 개발
구글이 돌고래와의 소통을 가능하게 할 인공지능(AI) 모델 '돌핀제마(DolphinGemma)'를 개발했다. 이번 기술은 조지아공과대학(Georgia Institute of Technology)과 야생 돌고래 프로젝트(Wild Dolphin Project)와의 공동 연구 결과물로, 돌고래 특유의 복잡한 소리를 분석하고 이해하는 데 특화돼 있다.
돌고래 소통의 비밀을 풀기 위한 첫 걸음
돌고래는 클릭, 휘슬(whistle), 펄스(pulse) 등 다양한 형태의 소리를 조합해 소통하는 것으로 알려져 왔으나, 이 구조적인 언어 체계를 파악하는 것은 오랜 과학적 과제였다. 돌핀제마는 이러한 고유한 음향 패턴을 학습하고, 더 나아가 새로운 형태의 '돌고래음'을 생성해낼 수 있는 능력도 갖췄다.
특히 돌핀제마는 오디오 패턴을 예측하는 데 사용되는 '사운드스트림 토크나이저(SoundStream Tokeniser)'라는 기술을 활용해, 자연에서 포착된 돌고래의 소리를 정밀하게 디지털화하고 분석한다. 이는 인간의 언어 모델이 다음 단어를 예측하는 방식과 유사하다.
가장 오래된 야생 돌고래 연구와의 협업
야생 돌고래 프로젝트는 1985년부터 바하마 해역에서 장기간에 걸쳐 돌고래의 음향 신호와 행동을 관찰해 왔다. 이 연구는 세계에서 가장 오랜 기간 이어진 수중 돌고래 관찰로 기록된다. 프로젝트에서 수집한 주요 의사소통 유형은 다음과 같다.
- ‘서명 휘슬(Signature whistles)’: 개체 식별을 위한 고유 음향 신호. 어미 돌고래가 새끼를 찾을 때 주로 사용된다.
- ‘격렬한 펄스음(Burst-pulse squawks)’: 주로 갈등 상황이나 위협적 상황에서 나타나는 소리.
- ‘클릭 버즈(Click buzzes)’: 구애 행위나 상어 추격 시 관찰되는 고주파 소리.
돌핀제마는 이처럼 맥락에 따라 변화하는 다양한 소리 유형을 정확히 분류해, 기존에 연구자들이 일일이 수작업으로 분석해야 했던 복잡한 소리 패턴을 효율적으로 처리할 수 있다.
돌고래와의 실제 소통 시도 'CHAT' 시스템도 병행 개발 중
또한 구글은 별도로 ‘챗(CHAT, Cetacean Hearing Augmentation Telemetry)’ 시스템도 개발 중이다. 챗 시스템은 돌고래가 좋아하는 장난감에 해당 음향 휘슬을 연결해, 인간과의 1:1 소통 가능성을 실험하고 있다. 이 방식은 일종의 ‘공유 언어’를 만들어 양방향 의사소통을 시도하려는 것이다.
두 시스템 모두 구글 픽셀 스마트폰을 활용해 수중 환경에서도 고해상도 오디오 데이터를 실시간 수집하고 처리한다. 픽셀 스마트폰은 현장 연구자들에게 AI 기능이 내장된 장비로서 유용성을 인정받고 있다.
누구나 사용할 수 있는 오픈 모델로 공개 예정
구글은 돌핀제마를 전 세계 연구자들이 자유롭게 활용할 수 있는 오픈 모델로 공개할 계획이다. 연구자들이 각자의 음향 데이터셋을 분석함으로써, 해양 생물의 지능과 소통 방식에 대한 더욱 깊은 통찰력을 확보할 수 있을 것으로 기대된다.
기자의 시선
인간과 돌고래가 공유하는 '소리의 언어'는 오랫동안 과학적 호기심의 대상이었지만, 기술 발전 없이 실질적인 진전을 기대하기 어려웠다. 돌핀제마는 그 가능성의 문을 여는 첫 AI 기술이라는 점에서 의미가 크다. 특히 기본 소리 단위부터 맥락별 해석까지 기계가 수행할 수 있다는 점은, 생물학과 인공지능의 융합이 실질적 성과를 만들어내고 있음을 보여준다. 구글의 오픈모델 공개는 이 기술의 민주화를 위한 중요한 조처로, 향후 다양한 해양 생물 연구로 확장될 수 있기를 기대한다.