구글, 클라우드 플랫폼에 음악 생성 AI 'Lyria' 도입
구글이 자사의 기업용 클라우드 플랫폼 '버텍스 AI(Vertex AI)'를 통해 다양한 생성형 인공지능 업데이트를 발표했다. 이번 업데이트에는 음악, 영상, 이미지, 음성 분야의 신기능이 포함되었으며, 생성형 AI 시장에서 점유율을 높이려는 구글의 전략이 반영됐다.
텍스트로 음악 만드는 'Lyria', 미리보기 형태로 공개
구글은 텍스트를 입력하면 다양한 스타일과 장르의 노래를 만들어낼 수 있는 'Lyria' 모델을 일부 고객에게 미리보기(preview) 형태로 제공한다고 밝혔다. 이 기술을 통해 전통적인 음악 제작 과정 없이 쉽게 맞춤형 음원을 생성할 수 있다.
영상 생성 모델 'Veo 2', 더욱 정교한 편집 가능
영상 생성 모델 'Veo 2'도 개선됐다. 새롭게 추가된 기능을 통해 기존 비디오에서 배경, 로고, 객체를 제거하거나, 카메라 각도와 촬영 속도를 조정하는 고급 편집이 가능해졌다. 보다 유연한 비주얼 콘텐츠 제작이 가능해진 셈이다.
음성 AI 'Chirp 3', 단 10초 오디오로 음성 복제 지원
음성 이해 모델 'Chirp 3' 기반으로는 즉석 음성 복제 기능인 'Instant Custom Voice'가 출시되었다. 이는 단 10초간 녹음된 음성만으로 개인화된 음성 생성이 가능하다. Chirp 3는 약 35개 언어를 지원해 다국어 콘텐츠 제작에도 유용하다.
이미지 생성기 'Imagen 3', 품질 대폭 향상
이미지 생성 모델 'Imagen 3'는 객체 제거와 손상 이미지 복원 능력이 대폭 향상됐다. 이를 통해 더욱 정밀한 이미지 편집이 가능해졌다. 모든 생성된 미디어에는 구글의 고유 워터마크 기술인 'SynthID'가 적용돼 콘텐츠 신뢰도를 높이고 있다.
AI 콘텐츠 안전성과 저작권 보호 방안 강화
구글은 생성형 AI 모델이 해로운 콘텐츠를 생성하지 않도록 다양한 안전 장치를 적용했다고 밝혔다. 다만, 모델 훈련에 활용한 데이터에 대한 자세한 정보는 공개하지 않았다. 최근 일부 기업이 저작권 소유자의 동의 없이 저작물을 AI 학습에 활용했다는 논란이 이는 가운데, 구글은 데이터 사용을 원치 않는 경우 이를 거부할 수 있는 장치를 마련했으며, 저작권 관련 분쟁 발생 시 고객을 보호하는 정책도 운영하고 있다.
의견
구글이 이번에 소개한 생성형 AI 기술은 엔터프라이즈 시장에서의 경쟁력을 강화하기 위한 중요한 한 걸음으로 보인다. 텍스트로 음악을 생성하거나, 짧은 오디오로 음성을 복제하는 기능은 기존 제작 프로세스를 혁신할 수 있는 잠재력을 지닌다. 특히 콘텐츠 생산 비용과 시간을 크게 줄여줄 것으로 기대된다.
하지만 AI 훈련 데이터에 대한 투명성 부족은 여전히 해결해야 할 문제다. 향후 구글이 저작권과 데이터 사용 논란을 어떻게 풀어나갈지가 이 기술들의 확산에 큰 영향을 미칠 것으로 보인다.