이미지 생성의 혁신, Google의 Whisk를 만나다
Google이 이미지 생성 기술에 새로운 바람을 일으키는 도구를 선보였습니다.
이미지로 프롬프트 제공, 새로운 접근법 도입
Google Labs의 실험 부서에서 개발 중인 이미지 생성 도구 'Whisk'는 기존의 텍스트 입력 방식에서 벗어나 이미지를 사용해 프롬프트를 제공할 수 있도록 설계되었습니다. 사용자는 사진의 주제, 장면, 스타일 등을 변경하며 원하는 이미지를 생성할 수 있습니다.
Imagen 3 모델을 통한 정교한 이미지 생성
Whisk는 Google의 이미지 생성 모델인 'Imagen 3'을 활용해 작동합니다. 이 도구는 세 가지 이미지를 결합하여 새로운 시각적 결과물을 생성합니다. 우선 주제를 위한 이미지, 장면을 형성할 이미지, 그리고 결과물에 적용할 스타일 이미지를 선정한 후 이를 합성합니다. 예를 들어, 사용자가 본인의 이미지를 주제로 설정하고 배경에 미래적 풍경을, 애니메이션 스타일을 추가하면 독창적인 결과물이 탄생합니다.
텍스트와 이미지의 융합, 세밀한 생성 가능
Whisk는 제공된 이미지를 바탕으로 자동으로 텍스트 설명을 생성해 작업을 이어갑니다. 사용자가 "주제가 날아다니는 자전거를 타고 있다"와 같은 문구를 추가하면 결과물의 세부사항을 더 구체화할 수 있습니다.
일부 한계점과 사용자 편의성
이 도구는 각 이미지의 핵심 요소에만 중점을 두기 때문에 결과물이 사용자 기대와 다르게 나타날 수 있습니다. 예를 들면, 생성된 주제의 키, 체형, 피부 톤 등이 원본과 다를 수 있습니다. 다만 Google은 사용자가 생성 과정에서 프롬프트를 쉽게 수정할 수 있는 옵션을 제공해 사용자 편의성을 높였습니다.
아직은 미국에서만 제한적 서비스
현재 Whisk는 미국 사용자들을 대상으로 테스트 중이며, 다른 지역으로 확장될 가능성은 아직 알려지지 않았습니다. Google의 이러한 실험적 시도는 이미지 생성 기술의 또 다른 가능성을 열어갈 것으로 보입니다.