Google, 차세대 AI 모델 Gemini 2.0 Flash 공개
Google이 최신 AI 모델인 Gemini 2.0 Flash를 발표했습니다. 이 모델은 텍스트, 이미지, 음성의 생성과 분석, 코드 실행 등의 다양한 능력을 갖춘 강력한 멀티모달 AI로, Google의 AI 생태계를 더욱 확장할 것으로 기대됩니다.
텍스트와 이미지, 음성까지 통합 지원
Gemini 2.0 Flash는 기존 AI 모델의 한계를 넘어 텍스트와 이미지를 함께 생성하거나 수정할 수 있으며, 오디오 생성 기능도 포함돼 있습니다. 특히 사용자가 요구하는 속도나 음성 톤으로 조정 가능해 더욱 다양한 요구사항에 대응할 수 있습니다.
"얼리 액세스" 파트너 우선 제공
AI 개발 플랫폼인 AI Studio와 Vertex AI를 통해 실험 버전이 오늘부터 제공되며, 오디오와 이미지 생성 기능은 우선적으로 "얼리 액세스 파트너"에게 배포됩니다. 이 기능들은 2024년 1월에 더 많은 사용자들에게 공개될 예정입니다.
SynthID 기술로 합성물 워터마킹 진행
Google은 Gemini 2.0 Flash에서 생성된 이미지와 오디오에 SynthID 기술을 적용해 워터마킹을 실시합니다. 이를 통해 생성된 콘텐츠의 합성 여부를 쉽게 식별할 수 있으며, 이러한 기술은 심각한 '딥페이크(deepfake)' 문제를 완화하는 데 기여할 것으로 보입니다.
실시간 멀티모달 API, 1월 출시 예정
2024년 1월에는 Gemini 2.0 Flash의 최종 버전과 함께 실시간 오디오 및 비디오 스트리밍이 가능한 멀티모달 라이브 API가 공개될 예정입니다. 이를 통해 개발자들은 실시간 분석과 생성 작업이 가능한 다양한 애플리케이션을 구축할 수 있게 됩니다.