Google, 차세대 AI 모델 Gemini 2.0 발표
AI 혁신의 새로운 장 열다
구글 CEO 순다르 피차이(Sundar Pichai)가 차세대 AI 모델인 Gemini 2.0을 발표하며 기술 혁신의 새로운 장을 열었다. 이번 업데이트는 다중 모달(multimodal) 기능, 에이전트형(agentic) 기능, 그리고 사용자가 활용할 수 있는 도구의 개선을 통해 AI 기술을 한 단계 더 진보시키는 것을 목표로 한다.
Gemini 2.0, AI 활용의 새로운 시대 열다
피차이는 "Gemini 1.0이 정보를 조직하고 이해하는 데 초점을 맞췄다면, Gemini 2.0은 정보를 더욱 유용하게 만드는 데 중점을 두었다"고 설명했다.
Gemini 1.0은 2022년 12월에 처음 공개된 구글의 첫 멀티모달 AI 모델로, 텍스트, 비디오, 이미지, 오디오, 코드 처리에서 우수함을 보였다. 후속 버전인 Gemini 1.5는 긴 문맥을 이해하는 능력을 강화해 개발자들로부터 많은 사랑을 받았다.
이번에 발표된 Gemini 2.0은 단순한 정보 처리에서 벗어나 실제 상황에서 의사결정을 돕는 범용 AI 비서로 발전했다. 피차이는 이를 "에이전트 시대(agentic era)의 서막"으로 정의하며, 중요한 도약점으로 평가했다.
Gemini 2.0 Flash: 더욱 발전된 다중 모달 AI
Gemini 2.0의 주력 모델인 Gemini 2.0 Flash는 사용자 경험을 혁신적으로 개선한다. 이 모델은 텍스트와 이미지를 결합한 시각 자료 생성, 다국어 음성을 제공하는 텍스트-음성 변환 등을 포함하여 다양한 다중 모달 입력과 출력을 지원한다.
또한, Google Search, 외부 사용자 정의 함수 등 네이티브 툴의 통합을 통해 이용자 편의를 극대화했다. 개발자와 기업 사용자는 Google AI Studio와 Vertex AI에서 Gemini API를 통해 접근할 수 있으며, 대규모 모델은 2024년 1월에 추가로 공개될 예정이다.
AI 기술의 최전선: 연구와 실험 도구
Gemini 2.0의 또 다른 주요 기능은 Deep Research다. 이 도구는 복잡한 주제를 간단하게 정리하여 보고서 형식으로 제공하는 AI 연구 비서 역할을 한다.
이 모델은 구글의 6세대 텐서 처리 유닛(TPU)인 Trillium으로 훈련되었다. Trillium은 현재 외부 개발자들에게도 개방되어, 구글 내부 시스템과 동일한 기반에서 개발 작업을 수행할 기회를 제공한다.
Gemini 2.0과 함께 주목받는 실험적 프로젝트는 다음과 같다:
- Project Astra: 구글의 다양한 도구(검색, 렌즈, 지도 등)와 통합되어 사용자와 AI 간 상호작용을 개선하는 범용 AI 비서.
- Project Mariner: 브라우저 내 인터랙티브한 데이터(텍스트, 이미지)를 해석하고 활용하는 웹 탐색 어시스턴트.
- Jules: GitHub 워크플로우에 통합된 코딩 비서로, 개발자의 문제 해결을 지원하는 데 초점을 맞춘 AI.
AI 윤리와 안전성, 개발의 핵심
구글은 Gemini 2.0의 개발 과정에서 안전성과 윤리적 기준을 최우선으로 고려했다고 밝혔다. "레드 팀(red-teaming)" 테스트와 같은 고급 위험 평가를 통해 보안 취약점을 식별하고 문제를 사전에 방지했다는 설명이다.
피차이는 "책임감 있는 AI 개발만이 지속 가능한 혁신을 가능하게 한다"고 강조하며, 글로별 사용자들이 신뢰할 수 있는 기술 제공을 약속했다.
이번 발표로 구글은 다양한 영역에서 상호작용을 혁신할 수 있는 '범용 AI 비서' 개발에 한 걸음 더 다가가게 되었다. Gemini 2.0은 AI 기술의 새로운 가능성을 제시하며 향후 기대감을 높이고 있다.