구글, 새로운 AI 추론 모델 '제미니 2.5' 공개
향상된 추론 능력으로 경쟁 모델 압도…멀티모달 처리 능력도 강화
구글이 최신 AI 모델 '제미니 2.5(Gemini 2.5)'를 공개했다. 이 모델은 단순한 질문 응답을 넘어, 질문에 대한 답변을 제공하기 전에 "생각하는(thinking)" 과정을 거치는 고도화된 추론 능력을 보유한 것이 특징이다. 특히 이번에 실험적으로 선보인 '제미니 2.5 프로(Gemini 2.5 Pro)'는 멀티모달 추론 기능까지 탑재한 고성능 AI로, 현재 구글 AI 스튜디오 및 제미니 앱을 통해 사용할 수 있다.
오픈AI에 이어 이어지는 '추론 중심' AI 경쟁
이번 발표는 오픈AI(OpenAI)가 처음으로 '추론 중심(reasoning-centric)' AI 모델을 선보인 이후, 기술 산업 전반에서 동일한 방향의 경쟁이 치열해지고 있는 가운데 나왔다. 구글은 이후 등장한 여러 AI 모델들처럼, 제미니 2.5에 팩트 체크와 문제 해결을 위한 강력한 연산 능력을 결합해 이러한 경쟁에 대응하고 있다.
주요 벤치마크에서 뛰어난 성능 보여
제미니 2.5 프로는 기존 AI 모델들과 다양한 평가 지표에서 비교 우위를 보였다. 프로그래밍 코드 편집 능력을 평가하는 'Aider Polyglot' 시험에서 68.6%의 정확도를 기록하며, 오픈AI 및 Anthropic의 모델들을 앞섰다. 그러나 소프트웨어 개발 안정성을 평가하는 'SWE-bench Verified' 테스트에서는 63.8%로, Anthropic 모델보다 약간 낮은 성능을 보였다.
또한, 다양한 주제를 다루는 멀티모달 평가에서는 18.8%의 점수를 획득했다. 이 외에도 사용 가능한 콘텍스트 윈도우(문맥 유지 범위)가 100만 토큰(약 75만 단어)에 달해 방대한 양의 정보를 동시에 처리할 수 있으며, 향후 이 수치를 두 배로 늘릴 계획도 공개되었다.
향후 API 가격 및 서비스 전략 공개 예정
구글은 제미니 2.5 프로의 API 사용 요금에 대한 구체적인 정보도 조만간 발표할 예정이라고 밝혔다. 이는 개발자나 기업 고객에게 실질적인 사용 가치를 판단할 수 있는 중요한 기준이 될 전망이다.
기사에 대한 의견:
구글이 선보인 제미니 2.5는 AI 기술의 패러다임이 단순한 응답에서 '추론 기반 사고(reasoning-based thinking)'로 전환되고 있다는 점을 잘 보여준다. 이는 단지 대화형 AI의 성능을 높이는 데 그치지 않고, 소프트웨어 개발, 교육, 고급 정보 분석 등 다양한 분야에서 활용도를 획기적으로 높일 수 있는 모델로 평가된다. 다만, 특정 벤치마크에 따라 성능 차이가 존재하는 만큼, 향후 업데이트와 개선이 지속적으로 이루어져야 할 것이다.