구글, 효율성 강화한 AI 모델 'Gemini 2.5 Flash' 발표
구글이 성능과 효율성에 중점을 둔 새로운 인공지능(AI) 모델 'Gemini 2.5 Flash'를 공개했다. 이 모델은 조만간 구글의 AI 개발 플랫폼인 'Vertex AI'에서 만나볼 수 있다.
연산 속도·정확성·비용 조정 가능
'Gemini 2.5 Flash'는 연산 속도와 정확성, 비용 간 균형을 사용자가 직접 조정할 수 있는 것이 가장 큰 특징이다. 구글은 "질문 난이도에 따라 처리 시간을 조절할 수 있어, 작업 특성에 맞게 최적화할 수 있다"고 설명했다. 특히 대규모 트래픽을 처리하거나 비용이 민감한 애플리케이션에 적합하도록 설계됐다.
지연 최소화하고 비용 절감에 초점
'Gemini 2.5 Flash'는 질문에 대한 답변을 스스로 검토하며 보다 정확한 결과를 제공하는 '추론(reasoning)' 모델이다. 다소 시간이 소요되지만 정확도를 높이는 것이 특징이다. 이에 따라 고객 서비스 상담이나 문서 분석 등 정확성이 중요한 용도에 활용하기 적합하다.
또한 이 모델은 응답 속도가 빠르고 비용이 낮아, 가상 비서나 실시간 요약 서비스 등 즉각적인 반응이 필요한 분야에도 유용하다.
로컬 서버와 클라우드 모두 지원 예정
구글은 올해 3분기부터 'Gemini 2.5 Flash'와 같은 Gemini 시리즈 모델을 온프레미스(로컬 서버) 환경에서도 사용할 수 있도록 지원할 예정이다. 이를 위해 구글은 'Google Distributed Cloud(GDC)' 플랫폼을 통해 제공할 계획이며, 엔비디아와의 협력도 강화해 'GDC' 규격을 충족하는 '엔비디아 블랙웰(Blackwell)' 시스템에서도 Gemini 모델을 이용할 수 있도록 준비하고 있다.
의견
구글이 공개한 'Gemini 2.5 Flash'는 AI 서비스의 상용화를 고려할 때 꽤 전략적인 모델로 보인다. 특히 속도, 정확성, 비용을 자유롭게 조정할 수 있다는 점은 다양한 산업군에서 폭넓게 활용될 가능성을 보여준다. 또한, 클라우드뿐 아니라 온프레미스 환경까지 지원 범위를 넓히려는 계획은 기업 고객의 요구를 반영한 영리한 접근이라고 평가할 수 있다.