구글, 새로운 'Gemini Embedding' 모델 공개
텍스트 검색·분류 분야 성능 향상 기대
구글이 7일(현지시간) 개발자를 위한 Gemini API에 새로운 실험적 '임베딩(embedding)' 모델, Gemini Embedding을 추가했다고 밝혔다. 임베딩 모델은 텍스트 데이터를 수치 형태로 변환해 의미적 유사도를 파악하는 기술로, 문서 검색 및 분류 등의 분야에서 유용하게 활용된다.
Gemini 모델 기반으로 더욱 향상된 성능 제공
기존 임베딩 모델과 차별화된 점은 Gemini AI 모델을 기반으로 학습됐다는 점이다. 구글은 이 모델이 언어에 대한 깊이 있는 이해와 정교한 컨텍스트 분석 능력을 갖췄다고 강조하며, 금융, 과학, 법률, 검색 등 다양한 분야에서 뛰어난 성능을 발휘할 것이라고 설명했다.
기존 모델보다 높은 성능과 다국어 지원
구글에 따르면, Gemini Embedding 모델은 이전에 가장 앞선 것으로 평가받던 'text-embedding-004' 모델을 뛰어넘는 성능을 보이며, 대표적인 임베딩 벤치마크에서도 경쟁력을 입증했다. 또한, 더 긴 텍스트와 코드 블록을 한 번에 처리할 수 있으며, 100개 이상의 언어를 지원하는 점도 강점이다.
실험적 모델로 출시… 향후 정식 버전 예고
현재는 실험적 단계로 제한된 용량으로 운영되며, 일부 기능과 성능이 변경될 가능성이 있다. 구글은 몇 개월 안에 안정적인 정식 버전을 출시할 계획이라고 덧붙였다.
🔍 의견
구글의 새로운 임베딩 모델은 AI 기반 검색 및 추천 시스템에서 중요한 변화를 가져올 가능성이 커 보인다. 특히 100개 이상의 언어를 지원하면서 다국적 기업 및 글로벌 서비스 제공업체들에게 유용할 것으로 보인다. 다만 실험적 단계이므로 성능을 직접 테스트해보는 것이 중요할 듯하다.