오픈소스 AI 도약… DeepSeek V3-0324, 비추론 모델 중 최고 성능 기록
오픈소스 인공지능(AI) 모델인 DeepSeek V3-0324가 'Artificial Analysis Intelligence Index'에서 비추론(non-reasoning) 부문 최고 점수를 기록하며 공개형 AI 개발의 새로운 전환점을 맞이했다.
구글·앤트로픽·메타 상용 모델 제치고 선두
DeepSeek V3-0324는 기준 점수에서 7포인트 상승하며, 구글의 Gemini 2.0 Pro, 앤트로픽의 Claude 3.7 Sonnet, 메타의 Llama 3.3 70B 등 유력 상용 AI 모델들을 앞섰다. 이 모델은 추론 기능이 없는 비추론 AI지만, 즉각적인 응답이 중요한 실시간 애플리케이션 측면에서는 업계 선도 수준에 도달했다는 평가다.
실시간 사용 사례에 최적화된 새 시대의 AI
비추론 모델은 복잡한 사고 과정을 거치지 않고 즉각적으로 답을 도출하는 특징이 있어 챗봇, 고객 서비스 자동화, 실시간 번역 등 시간에 민감한 분야에서 특히 유용하다. DeepSeek의 이번 V3-0324는 이 같은 실시간 활용에 있어 업계 기준을 새롭게 정립한 셈이다.
Artificial Analysis는 “이 모델은 오픈소스 중 최초로 비추론 부문 1위에 오른 사례”라며 “오픈소스 AI가 상용 모델과의 격차를 줄이고 있다”고 강조했다.
프리미엄 사양… 여전히 고사양 인프라 필요
DeepSeek V3-0324는 2024년 12월 버전과 대부분의 사양을 공유한다. 해당 모델은 128,000 토큰의 컨텍스트 윈도우(DeepSeek API 기준 64,000 토큰 제한), 총 6,710억 개의 파라미터(실사용은 370억 파라미터), FP8 정밀도 기준 약 700GB 이상의 GPU 메모리를 요구하며, 텍스트 입력 전용 모델이다. 멀티모달 기능은 지원하지 않는다.
Artificial Analysis는 이러한 고사양 요구를 두고 “여전히 집에서 돌릴 수 있는 수준은 아니다”고 언급하며, 기업용 인프라가 필요하다는 점을 강조했다.
오픈소스와 상용 AI 간의 간극 좁혀져
세 달 전만 해도 DeepSeek V3는 앤트로픽과 구글의 상용 비추론 모델을 거의 따라잡았지만, 이번 업데이트된 V3-0324는 마침내 이들을 능가하게 됐다. 추론 능력이 필요한 복잡한 문제 해결에서는 여전히 OpenAI, 알리바바, DeepSeek R1과 같은 추론 모델이 우위에 있지만, 오픈소스 AI가 기술적으로 얼마나 근접했는지를 보여주는 중요한 변화다.
Artificial Analysis는 “이번 릴리스는 R1보다 더욱 인상적”이라며, 오픈소스가 상용 플랫폼과 대등한 수준으로 발전하고 있음을 시사했다.
R2 발표 기대감 속 업계 시선 집중
DeepSeek은 현재 R2 모델의 공개를 앞두고 있어, 향후 또 한 차례 성능 도약이 예상된다. 전문가들은 오픈소스 AI가 실시간 응용 분야뿐만 아니라 고도의 연산력과 사고를 요구하는 영역으로도 점차 확장될 것이라 내다보고 있다.
의견
이번 DeepSeek V3-0324의 성과는 단순한 기술적 향상을 넘어, 오픈소스 AI가 상용 독점형 모델과 맞설 수 있는 가능성을 현실로 보여줬다는 점에서 의미가 깊다. 특히 비추론 영역에서는 오픈소스가 이미 경쟁 우위를 점하고 있음을 시사하며, 향후 더 많은 기업들이 비용 효율성과 유연성을 고려해 오픈소스 기반 솔루션을 고려하게 될 가능성이 높아졌다. R2 모델의 등장이 AI 주도권 변화의 촉매제가 될 수 있을지 관심이 집중된다.