중국 DeepSeek, 혁신적 추론 AI 모델 공개
중국 인공지능(AI) 기업 DeepSeek가 새로운 AI 추론 모델인 'DeepSeek-R1'의 오픈버전을 발표했다. 이 모델은 미국 OpenAI의 'o1'에 필적하는 성능을 보이며, MIT 라이선스 하에 Hugging Face 플랫폼에서 공개되어 상업적으로도 이용이 가능하다.
OpenAI 모델 넘보는 'DeepSeek-R1'
DeepSeek 측은 R1이 AIME, MATH-500, SWE-bench Verified 같은 AI 평가 지표에서 OpenAI의 o1보다 더 나은 성과를 내고 있다고 주장한다. AIME는 다른 AI 모델의 성능을 평가하는 방식이고, MATH-500은 수학 문제, SWE-bench Verified는 프로그래밍 과제를 중심으로 테스트를 진행한다.
특히 R1은 자체적으로 정보를 확인하는 능력을 갖추어 기존 모델의 흔한 오류를 피할 수 있는 장점이 있다. 다만 추론 AI 모델의 특성상 솔루션 도출 시간이 다소 걸리지만, 이는 물리학, 과학, 수학 등 정확도가 중요한 분야에 적합한 신뢰도를 제공한다.
6710억 개 파라미터…다양한 규모로 제공
R1은 6710억 개의 파라미터를 탑재하고 있어 높은 문제 해결 능력을 자랑한다. 일반적으로 파라미터가 많을수록 모델의 성능이 뛰어나기 마련이다. 이와 더불어 DeepSeek는 표준 노트북에서도 실행 가능한 15억~700억 파라미터로 구성된 '디스틸드(distilled)' 버전도 함께 제공한다.
중국 정부 규제 속의 기술 개발
중국 기업이 개발한 만큼 R1은 '사회주의 핵심 가치'와 같은 중국 정부 정책에 부합해야 하며, 천안문 사태나 대만 독립과 같은 민감한 주제에 대해선 제약이 있다.
본 모델의 발표는 미국 바이든 행정부가 중국 관련 AI 기술의 수출 규제를 강화할 것이라는 발표 직후 이루어졌다. 중국은 Advanced AI 칩을 확보하는 데 어려움을 겪고 있음에도, DeepSeek, 알리바바, Kimi 등 최소 세 곳의 실험실은 OpenAI의 o1에 맞먹는 경쟁력을 가진 시스템을 개발했다고 주장하고 있다.
중국의 '빠른 추격자' 전략
DeepSeek 사례는 중국의 연구소들이 AI 발전 과정에서 '빠른 추격자(fast follower)'로 활약하며 미국의 AI 기술 리더십을 잠재적으로 위협하고 있다는 우려를 불러왔다.
의견: AI 연구의 글로벌 조화 중요
DeepSeek의 새로운 모델 발표는 기술이 국경을 초월해 치열한 경기장을 형성하고 있음을 보여준다. 다만 AI 기술 발전이 각국의 규제와 상이한 가치관에 따라 제약받는 모습은 안타깝다. AI는 협력이 중요한 분야인 만큼, 정치와 분리를 통해 더욱 긴밀한 국제적 협력을 이루는 것이 기술 발전에 바람직한 방향일 것이다.