중국, 최초의 합리적 AI 모델 발표
중국의 AI 연구 기업 딥시크(DeepSeek)가 합리적 사고를 갖춘 AI 모델인 딥시크-R1(DeepSeek-R1)을 공개했다. 이 모델은 OpenAI의 o1과 유사하게 여러 작업을 계획하며 문제를 해결해 나간다. 딥시크-R1은 복잡한 질문에 대해서 오랜 시간 동안 '생각'한 후 답변을 제공하며, 이는 AI 모델이 일반적으로 직면하는 문제의 몇 가지를 해결할 수 있게 도와준다.
새로운 AI 모델, 두 개의 AI 성능 기준서 평가
딥시크는 딥시크-R1 모델이 OpenAI의 o1과 AIME와 MATH라는 두 인기 있는 AI 성능 기준에서 비슷한 수준의 성과를 나타낸다고 주장했다. AIME는 다양한 AI 모델을 평가하기 위해 사용되고, MATH는 수학 문제를 모아 둔 기준서이다. 그러나 딥시크-R1은 여전히 완벽하진 않다. 일부 논평자들은 딥시크-R1이 삼목 게임(tic-tac-toe)과 같은 논리 문제에서 어려움을 겪는다고 지적했다.
정치적 주제에 대한 답변 제한
딥시크-R1은 정치적으로 민감한 질문에 대한 답변을 차단하는 것으로 보인다. 테스트 결과, 모델은 중국 지도자 시진핑, 천안문 사태, 대만 침공의 지리적 영향 등과 관련된 질문에 대해 대답을 거부했다. 이러한 행위는 지역 AI 프로젝트에 대한 중국 정부의 압력으로 인해 발생하는 것으로 보인다. 중국 내 AI 모델은 주요한 사회주의적 가치를 포함해야 하는 벤치마킹을 통과해야 하며, 훈련에 사용할 수 없는 소스 목록이 제안되기도 한 것으로 알려졌다.
새로운 AI 접근법 모색
최근 주요 AI 연구소에서 발표된 모델들이 예상만큼의 성과를 내지 못하자 새로운 AI 접근법이 모색되고 있다. 그 중 하나가 테스트-타임 컴퓨트(Test-time compute)로, 이는 모델들이 보다 많은 처리 시간을 통해 작업을 완료하도록 하는 것이다.
딥시크의 향후 계획
딥시크는 딥시크-R1을 오픈소스로 공개하고 API를 출시할 계획이다. 딥시크는 고성능 AI 모델을 목표로 하고 있으며, 이는 중국의 양적 헤지펀드인 하이플라이어 캐피탈 매니지먼트(High-Flyer Capital Management)가 지원하고 있다. 딥시크-V2라는 첫 모델은 ByteDance, Baidu 및 Alibaba와 같은 경쟁업체의 가격 정책을 변화시켰다. 딥시크의 지원을 받는 하이플라이어는 자사의 거래 결정에 AI를 활용하며, 138억 원 규모의 자금을 투자해 자체 서버 클러스터를 구축했다.
출처 : A Chinese lab has released a ‘reasoning’ AI model to rival OpenAI’s o1