하이브리드 AI 모델 '코지토', 공개 출시
신생 AI 기업 딥코지토(Deep Cogito)가 개발한 새로운 AI 모델 시리즈 '코지토 1(Cogito 1)'이 공개됐다. 이 모델들은 필요에 따라 '추론 모드'와 '비추론 모드'를 전환할 수 있는 것이 특징이다. 수학과 물리 분야에서는 추론형 모델이 스스로 오류를 찾아내며 복잡한 문제를 해결하는 데 뛰어난 성능을 보여왔으나, 이 과정에서 높은 연산 자원과 지연(latency)이 요구된다는 단점이 있었다.
빠른 응답과 복잡한 문제 해결을 동시에
딥코지토의 코지토 1 모델은 하이브리드 형태로 설계돼 필요한 곳에만 계산 성능을 집중시킨다. 단순한 질문에는 빠르게 답하고, 복잡한 문제는 더 많은 시간과 연산을 투입해 해결하는 방식이다. 회사 측은 동급 공개 모델들과 비교해 코지토 1이 더 뛰어난 성능을 보였다고 주장하고 있다.
3억~700억 매개변수 모델 출시, 6710억 모델도 예정
코지토 1 시리즈는 30억(3B)부터 700억(70B)까지 다양한 매개변수(parameter) 규모로 구성돼 있다. 매개변수는 AI의 문제 해결 능력을 나타내며, 수가 많을수록 일반적으로 성능도 향상된다. 딥코지토는 앞으로 6710억(671B) 매개변수를 가진 초대형 모델도 선보일 계획이라고 밝혔다.
오픈소스 모델 기반 독자적 훈련 기법 사용
코지토 1은 메타(Meta)의 라마(Llama) 모델과 알리바바(Alibaba)의 큐엔(Qwen) 모델을 기반으로 개발됐다. 그러나 딥코지토는 독자적인 훈련 기법을 적용해 성능을 끌어올리고 추론 기능을 자유롭게 전환할 수 있도록 했다. 내부 벤치마크 결과, 가장 큰 모델인 '코지토 70B'는 주요 추론용 오픈 모델을 능가하는 평가를 받은 것으로 알려졌다.
클라우드와 API 통해 전 세계 제공
딥코지토는 모든 코지토 1 모델을 다운로드 또는 클라우드 API를 통해 제공하고 있다. 기업 등 다양한 사용자가 쉽게 접근할 수 있도록 한 것이다. 한편, 딥코지토는 2024년 6월 드리샨 아로라(Drishan Arora)와 드루브 말호트라(Dhruv Malhotra)가 공동 설립했으며, 사우스 파크 커먼스(South Park Commons)로부터 투자를 받았다. 이들은 "대다수 인간의 지적 능력을 뛰어넘고 새로운 역량을 스스로 발견할 수 있는 '범용 초지능(AGI)'을 목표로 하고 있다"고 밝혔다.
나의 의견
딥코지토의 접근 방식은 매우 흥미롭다. 최근 AI 분야에서는 "추론 능력"을 강화하는 것이 주요 과제로 떠오르고 있는데, 코지토 1은 연산 효율성과 성능을 모두 잡으려는 새로운 시도를 보여주고 있다. 특히 필요에 따라 추론 모드를 전환할 수 있다는 점은 실제 산업 현장에서 AI를 적용할 때 매우 실용적일 것으로 보인다. 다만, 내부 벤치마크라는 제한된 평가만으로 성능을 판단하기는 이르므로, 향후 외부 평가와 실제 적용 사례를 지켜볼 필요가 있다.