LG AI연구원, 수학·과학·코딩에 강한 AI 모델 ‘EXAONE Deep’ 공개
LG AI연구원이 복잡한 문제 해결 능력을 갖춘 차세대 인공지능 모델 'EXAONE Deep'을 공개했다. 이번 모델은 수학, 과학, 코딩 등의 분야에서 추론 능력을 크게 강화하여 글로벌 수준의 AI 모델과 경쟁을 목표로 하고 있다.
대용량 모델뿐 아니라 경량 모델도 최고 성능 기록
EXAONE Deep은 32B, 7.8B, 2.4B의 세 가지 크기로 구성됐다. 각 모델 모두 첨단 벤치마크 테스트에서 탁월한 성과를 보였으며, 특히 경량 모델임에도 불구하고 대규모 AI를 뛰어넘는 결과를 냈다.
수학 성능: AIME 2024 고득점 달성
가장 큰 규모의 32B 모델은 2025학년도 수학 교육과정을 기반으로 진단한 테스트에서 94.5점(일반 수학 능력), 미국 수학 경시대회(AIME 2024)에서 90.0점을 기록해 동급의 글로벌 AI들을 압도했다. 중간 규모인 7.8B 모델은 MATH-500 벤치마크에서 94.8점을, 2.4B 모델은 92.3점을 기록하며 해당 모델 크기 중 최고 성능을 나타냈다.
과학 및 코딩 분야에서도 두각
EXAONE Deep은 복잡한 과학적 사고력과 실제 코딩 능력에서도 뛰어났다. 32B 모델은 과학 고난이도 추론 테스트인 GPQA Diamond에서 66.1점을, 실시간 코딩 평가인 LiveCodeBench에서 59.5점을 획득했다. 7.8B와 2.4B 모델 역시 같은 분야에서 각 크기군 중 1위를 차지했다.
언어 이해력도 국내 최고 수준
AI 모델의 언어 전반 이해 성능을 측정하는 MMLU(Massive Multitask Language Understanding) 평가에서는 32B 모델이 83.0점을 기록하며 국내 AI 모델 중 최고의 성능을 보였다. 이는 글로벌 AI 성능과 경쟁 가능한 수준으로, 모델의 전반적인 이해력과 문제 해결 능력을 동시에 입증한 셈이다.
'주목할 AI 모델'로 국제적 인정 받아
EXAONE Deep은 미국의 비영리 리서치 기관 Epoch AI로부터 ‘주목할 AI 모델’에 선정되며, 출시 직후부터 국제적인 인정을 받았다. 이는 국내 AI 기술 경쟁력을 세계적으로 입증한 성과로 해석된다.
AI의 진화, 실생활 문제 해결로 이어지나
LG AI연구원은 EXAONE Deep을 통해 AI의 복잡한 사고 능력 가능성을 실현했으며, 향후 더 정교한 문제 해결 및 인간 삶 개선에 기여할 수 있을 것으로 기대한다고 밝혔다.
📝 기자 의견
EXAONE Deep은 단순 언어 생성 능력을 넘어, 논리와 수학적 사고 등 고차원적 문제 해결 능력까지 갖춘 AI로 진화하고 있다는 점에서 의미가 크다. 특히 경량 모델에서 뛰어난 성능이 눈에 띄며, 이는 실사용에도 효율적으로 적용될 가능성을 넓힌다. 앞으로 EXAONE Deep이 학문 연구나 실무 분야 등 다양한 영역에서 활용될 수 있을지 귀추가 주목된다.