총상금 100만 달러, 'ARC-AGI-2'로 AI 지능 평가 도전
AI 분야의 권위 있는 대회인 ARC Prize가 차기 대회인 2025년 ARC Prize의 시작을 알리며 새로운 벤치마크 'ARC-AGI-2'를 공개했다. 이번 벤치마크는 총상금 100만 달러가 걸린 가운데, 범용 인공지능(AGI)의 실질적인 지능 수준을 평가하는 데 초점을 맞춘다.
인간과 AI의 '지능 격차' 여전
ARC-AGI-2는 AI가 특정 작업만 수행하는 기존의 '협소한 인공지능(narrow AI)'을 넘어, 인간처럼 다양한 상황에 적응하며 문제를 해결할 수 있는 일반 지능(general intelligence)에 접근하게끔 유도한다. 인간에게는 쉽게 느껴지는 과제를 인공지능이 얼마나 효율적으로 수행할 수 있는지를 검증하는 것이 핵심이다.
이번 벤치마크는 상징적 해석(symbolic interpretation), 조합적 추론(compositional reasoning), 문맥 기반 규칙 적용(contextual rule application)과 같은 영역에서 AI가 여전히 인간에 비해 큰 한계를 보이며, 그 격차가 뚜렷하게 드러난다고 밝혔다.
학습의 유연성, 단순 암기와 구별
ARC 측은 2019년부터 AI가 단순히 데이터를 암기하는 것이 아니라, 새로운 정보를 기반으로 융통성 있게 학습해 문제를 해결할 수 있는지를 측정하는 벤치마크 방식을 추구해왔다. 이는 인간의 '유동 지능(fluid intelligence)'과 유사한 개념으로, 인공지능의 근본적인 사고 능력을 평가하는 데 중점을 둔다.
오픈AI ‘o3’ 이후, 여전히 남은 과제들
오픈AI가 최근 공개한 'o3' 모델이 AI 능력의 진화를 보여주긴 했지만, ARC에 따르면 AI가 진정한 범용성을 발휘하기 위해서는 여전히 크고 복잡한 도전에 직면해 있다. 특히 효율성과 자원 최적화(resource optimization)는 향후 AI 지능을 정의하는 새로운 기준으로 주목받고 있다.
2025년 대회, 연구 혁신 활발 유도 목표
ARC Prize 주최 측은 2024년 대회에서 약 1,500개 팀이 참가했던 전례를 바탕으로, 내년에는 더욱 많은 참여와 혁신적 아이디어가 등장할 것으로 기대하고 있다. 다양한 부문별 상금이 마련되어 있어, 협업과 실험적 연구를 장려하는 데 초점을 맞춘다.
이번 대회를 발판 삼아, 인공지능이 인간 수준의 지능 효율성과 적응력을 갖춘 시스템으로 발전할 수 있을지 주목된다.
📝 기자의 시각
ARC-AGI-2는 단순히 성능만을 평가하는 데서 나아가, AI가 인간처럼 사고하고 적응할 수 있는지를 실질적으로 측정하려는 중요한 시도다. 특히 '효율성'과 '자원 사용 최적화'라는 기준은, 앞으로의 AI 평가에서 매우 중요한 요소로 자리매김할 전망이다. 단순히 문제를 풀 수 있느냐보다 '어떻게 푸느냐'에 초점을 맞춘 이번 벤치마크는, AI 연구의 질적 전환점을 마련할 수 있을 것이다.