AI의 'IQ' 상승? 전문가들 "평가 척도 부적절"
최근 기자회견에서 OpenAI의 CEO 샘 알트먼은 인공지능(AI)의 'IQ'가 매년 한 표준편차씩 상승하는 것과 같다고 밝혔다. 이는 AI의 발전 속도를 가늠하는 비유적 표현이지만, 전문가들은 IQ 테스트가 AI의 성능을 측정하는 적절한 도구가 아니라는 점을 지적하고 있다.
IQ 테스트로 AI 평가할 수 있을까?
옥스퍼드대학교에서 기술과 규제를 연구하는 산드라 왝터 연구원은 IQ 테스트가 특정 논리적 사고와 추상적 사고를 측정하는 데 초점이 맞춰져 있지만, 실용적인 문제 해결 능력이나 AI의 실제 작동 능력을 평가하기에는 부적절하다고 설명했다.
즉, IQ는 인간 지능에 대한 논란이 있는 개념이며, 이를 AI 평가에 그대로 적용하는 것은 잘못된 접근법이라는 것이다.
IQ 테스트, AI에게 유리한 논란의 기준
AI가 IQ 테스트에서 높은 점수를 얻는 것은 해당 테스트의 한계를 드러낼 뿐, AI의 실제 능력을 반영하는 것은 아니라는 지적도 있다. 에든버러대학교의 박사 과정 연구원 오스 키이스는 AI 모델이 막대한 기억 용량을 갖추고 있으며, 인터넷 상의 다양한 IQ 테스트 데이터를 학습했기 때문에 이러한 평가에서 유리한 위치를 차지한다고 말했다.
또한, IQ 테스트 자체가 역사적으로 우생학(eugenics)에 뿌리를 두고 있으며, 특정 문화와 기억력 위주의 평가 방식으로 인해 편향될 가능성이 크다는 점도 문제로 지적됐다.
AI와 인간 지능, 근본적으로 다른 평가 기준 필요
킹스칼리지 런던의 연구원 마이크 쿡은 "IQ 테스트는 인간의 문제 해결 능력을 평가하기 위해 설계되었다"면서 "인간의 인지 과정은 AI와 근본적으로 다르다"고 말했다. AI는 인간보다 훨씬 방대한 정보를 정밀하게 분석할 수 있지만, 인간과 같은 사고방식을 가진 것은 아니라는 점에서 IQ 테스트로 평가하는 것은 적절하지 않다는 것이다.
AI 평가를 위한 새로운 기준 마련돼야
AI Now Institute의 수석 연구원 하이디 클라프는 AI의 역량을 평가할 새로운 척도가 필요하다고 강조했다. 그는 인간과 AI의 성능을 직접 비교하는 방식이 최근 등장한 논란 많은 경향이라면서, "현재의 IQ 테스트는 AI의 본질을 제대로 반영하지 못한다"고 지적했다.
결국, AI의 발전을 보다 정확하게 측정하기 위해서는 인간 중심의 기존 측정 방식에서 벗어나 AI의 특성을 반영한 새로운 평가 기준이 필요하다는 목소리가 커지고 있다.
기사에 대한 의견
AI의 발전 속도가 빠르게 증가하고 있는 지금, 이를 평가하는 적절한 기준이 필요하다는 점에는 동의한다. IQ 테스트가 인간의 특정 능력을 측정하기 위해 고안된 만큼, 이를 AI의 성능 기준으로 삼는 것은 다소 무리가 있어 보인다. 앞으로 AI의 고유한 특성을 반영한 평가 방법이 연구되어야 할 것이다.