앤드루 바르토와 리처드 서튼, 2024 튜링상 수상
기계 학습 분야에서 중요한 기여를 한 두 명의 컴퓨터 과학자, 앤드루 G. 바르토와 리처드 S. 서튼이 2024년 튜링상을 수상했다. 이들은 강화 학습(reinforcement learning) 분야에서 획기적인 연구를 진행했으며, 기계가 보상을 기반으로 시행착오를 거치며 학습하는 방식을 체계적으로 정립했다.
강화 학습 연구의 선구자들
바르토와 서튼은 1980년대부터 강화 학습에 관한 연구를 시작했으며, 그들의 연구 성과 중 하나로 '시간차 학습(temporal difference learning)' 개념이 있다. 이 방법은 학습 과정에서 미래 보상을 예측하는데 중요한 역할을 하며, 현재 인공지능(AI) 연구에서도 적극적으로 활용되고 있다. 뿐만 아니라, 이들은 강화 학습 이론을 집대성한 저서 『Reinforcement Learning: An Introduction』을 출간하며 학계와 산업계에 큰 영향을 끼쳤다.
컴퓨팅 분야의 '노벨상' 수상 영예
튜링상은 컴퓨팅 분야에서 가장 권위 있는 상으로 '컴퓨터 과학의 노벨상'이라 불린다. 바르토와 서튼의 연구는 인지과학(cognitive science)과 신경과학(neuroscience) 등 다양한 학문에서 영감을 받아 발전했으며, AI의 성장뿐만 아니라 인간 두뇌의 기능을 이해하는 데에도 중요한 역할을 했다. 그들의 연구는 향후 컴퓨팅 기술의 발전에도 큰 기여를 할 것으로 평가받고 있다.
과거 수상자들과의 비교
이전에 튜링상을 수상한 인물들로는 딥러닝(deep learning) 기술을 발전시킨 얀 르쿤(Yann LeCun), 제프리 힌튼(Geoffrey Hinton), 그리고 요슈아 벤지오(Yoshua Bengio) 등이 있다. 바르토와 서튼 또한 AI 분야에서 기념비적인 성과를 남긴 공로를 인정받아 이번 상을 수상했으며, 이들은 구글에서 후원하는 총 100만 달러의 상금을 공동으로 받게 된다.
의견
바르토와 서튼의 연구는 오늘날 AI 분야, 특히 로봇공학과 자율 학습 시스템의 근간을 형성하는 데 기여했다. 강화 학습은 최근 게임 AI뿐만 아니라 의료, 금융, 자율 주행 등 다양한 산업에서 활용되고 있어 이들의 연구 성과가 더욱 중요하게 다가온다. 과거 수상자들과 비교해도, 이들의 연구가 AI 발전의 핵심 토대를 마련했다는 점에서 충분히 수상 자격이 있다고 생각된다. 앞으로도 이들의 연구가 어떻게 발전해 나갈지 기대된다.