AI 모델, 선택적 '망각' 구현하는 기술 개발
도쿄과학대학 연구진, 데이터 관리 개선 노력
도쿄과학대학(TUS) 연구진이 대규모 인공지능(AI) 모델에서 특정 데이터 클래스를 선택적으로 '망각'할 수 있는 기술을 개발했다. 이는 AI가 다양한 분야에 도입되면서 발생하는 복잡성과 윤리적 우려를 해소하기 위한 중요한 진전으로 평가받고 있다.
AI의 효율성과 윤리적 과제
불필요한 분류 제거로 처리 효율 높여
대규모로 사전 학습된 AI 시스템(예: OpenAI의 ChatGPT, CLIP)은 AI 역량에 대한 기대치를 크게 바꿔놓았지만, 동시에 막대한 에너지와 시간 소모, 특정 작업 효율성 저하 등의 문제를 수반했다. 예를 들어, 자율주행에서는 차량과 보행자 같은 제한된 객체를 인식하는 것만이 중요할 수 있다. 그러나 불필요한 정보를 유지하면 정확성이 떨어지고 자원이 비효율적으로 사용될 가능성이 높다.
블랙박스 '망각' 방식 도입
모델 접근 없이 불필요 정보를 단계적 제거
연구진은 AI 모델 내부 과정에 직접 접근하지 않고도 정보의 잊음을 유도하는 '블랙박스 망각(black-box forgetting)' 방식을 제안했다. 이 방법은 AI 모델에 반복적으로 제공되는 입력 프롬프트를 수정함으로써 특정 클래스를 점차적으로 잊도록 설계되었다. 특히 CLIP이라는 시각-언어 모델을 대상으로 '공분산 행렬 적응 진화전략(CMA-ES)'을 활용해 분류 억제를 최적화했다.
대규모 적용 위한 최적화 전략
'잠재 컨텍스트 공유' 기법으로 연산 간소화
기존 방법의 스케일 확장에 어려움을 겪던 연구진은 '잠재 컨텍스트 공유(latent context sharing)'라는 새로운 매개변수화 전략을 개발했다. 이 접근법은 정보를 더 작은 단위로 나누어 망각 과정을 단순화시키며, 대규모 활용에도 계산 효율성을 확보할 수 있도록 돕는다.
초기 실험에서 높은 성과 확보
CLIP 모델, 목표 클래스 40% 이상 '망각'
벤치마크 테스트 결과, CLIP 모델이 목표로 한 데이터 클래스의 약 40%를 잊도록 만드는 데 성공했다. 이는 모델 내부 구조에 대한 접근 없이 블랙박스 비전-언어 모델에서 선택적 망각을 구현한 최초의 사례로, 차세대 AI 기술의 가능성을 보여준다.
실생활 적용과 프라이버시 강화
특화된 작업에서 효율성 증대 기대
이 기술은 특정 작업에서 불필요한 데이터를 제거함으로써 효율성을 높이고, 이미지 생성 시 유해 콘텐츠 생성 위험을 줄이는 데 유용할 것으로 보인다. 특히 의료나 금융과 같은 민감한 데이터를 다루는 산업에서 알고리즘이 개인 정보 보호를 더 효과적으로 관리할 수 있는 잠재력을 제공한다.
AI 기술의 새로운 발전 전망
적응성과 프라이버시 해결 방안 제시
블랙박스 망각 기술은 AI 모델이 보다 적응력 있고 효율적으로 진화할 수 있는 방향을 제시하는 혁신적인 접근법이다. 동시에, 프라이버시 문제를 해결하는 데 기여하며 AI 활용이 늘어나는 현대 사회에서 중요한 기술적 진보로 평가받고 있다.