메타, 유럽 이용자 게시물로 AI 훈련 계획 발표
유럽 사용자 맞춤형 AI 개발 위한 데이터 수집 본격화
메타(Meta)가 유럽연합(EU) 성인 사용자가 공유한 공개 게시물과 댓글 등의 콘텐츠를 자사 인공지능(AI) 모델 훈련에 활용하겠다는 방침을 공식 발표했다. 이번 결정은 유럽 내 메타 AI 기능 출시 이후 본격적인 현지화 추진의 일환으로, 다양한 유럽 문화와 언어적 특성을 반영한 AI 개발을 목표로 한다.
성인 공개 콘텐츠 활용… 비공개 메시지 및 미성년자 데이터 제외
메타는 유럽 성인 사용자가 페이스북, 인스타그램, 왓츠앱, 메신저 등 자사 플랫폼에서 올린 공개 게시물과 댓글을 AI 학습에 사용하겠다고 밝혔다. 또, 사용자가 메타 AI와 주고받은 질문이나 명령어 등의 상호작용 내용도 AI 성능 개선에 활용된다.
그러나 메타는 일부 데이터는 AI 훈련에 포함되지 않는다고 강조했다. 이용자 간의 비공개 메시지 내용이나, 18세 미만 사용자 계정의 공개 게시물은 수집 대상에서 제외된다.
이용자에게 알림… 데이터 수집에 대한 이의제기 가능
이러한 변화에 따라 이번 주부터 유럽 내 메타 서비스 이용자는 관련 사실을 알리는 알림을 받게 된다. 알림에는 어떤 정보가 수집되는지에 대한 상세 내용과 함께, 이에 동의하지 않을 경우 이의를 제기할 수 있는 온라인 양식 링크도 함께 제공된다.
"유럽 문화 반영한 AI 개발 필요" 강조
메타는 유럽 이용자의 언어, 방언, 지역적 유행어, 유머 등을 효과적으로 이해하고 반영할 수 있는 AI 시스템을 구축하기 위해 이 같은 접근이 불가피하다고 설명했다.
회사 측은 "유럽인을 위한 AI를 만들기 위해, 유럽인이 공유한 콘텐츠에서 학습하는 것은 핵심"이라며, "보다 투명한 태도를 견지하고 있으며, 관련 기관의 데이터 보호 기준에도 부합한다"고 주장했다.
사용자 데이터 활용, 여전한 논란의 중심
하지만 이번 조치를 두고 우려의 목소리도 제기되고 있다. 첫 번째로는 ‘공개’ 콘텐츠의 범위가 모호하다는 점에서 사용자 동의가 충분히 이뤄졌는지에 대한 의문이 있다. 또한, 이의제기 절차가 실질적으로 작동할 수 있을지에 대한 회의, 그리고 AI 훈련 데이터에서 비롯될 수 있는 편향 문제와 저작권 문제 또한 논란거리다.
AI 모델이 어떤 데이터를 바탕으로 어떤 판단이나 출력을 만들어내는지에 대한 투명성이 확보되지 않았다는 지적도 여전히 존재한다.
사용자 콘텐츠, AI 산업의 핵심 자원으로 부상
이처럼 사용자 생성 콘텐츠(User-Generated Content)가 AI 산업 발전에 있어 중요한 자원으로 인식됨에 따라, 데이터 프라이버시와 정보 제공에 대한 새로운 규범과 논의가 계속 이어질 전망이다. 메타의 이번 사례는 AI 개발사들의 책임 있는 데이터 활용 및 이용자 동의의 중요성을 다시금 상기시킨다.
기자 의견:
메타의 이번 결정은 AI의 향후 발전 방향과 개인정보에 대한 사회적 인식 변화 사이에서 중요한 교차점에 놓여 있는 사례다. 특히 AI의 현지화를 위한 데이터 수집이라는 점에서 설득력이 있으나, 사용자의 동의 과정과 데이터 활용 범위에 대한 투명성이 아직 충분하지 않다는 비판은 무시할 수 없다. 기업의 혁신과 윤리 사이 균형이 그 어느 때보다 중요해진 시점이다.