메타, 저작권 침해 소송에 휘말리다
자사 AI 모델 훈련에 저작권 보호 자료 사용 의혹
메타(Meta)가 AI 모델 '라마(Llama)'의 훈련 데이터셋에 저작권으로 보호된 자료를 사용한 혐의로 소송을 당했다. 이번 사건은 '카드레이 대 메타(Kadrey v. Meta)'로 불리며, 제기된 소송에서는 마크 저커버그(Mark Zuckerberg) CEO가 무단 복제된 전자책과 기사들을 훈련 데이터로 이용하는 것을 승인했다는 주장이 포함되어 있다. 메타 측은 '공정 이용(fair use)' 원칙에 근거하여 자료 사용이 합법적이라고 주장하고 있으나, 논란은 계속되고 있다.
내부 문서, 논란의 중심에 서다
LibGen 데이터셋 사용 승인, 내부 이슈로 확대
공개된 법원 문서에 따르면, 베스트셀러 작가 사라 실버맨(Sarah Silverman)과 타-네히시 코츠(Ta-Nehisi Coates) 등 원고들은 메타가 내부적으로 LibGen이라는 데이터셋 사용을 승인했음을 확인했다고 주장했다. LibGen은 저작권이 있는 자료들을 무료로 제공하는 불법 도서관 사이트로, 여러 차례 저작권 침해 소송을 당한 바 있다.
메타 내부에서 LibGen 사용에 대한 우려가 제기되었지만, 해당 문제는 저커버그에게 보고되었고 결국 사용 승인이 내려졌다는 진술이 나오면서 논란이 증폭됐다.
저작권 정보 제거와 불법 파일 공유 의혹
데이터셋 정제 과정에서 추가 불법 행위 주장
법원 문서에 따르면, 메타는 AI 훈련에 사용된 자료에서 저작권 정보를 제거하기 위해 자체적으로 스크립트를 작성한 정황이 드러났다. 심지어 일부 메타 엔지니어들이 LibGen에서 자료를 다운로드(토렌트 방식)받는 행위도 이루어진 것으로 전해진다. 이러한 과정은 단순히 활용을 넘어 불법 자료의 배포(facilitating distribution)까지 이어졌다는 강력한 주장을 낳고 있다.
메타 내부에서는 이러한 과정이 불법 행위에 해당할 수 있다는 우려도 있었으나, 메타의 생성형 AI 부문 책임자가 이를 허용한 것으로 진술됐다.
법적 공방 전망과 쟁점
'공정 이용' 논란과 신뢰성 문제
현재 소송은 메타의 초기 라마 모델에 초점이 맞춰져 있으며, '공정 이용' 논리가 재판부에 수용될 경우 메타에 유리한 판결이 날 가능성도 있다. 하지만 법원은 메타가 공정 이용과 관련 없는 정보를 지나치게 비공개로 하려 한 점에 대해 비판했다. 이는 기업의 명예 보호 목적이 클 수 있다는 관측을 불러일으키고 있다.
기사에 대한 의견
이번 사안을 통해 대형 기술 기업들이 AI 기술 개발 과정에서 저작권 문제를 어떻게 다루고 있는지 깊이 살펴볼 필요가 있다. AI 기술의 발전이 시대적 흐름인 만큼 혁신과 법적 공존 사이의 균형을 찾는 것이 중요하다. 메타가 현재 논란 속에서도 공정 이용 주장을 내포하고 있지만, 사회적 신뢰 및 비판이 이를 어떻게 변화시킬지 주목된다. AI의 윤리적 사용은 앞으로도 기술 산업의 핵심 쟁점으로 남을 것이다.