캘리포니아 AI 기업, 훈련 데이터 공개 의무화
캘리포니아 주지사 개빈 뉴섬은 일요일에 새로운 법안 AB-2013을 서명하여, 생성 AI 시스템을 개발하는 기업들이 사용한 훈련 데이터에 대한 상세 요약을 발표하도록 요구했다. 이 요약에는 데이터의 소유권, 수집 또는 라이센스 방식, 저작권이나 개인정보 포함 여부를 다루어야 한다.
AI 기업들, 새로운 법안에 대한 반응은 미온적
주요 AI 기업 중 대다수가 이 법안에 대한 입장을 밝히지 않았으며, 오직 스테이빌리티, 런웨이, 오픈AI만이 법안을 준수할 의향을 표명했다. 오픈AI는 "우리가 운영하는 지역의 법률에 따라 준수하겠다"고 언급했다. 반면에 일부 기업들은 훈련 데이터의 공개가 경쟁력 저하와 법적 문제를 초래할 수 있다고 우려하고 있다.
훈련 데이터 출처, 기업간 경쟁에서 주요 요소
AI 시스템의 훈련 데이터는 종종 웹에서 수집된다. 과거에는 AI 개발자들이 훈련 데이터 출처를 기술 논문에 상세히 명시했으나, 지금은 경쟁력을 이유로 비공개하는 것이 일반적이다. 이러한 밀폐성은 법적 관리를 피하기 위한 조치일 수도 있다.
훈련 데이터 공개, 법적 문제의 도화선이 될 가능성
현재 훈련 데이터에 대한 소송이 다수 진행 중이며, AB-2013은 이러한 법적 논쟁을 심화시킬 수 있다. 법안은 훈련 데이터 세트의 첫 사용 시점과 데이터 수집 지속 여부 등을 공개하도록 요구한다. AI 기업들은 저작권 침해 및 프라이버시 침해 논란을 우려하며, '공정 사용(fair use)'을 주장하고 있다.
AB-2013의 적용은 2026년 1월까지 유예되며, 캘리포니아 거주자에게 제공되는 시스템에만 해당된다. 이러한 조건 속에서, 기업들은 일정 부분 대응책을 마련하고 있으며, 법의 최종적 영향은 아직 명확하지 않다.
출처 : 원문 보러가기