AI 기업의 데이터 수집 권한과 그 위험성
AI 시스템에서 데이터는 필수적이며, 이를 확보하려는 기업들의 움직임이 활발하다. 데이터 수집을 위해 정부가 AI 기업들에게 '옵트아웃' 방식, 즉 사용자가 명시적으로 거부하지 않는 한 데이터를 수집할 수 있는 권한을 허용하는 방향으로 논의 중이다. 이 방식은 특정 개인이나 조직이 자신의 데이터 수집을 거부하지 않는 한 AI 기업들이 데이터를 활용할 수 있게 한다.
AI 발전의 물질: 데이터와 에너지
AI 기술의 발전은 빠르고 광범위하다. 주간 2억 명이 접속하는 ChatGPT뿐만 아니라 다양한 AI 시스템이 우리의 일상에 깊숙이 들어왔다. 이런 AI 시스템들은 두 가지 주요 요소가 필요하다: 에너지와 데이터. AI 기업들은 에너지를 충족시키기 위해 심지어 원자력 발전소까지 구입하는 행보를 보인다. 데이터는 AI가 사람들의 상호작용을 모방하게 하는 중요한 요소이다.
AI 기업의 데이터 욕구
AI의 발전은 데이터 활용에 큰 의존을 두고 있으며, 연구에 따르면 2026년까지 ChatGPT와 같은 대규모 언어 모델이 사용할 수 있는 데이터가 부족해질 전망이다. 때문에 AI 기업들은 콘텐츠의 라이선스 계약을 통해 필요한 데이터를 확보하려 하고 있다. 그러나 이는 마찰을 불러일으키고, '빠르게 움직이고 부수라'는 철학을 가진 IT 업계에 맞지 않는다.
데이터 수집 방식의 변화와 그 영향
기업들은 '옵트아웃' 방식으로 전환하려 하고 있다. 이를 통해 모든 콘텐츠가 AI 학습 데이터로 사용될 수 있도록 하려는 것이다. 예를 들어, Elon Musk의 AI 모델 개발을 위한 데이터 수집에 있어 X는 이용약관 변경을 시작했다. Meta도 비슷한 방식의 변경을 시행하고 있다.
기업과 정부의 상충된 이해관계
AI 기업은 사용자의 콘텐츠를 AI 학습에 활용하고자 하며, 많은 사용자가 자신의 콘텐츠가 AI에 사용되기를 원하지 않을 경우 AI 혁신이 둔화될 것을 우려한다. 정부 입장에서는 거대 기술 기업들이 국가에 투자하는 유인을 주기 위한 방안으로 해당 데이터를 허용하는 것을 고려하고 있다. 이런 맥락에서 '옵트아웃' 방식을 지지하는 로비 활동이 활발하다.
AI 혁신의 경제적 이익을 놓치고 싶지 않은 정부는 기술 발전과 국가 경쟁력을 고려하면서 최적의 정책을 모색해야 할 필요가 있다. 그러나 이는 개인의 창작물과 데이터가 무분별하게 수집되는 부작용을 초래할 수 있다. 장기적인 관점에서 바라본다면, AI 기업들이 직접 데이터를 구매하는 것이 개인의 권리 보호와 더불어 지속 가능성을 보장하는 방법일 것이다.
출처 : Here’s the deal: AI giants get to grab all your data unless you say they can’t. Fancy that? No, neither do I | Chris Stokel-Walker