중국 AI 기업의 데이터 활용 의혹, MS와 OpenAI 조사 착수
OpenAI API 통해 데이터 대규모 유출?
마이크로소프트(Microsoft)가 중국 AI 기업인 DeepSeek이 OpenAI의 애플리케이션 프로그래밍 인터페이스(API)를 부적절하게 활용했을 가능성을 조사 중이다. DeepSeek은 2024년 말 OpenAI API를 통해 대규모 데이터를 수집, 이를 바탕으로 자신들의 'R1 추론 모델'을 개발했다는 의혹을 받고 있다.
오픈AI의 최대 주주인 Microsoft는 이러한 이상 징후를 포착하고 OpenAI에 즉각 알린 것으로 전해졌다.
API 사용 규칙 위반 가능성
OpenAI는 서비스 약관을 통해 사용자가 AI 모델의 출력물을 새로운 모델 학습에 이용하거나 경쟁 모델을 개발하는 것을 명확히 금지하고 있다. 또 데이터의 자동 추출 방식 또한 제한하고 있어 이번 사건이 약관 위반에 해당될 가능성이 크다.
수사 과정에서는 DeepSeek이 '딥러닝 디스틸레이션(distillation)'이라는 기술을 사용했는지가 주요 쟁점이 되고 있다. 이는 기존 AI 모델에서 지식을 추출하는 방식으로, OpenAI API를 광범위하게 통해 데이터를 수집했다면 OpenAI의 요청 속도 제한(rate limit)을 우회했을 가능성도 제기된다.
법적 논란 가능성 제기
만약 DeepSeek이 OpenAI의 API를 악용해 대규모 데이터를 불법적으로 활용했다는 사실이 밝혀질 경우, 이는 법적 논란으로 확대될 가능성이 있다. 특히, API의 대량 호출이나 데이터 추출은 기술적으로 복잡한 문제지만, 의도적인 시도가 있었다면 심각한 계약 위반으로 해석될 수 있다.
내 생각에, 이 사례는 AI 개발 경쟁이 심화됨에 따라 기술과 법률적 기준 사이에서 발생할 수 있는 충돌을 보여준다. 더불어 API 사용 관련 정책이 얼마나 철저히 이행되고 위반 가능성을 차단할 수 있는지 기술적, 법적 개선이 필요하다는 점도 시사한다. 이를 통해 향후 AI 기술의 윤리적 개발과 이용 방향에 초점이 맞춰져야 할 것이다.