메타(Meta), Llama 3로 OpenAI GPT-4 뛰어넘기 노린다
메타는 자사의 차세대 인공지능(AI) 모델 Llama 3 개발에 있어 OpenAI의 GPT-4를 능가하는 것을 목표로 하고 있다. 이러한 내부 목표는 최근 법원 제출 문서에서 공개된 메타 내부 메시지를 통해 밝혀졌다. 메타의 생성형 AI 부문 부사장인 아흐마드 알-달레(Ahmad Al-Dahle)는 GPT-4와 경쟁할 수 있는 모델을 만드는 것이 목표라며, 이를 위해 충분한 GPU 자원을 확보하고 있다고 강조했다.
## '엑소더스'를 넘어서: 주요 경쟁 상대는 구글과 OpenAI
메타는 경쟁 우위를 확보하기 위해 Anthropic과 OpenAI와 같은 비공개 모델 개발 기업들을 주요 비교 대상으로 삼고 있다. 한편 프랑스 기반의 AI 스타트업 Mistral에 대해서는 상대적으로 낮은 평가를 하며 "메타의 수준에는 못 미친다"고 언급했다.
경쟁적인 문화가 두드러지는 메타 내부에서는 Llama 3의 훈련을 위한 고품질 데이터 확보의 중요성이 강조되고 있다. Llama 2의 데이터 구성이 다소 부족했던 과거 사례를 지적하며, 이번에는 데이터 출처의 질을 향상시키는 데 초점을 맞추고 있다. 특히 LibGen과 같은 데이터세트 활용에 대한 논의도 이루어졌는데, 이 데이터는 저명한 저작권 있는 출판물들을 포함하고 있어 추가적으로 논란의 여지를 낳고 있다.
## 데이터 윤리성 문제 속에서도 목표는 '정상'
마크 저커버그 메타 CEO는 OpenAI, 구글 등 폐쇄형 모델들과의 성능 격차를 줄이는 것이 목표라고 공언한 바 있다. 내부적으로는 이러한 압박감이 명확히 드러났으며, 메타는 데이터 품질 개선을 통해 Llama 시리즈의 성능을 더욱 향상시킬 계획을 세우고 있다.
Llama 3는 2024년 4월 공개되었을 때, 비공개 AI 모델들과 비교해 경쟁력이 있다고 평가되었다. 특히 공개된 AI 모델 가운데에서는 높은 성과를 보여주었다고 전해진다. 그러나 해당 모델의 학습에 사용된 데이터세트의 합법성이 여러 소송 속에서 논란이 되고 있는 상황이다.
개인적인 의견:
메타가 경쟁사의 AI 모델들을 능가하는 목표를 제시하며 공격적인 움직임을 보이는 것은 흥미롭다. 하지만 AI 학습에 사용되는 데이터의 윤리성과 합법성이 더욱 중요시되는 시대에, 메타가 이 부분에서 가벼운 태도를 보일 경우 오히려 브랜드 신뢰도와 평판에 부정적인 영향을 미칠 수 있다. 메타의 AI 연구에서 단순히 성능 경쟁을 넘어서 지속 가능한 모델 개발 방식을 확립하는 노력이 요구된다. AI의 신뢰성과 공정성 확보가 지금처럼 중요한 시기에, 메타가 어떤 결정을 내릴지 주목된다.