마이크로소프트, 새로운 생성형 AI 모델 'Phi-4' 발표
성능 개선, 수학 문제 해결 능력 대폭 향상
마이크로소프트가 생성형 AI 모델의 최신작 'Phi-4'를 공개했다. 이 모델은 기존 Phi 시리즈 모델에 비해 여러 면에서 성능이 개선되었으며, 특히 수학 문제 해결 능력에서 두드러진 발전을 보였다. 이러한 개선은 고품질 훈련 데이터의 활용 덕분이라고 회사는 밝혔다.
제한된 접근, 연구 목적으로만 제공
Phi-4는 마이크로소프트의 최신 플랫폼 '애저 AI 파운드리(Azure AI Foundry)'에서 이용 가능하며, 현재로선 연구 목적으로만 제한적인 접근이 허용된다. 사용자는 마이크로소프트 연구 사용 라이선스에 동의해야 한다.
Phi-4는 140억 개의 매개변수를 갖춘 모델로, GPT-4o Mini, Gemini 2.0 Flash, Claude 3.5 Haiku 등 유사한 소형 모델들과 경쟁할 것으로 보인다. 소형 AI 모델은 처리 속도가 빠르고 비용 효율성이 높은 장점이 있어 지속적인 성능 향상이 주목받고 있다.
고품질 데이터와 새로운 훈련 방법이 핵심
마이크로소프트는 Phi-4의 성능 향상이 고품질의 합성 데이터와 인간이 생성한 콘텐츠 데이터의 결합 덕분이라고 설명했다. 또한 추가적인 사후 훈련(post-training) 기법이 적용되었지만, 구체적인 세부 사항은 공개하지 않았다. 현재 AI 연구소들은 합성 데이터 활용 및 사후 훈련 개선에 중점을 두고 연구를 진행 중이다.
Phi 시리즈 개발 주역의 이탈
Phi-4는 마이크로소프트의 AI 부사장으로 활동하며 Phi 시리즈 개발을 주도했던 세바스티앙 부벡(Sébastien Bubeck)이 이탈한 이후 처음으로 공개된 모델이다. 부벡은 올해 10월 오픈AI(OpenAI)로 이직하며 마이크로소프트를 떠났다.
결론
Phi-4는 소형 모델 시장에서 높은 성능과 효율성을 갖춘 차세대 AI 모델로 주목받고 있다. 특히 연구 및 개발 단계에서 합성 데이터와 사후 훈련 기법의 중요성이 더욱 강조되며, AI 기술 발전의 새로운 방향을 제시할 것으로 기대된다.