메타, 새로운 AI 모델 '라마 4' 공개…성능·효율 동시 강화
메타(Meta)는 새로운 AI 모델 시리즈 '라마 4(Llama 4)'를 공개하며, AI 기술의 진보를 다시 한 번 알렸다. 이번 시리즈는 세 가지 모델인 '라마 4 스카우트(Scout)', '라마 4 매버릭(Maverick)', 그리고 아직 개발 중인 '라마 4 비히모스(Behemoth)'로 구성되어 있다. 이들 모델은 대규모의 이름 없는 텍스트, 이미지, 영상 데이터를 학습해 시각 정보 처리 능력을 대폭 향상시켰다.
중국발 오픈모델 자극에 속도 높인 개발
라마 4 개발이 빠르게 진행된 배경에는 중국의 AI 연구소 딥시크(DeepSeek)가 공개한 오픈모델의 영향이 크다. 딥시크 모델은 메타의 이전 주력 모델들과 동등하거나 더 나은 성능을 보여 메타에 경쟁심을 불러일으켰고, 라마 4 개발에 박차를 가하게 했다.
스카우트·매버릭은 공개…비히모스는 아직 훈련 중
라마 4 중 '스카우트'와 '매버릭'은 Llama.com을 통해 또는 제휴를 거쳐 사용할 수 있다. 두 모델은 각각 특정 용도에 최적화되어 있다. 반면, '비히모스'는 아직 훈련 단계에 있으며 정식 공개 일정은 미정이다.
현재 메타는 '메타 AI'라는 자사 AI 어시스턴트 서비스에 라마 4를 탑재해 40개국에서 제공 중이다. 다만, 이미지와 영상을 포함하는 멀티모달 기능은 현재 영어를 사용하는 미국 사용자에게만 제공된다.
새로운 구조 '전문가 혼합(MoE)' 도입…효율 극대화
라마 4 시리즈에는 '전문가 혼합(Mixture of Experts·MoE)' 구조가 처음으로 적용되어, 계산 효율성을 크게 개선했다. 예컨대, 매버릭 모델은 총 4000억 개의 매개변수 중에서 실제 작동 중에는 170억 개만 활성화되는 구조다. 이는 128개의 전문가 네트워크 중 필요한 일부만 사용하도록 하여 자원을 절약하면서 성능은 유지할 수 있게 한다. 스카우트 역시 유사한 방식으로 작동하며, 총 매개변수는 1090억 개, 활성 상태는 170억 개다.
매버릭은 대화형 AI, 스카우트는 문서 요약 전문가
매버릭은 챗봇 및 AI 어시스턴트 용으로 설계됐으며, 오픈AI의 GPT-4 및 구글의 제미나이 2.0과 비교해도 손색없는 성능을 보이는 것으로 전해진다. 이에 비해 스카우트는 문서 요약, 복잡한 코드 해석 등의 작업에 뛰어나며, 최대 1천만 토큰의 길이를 처리할 수 있는 넓은 문맥창(context window)을 자랑한다.
비히모스, 엄청난 계산 요구…STEM 능력 시험에서는 최고 성능 기대
가장 관심을 모으는 모델은 아직 훈련 중인 '비히모스'다. 활성 매개변수만 2880억 개, 전체 매개변수는 무려 2조 개에 달해 엄청난 계산 자원을 필요로 할 것으로 보인다. 내외부 테스트 결과, 수학·과학 등 이공계 중심의 평가에서 기존 유명 모델들을 능가할 가능성이 높은 것으로 평가되고 있다.
민감한 이슈도 회피하지 않도록 조정…중립성 강화
메타는 라마 4 모델들이 정치적 등 민감한 질문에 대해 일관되게 응답을 피하거나 편향된 답변을 하는 것을 방지하기 위한 조정 작업도 병행 중이다. 다양한 관점을 균형 있게 반영하도록 설계해, AI가 특정 입장을 강화하지 않도록 했다.
기자 의견
메타의 라마 4 발표는 AI 모델의 성능을 넘어서 기술적 효율성과 사회적 책임을 고려한 진화된 접근으로 보인다. 특히 MoE 구조는 연산 자원의 사용을 절감하면서도 모델의 정밀도와 응답 성능을 유지하는 데 기여할 것으로 기대된다. 다만, 비히모스처럼 거대한 모델의 실제 적용 가능성과 비용 대비 효과성에 대해선 향후 추가적인 검증이 필요하다. 메타의 기술력이 점차 오픈AI나 구글과의 기술 격차를 줄여나가고 있는 점도 주목된다.