유럽, 디지털 주권 강화 위해 오픈소스 LLM 개발 추진
유럽연합(EU)이 디지털 주권 확보를 위한 새로운 프로젝트를 추진한다. 유럽 각국의 언어를 포괄하는 오픈소스 대규모 언어 모델(LLM)을 개발하는 'OpenEuroLLM' 프로젝트가 본격적으로 시작된 것이다.
OpenEuroLLM, 20개 기관 협력해 추진
이 프로젝트는 체코 찰스 대학교의 얀 하지크(Jan Hajič)와 핀란드 AI 기업 실로 AI(Silo AI)의 피터 사를린(Peter Sarlin)이 공동 주도하며, 약 20개의 기관이 참여한다. 이번 추진은 유럽 내에서 디지털 인프라를 자체적으로 구축하려는 목표와 맞닿아 있다.
이미 클라우드 기업들이 데이터 거주성을 보장하는 현지 인프라에 투자하는 가운데, EU도 자체적인 디지털 역량 강화를 위해 110억 달러 규모의 독자적 위성 군집 개발을 진행하는 등 다양한 시도를 이어가고 있다.
프로젝트 예산 3,740만 유로… 글로벌 AI 기업 대비 부족
OpenEuroLLM 프로젝트의 예산은 총 3,740만 유로(약 540억 원)로 책정됐으며, 이 중 2,000만 유로는 EU의 ‘디지털 유럽 프로그램(Digital Europe Programme)’에서 지원받는다. 그러나 이는 구글, 마이크로소프트 등 글로벌 AI 기업들이 투자하는 금액과 비교하면 상당히 적은 수준이다.
이번 프로젝트에는 여러 유럽 국가의 유로HPC(EuroHPC) 슈퍼컴퓨터 센터도 참여하며, 이는 70억 유로 규모의 유로HPC 이니셔티브의 일부로 진행된다.
다수의 참여 기관… 효율성 문제 제기돼
그러나 프로젝트의 성공 가능성을 두고 일부 전문가들은 우려의 시선을 보내고 있다. AI 개발 경험이 있는 플라이어스(Pleias)의 아나스타샤 스타센코(Anastasia Stasenko)는 "소규모 집단이 집중적으로 연구할 때 더 효과적인 결과를 얻는다"며, 이번 프로젝트가 지나치게 많은 기관이 참여해 비효율적일 수 있다고 지적했다.
다언어·분야별 최적화 LLM 개발 목표
OpenEuroLLM의 목표는 EU 내 다양한 언어와 문화적 특성을 반영한 기초 언어 모델을 만드는 것이다. 이를 위해 범용 다국어 LLM을 구축하는 동시에, 특정 분야에 필요한 경량화된 모델도 개발할 예정이다.
데이터 활용 방법은 아직 최종 확정되지 않았으나, 하지크가 주도했던 이전 HPLT 프로젝트에서 구축된 데이터셋 및 모델을 기반으로 발전시킬 계획이다.
오픈소스 원칙 준수, 유럽 AI 규제와 조화 필요
OpenEuroLLM 프로젝트가 내세우는 핵심 원칙 중 하나는 ‘오픈소스’다. 그러나 AI의 오픈소스 정의를 명확히 규정하고 EU의 AI 규제와 부합시키는 과정이 도전 과제가 될 것으로 보인다.
또한, 유럽에서 진행 중인 또 다른 오픈소스 LLM 프로젝트인 'EuroLLM'과의 관계 설정 및 자원 배분 문제도 고려해야 할 요소로 지목되고 있다.
유럽은 자체 AI 모델 개발할 수 있을까?
OpenEuroLLM 프로젝트는 글로벌 AI 시장에서 경쟁력을 확보하는 것보다, 유럽의 디지털 주권을 확립하고 안정적인 AI 인프라를 구축하는 데 의미를 두고 있다.
그러나 제한된 예산과 복잡한 협력 구조로 인해 실질적인 성과를 내는 것이 쉽지 않을 수도 있다. 이번 프로젝트가 유럽 특화 AI 생태계를 조성하는 데 어느 정도 영향을 미칠지 지켜볼 필요가 있다.
의견
유럽은 오픈소스 AI 개발을 통해 글로벌 AI 산업에 대한 의존도를 줄이고, 디지털 주권을 확보하려 하고 있다. 하지만 상대적으로 적은 예산과 다수 기관이 참여하는 형태로 인해 연구 효율성에 대한 우려가 크다.
유럽 내 AI 규제와 오픈소스 원칙을 함께 충족해야 한다는 점도 해결해야 할 과제가 될 것이다. 실제로 경쟁력 있는 AI 모델을 생산할 수 있을지가 관건이며, 이를 통해 유럽이 독자적 디지털 역량을 갖출 수 있을지 지속적인 모니터링이 필요하다.