바이두, 차세대 AI 모델 ERNIE 4.5와 ERNIE X1 공개
– 멀티모달 및 추론 기능 강화
중국의 대표 기술 기업 바이두(Baidu)가 차세대 인공지능(AI) 모델인 ERNIE 4.5와 ERNIE X1을 공개했다. 두 모델은 개인 사용자를 대상으로 ERNIE 봇을 통해 무료로 제공되며, 바이두 검색과 웬샤오얀(Wenxiaoyan) 앱 등 다양한 자사 서비스에 통합될 예정이다.
ERNIE 4.5, 멀티모달 이해력 대폭 향상
– 텍스트, 이미지, 영상까지 통합 분석
ERNIE 4.5는 바이두가 선보인 차세대 멀티모달 기반 AI 모델로, 텍스트뿐만 아니라 이미지, 오디오, 영상 등 다양한 콘텐츠를 종합적으로 인식하고 해석할 수 있는 기능이 특징이다. 특히 인터넷 밈(Meme)이나 풍자 만화와 같은 복잡한 콘텐츠까지도 이해 가능하다는 점에서 주목받고 있다.
또한 언어 이해와 생성, 추론, 기억 기능이 강화됐으며, 허위 정보 생성 방지(hallucination prevention), 논리적 추론, 코딩 능력 등에서도 개선이 이뤄졌다. 바이두는 이 모델이 OpenAI의 GPT-4.5보다 여러 평가 기준에서 앞선 성능을 보이며, 가격은 GPT-4.5 대비 1% 수준으로 공급된다고 밝혔다.
이 같은 성능 향상은 FlashMask 동적 마스킹, 이기종 멀티모달 전문가 혼합 방식, 시공간 압축 표현 기술, 지식 중심의 학습 데이터 구성, 자체 피드백 강화를 통한 후학습 기술 등 여러 고급 기술이 결합된 결과다.
ERNIE X1, 고차원 추론 AI 모델
– 계획 수립·반성·도구 활용 능력 특화
함께 공개된 또 다른 모델 ERNIE X1은 깊이 있는 사고와 추론에 초점을 맞춘 AI로, 높은 수준의 이해력과 계획 수립, 자기 반성, 진화 능력을 갖췄다. 중국어 기반 지식 문답, 문학 창작, 복잡한 계산 영역에 특화돼 있으며, AI 이미지 생성, 웹페이지 읽기, 고급 검색 및 문서 질의응답 기능까지 포함돼 있다.
2025년, AI 대모델 발전의 전환점 될 것
– 바이두, 인프라 투자 지속
바이두는 "2025년이 대형 언어 모델과 관련 기술 발전에 있어 중대한 전환점이 될 것"이라고 전망하며, AI 역량 강화를 위해 데이터 센터 및 클라우드 인프라 투자도 지속할 계획을 밝혔다.
개인적인 의견
바이두의 ERNIE 4.5와 ERNIE X1 발표는 글로벌 AI 경쟁 구도에서 중국의 입지를 강화하겠다는 의지를 분명히 보여준다. 특히 ERNIE 4.5가 멀티모달 성능에서 GPT-4.5를 능가한다고 주장하는 부분은 향후 성능 비교 테스트에서도 주요 관심사가 될 것이다. 가격 경쟁력까지 갖춘 만큼, AI 기술의 대중화 측면에서도 긍정적인 파급력이 예상된다.