메타, 유네스코와 손잡고 인공지능 언어 데이터 수집
메타(Meta)가 유네스코(UNESCO)와 협력해 인공지능(AI) 개발을 위한 음성 녹음 및 전사 데이터를 수집하는 새로운 프로그램을 시작한다.
다양한 언어 AI 개발 위한 협업 추진
이번에 발표된 '언어 기술 파트너 프로그램(Language Technology Partner Program)'은 10시간 이상의 음성 녹음, 텍스트 문서, 번역 문장을 제공할 협력 기관을 모집한다. 이를 통해 메타의 AI 연구팀은 해당 데이터를 학습해 음성 인식 및 번역 모델에 적용할 예정이다. 프로그램이 완료되면, 이 기술들은 공개 소스로 제공될 계획이다.
현재까지 협력 기관에는 캐나다 누나부트(Nunavut) 정부가 포함됐다. 해당 지역에서는 이누크툿(Inuktut) 언어가 사용되며, 메타는 소외된 언어를 AI에 반영하는 것에 중점을 두고 있다. 이를 통해 유네스코가 추진하는 다양한 문화와 언어를 아우르는 지능형 시스템 구축 노력도 지원할 방침이다.
AI 번역 성능 평가 위한 벤치마크 공개
이와 함께 메타는 오픈소스 기계 번역 벤치마크도 공개했다. 이는 AI 기반 언어 번역 모델의 성능을 평가하기 위한 기준으로, 언어학자들이 제작한 문장들을 포함하고 있다. 현재 7개 언어를 지원하며, AI 플랫폼 허깅페이스(Hugging Face)를 통해 사용자가 직접 기여할 수도 있다.
비영어권 AI 기술 개선 과제 남아
한편, 메타는 비영어권 콘텐츠에 대한 번역 및 검열 기술과 관련해 그동안 여러 비판을 받아왔다. 이에 대해 메타는 기술 개선을 위해 꾸준히 노력하고 있다고 밝혔다.
의견
메타의 AI 연구가 단순한 언어 번역을 넘어 다양한 문화와 언어권을 포괄하는 방향으로 나아간다는 점에서 긍정적으로 평가할 만하다. 특히, 이누크툿과 같은 소외된 언어를 지원하는 노력이 지속된다면, AI 기술이 더욱 포괄적이고 공정한 방향으로 발전할 가능성이 크다. 다만, 비영어권 콘텐츠에 대한 번역 및 검열 기술이 완성도를 높이는 데 여전히 많은 과제가 남아 있는 만큼, 지속적인 개발과 개선이 필요할 것이다.