언어 따라 달라지는 AI 응답, 왜 그럴까?
인공지능(AI)의 응답 내용이 사용하는 언어에 따라 달라질 수 있다는 연구 결과가 발표됐다. 특히 정치적으로 민감한 주제에 대한 AI의 반응이 언어마다 달라지는 현상은 AI 모델의 설계 및 훈련 과정에서 비롯된 것이라는 분석이 제기되고 있다.
중국 AI 모델, 민감한 질문 대부분 거절
중국의 AI 연구소에서 개발한 AI 모델들은 정치적으로 논란이 될 수 있는 질문에 대해 엄격한 검열 기준을 따르는 것으로 나타났다. 중국에서는 2023년 제정된 법률에 따라, AI가 "국가 통합이나 사회적 조화를 해치는" 콘텐츠를 생성하는 것이 금지돼 있다. 실제로 한 연구에서는 DeepSeek의 R1 모델이 정치적 질문의 85%에 대해 아무런 응답도 하지 않았다고 밝혀졌다.
동일한 질문, 언어에 따라 응답 달라
흥미로운 점은 AI의 응답 경향은 어떤 언어로 질문하느냐에 따라 크게 달라진다는 것이다. 개발자 xlr8harder가 만든 테스트 도구를 활용한 실험에서는, 동일한 질문을 영어와 중국어로 했을 때 반응이 상이한 것으로 나타났다. 심지어 미국에서 개발된 AI 모델조차도 중국 정부를 비판하는 내용에 대해 영어 질문에는 응답하면서, 중국어 질문에는 답변을 거부하는 경향이 있었다.
Alibaba AI 모델, 중국어엔 더 민감
대표적으로 Alibaba의 대형 언어 모델 ‘Qwen 2.5 72B’는 영어에서는 사용자 요청에 적극 응답했지만, 중국어로 입력된 정치적 질문의 경우에는 절반 정도만 답변을 제공했다. 더욱이 DeepSeek의 최신 모델인 ‘R1 1776’은 중국어로 된 민감한 질문에 대해 많은 수를 거부한 것으로 드러났다.
데이터 편향이 원인일 수도
전문가들은 이러한 언어별 응답 차이가 단순한 기술적 오류가 아닌, AI 훈련 과정에서의 데이터 편향 문제와 관련되어 있을 수 있다고 지적한다. 특히 중국어로 된 정치적 비판 데이터가 상대적으로 부족하기 때문에, AI가 학습한 내용도 제한적일 수밖에 없다는 것이다. 이는 일종의 ‘일반화 실패’로, 특정 언어권의 문화적 맥락을 충분히 이해하지 못하는 결과를 초래할 수 있다.
문화적 맥락 반영 미흡한 AI 훈련, 신중 접근 필요
AI 모델이 다양한 언어와 문화적 맥락을 올바르게 반영하려면, 훈련 데이터의 품질과 균형이 매우 중요하다. 하지만 현실적으로 정치적 제한이 존재하거나 민감한 주제에 대한 데이터가 부족할 경우, 공정성이나 표현의 자유 측면에서 AI의 응답이 왜곡될 가능성도 늘 존재한다.
AI가 단순히 정보만 제공하는 도구를 넘어 사회적 역할까지 확대될수록, 언어·문화·정치적 맥락까지 고려한 개발과 검토가 필수적이다. 사용자의 질문에 대한 응답이 어느 언어로 이루어졌는지에 따라 달라질 수 있다는 점은, AI 관련 정책과 기술 개발에 있어 중요한 시사점을 던진다.
📝 개인 의견
이 연구는 AI 기술이 중립적 도구가 아닌, 데이터와 정책, 언어권 등의 영향을 깊이 받는 ‘문화적 산물’임을 보여준다. 다양한 언어와 문화권에서 공정하고 일관된 AI 응답을 제공하려면, 특정 가치관이나 정치적 규율에 좌우되지 않는 더욱 투명하고 다각적인 접근이 요구된다. 이는 장기적으로 AI의 신뢰성과 글로벌 수용에 있어 핵심 요소가 될 것이다.