AI 응답 평가 방식 변경에 따른 논란
구글의 개발 중인 AI 시스템 'Gemini'가 최근 업데이트된 평가 지침으로 논란을 일으키고 있습니다. 이 변화는 AI가 생성한 응답을 계약 직원들이 자신들의 전문 지식을 초과한 주제라도 평가하도록 요구하면서 시작되었습니다. 특히 의료와 같은 민감한 주제에서 AI의 신뢰도와 정보 정확성에 대한 우려가 제기되고 있습니다.
전문가 부족 상황에서도 모든 주제 평가 의무화
기존에는 계약 직원들에게 자신의 전문 분야 밖의 주제는 건너뛰는 것이 허용되었습니다. 그러나 새롭게 변경된 지침은 모든 주제를 평가할 것을 강제하며, 전문성 부족 시 이를 명시하라는 조건을 추가했습니다. 이러한 변화는 희귀 질환과 같은 세부적이고 전문적인 주제에 대해 AI가 제공하는 정보의 정확성 문제를 더 부각시키고 있습니다.
평가 제한 상황: 정보 부족 및 유해성 기준
업데이트된 정책에 따라 계약 직원들은 정보를 얻을 수 없거나, 내용이 유해하다고 판단될 경우에만 평가를 건너뛸 수 있습니다. 하지만 일부 계약자들은 특정 주제를 생략할 수 없는 상황이 결과적으로 AI 응답의 정확도를 낮출 수 있다는 우려를 표명하고 있습니다.
구글의 입장: AI 정확도 개선 중
이와 관련하여 구글 측은 ‘Gemini’의 사실적 정확성을 지속적으로 개선 중이라고 밝혔습니다. 또한 계약 직원들의 피드백이 AI의 전반적인 성능을 측정하는 데 중요한 역할을 하고 있음을 강조했습니다. 하지만 민감한 전문 분야에서의 평가 방식에 대한 논란은 여전히 진행 중입니다.