OpenAI, GPT-4.5 모델 공개…'설득' 능력 대폭 향상
OpenAI가 차세대 AI 모델인 GPT-4.5를 공식 발표했다. 이 모델은 특히 다른 AI를 설득하거나 금전적 지원을 이끌어내는 능력이 뛰어난 것으로 평가되며, 다양한 테스트를 통해 그 성능이 입증됐다.
GPT-4o를 설득해 가상 기부 유도 성공
OpenAI가 발표한 백서에 따르면, GPT-4.5는 ‘설득’과 관련된 여러 벤치마크 테스트에서 우수한 성과를 기록했다. 특히 한 실험에서 이 모델은 OpenAI가 개발한 또 다른 모델인 GPT-4o로부터 가상의 기부를 유도하는 데 성공했다.
이전 모델보다 설득력이 뛰어난 것으로 평가된 GPT-4.5는 ‘개인적인 기부 요청’ 전략을 활용해 작은 금액을 요청하는 방식으로 높은 성공률을 기록했다. 이 테스트 결과는 AI의 설득력이 실질적으로 향상되었음을 보여준다.
비밀 코드워드 속이기에서도 우월한 성능
GPT-4.5는 단순한 설득 능력을 넘어 비밀 코드워드를 속이는 실험에서도 뛰어난 성능을 보였다. 기존 모델과 비교했을 때 10%포인트 높은 성공률을 기록하며 AI의 논리적 전략 구사 능력이 더욱 발전했음을 입증했다.
하지만 이러한 능력이 악용될 가능성도 있는 만큼, OpenAI는 GPT-4.5가 허용된 위험 기준을 초과하지 않도록 철저한 안전 조치를 시행하겠다고 밝혔다.
OpenAI "설득력 높은 AI, 안전 조치 강화할 것"
OpenAI는 AI의 설득력이 강화됨에 따라, 잘못된 정보 확산 가능성을 우려하고 있다. 특히 AI가 현실 세계에서 사람들을 효과적으로 설득할 수 있을 경우, 의도하지 않은 부작용이 발생할 수 있다는 점을 고려해 연구 방향을 조정 중이다.
이에 따라 OpenAI는 실제 환경에서 설득 기술이 어떻게 작용하는지 면밀히 분석하고, AI의 오남용 가능성을 차단하기 위한 새로운 안전 프로토콜을 적용할 예정이라고 발표했다.
📝 GPT-4.5의 설득 능력, 기회일까 위험일까?
GPT-4.5는 AI의 설득력과 논리적 사고 능력이 얼마나 발전했는지를 보여주는 흥미로운 사례다. 하지만 AI가 설득 전략을 효과적으로 구사할 경우, 이는 단순한 기술적 혁신을 넘어 윤리적 문제를 초래할 수도 있다.
특히 허위 정보 전파나 사기 목적의 사용 가능성이 제기될 수 있는 만큼, OpenAI가 강조한 안전 조치가 얼마나 효과적으로 작동할지 주목할 필요가 있다. 앞으로 AI의 설득력을 어디까지 허용할 것인지에 대한 규제 논의가 더욱 활발해질 것으로 예상된다.