음성 및 영상 이해를 더한 ChatGPT 업데이트
OpenAI는 최근 ChatGPT에 음성과 비전을 결합한 '고급 음성 모드'를 추가했습니다. 이를 통해 사용자는 단순한 텍스트 입력을 넘어, 음성과 이미지를 활용하여 더 풍부한 상호작용을 할 수 있습니다. 이 기능은 대화형 AI의 맥락 인식 수준을 한층 끌어올리기 위해 설계되었으나, 초기 테스트에서는 몇 가지 신뢰성 문제를 드러냈습니다. 예를 들어, 오토만을 소파로 오인하거나 이미지의 세부사항을 놓치는 사례가 관찰되었습니다.
신뢰성 문제와 잔존하는 한계
새로운 음성 모드는 ChatGPT의 기존 '환각(hallucination)' 현상을 완전히 해결하지는 못했습니다. 데모 과정에서 ChatGPT가 기하학 문제의 삼각형 높이를 잘못 식별한 사례는 AI가 특정 상황에서 신뢰하기 어려울 수 있음을 보여줍니다. 이러한 문제는 영화 Her에서 묘사된 미래형 AI와의 이상적인 수준의 상호작용이 여전히 멀리 있음을 시사합니다.
AI 주요 기업들의 변화와 혁신 노력
OpenAI는 이러한 한계를 해결하기 위해 지속적으로 연구를 진행하고 있는 가운데, 다른 주요 기업들 역시 AI 기술 발전과 새로운 기능 도입에 박차를 가하고 있습니다. 유튜브는 콘텐츠 제작자 도구를 개선했으며, 메타는 AI 기능을 활용한 스마트 글래스 업그레이드를 발표했습니다. 또한, 구글 딥마인드와 앤스로픽도 새로운 AI 도구를 공개하며 경쟁력을 강화하고 있습니다.
앤스로픽과 Pika의 독창적 기술 도입
특히 AI 스타트업 앤스로픽은 Clio라는 시스템을 선보이며 모델 사용 방법에 대한 안전 개선 통찰을 제공합니다. 이와 함께 Pika는 차세대 비디오 생성 모델인 Pika 2를 발표했습니다. 이 모델은 사용자가 제공한 참고 자료를 기반으로 장면을 생성할 수 있는 기능을 제공하며, 비디오 제작의 새로운 가능성을 열고 있습니다.
AI 안전성 평가의 결과와 과제
한편, Future of Life Institute는 'AI 안전성 지수'를 발표하며, 주요 AI 기업들의 안전 관행을 평가했습니다. 그 결과, 전반적으로 많은 기업에서 개선이 필요한 부분이 드러났습니다. 이 중 메타는 가장 낮은 점수를 기록하며, AI 안전성 향상의 필요성을 강조받았습니다.
결론: 여전히 남아있는 과제와 발전 가능성
OpenAI와 주요 AI 기업들은 기술 혁신을 통해 다양한 분야에서 AI 사용성을 높이고자 하고 있습니다. 그러나 신뢰성과 안전성 문제를 해결하는 것이 이들의 가장 큰 과제로 남아 있습니다. AI 기술이 궁극적으로 우리의 삶에 더 깊이 스며들기 위해서는 이러한 문제를 꾸준히 해결하는 것이 중요할 것입니다.