ChatGPT 음성 모드 개선…더 자연스러운 대화 가능
오픈AI(OpenAI)가 자사 인공지능(AI) 음성 기능인 '고급 음성 모드(Advanced Voice Mode)'에 대한 업데이트를 발표했다. 이번 업데이트는 AI와 사용자 간의 실시간 대화를 보다 인간처럼 자연스럽게 하고, 중간에 끼어들지 않도록 설계되었다.
사용자 발언 끊김 줄여…자연스러운 호흡 반영
기존 음성 기반 AI 비서의 가장 큰 문제점 중 하나는 사용자가 말을 멈추거나 생각을 정리할 때 AI가 이를 대화 종료로 오인해 대화를 방해하는 것이었다. 이번 업데이트에서는 이러한 불편을 줄이기 위해, 사용자들이 말을 멈추더라도 AI가 대화를 끊지 않고 기다릴 수 있도록 반응 방식을 조정했다.
무료 이용자들도 이번 개선된 고급 음성 모드를 사용할 수 있으며, 유료 이용자들에게는 한층 더 매끄럽고 개성 있는 대화 경험이 제공된다. 여기에는 ChatGPT Plus, Teams, Edu, Business, Pro 요금제가 포함된다.
AI 목소리도 ‘성격’ 갖춘다
오픈AI에 따르면, 유료 사용자용 음성 모드는 기존보다 더욱 ‘직관적이고, 친근하며, 간결하고 구체적인’ 응답을 제공하도록 업그레이드되었다. 또한 감정 표현이나 대화 흐름도 향상돼, 마치 실제 사람과 이야기하는 것 같은 대화 경험을 전달한다. 일부 대답에서는 창의적인 표현도 더해져 AI ‘비서’보다는 ‘대화 파트너’에 가까운 분위기를 띤다.
AI 음성 경쟁 치열…아마존 등도 각축 중
이번 개선은 AI 음성 비서 시장의 경쟁이 치열해지고 있는 시점에서 나왔다. 오픈AI 외에도 아마존을 비롯한 주요 빅테크 기업 및 스타트업들이 보다 정교한 음성 기반 AI 기술 개발에 박차를 가하고 있어, 향후 이 분야의 발전 속도는 더욱 빨라질 것으로 보인다.
기자 의견:
이번 업데이트는 단순한 기술 개선이 아니라 인공지능이 인간과 감정적으로 교류하는 방향으로 나아가는 중요한 한 걸음이라고 본다. 특히 AI가 사용자의 일시적인 침묵을 ‘생각의 흔적’으로 인식하고 이를 존중하는 방식으로의 변화는, 사람과 기계 간 대화의 질적 전환을 상징한다. 앞으로는 ‘대화형 AI’에서 더 나아가 ‘이해하는 AI’ 시대로의 전환이 더욱 기대된다.