인공지능으로 억양 바꾸는 기술 등장
크리스프, 인도식 영어를 미국식 영어로 실시간 변환
음성 기술 스타트업 ‘크리스프(Krisp)’가 인공지능(AI)을 활용해 통화 중 사용자의 억양을 실시간으로 미국식 억양으로 바꿔주는 기능을 선보였다. 현재 베타 테스트 단계인 이 기능은 주로 인도식 영어 억양을 미국식 억양으로 변환하는 데 초점을 맞추고 있으며, 크리스프 데스크톱 앱에서 이용할 수 있다.
발음은 바꿔도 목소리는 그대로
음성의 자연스러움은 아직 과제
이 기능은 사용자 고유의 목소리는 유지하면서, 발음을 미국식 억양에 맞게 조정하는 방식이다. 크리스프 공동 창업자인 아르토 미나시안은 억양으로 인해 생기는 의사소통의 어려움을 직접 경험한 뒤, 이를 해결하기 위해 해당 기술을 개발하게 됐다고 밝혔다.
크리스프는 2년간의 연구와 사용자 피드백을 토대로 AI 모델을 개발했으며, 기업 환경에서 시범 테스트 결과 영업 전환율이 26.1% 향상되고, 예약당 수익도 14.8% 증가하는 등 긍정적인 효과를 얻었다고 전했다. 다만, 실제 사용에서는 일부 단어가 누락되거나 음성이 부자연스럽게 변형되는 문제가 보고되었고, 회사 측은 향후 성능 개선을 예고했다.
글로벌 전문가 위한 억양 지원 확대 계획
다양한 억양으로 AI 모델 확장 중
크리스프는 우선 인도 억양을 우선 적용한 배경으로 IT 및 과학 분야에서 높은 비율을 차지하고 있는 인도 출신 전문가들의 수요를 반영했다고 밝혔다. 향후 필리핀 억양 등도 지원할 계획이다.
이번 AI 모델은 개별 사용자의 목소리에 대한 사전 학습 없이도 실시간으로 억양 변환이 가능하도록, 다양한 음성 데이터를 기반으로 학습됐다. 또한, 크리스프는 모바일 앱(iOS·안드로이드) 출시도 준비 중이며, 구글 미트(Google Meet)와의 통합이 가능한 크롬 브라우저 확장 프로그램도 선보일 예정이다.
이 기술은 글로벌 소통의 벽을 허무는 데 긍정적인 역할을 할 수 있는 잠재력을 갖고 있다. 특히 다국적 기업이나 고객 응대 중심의 분야에서는 억양으로 생기는 오해나 커뮤니케이션 단절을 줄이는 데 기여할 수 있다. 다만, 현재로선 음성의 자연스러움과 정확성에 개선이 필요한 상황이며, AI 기술이 언어 다양성을 단순화시키는 방향으로 흐르지 않도록 균형 있는 접근이 필요해 보인다.