AI 기반 의료 음성 인식 모델 'Nova-3 Medical' 출시
의료 분야 음성 인식 기술, 정확성과 효율성 높인다
딥그램(Deepgram)이 의료 환경에 최적화된 AI 음성 인식 모델 'Nova-3 Medical'을 공개했다. 이 모델은 영국의 공공 의료 서비스(NHS) 및 민간 의료기관에서 요구되는 정확한 의료 기록 작성과 효율적인 음성 전사를 지원하기 위해 개발됐다.
의료 환경 최적화된 음성 인식 모델
현재 의료계에서는 전자 건강 기록(EHR), 원격 의료, 디지털 헬스케어 플랫폼이 빠르게 확산되면서, 높은 정확도의 AI 기반 음성 전사 기술에 대한 수요가 증가하고 있다. 기존 음성 인식 기술은 의료 용어 및 특수한 임상 용어를 정확하게 처리하는 데 어려움을 겪으며, 이로 인해 환자 치료에 영향을 줄 수 있는 오류가 발생하기도 한다.
Nova-3 Medical은 이러한 문제를 해결할 수 있도록 설계됐다. 이 모델은 고급 머신러닝 기술과 의료 전문 용어 학습을 통해 복잡한 의료 어휘, 약어 및 의료 분야의 전문 용어를 높은 정확도로 인식할 수 있다. 또한, 환경 소음이 있는 상황에서도 안정적인 성능을 발휘할 수 있도록 최적화됐다.
EHR 연동 및 맞춤형 설정 지원
Nova-3 Medical은 임상 워크플로우 및 전자 건강 기록(EHR) 시스템과 원활하게 통합되는 구조화된 전사 기능을 제공한다. 이를 통해 중요한 환자 데이터를 체계적으로 관리할 수 있도록 지원한다.
또한, 의료 환경에 따라 맞춤 설정이 가능하다. 사용자는 최대 100개의 핵심 키워드를 'Keyterm Prompting' 기능을 통해 커스텀할 수 있으며, 이를 통해 특정 의료 분야에서 더욱 정확한 결과를 얻을 수 있다. 이는 다양한 의료 전문 분야에 맞춰 솔루션을 최적화할 수 있도록 돕는다.
보안 강화 및 높은 정확도 제공
Nova-3 Medical은 온프레미스(On-Premises) 및 가상 프라이빗 클라우드(VPC) 환경 모두에서 배포가 가능하며, 영국의 의료 데이터 보호 법규를 준수할 수 있도록 보안성과 HIPAA(미국 건강보험 이동 및 책임법) 규정을 충족하는 설정을 지원한다.
딥그램은 Nova-3 Medical의 성능을 입증하기 위한 벤치마킹 테스트를 실시했다. 이 테스트에서 Nova-3 Medical은 3.45%의 평균 단어 오류율(WER)을 기록하며 기존 경쟁 모델보다 63.6% 낮은 오류율을 보였다. 또한, 핵심 의료 용어 인식 정확도를 나타내는 키워드 오류율(KER)도 6.79%로 측정되었으며, 이는 경쟁 제품 대비 40.35% 오류 감소 효과를 보였다.
실시간 응용 프로그램에 최적화
Nova-3 Medical은 실시간 음성을 기존 제품보다 5~40배 빠르게 전사할 수 있어, 원격 의료 및 디지털 헬스케어 플랫폼에서 효과적으로 활용될 수 있다. 또한, 확장 가능한 아키텍처를 채택해 전사 작업량이 증가하더라도 높은 성능을 유지할 수 있도록 설계됐다.
의료 AI 전사 기술의 새로운 기준 제시
딥그램의 Nova-3 Medical은 뛰어난 정확도와 속도를 기반으로 의료 분야의 음성 인식 기술을 한 단계 발전시킬 것으로 기대된다. 향후 이 모델이 의료 데이터 관리 및 진료 기록 작성에서 중요한 역할을 하면서, 업무 자동화와 효율성을 극대화할 수 있을 것으로 보인다.
Nova-3 Medical의 출시는 의료 음성 인식 기술의 발전을 의미하는 중요한 한 걸음이라고 생각한다. 기존 음성 인식 솔루션들이 의료 환경에서 겪었던 문제들을 효과적으로 해결할 수 있다면, 의료진의 업무 부담을 줄이고 환자 진료의 질을 향상하는 데 기여할 것으로 보인다. 특히, 맞춤형 설정 기능과 높은 정확도를 바탕으로 의료 현장에서 더욱 널리 사용될 수 있을 것으로 기대된다.