스틸 이미지로 몰입감 넘치는 영상 제작
Stability AI가 새로운 인공지능 모델 ‘스테이블 버추얼 카메라(Stable Virtual Camera)’를 공개했다. 이 모델은 일반적인 2D 이미지를 마치 실제 카메라가 촬영한 듯한 사실적인 깊이와 시점을 가진 영상으로 변환할 수 있다. 단일 이미지 또는 여러 이미지를 기반으로 다양한 카메라 앵글에서 새로운 시야를 생성하며, 역동적인 카메라 움직임까지 구현 가능하다.
다양한 카메라 앵글과 경로 지원
이 AI 모델은 ‘스파이럴(Spiral)’, ‘돌리 줌(Dolly Zoom)’, ‘무브(Move)’, ‘팬(Pan)’ 등 미리 설정된 카메라 경로를 따라 영상을 생성할 수 있어, 마치 실제 촬영 영상을 보는 것과 같은 효과를 준다. 영상은 정방형(square), 세로형(portrait), 가로형(landscape)의 화면 비율로 최대 1,000프레임까지 제작 가능하다.
인간과 동물, 복잡한 장면에서는 품질 저하 우려
다만, 스테이블 버추얼 카메라는 사람, 동물, 물과 같은 동적인 질감이 포함된 이미지나 시점 간 차이가 클 경우, 영상 품질이 떨어지거나 깜빡임(flickering)이 발생할 수 있다. 특히 모호한 장면이나 복잡한 카메라 이동이 필요한 경우에는 출력 결과가 불안정할 수 있다.
비상업용 연구 목적에 한정된 사용
이 모델은 인공지능 개발 플랫폼 허깅페이스(Hugging Face)를 통해 비상업적 연구 용도로만 이용할 수 있다. Stability AI는 이미지 생성 모델 ‘스테이블 디퓨전(Stable Diffusion)’으로 잘 알려져 있으며, 최근 재정난과 경영진 교체를 겪었다. 그럼에도 불구하고 오디오 생성 모델 개발을 위해 반도체 기업 ARM과 협력하는 등 다양한 인공지능 기술 공개와 개발을 이어가고 있다.
이 기술은 이미지를 실제처럼 느껴지는 영상으로 바꿀 수 있다는 점에서 영상 제작 분야에 큰 변화를 예고한다. 특히 콘텐츠 제작자나 크리에이터들에게 새로운 표현의 장을 열어줄 수 있을 것으로 기대된다. 다만 아직은 기술적 한계가 있어 상용화에는 시간이 더 필요해 보인다.