새로운 이미지 생성 모델 'Stable Diffusion 3.5' 공개
AI 스타트업 스테빌리티 AI가 논란을 뒤로하고 새로운 이미지 생성 모델 'Stable Diffusion 3.5' 시리즈를 발표했습니다. 이번 시리즈는 기존 모델들보다 더 커스터마이즈가 가능하고 다재다능하다는 평가를 받고 있습니다.
'Stable Diffusion 3.5' 시리즈는 총 세 가지 모델로 구성되어 있습니다. 가장 강력한 '3.5 Large'는 무려 80억 개의 파라미터를 보유하고 있으며 최대 1 메가픽셀 해상도의 이미지를 생성할 수 있습니다. '3.5 Large Turbo'는 빠른 이미지 생성을 위해 퀄리티를 약간 희생한 모델입니다. '3.5 Medium'은 스마트폰이나 노트북 등 엣지 디바이스에서 최적화된 모델로, 0.25에서 2 메가픽셀 해상도의 이미지 생성을 지원합니다.
다양한 이미지 생성 가능성 확보
스테빌리티는 이번 모델들이 더 '다양한' 이미지를 생성할 수 있을 것이라고 강조합니다. 스테빌리티의 기술 책임자 Hanno Basse는 "훈련 과정에서 각 이미지에는 여러 버전의 프롬프트가 캡션으로 붙여진다"며 이는 텍스트 설명에 대해 다양한 이미지 개념을 보장하는 새로운 방식을 도입했다고 설명했습니다.
상업적 사용 조건 및 라이선스 정책
새로운 모델의 비상업적 사용은 무료로 제공되며, 연매출 100만 달러 미만의 기업은 상업적 목적으로도 무료로 사용할 수 있습니다. 그러나 연매출 100만 달러 이상의 기업은 기업 라이선스를 위해 스테빌리티와 계약해야 합니다.
과거 라이선스와 관련된 논란을 불식시키기 위해 스테빌리티는 사용자가 생성한 미디어의 소유권을 사용자에게 부여한다고 재확인했습니다.
저작권 문제 및 데이터 소유
스테빌리티의 모델은 공개된 웹 데이터를 기반으로 훈련되었으며, 일부 데이터는 저작권이 걸려있거나 제한적 라이선스가 있는 경우도 있습니다. 스테빌리티는 저작권 청구로부터 합법적인 방어가 가능하다고 주장하지만, 저작권 소유자가 소송을 제기하는 사례가 늘고 있습니다. 스테빌리티는 이에 대해 사용자 스스로 방어해야 한다고 명시했으며, 데이터 소유자가 요청하면 훈련 데이터 세트에서 해당 데이터를 삭제할 수 있다는 정책을 유지합니다.
안전한 사용을 위한 노력
스테빌리티는 이미지 생성 도구가 악의적으로 사용되지 않도록 합리적인 조치를 취하고 있다고 밝혔으며, 여전히 정책을 구체적으로 명시하지는 않았습니다.
출처 : Stability claims its newest Stable Diffusion models generate more ‘diverse’ images