OpenAI, 'Canvas' 통해 인공지능 인터랙션 혁신
최근 인공지능 분야에서 주목할 만한 발전이 있었습니다. OpenAI는 새로운 방식으로 ChatGPT와 상호작용할 수 있는 'Canvas'를 도입했습니다. 이 기능은 텍스트와 코딩 프로젝트를 위한 작업 공간을 제공하며, 사용자가 텍스트나 코드를 생성하고 필요한 경우 이를 편집할 수 있도록 돕습니다.
Canvas의 주요 특징은 'synthetic data'에 의존한 맞춤형 모델입니다. OpenAI는 이 기능을 위해 GPT-4o 모델을 사용해 Canvas에서 새로운 사용자 인터랙션을 가능하게 했다고 설명했습니다. ChatGPT의 제품 책임자인 Nick Turley는 synthetic data 생성 기술을 활용해 모델을 조정하고, 데이터 없이도 빠르게 개선할 수 있었다고 밝혔습니다.
Meta도 synthetic data 적극 활용
OpenAI뿐만 아니라 Meta도 'Movie Gen'이라는 AI 도구를 개발하는 데 synthetic data를 활용했습니다. Meta는 Llama 3 모델에서 파생된 캡션을 생성하고, 인간 주석가를 통해 오류를 수정했습니다. 그러나 기본적인 작업은 자동화되어 진행되었습니다.
OpenAI의 CEO Sam Altman는 언젠가 AI가 자체적으로 훈련 가능한 수준의 synthetic data를 생성할 것이라는 전망을 내놨습니다. 이는 데이터 라이선스와 인간 주석가에 많은 비용을 지출하는 기업들에게 유리할 것입니다.
Synthetic Data 사용 시 주의 필요
다만, synthetic data 사용에는 리스크가 따릅니다. 데이터 생성에 사용되는 모델은 환각이나 편향된 결과를 포함할 수 있으며, 이는 생성된 데이터에도 영향을 미칩니다. 이를 처리하지 않으면 모델이 점점 창의성을 잃고 편향성이 증가해 기능을 저해할 수 있습니다. 따라서 데이터를 철저히 관리하고 필터링하는 것이 중요합니다.
진짜 데이터를 구하기가 점점 어려워지고 비용이 증가하는 상황에서 AI 업체들은 synthetic data를 유일한 해결책으로 고려할 수 있지만, 이를 사용할 때는 신중한 접근이 필요합니다.
출처 : 원문 보러가기