Meta는 Google의 NotebookLM 기능을 기반으로 한 팟캐스트 생성 기능의 오픈 구현체인 "NotebookLlama"를 공개했습니다. 이 프로젝트는 대부분의 처리 과정을 Meta의 자체 Llama 모델을 활용해 수행합니다. NotebookLlama는 NotebookLM처럼 텍스트 파일을 업로드하면 대화 형식의 팟캐스트 스타일로 요약을 생성합니다.
Meta의 NotebookLlama, 드라마틱한 대화를 생성
NotebookLlama는 먼저 파일에서 텍스트를 추출하여 이를 바탕으로 드라마틱한 대화와 중단을 추가한 후, 오픈 소스 텍스트-음성 변환 모델에 입력합니다. 그러나 현재 결과물은 NotebookLM에 비해 품질이 떨어지며, 로봇 같은 목소리와 비자연스러운 중첩 대화가 발생하는 단점이 있습니다.
프로젝트에 참여한 Meta 연구자들은 더욱 강력한 모델을 사용해 품질을 향상시킬 수 있다고 설명했습니다. 이들은 NotebookLlama의 GitHub 페이지에서 "텍스트-음성 변환 모델이 자연스러움을 좌우하는 한계"임을 강조하며, "또 다른 제작 방법으로는 두 에이전트가 관심 주제에 대해 토론하고 팟캐스트 구성을 작성하는 것을 고려할 수 있다"고 언급했습니다.
AI 팟캐스트, 여전히 해결해야 할 과제
NotebookLlama는 NotebookLM의 팟캐스트 기능을 모방하려는 첫 번째 시도가 아닙니다. 다른 프로젝트들도 다양한 성공을 보였지만, 모든 AI가 직면한 '환각 문제'는 해결되지 않았습니다. 즉, AI가 생성한 팟캐스트는 실수로 만들어낸 내용이 포함될 가능성이 있습니다.
출처 : Meta releases an ‘open’ version of Google’s podcast generator