이 문서는 텍스트 프롬프트와 포즈 또는 가장자리의 안내를 사용하여 동영상을 생성하는 제로샷 동영상 생성기의 구현인 Text2Video-Zero에 관한 문서입니다. 이 구현은 GitHub에서 사용할 수 있으며 허깅페이스 데모, 모든 생성 방법에 대한 코드, ControlNet에서 사용되는 포즈 모델에 대한 가중치가 포함되어 있습니다. 또한 이 구현에는 모션 필드 강도, 비디오 길이, 캐니 에지 감지를 위한 낮은 임계값과 높은 임계값에 대해 정의할 수 있는 추론 API와 하이퍼파라미터가 포함되어 있습니다. 청크 크기 매개변수를 추가하여 낮은 메모리 설정에서 구현을 실행할 수 있습니다. 이 문서에는 "고양이가 잔디 위를 달리고 있습니다.", "우주 비행사가 달에서 손을 흔들고 있습니다."와 같은 텍스트 프롬프..