생성 모델 2

텍스트2비디오-제로 코드 및 가중치 출시, 픽스아트 AI 리서치(12G VRAM)

이 문서는 텍스트 프롬프트와 포즈 또는 가장자리의 안내를 사용하여 동영상을 생성하는 제로샷 동영상 생성기의 구현인 Text2Video-Zero에 관한 문서입니다. 이 구현은 GitHub에서 사용할 수 있으며 허깅페이스 데모, 모든 생성 방법에 대한 코드, ControlNet에서 사용되는 포즈 모델에 대한 가중치가 포함되어 있습니다. 또한 이 구현에는 모션 필드 강도, 비디오 길이, 캐니 에지 감지를 위한 낮은 임계값과 높은 임계값에 대해 정의할 수 있는 추론 API와 하이퍼파라미터가 포함되어 있습니다. 청크 크기 매개변수를 추가하여 낮은 메모리 설정에서 구현을 실행할 수 있습니다. 이 문서에는 "고양이가 잔디 위를 달리고 있습니다.", "우주 비행사가 달에서 손을 흔들고 있습니다."와 같은 텍스트 프롬프..

Hacker News 2023.03.29

ChatGPT의 기능은 무엇이며 왜 작동하나요?

이 기사에서는 Stephen Wolfram이 사람과 같은 대화를 생성하도록 설계된 자연어 처리 시스템인 ChatGPT로 알려진 AI 기술에 대해 설명합니다. 그는 ChatGPT가 다양한 유형의 입력에 응답하는 방법을 학습하기 위해 대규모의 훈련 데이터 모음을 사용하여 작동한다고 설명합니다. 그런 다음 자연어 처리, 딥러닝, 확률적 프로그래밍의 조합을 사용하여 ChatGPT가 어떻게 사람과 같은 대화를 생성할 수 있는지에 대해 설명합니다. 또한 보다 자연스러운 응답을 생성하는 능력과 실수로부터 학습하는 능력 등 ChatGPT가 잘 작동하는 이유에 대해서도 설명합니다. 마지막으로 고객 서비스 및 가상 비서와 같은 응용 프로그램에서 ChatGPT를 어떻게 사용할 수 있는지에 대한 몇 가지 예를 제공합니다. 원..

Hacker News 2023.02.15