비디오 3

비디오 체스 분해 및 댓글 달기

Atari 2600용 비디오 체스는 콘솔의 제한된 하드웨어를 고려할 때 인상적인 게임이었습니다. 저자는 이 게임의 코드를 리버스 엔지니어링하여 128바이트의 RAM과 4K ROM 카트리지만으로 어떻게 인공 지능을 구현했는지 이해했습니다. 이 게임은 코드를 사용하여 체스 말을 표현하고 체스 판을 RAM 주소 $80~$bf에 저장했습니다. 저자는 이 게임이 움직임을 분석하기 위해 시뮬레이션 스택에 보드 상태를 저장한다는 사실을 발견했습니다. 자세한 분석에도 불구하고 저자는 게임에서 한 번에 두 개의 말이 움직인다는 소문의 버그에 대한 증거를 찾지 못했습니다. 보드 초기화 코드는 사르곤 체스 프로그램과 매우 흡사했는데, 아마도 오마주인 것 같습니다. 전반적으로 비디오 체스는 심층 분석과 엔드게임 개선 등 19..

Hacker News 2023.06.23

모노리스 스토리를 위한 프라임 비디오 마이크로 서비스

오디오/비디오 모니터링 서비스를 확장하고 비용을 90% 절감한 Prime Video 팀의 이야기는 인터넷에서 많은 의견과 악평을 불러일으켰습니다. 그러나 이 팀은 서버리스 퍼스트 접근 방식을 따라 단계 함수와 람다 호출을 사용하여 프로토타입을 빠르게 구축했습니다. 그런 다음 높은 트래픽에 대처하기 위해 확장하면서 몇 가지 문제를 발견했고, 대부분의 작업 코드를 ECS를 사용하여 수평적으로 확장되고 람다 함수를 통해 호출되는 하나의 장기 실행 마이크로서비스로 결합하여 문제를 해결했습니다. 이 마이크로서비스는 Prime Video 애플리케이션을 구성하는 수많은 마이크로서비스 중 하나에 불과합니다. 팀에서는 이 리팩터링을 마이크로서비스에서 모놀리스로의 전환이라고 불렀지만, 실제로는 서버리스 우선 접근 방식에서..

Hacker News 2023.05.08

잠상 정렬: 잠상 확산 모델을 사용한 고해상도 비디오 합성

이 문서에서는 고해상도 비디오 합성을 위한 추상 잠재 확산 모델(LDM)의 사용에 대해 설명합니다. LDM 패러다임은 압축된 저차원 잠재 공간에서 확산 모델을 훈련하는 데 사용되며, 이 모델은 비디오 생성으로 확장됩니다. 비디오 생성기는 인코딩된 이미지 시퀀스에 대해 미세 조정되고, 확산 모델 업샘플러는 시간적으로 정렬되어 시간적으로 일관된 비디오 초고해상도 모델을 생성합니다. 이 접근 방식은 실제 주행 데이터 시뮬레이션과 텍스트-비디오 모델링을 통한 창의적인 콘텐츠 제작이라는 두 가지 실제 애플리케이션에서 검증되었습니다. 비디오 LDM은 해상도 512 x 1024의 실제 주행 비디오에서 최첨단 성능을 발휘하는 것으로 나타났습니다. 이 접근 방식은 개인화된 텍스트-비디오 생성에도 사용할 수 있습니다. 이..

Hacker News 2023.04.19