스키마 2

Apache Arrow와 함께한 여정(2부): 적응형 스키마 및 정렬

1. 저자들은 동적 데이터 스트림에 대한 Apache Arrow 사용을 최적화하기 위해 적응형 스키마 아키텍처를 개발합니다.2. 가능한 모든 경우를 포괄하는 일반 스키마로 시작하지만 실제로는 하위 집합만 사용합니다. 3. 사용하지 않는 필드를 제거하고, 최적의 사전 인코딩을 사용하고, 유니온 유형을 최적화하여 관찰된 데이터를 기반으로 스키마를 동적으로 조정합니다. 4. Apache Arrow는 재귀 스키마를 지원하지 않으므로 재귀 데이터를 이진 열로 직렬화합니다.5. 관련 열을 기준으로 테이블을 정렬하면 중복된 데이터를 그룹화하여 압축을 개선합니다.6. 테이블을 주에서 잎으로 정렬하고 델타 인코딩을 사용하면 압축률이 더욱 향상됩니다.7. 적응형 스키마 접근 방식과 정렬을 통해 메모리 사용량을 줄이고 압축..

Hacker News 2023.07.05

GPT-4의 기본 JSON 출력

새로운 OpenAI API를 사용하면 GPT 모델이 단순한 텍스트 대신 구조화된 JSON 출력을 생성할 수 있으므로 보다 정확하고 유용한 응답을 제공할 수 있습니다. JSON 스키마를 지정하면 모델이 해당 스키마를 준수하는 JSON을 생성할 수 있습니다. 따라서 기존 프롬프트 방식에 비해 오류가 줄어들고 GPT의 작업이 간소화됩니다. 결과적으로 JSON 출력은 더 정확하고 더 적은 토큰을 사용하며 더 저렴하게 생성되는 경향이 있습니다. 이 API는 기술 전문가가 아닌 사용자도 자연어를 통해 지능형 백엔드 API를 구축할 수 있는 새로운 노코드 도구를 구현할 수 있는 잠재력을 가지고 있습니다. 제한적이긴 하지만, 지원되는 JSON 스키마 기능만으로도 스키마 언어를 튜링이 완성된 스키마 언어로 전환할 수 있..

Hacker News 2023.06.15