데이터 26

XTDB 2.x 얼리 액세스

XTDB는 SQL 및 데이터로그를 위한 비시간적 동적 관계형 데이터베이스입니다. XTDB 2.x는 아직 개발 중이며 현재 미출시 소프트웨어입니다. 2.x 얼리 액세스 프로그램은 XTDB의 광범위한 미래에 관심이 있는 사용자에게 가시성을 제공합니다. XTDB 1.x는 당분간 계속 지원될 예정입니다. XTDB 2.x의 주요 기능에는 클라우드 네이티브, 비시간적, 동적, 관계형, SQL 및 데이터 로그가 포함됩니다. XTDB는 사전 정의된 스키마나 테이블이 필요하지 않습니다. XTDB는 내부 및 외부 모두에서 Apache Arrow를 수용합니다. 개인정보 보호법을 준수하기 위해 불변 데이터를 처리할 때는 삭제가 필요합니다. 2.x 설계는 1.x의 필수 품질을 확장하고 중요한 새로운 기능을 제공합니다. 일반 공..

Hacker News 2023.04.28

Dropbox 원격 분석은 비활성화할 수 없습니다.

이 문서는 텔레메트리.dropbox.com 사용에 대해 논의하는 스레드에 대한 Dropbox 커뮤니티 운영자의 답변입니다. 운영자는 개발팀이 이 채널을 사용하여 클라이언트 측 로깅, 오류 보고 및 기타 지표를 수신한다고 설명합니다. 기본 도메인이 'dropbox.com'이므로 이 도메인은 신뢰할 수 있는 도메인으로 나열됩니다. Pi-Hole 부가 기능은 해당 웹 경로를 통해 수집되는 오류 보고 도메인을 표시합니다. 운영자는 이 정보를 통해 문제가 명확해지기를 바랍니다. 이 게시물에는 피드백을 제공하고, 질문하고, Dropbox를 사용하는 더 많은 방법을 알아볼 수 있는 링크가 포함되어 있습니다.원문: https://www.dropboxforum.com/t5/Integrations/Why-So-Much-T..

Hacker News 2023.04.27

PostgreSQL로 스스로를 보호하는 방법

이 글에서는 PostgreSQL을 사용할 때 흔히 저지르는 실수를 피하는 9가지 방법에 대해 설명합니다. 저자는 확장성의 중요성과 확장성이 데이터베이스 성능에 어떤 영향을 미칠 수 있는지 강조합니다. 가장 중요한 실수 중 하나는 성능 저하를 유발할 수 있는 work_mem의 기본값을 유지하는 것입니다. 저자는 문제가 발생하기 전에 자동화된 타사 시스템을 사용하여 경고할 것을 권장합니다. 모든 애플리케이션 로직을 Postgres 함수 및 절차에 푸시하는 것도 성능을 저하시킬 수 있으므로 실수가 될 수 있습니다. 저자는 하위 쿼리 대신 CTE를 사용하고 시간이 중요한 쿼리에는 재귀적 CTE를 피할 것을 제안합니다. 또한 이 문서에서는 외래 키에 인덱스를 추가하지 말고, NULL을 사용하는 일반 비교 연산자 ..

Hacker News 2023.04.25

'삭제 법안'은 캘리포니아 주민들에게 데이터 추적을 차단할 수 있는 더 많은 권한을 부여하고자 합니다.

캘리포니아 삭제법(SB 362)은 캘리포니아 주민들이 자신의 개인 온라인 데이터를 더 잘 통제할 수 있도록 하는 법안입니다. 이 법안은 2023년 4월 25일 새크라멘토에서 상원 사법위원회에서 심의될 예정입니다. 샌프란시스코에 본부를 둔 디지털 시대의 시민 자유를 위한 비영리 단체인 전자 프론티어 재단(EFF)은 이 법안을 지지합니다. EFF의 수석 입법 활동가인 헤일리 츠카야마는 캘리포니아 법이 이 분야에서 미국을 선도하고 있지만 여전히 거의 시행되지 않고 있다고 말했습니다. 이 법안을 발의한 주 상원의원 조쉬 베커는 소비자가 자신의 개인 정보를 삭제하고 데이터 브로커가 개인 정보를 수집하고 추적하는 것을 막을 수 있는 기능을 제공하고자 합니다. 그러나 데이터 프라이버시 옹호자들은 이 법안이 기업의 비..

Hacker News 2023.04.25

ProfileGPT: AI 에이전트 협업 아키텍처의 예시

이 글에서는 ChatGPT로 본 사용자의 프로필과 성격을 분석하는 오픈소스 앱인 ProfileGPT에 대해 설명합니다. 이 앱은 웹에서 생활 요약, 취미/관심사, 성격 평가, 예측, 정신 건강 평가, 정치/종교적 견해, 개인 정보 등 다양한 유형의 정보를 추출할 수 있습니다. 이 앱은 세 가지 에이전트로 구성된 AI 협업 아키텍처 프레임워크를 사용합니다: 정신분석가, 정신사학자, 스토커입니다. 각 에이전트는 고유한 방식으로 데이터와 인사이트를 추출할 수 있도록 특정 기술과 전문 지식을 갖추고 설계되었습니다. 이 문서에서는 추출할 데이터와 함께 각 에이전트의 작업을 설명하는 데 사용되는 프롬프트에 대해서도 설명합니다. 이 글은 AI 기술의 개발과 사용에 있어 책임감 있고 윤리적인 관행이 필요하다는 점을 강..

Hacker News 2023.04.24

Show HN: 사람들이 자신의 기술을 배우고 도전할 수 있도록 SQL 게임을 만들었습니다.

"로스트 앳 SQL"은 사용자가 기본적인 SQL 기술을 배울 수 있도록 설계된 게임입니다. SQL은 데이터베이스에서 정보를 추출하는 데 널리 사용되는 언어이며, 대규모 데이터 세트가 일반적인 산업에서 매우 중요한 기술입니다. 또한 SQL은 여러 산업 분야에 걸쳐 이전 가능한 기술입니다. 이 게임은 기본부터 시작하여 더 복잡한 도전 과제로 발전하는 학습 게임과 SQL 기술을 테스트하려는 사용자를 위한 전문가 도전의 두 가지 모드를 제공합니다. 게임 인터페이스에는 사용자가 익숙해지는 데 도움이 되는 튜토리얼이 포함되어 있습니다. 머신 러닝은 사용자를 위해 일부 쿼리를 작성할 수 있지만, SQL 학습은 사용자가 데이터를 탐색하고, 쿼리가 예상한 답변을 제공하지 않는 이유를 이해하고, 더 정확하거나 이해하기 쉬..

Hacker News 2023.04.23

DOOM 맵을 SVG로 레이저 커터로 변환하기

이 글의 작성자는 클래식 DOOM 게임의 데이터 형식에서 맵을 추출하고 레이저 커팅이 가능한 벡터 그래픽으로 변환하기 위해 Rust 코드를 작성했습니다. DOOM 데이터 형식은 잘 문서화되어 있으며 맵, 텍스처, 사운드 등을 설명하는 덩어리를 포함하고 있습니다. 작성자는 nom Rust 파서 결합기 라이브러리를 사용하여 데이터를 파싱하고 맵 지오메트리를 추출했습니다. 그런 다음 선분을 섹터로 그룹화하고 바닥 높이가 비슷한 섹터를 그룹화하여 레이어 수를 줄였습니다. 작성자는 SVG 상자를 사용하여 각 레이어, 내부 선 및 위치 지정 선에 대해 서로 다른 색상을 사용하여 레이저 커팅이 가능한 SVG를 작성했습니다. 또한 할튼 시퀀스를 사용하여 반무작위 색상을 생성했습니다. 그런 다음 Bevy 앱과 삼각측량 ..

Hacker News 2023.04.18

레드파자마: 친절한 라이센스로 라마 복제

레드파자마는 선도적인 완전 오픈소스 언어 모델 세트를 만드는 것을 목표로 하는 프로젝트입니다. 프로젝트의 첫 번째 단계는 1조 2천억 개가 넘는 토큰으로 구성된 LLaMA 학습 데이터셋을 재현하는 것입니다. 오늘날 가장 유능한 기초 모델은 상용 API로 폐쇄되어 있어 연구, 커스터마이징 및 민감한 데이터에 대한 사용이 제한됩니다. 완전 오픈 소스 모델은 이러한 한계를 없앨 수 있는 가능성을 가지고 있습니다. RedPajama는 Together, Ontocord.ai, ETH DS3Lab, 스탠포드 CRFM, Hazy Research, MILA 퀘벡 AI 연구소의 협업으로 탄생했습니다. 레드파자마 기본 데이터 세트는 LLaMA 백서에 설명된 레시피에 따라 생성된 1조 2,000억 토큰 규모의 완전 개방형 ..

Hacker News 2023.04.18

ML 모델의 91%는 시간이 지남에 따라 성능이 저하됩니다.

MIT, 하버드 및 기타 기관의 최근 연구에 따르면 머신러닝(ML) 모델의 91%가 시간이 지남에 따라 성능이 저하되는 것으로 나타났습니다. 이 연구는 배포 후 ML 모델의 동작과 보이지 않는 데이터에 따라 성능이 어떻게 변화하는지를 연구하는 데 중점을 두었습니다. 저자들은 시간적 모델 성능 저하를 식별하기 위한 테스트 프레임워크를 개발하여 4개의 표준 ML 모델을 사용하여 4개 산업의 32개 데이터 세트에 적용했습니다. 그 결과 시간이 지남에 따라 오차가 증가하고, 시간이 지남에 따라 오차 변동성이 증가하여 불규칙한 동작으로 이어진다는 사실을 발견했습니다. 저자들은 점진적인 성능 저하 또는 성능 저하 없음, 폭발적인 성능 저하, 오류 변동성 증가 등 네 가지 일반적인 성능 저하 패턴을 확인했습니다. 저..

Hacker News 2023.04.14

와이어커터에게 물어보세요: 스마트하지 않은 TV를 추천해 주시겠어요?

이 기사에서는 대부분의 최신 TV가 인터넷 연결이 필요하기 때문에 비스마트 TV를 찾는 것이 어렵다는 점에 대해 설명합니다. 스마트 TV 데이터 개인정보 보호 및 보안 문제도 다루고 있으며, 데이터 수집을 거부하는 것이 해결책의 일부일 뿐이라고 제안합니다. 이 기사에서는 Wi-Fi에 연결되지 않은 새 TV를 구입하거나, 구형 TV, 4K 모니터 또는 프로젝터를 구입하는 등 연결되지 않은 TV를 원하는 사람들을 위한 몇 가지 옵션을 제공합니다. 또한 이 기사에서는 스마트 TV를 원하지만 데이터 프라이버시가 걱정되는 분들을 위한 좋은 옵션으로 Hisense U8H 시리즈와 TCL 5 시리즈 Roku TV를 추천합니다. 이 기사에서는 모니터와 프로젝터의 연결 옵션이 TV와 동일한 경우가 많으며, 엔터테인먼트 ..

Hacker News 2023.04.08