llm 2

LLM 기반 자율 에이전트

이 문서에서는 대규모 언어 모델을 핵심 컨트롤러로 사용하는 자율 에이전트 구축에 대해 설명합니다. 작업 분해, 메모리, 도구 사용, 자기 반성 등 LLM을 보완하기 위한 몇 가지 메커니즘이 제안되어 있습니다. 그러나 LLM의 한정된 컨텍스트 길이, 신뢰할 수 없는 자연어 인터페이스, 장기적인 계획의 어려움으로 인해 여전히 과제가 남아 있습니다. 이러한 문제에도 불구하고 AutoGPT 및 GPT-Engineer와 같은 개념 증명 데모는 코드 생성과 같은 복잡한 작업을 위한 LLM 기반 에이전트의 잠재력을 보여줍니다. 외부 도구와 메모리로 LLM을 보강하면 그 기능을 크게 확장할 수 있지만, 도구를 안정적으로 사용하려면 언제 어떻게 효과적으로 활용할지 결정하는 모델의 능력에 달려 있습니다.원문: https:..

Hacker News 2023.06.27

Gorilla: API와 연결된 대규모 언어 모델

Gorilla는 정확한 API 호출을 생성하도록 미세 조정된 대규모 언어 모델입니다. 이 모델은 정확한 API 호출과 인수를 작성하는 데 있어 GPT-4보다 뛰어난 성능을 발휘합니다. 또한 문서 검색기를 사용하여 API 문서의 변경 사항에 적응하여 업데이트된 API 버전을 처리할 수 있습니다. 저자들은 Gorilla의 성능을 평가하기 위해 HuggingFace, TorchHub 및 TensorHub API의 데이터 세트인 APIBench를 만들었습니다. 리트리버 시스템과 Gorilla의 조합은 대규모 언어 모델에서 보다 안정적인 API 호출을 생성할 수 있는 가능성을 보여줍니다. 저자들은 Gorilla와 코드를 GitHub에서 공개적으로 사용할 수 있도록 했습니다.원문: https://shishirpat..

Hacker News 2023.06.15