Tag: LLM
All the articles with the tag "LLM".
-
api-to-tools: 어떤 API든 LLM 도구로 변환하는 5단계 Fallback 디스커버리 전략
OpenAPI/Swagger/HAR/GraphQL/gRPC/AsyncAPI/WSDL/Nexacro까지, 스펙이 있든 없든 임의의 API를 LLM이 호출 가능한 Tool 정의로 자동 변환하는 라이브러리를 4일 만에 v0.3에서 v0.16까지 진화시킨 과정과 5단계 Fallback 디스커버리 전략을 정리한다.
-
graph-tool-call v0.19: Tool Result 지능형 압축으로 76K → 116 토큰 (97.6% 절감)
LLM 에이전트의 컨텍스트 폭주 주범인 tool 응답을 타입별로 지능형 압축한다. JSON list/dict, HTML, Error, Text 5종 압축기와 HTTP 응답 자동 감지, ToolGraph/MCPProxy/MCP server/LangChain 게이트웨이 4개 통합 지점을 zero-dependency로 구현한 v0.19의 설계와 측정치.
-
sonlife 자율 에이전트 루프: 예산 Hard-Stop · HITL 게이트 · MS Graph 실시간 Push 설계
라이프로그/메일/Teams를 자율 답신하는 에이전트 루프를 만들면서 도입한 안전장치 — 예산 150% hard-stop, max_age 뒷북 가드, L03 permission HITL, MS Graph Change Notifications로 폴링 30분→초 단위 단축, synaptic 그래프 preflight까지 — 의 설계를 정리한다.
-
XGEN GPU 벤더 추상화 — Vulkan 의존 제거와 멀티 벤더 Dockerfile 전략
XGEN 모델 서버의 GPU 관리가 Vulkan 종속 구조에서 벤더 중립 아키텍처로 전환한 과정을 정리한다. Hardware 계층 타입 시스템 설계, Management API 재설계, 프론트엔드 GPU UX 개선, NVIDIA/AMD 벤더별 Dockerfile 분리 전략과 amdsmi 설치 순서 트랩까지 실전 삽질기를 포함한다.