SON BLOG
AI Engineer · 손성준
|
Search Engine
Rust 커머스 검색 엔진, OpenSearch, Qdrant, 시맨틱 검색
90 postsAI / ML
GPU 모델 서빙, MCP Agent, 임베딩 최적화, XGEN 플랫폼
70 postsFull Stack
Python, PoC, 프론트엔드, 백엔드, 데스크톱 앱
60 postsDevOps
K8s, ArgoCD, Jenkins, Docker, 홈서버 인프라
38 postsInteractive
Knowledge Graph
269개 포스트 · 640개 태그
탐색하기 →Featured
AI
vLLM에서 llama.cpp로: LLM 서빙 아키텍처 통합 마이그레이션
vLLM Ray Serve 분산 구조에서 통합 모델 서빙 서비스로 마이그레이션한 과정. 백엔드 스위칭 매니저 설계, llama.cpp와 vLLM 런타임 전환까지.
AIgraph-tool-call: LLM Agent를 위한 그래프 기반 도구 검색 엔진
1,077개 API endpoint를 가진 커머스 플랫폼에서 LLM Agent가 적절한 도구를 찾는 문제를 해결하기 위해 그래프 기반 도구 검색 엔진을 설계하고 구현한 과정을 정리한다. OpenAPI 스펙 자동 수집...
Search EngineRust로 커머스 검색 엔진을 처음부터 만들기
NestJS 기반 검색 서비스의 한계를 넘어, Rust로 이커머스 검색 엔진을 처음부터 설계하고 구현한 과정을 다룬다.
Recent Posts
AI
2026.04.13
Cohere Transcribe STT Provider 도입: 한/영 코드스위칭과 HF Gated Repo 자동 인증
18min
AI
2026.04.13
graph-tool-call v0.19: Tool Result 지능형 압축으로 76K → 116 토큰 (97.6% 절감)
21min
AI
2026.04.13
api-to-tools: 어떤 API든 LLM 도구로 변환하는 5단계 Fallback 디스커버리 전략
22min
AI
2026.04.13
sonlife 자율 에이전트 루프: 예산 Hard-Stop · HITL 게이트 · MS Graph 실시간 Push 설계
24min
AI
2026.04.13
XGEN 2.0 권한 모델 리팩토링: Group → Role 기반으로 6개 마이크로서비스 일괄 마이그레이션
21min
DevOps
2026.04.13
Jenkins 자격증명 하드코딩 제거: K8s Secret + JCasC 변수 참조 전환과 부수 인프라 fix
13min