SON BLOG
AI Engineer · 손성준
|
Search Engine
Rust 커머스 검색 엔진, OpenSearch, Qdrant, 시맨틱 검색
90 postsAI / ML
GPU 모델 서빙, MCP Agent, 임베딩 최적화, XGEN 플랫폼
65 postsFull Stack
Python, PoC, 프론트엔드, 백엔드, 데스크톱 앱
59 postsDevOps
K8s, ArgoCD, Jenkins, Docker, 홈서버 인프라
37 postsInteractive
Knowledge Graph
262개 포스트 · 615개 태그
탐색하기 →Featured
AI
vLLM에서 llama.cpp로: LLM 서빙 아키텍처 통합 마이그레이션
vLLM Ray Serve 분산 구조에서 통합 모델 서빙 서비스로 마이그레이션한 과정. 백엔드 스위칭 매니저 설계, llama.cpp와 vLLM 런타임 전환까지.
AIgraph-tool-call: LLM Agent를 위한 그래프 기반 도구 검색 엔진
1,077개 API endpoint를 가진 커머스 플랫폼에서 LLM Agent가 적절한 도구를 찾는 문제를 해결하기 위해 그래프 기반 도구 검색 엔진을 설계하고 구현한 과정을 정리한다. OpenAPI 스펙 자동 수집...
Search EngineRust로 커머스 검색 엔진을 처음부터 만들기
NestJS 기반 검색 서비스의 한계를 넘어, Rust로 이커머스 검색 엔진을 처음부터 설계하고 구현한 과정을 다룬다.
Recent Posts
AI
2026.03.23
AI 회사 자율운영 플랫폼에 synaptic-memory + graph-tool-call 통합기
11min
AI
2026.03.22
graph-tool-call v0.15: 1068 Tool 스트레스 테스트와 워크플로우 체인 엔진
11min
AI
2026.03.22
gwanjong-mcp 운영기 — 9개 플랫폼 확장, 캠페인 GTM, 스팸 방지 실전
12min
AI
2026.03.22
xgen-model v2 아키텍처 — MinIO 모델 허브, vLLM 0.17.0, Inference Proxy
10min
Full Stack
2026.03.22
현금흐름 예측 실전기 — 256피처 ML의 함정에서 시계열 앙상블까지
12min
AI
2026.03.08
gwanjong-mcp — AI 소셜 에이전트 MCP 시스템 설계와 구현
14min