Skip to content
SON BLOG

Archives

All the articles I've archived.

2026 122
6월 7
4월 7
3월 11
  • AI 회사 자율운영 플랫폼에 synaptic-memory + graph-tool-call 통합기

    AI 에이전트 회사 자율운영 플랫폼 Hive Corp에서 자체 구현된 메모리 시스템과 도구 레지스트리를 synaptic-memory, graph-tool-call 두 라이브러리로 전면 교체한 과정을 정리한다. PostgreSQL tsvector 기반 검색을 SynapticGraph의 resonance 기반 검색으로, 정적 role mapping을 ToolGraph의 지능형 retrieval로 대체했다.

  • graph-tool-call v0.15: 1068 Tool 스트레스 테스트와 워크플로우 체인 엔진

    graph-tool-call을 v0.7에서 v0.15까지 진화시키며 겪은 기술적 의사결정을 정리한다. 6개 retrieval 전략 경쟁 벤치마크로 Graph의 실제 가치를 검증하고, BM25보다 나쁜 결과를 내던 Graph를 candidate injection 아키텍처로 전환한 과정, 그리고 LLM Agent의 왕복 호출을 줄이는 워크플로우 체인 API를 구현한 경험을 다룬다.

  • gwanjong-mcp 운영기 — 9개 플랫폼 확장, 캠페인 GTM, 스팸 방지 실전

    AI 소셜 에이전트 gwanjong-mcp를 4개에서 9개 플랫폼으로 확장하고, 캠페인 기반 GTM 시스템, 연속 실패 자동 차단, 에이전트 캐릭터 시스템, 자동 대댓글, 저자 중복 방지까지 실제 운영하며 겪은 문제와 해결 과정을 정리한다.

  • xgen-model v2 아키텍처 — MinIO 모델 허브, vLLM 0.17.0, Inference Proxy

    XGEN 플랫폼의 모델 서빙 서비스를 4-Tier 아키텍처로 리팩토링한 과정을 정리한다. MinIO 기반 중앙 모델 저장소 + PV 캐시, vLLM 0.17.0 업그레이드, LLM/임베딩 자동 라우팅 Inference Proxy, GPU Fallback Chain, zombie 프로세스 처리까지.

  • 현금흐름 예측 실전기 — 256피처 ML의 함정에서 시계열 앙상블까지

    48개월 월별 데이터로 기업 현금흐름을 예측하는 프로젝트. 256개 피처 ML이 평균 예측기에 불과하다는 사실을 발견하고, 순수 시계열(AutoARIMA, Chronos-Bolt) + 역MAE 앙상블로 전환하기까지의 과정을 정리한다. Rolling CV, data leakage 수정, 구간 예측까지.

  • graph-tool-call: LLM Agent를 위한 그래프 기반 도구 검색 엔진

    1,077개 API endpoint를 가진 커머스 플랫폼에서 LLM Agent가 적절한 도구를 찾는 문제를 해결하기 위해 그래프 기반 도구 검색 엔진을 설계하고 구현한 과정을 정리한다. OpenAPI 스펙 자동 수집, 관계 그래프 구축, BM25+그래프확장+임베딩 하이브리드 검색, MCP Annotation-Aware Retrieval까지 8일간의 개발 여정을 다룬다.

  • gwanjong-mcp — AI 소셜 에이전트 MCP 시스템 설계와 구현

    4개 소셜 플랫폼(Dev.to, Bluesky, Twitter, Reddit)을 하나의 인터페이스로 통합하고, Stateful Pipeline MCP 프레임워크 위에 Scout/Draft/Strike 3단계 파이프라인을 구축한 AI 소셜 에이전트의 아키텍처와 구현 과정을 정리한다.

  • XGEN MS 365 MCP 통합 — Device Code Flow 인증부터 워크플로우 노드까지

    XGEN 2.0 AI Agent 플랫폼에 Microsoft 365 MCP 서버를 통합한 과정을 정리한다. Client Credentials에서 Device Code Flow로의 인증 방식 전환, K8s PVC 토큰 캐시, 프론트엔드-백엔드-인프라 3계층에 걸친 아키텍처 설계, 그리고 100개 이상의 MS 365 도구를 프리셋으로 관리하는 방법까지 다룬다.

  • XGEN GPU 모델 서빙 인프라 실전기 — 폐쇄망 배포부터 멀티 GPU 오버라이드까지

    XGEN 플랫폼의 GPU 모델 서빙 서비스(xgen-model)를 제주 폐쇄망과 AWS EKS에 배포하면서 겪은 인프라 삽질을 정리한다. Istio/Traefik 전환, imagePullPolicy 폐쇄망 대응, GPU Recreate 배포 전략, CUDA graph 캡처 중 헬스체크 실패, 프로젝트별 gpuCount/config 오버라이드, MinIO credential 불일치, 프론트엔드 tensor_parallel_size 자동 설정까지.

  • 업무 자동 수집 → 일일 리포트: 500+개 메시지를 Claude로 요약하는 3계층 아키텍처

    MS 365(메일, Teams) 500개 이상의 일일 메시지를 자동 수집하고, Claude API로 구조화된 일일 리포트로 변환한 후, Docsify 웹 서비스로 제공하는 end-to-end 자동화 시스템 설계 및 구현 과정을 정리한다. MSAL 토큰 캐싱, MS Graph API 재시도 전략, Claude CLI 통합, Nginx 계층화 캐싱 등 프로덕션 수준의 에러 처리를 다룬다.

  • workstream-kb — 업무 지식 베이스 자동화: MS365 수집부터 Claude 리포트 생성까지

    MS Graph API로 메일과 Teams 메시지를 30분마다 수집하고, Claude CLI 1회 호출로 종합 일일 업무 리포트를 생성하는 2-Layer 자동화 시스템의 설계와 구현 과정을 정리한다. 토큰 캐시 공유, 노이즈 필터링, 리포트 품질 검증, Docsify 뷰어까지.

2월 63
1월 34
2025 134
12월 22
11월 3
10월 2
9월 8
8월 1
  • 아이스크림몰 AI Search 구축 사례

    교육전문 쇼핑몰 아이스크림몰에 AI 기반 통합 검색 시스템을 도입한 사례를 정리한다. 초당 5,000건 이상의 검색 트래픽 대응, 검색엔진 인프라 재구성, AI 모델 최적화 과정을 다룬다.

7월 70
6월 12
5월 1
  • 커머스 상품 추천 검색 API 설계 (goods + marketing)

    Rust 검색 엔진에서 상품, 마케팅, 이벤트 데이터에 대한 추천 검색어(recomword) API를 설계하고 구현한 과정. 인덱싱 파이프라인부터 Terms Aggregation 기반 자동완성, 문자열 길이 정렬까지.

4월 9
3월 2
2월 3
  • Intel NPU 가속을 활용한 TinyLlama 챗봇 구현

    Intel NPU Acceleration Library를 사용하여 TinyLlama 모델을 NPU에서 추론하는 챗봇을 구현한 과정. transformers 버전 호환성 문제와 NPU 가속 설정을 정리한다.

  • RxDB 란 무엇인가? (OpenSearch 연동)

    RxDB(Reactive Database)의 개념과 Frontend 애플리케이션에서의 활용법을 정리한다. OpenSearch 연동을 통한 실시간 상태 변경 감지와 NoSQL 기반 로컬 DB 구성 방식을 다룬다.

  • Tauri - 크로스 플랫폼 앱 개발 프레임워크

    Tauri 프레임워크의 개요와 아키텍처를 정리한다. Rust 백엔드와 WebView 기반 프론트엔드(React, Next.js)를 결합한 데스크톱 앱 개발 방식을 다룬다.

1월 1
  • OJT 리팩토링과 Kotaemon RAG 구현기

    기존 OJT 시스템의 한계를 해결하고자 전면 리팩토링을 진행했다. Kotaemon RAG 프레임워크를 도입하여 문서 기반 질의응답 성능을 대폭 개선한 과정을 공유한다.

2024 18
11월 2
  • GliNER과 DPO-LoRA를 활용한 모델 파인튜닝

    GliNER NER 모델과 DPO, LoRA를 결합한 파인튜닝 파이프라인 구축 과정. 데이터 수집부터 학습, 평가, 배포까지 실전 경험을 정리한다.

  • Search API와 LLMOps Docker 구성기

    검색 API 성능 최적화와 LLMOps 파이프라인의 Docker 환경 구성을 진행했다. 아키텍처 설계와 컨테이너화 전략, docker-compose 멀티 서비스 구성까지.

10월 4
9월 10
  • 파이썬 비동기 프로그래밍 소개

    I/O 대기 시간을 활용하는 비동기 프로그래밍의 기본 개념을 정리한다. 커널의 I/O 처리 구조, 동시성 프로그램의 특징, 경쟁 상태 주의점 등 비동기 입문에 필요한 핵심을 다룬다.

  • 파이썬 비동기 작업의 과부하 제어

    비동기 I/O에서 동시 작업 수가 과도하면 오히려 성능이 저하되는 문제를 다룬다. Chunking/Batching 기법으로 작업을 일정 크기로 나누어 부하를 제어하는 방법을 정리한다.

  • 파이썬 비동기 프로그래밍: 콜백과 퓨처

    이벤트 루프 기반 비동기 프로그래밍의 두 가지 패러다임인 콜백과 퓨처를 비교한다. 콜백 지옥 문제와 퓨처를 통한 해결, 실전 코드 패턴을 정리한다.

  • 순차처리 vs 일괄처리 vs 비동기 처리 비교

    파이썬에서 순차 처리, 일괄(배치) 처리, 비동기 처리 세 가지 방식을 비교한다. 각 방식의 동작 원리, 성능 차이, 적합한 사용 시나리오를 코드 예제와 함께 정리한다.

  • 파이썬 클래스의 `__enter__`와 `__exit__` 메서드

    파이썬 with 문에서 자동 호출되는 __enter__와 __exit__ 특수 메서드를 정리한다. 컨텍스트 매니저 프로토콜 구현으로 파일, DB 연결, 락 등의 리소스를 안전하게 관리하는 방법을 다룬다.

  • 파이썬 multiprocessing - 병렬 처리로 성능 향상하기

    파이썬 multiprocessing 모듈을 활용한 프로세스/스레드 기반 병렬 처리를 다룬다. 몬테 카를로 원주율 추정, Pool 기반 소수 검색, Queue와 포이즌 필을 통한 작업자 관리까지 실전 예제를 정리한다.

  • 파이썬의 MVC 패턴 구현

    파이썬에서 MVC(Model-View-Controller) 디자인 패턴을 적용하는 방법을 정리한다. 애플리케이션을 Model, View, Controller로 분리하여 유지보수성과 확장성을 높이는 구조를 다룬다.

  • OpenSearch 기반 시맨틱 검색 로직 구현

    OpenSearch에서 텍스트로 이미지를 검색하는 시맨틱 검색 로직을 정리한다. 벡터 임베딩 기반 유사도 검색과 전통적 키워드 검색을 결합한 하이브리드 검색 구조를 다룬다.

  • 이미지 검색 기능 구현기 - 시맨틱 검색과 AI 분류의 만남

    2024년 7월부터 9월까지 진행한 이미지 기반 상품 검색 시스템 개발기. CLIP 모델로 이미지를 벡터화하고 배경 제거, AI 분류를 결합한 시맨틱 이미지 검색 구현 과정이다.

  • 벡터 기반 시맨틱 검색 구현기

    Python FastAPI와 OpenSearch를 활용해 Dense Vector 기반 시맨틱 검색을 구현한 과정. 임베딩 모델 선택, 벡터 인덱스 설계, 하이브리드 검색까지.

8월 1
5월 1