Posts
All the articles I've posted.
-
Kubernetes Downward API로 멀티 Pod 세션 라우팅 구현
POD_NAME과 POD_IP를 컨테이너 환경변수로 주입해 멀티 Pod 환경에서 세션 스티키니스와 분산 추적을 구현한 방법
-
FastAPI 워크플로우 엔진: 접근 제어와 감사 로깅 구현
FastAPI 기반 워크플로우 엔진에 엔터프라이즈급 권한 관리와 감사 추적 시스템을 구축한 과정. 실행 권한 체계 설계, IO 로깅 미들웨어, Redis 기반 세션 관리까지.
-
Kubernetes Health Probe 타임아웃 설정으로 Pod 재시작 방지
initialDelaySeconds, timeoutSeconds, failureThreshold 조정으로 무거운 AI 서비스의 불필요한 Pod 재시작을 방지한 실전 사례
-
문서 임베딩 파이프라인: 청킹 옵션과 전처리 전략
xgen-retrieval에서 PDF/DOCX/PPT 문서를 임베딩 파이프라인으로 처리하는 과정 - force_chunking, advanced chunking, OCR 처리, 텍스트 정제, 메타데이터 추출까지