Tag: XGEN
All the articles with the tag "XGEN".
-
XGEN 1.0 프론트엔드 모델 관리 UI 구현
Next.js와 TypeScript로 GPU 모델 관리, 실시간 모니터링, 워크플로우 관리 UI를 구현한 과정. XGEN 1.0 플랫폼의 관리자 대시보드 설계까지.
-
Workflow Execution Panel: 검증과 에러 핸들링 UI 패턴
XGEN 2.0 워크플로우 에디터의 실행 패널 구현기 — 3단계 검증 레이어, 타입 가드 기반 출력 분기, SSE 스트리밍 실행, 일시정지/재개까지
-
FastAPI 워크플로우 엔진에 Qdrant 하이브리드 검색 붙이기
FastAPI 기반 워크플로우 엔진과 Qdrant 벡터 DB를 결합하여 Dense+Sparse 하이브리드 검색 파이프라인을 구축한 과정. Circuit Breaker 패턴으로 장애 전파 차단까지.
-
vLLM + llama.cpp GPU 모델 서빙 최적화 실전기
대규모 언어 모델의 효율적인 서빙을 위해 vLLM과 llama.cpp 기반 추론 엔진을 구축한 과정. GPU 리소스 최적화, 동적 배칭, CUDA 메모리 관리까지 프로덕션 경험을 정리한다.