Tag: 모니터링
All the articles with the tag "모니터링".
-
XGEN K3s 인프라 완전 해부 (5) — Istio 서비스 메시와 Observability 스택
XGEN 2.0 인프라의 네트워크 계층과 관측성 스택을 분석한다. Istio Gateway/VirtualService의 경로 기반 라우팅, SSE 스트리밍 버퍼링 문제 해결, DestinationRule 트래픽 정책을 다루고, Prometheus/Loki/Tempo/Grafana로 구성된 Observability 스택의 메트릭 수집, 로그 집계, 분산 트레이싱, 알림 규칙까지 정리한다.
-
GPU 상태 모니터링 및 자동 모델 배포 시스템
amdsmi → pynvml → torch.hip → torch.cuda 순서의 Fallback Chain으로 GPU를 감지하고, xgen-model이 UI 설정에 따라 자동으로 vLLM 또는 llama-server를 선택해 배포하는 시스템
-
K3s + ArgoCD로 AI 플랫폼 GitOps 배포 구축하기
K3s 기반 Kubernetes 클러스터에 ArgoCD, Istio, Grafana, Prometheus를 구성하여 AI 플랫폼 6개 마이크로서비스를 GitOps 방식으로 운영 배포한 과정.