Tag: 성능최적화
All the articles with the tag "성능최적화".
-
Jenkins executor 수 최적화: 6개 서비스 동시 빌드를 위한 성능 튜닝
numExecutors 2에서 6으로 증가, K3s 노드 리소스 계획, 빌드 큐 병목 해소 과정
-
vLLM + llama.cpp GPU 모델 서빙 최적화 실전기
대규모 언어 모델의 효율적인 서빙을 위해 vLLM과 llama.cpp 기반 추론 엔진을 구축한 과정. GPU 리소스 최적화, 동적 배칭, CUDA 메모리 관리까지 프로덕션 경험을 정리한다.
-
아이스크림몰 AI Search 구축 사례
교육전문 쇼핑몰 아이스크림몰에 AI 기반 통합 검색 시스템을 도입한 사례를 정리한다. 초당 5,000건 이상의 검색 트래픽 대응, 검색엔진 인프라 재구성, AI 모델 최적화 과정을 다룬다.
-
OpenSearch 샤드 구성 — number_of_shards 설정 가이드
OpenSearch에서 인덱스의 number_of_shards를 설정하는 기준을 정리한다. 데이터 분산 저장, 병렬 검색 처리, 수평 확장을 위한 샤드 수 결정 방법과 주의사항을 다룬다.