Tag: AMD GPU

All the articles with the tag "AMD GPU".

AMD GPU에서 LLM 돌리기: Vulkan vs ROCm 비교

31 Jan, 2026

XGEN 모델 서버에서 AMD GPU로 LLM을 서빙할 때 Vulkan과 ROCm 백엔드를 선택하는 기준, mlock 설정, GPU 감지 fallback chain 구현까지 실전 비교
임베딩 전용 서버 분리와 대용량 배치 처리 최적화

30 Jan, 2026

임베딩 모델을 LLM 서빙과 분리한 전용 서버 아키텍처 설계. switch-backend 기반 멀티모드 서빙과 batch size 512에서 2048로 확대한 대용량 문서 배치 처리 최적화 과정.

AMD GPU에서 LLM 돌리기: Vulkan vs ROCm 비교