홈 블로그 활동 & 프로젝트

vLLM

2개의 게시글

Published on
2026년 5월 6일
AI 조교 기획 및 Ollama를 vLLM으로 전환해 동시 사용자 50명 처리하기
Ollama 기반 LLM 서버의 동시 요청 병목을 분석하고 vLLM으로 전환해 동시 사용자 50명 수준까지 안정적으로 처리하도록 개선했습니다.
대표-글LLMvLLMKubernetesInfra
Published on
2026년 5월 2일
k3s에서 vLLM GPU 워크로드 실행하기
Code Place AI 조교 기능을 운영 클러스터에서 실행하기 위해 NVIDIA 드라이버, runtime, k3s containerd, RuntimeClass, device plugin 설정을 맞췄습니다.
대표-글Kubernetesk3svLLMCUDAInfra