홈 블로그 활동 & 프로젝트

Kubernetes

4개의 게시글

Published on
2026년 5월 6일
AI 조교 기획 및 Ollama를 vLLM으로 전환해 동시 사용자 50명 처리하기
Ollama 기반 LLM 서버의 동시 요청 병목을 분석하고 vLLM으로 전환해 동시 사용자 50명 수준까지 안정적으로 처리하도록 개선했습니다.
대표-글LLMvLLMKubernetesInfra
Published on
2026년 5월 2일
k3s에서 vLLM GPU 워크로드 실행하기
Code Place AI 조교 기능을 운영 클러스터에서 실행하기 위해 NVIDIA 드라이버, runtime, k3s containerd, RuntimeClass, device plugin 설정을 맞췄습니다.
대표-글Kubernetesk3svLLMCUDAInfra
Published on
2026년 4월 27일
WAL 폭주 이후 Longhorn/CNPG 장애 복구기
Code Place 운영 중 WAL 증가로 시작된 디스크 부족 장애를 Longhorn replica 조정, CNPG 복구, multipathd 간섭 해결, 디스크 추가, WAL 상태 점검으로 복구했습니다.
대표-글KubernetesLonghornCNPGPostgreSQLInfra
Published on
2026년 4월 23일
Longhorn Mount Conflict와 multipathd 간섭 가능성 추적
WAL 폭주 이후 Longhorn·CNPG 복구 과정에서 발생한 볼륨 마운트 실패를 Kubernetes 이벤트, share-manager, ext4 메시지, multipathd 간섭 가능성으로 추적했습니다.
대표-글LonghornKubernetesLinuxStorageInfra