홈 블로그 활동 & 프로젝트

LLM

2개의 게시글

Published on
2026년 5월 6일
AI 조교 기획 및 Ollama를 vLLM으로 전환해 동시 사용자 50명 처리하기
Ollama 기반 LLM 서버의 동시 요청 병목을 분석하고 vLLM으로 전환해 동시 사용자 50명 수준까지 안정적으로 처리하도록 개선했습니다.
대표-글LLMvLLMKubernetesInfra
Published on
2025년 4월 13일
RAG 파이프라인으로 LLM 환각 현상 완화하기
DocDoc에서 질문만 LLM에 전달할 때 생기는 근거 없는 답변을 RAG, reranking, SSE 스트리밍으로 줄였습니다.
RAGLLMPineconeLangChainAI