로컬 AI 서버 원도우11에 설치하기: FastAPI + llama-server구현 및 AI 외부 접속 설정
AI 모델을 한 번 돌릴 때마다 1~3분씩 하염없이 기다리는 시간, 정말 지루하죠. 특히 이것저것 프로젝트를 많이 벌여놓고 테스트하다 보면 로딩 속도 때문에 흐름이 다 끊기기 일쑤입니다. 게다가 여러 파이썬 프로그램에서 같은 로컬 LLM을 동시에 불러오려다 메모리 부족(OOM) 메시지를 볼 때면 정말 힘이 빠지죠. 이런 고민을 하시는 분들께 해결책이 있습니다. 바로 FastAPI를 활용한 로컬 AI 서버 […]