최근 개발 트렌드는 단순히 문법을 외우는 것이 아니라, 얼마나 똑똑한 AI 코딩 비서를 곁에 두느냐로 바뀌고 있습니다. 하지만 매달 지출되는 구독료가 부담스럽거나 내 소중한 코드가 외부 서버로 전송되는 보안 문제가 걱정되셨나요?
오늘은 현재 전 세계적으로 가장 핫한 Cursor(커서)의 대항마 Windsurf(윈드서프)와 구글의 차세대 에디터 Google IDX (안티그래비티)를 중심으로, 초보자도 윈도우 환경에서 10분 만에 구축할 수 있는 무료 AI 코딩 환경을 소개해 드리려고 합니다.
특히 인터넷 연결 없이도 내 컴퓨터 성능만으로 돌아가는 Ollama(올라마)와 코딩 특화 모델인 Qwen 2.5 Coder를 연동하는 실전 세팅법까지 담았습니다. 파이썬과 Node.js 설치부터 에러 해결 팁까지, 코딩을 전혀 모르는 초보자도 윈도우 환경에서 바로 시작할 수 있도록 필요한 도구와 설정 방법을 정리해 드립니다.
목차
1. 무료 AI 코딩 도구 종류: 전용 에디터(IDE) 선택
코딩을 할 때 가장 먼저 필요한 것은 코드를 작성하는 “공장”인 에디터입니다. 요즘은 코드를 한 줄씩 직접 치기보다 AI가 흐름을 파악해 대신 짜주는 ‘AI 네이티브 에디터’가 대세입니다. 어떤 공장을 선택하느냐에 따라 코딩의 재미가 달라집니다.
1-1. Cursor (커서)
현재 전 세계에서 가장 많은 사람이 선택한 AI 에디터의 표준입니다. 비주얼 스튜디오 코드(VS Code)를 그대로 옮겨온 듯한 익숙한 화면 덕분에 기존 사용자들도 적응 기간 없이 바로 쓸 수 있습니다.
- 장점: 내 프로젝트 전체를 머릿속에 넣고 있는 듯한 정교한 코드 분석력과 버그를 찾아내는 귀신같은 능력이 일품입니다.
1-2. Windsurf (윈드서프) – 강력 추천 대안
코드이움(Codeium) 팀에서 야심 차게 내놓은 에디터로, 커서의 독주를 막고 있는 가장 강력한 라이벌입니다. 여기에는 ‘Cascade(캐스케이드)’라는 AI 항해사가 탑재되어 있습니다.
- 장점: “이 기능 구현해줘” 한마디에 파일 생성부터 터미널 명령어 입력까지 스스로 판단해서 움직이는 자율성이 매우 뛰어납니다. 초보자가 “다음에 뭐 해야 하지?”라고 고민할 필요가 없을 정도로 직관적입니다.
1-3. Google IDX (안티그래비티)
구글이 야심 차게 공개한 차세대 AI 에디터입니다. 구글의 강력한 인프라와 최신 모델을 가장 먼저 경험해 볼 수 있는 창구입니다.
- 특징: 현재 퍼블릭 프리뷰 기간이라 Gemini 3 Pro 같은 고가의 모델을 무료로 마음껏 써볼 수 있는 파격적인 기회를 제공합니다. 구글 클라우드 환경과 연결성이 좋아 확정성이 뛰어납니다.
1-4. Trae (트래) – 떠오르는 무서운 신예
틱톡을 만든 바이트댄스에서 출시한 AI 에디터입니다. “무료로 이 정도까지 해준다고?”라는 말이 절로 나올 만큼 강력한 퍼포먼스를 보여줍니다.
- 장점: 커서의 유료 기능을 거의 대부분 무료로 제공하며, Claude 3.5 Sonnet 같은 고성능 모델을 무료 횟수 제한 없이 사용할 수 있어 가성비 끝판왕으로 불립니다.
1-5. PearAI (페어 AI) – 오픈소스의 자존심
특정 기업에 종속되지 않고 누구나 발전시킬 수 있는 오픈소스 기반의 AI 에디터입니다.
장점: 투명한 운영 방식과 사용자 커뮤니티의 피드백이 빠르게 반영됩니다. 내 코드가 어떻게 활용되는지 걱정되는 보안 중시 사용자들에게 좋은 선택지입니다.
1-6. Visual Studio Code (VS Code) – 영원한 클래식 끝판왕
마이크로소프트에서 만든 무료 에디터로, 전 세계 점유율 1위입니다. 앞서 소개한 Cursor나 Windsurf도 사실 이 VS Code를 밑바탕으로 해서 만든 형제들입니다.
- 왜 여전히 최고인가?
- 확장성: ‘마켓플레이스’에 없는 게 없습니다. 파이썬, 자바, HTML 등 어떤 언어든 플러그인 하나면 완벽 세팅됩니다.
- Codeium(코드이움) 조합: VS Code 자체에는 AI가 없지만, 여기에 Codeium 확장 프로그램을 설치하면 유료 AI 에디터 부럽지 않은 무료 AI 코딩 환경이 완성됩니다.
- 신뢰도: 대기업(MS)이 관리하므로 가장 안정적이고, 문제가 생겼을 때 구글링하면 해결책이 수만 개 나옵니다
2. 확장 프로그램형 – 비주얼 스튜디오 코드 활용
이미 비주얼 스튜디오 코드(VS Code)를 쓰고 있다면 플러그인만 설치해서 쓸 수 있습니다.
- GitHub Copilot (무료 티어): 예전에는 유료였으나, 2026년 현재 가벼운 사용자를 위한 무료 플랜을 운영 중입니다.
- 혜택: 월 2,000회 정도의 코드 자동 완성 제안을 무료로 받을 수 있어, 타이핑 양을 줄이는 데 최고입니다.
- Codeium (코드이움): 개인 사용자에게 평생 무료를 선언한 가장 혜자스러운 도구입니다.
- 혜택: 40개 이상의 프로그래밍 언어를 지원하며, 개인용으로는 기능 제한 없이 거의 무제한으로 사용 가능합니다.
- Claude 3.5 / 4.6 Sonnet: 개발자들 사이에서 코딩 실력이 가장 좋다고 평가받는 모델입니다.
- 혜택: 매일 일정량의 대화가 무료이며, 복잡한 알고리즘을 물어볼 때 가장 정확한 답을 줍니다.
- ChatGPT (GPT-4o): 가장 대중적이며 전체적인 프로젝트 구조를 잡을 때 유리합니다.
2-1. 나에게 맞는 AI 비서 (유/무료 도구)
| 구분 | 이름 | 특징 | 비용 |
| 에디터 내장 | Windsurf (Cascade) | 에이전트 기반 자율 코딩, 초보자 친화적 | 부분 무료 |
| 에디터 내장 | Cursor AI | 프로젝트 전체 문맥 파악 및 코드 완성 | 부분 무료 |
| 웹 브라우저 | Claude 3.5 Sonnet | 코딩 실력이 매우 뛰어나며 설명이 친절함 | 부분 무료 |
| 로컬 실행 | Ollama (올라마) | 내 컴퓨터 자원을 사용하여 오프라인 실행 | 완전 무료 |
3. AI 코딩 윈도우 환경 설정하기 (파이썬과 노드)
AI가 아무리 좋은 코드를 짜줘도 내 컴퓨터에서 실행할 엔진이 없으면 무용지물입니다. 가장 범용성 높은 두 가지 엔진을 설치해 두는 것이 ‘정석’입니다.
Step 1: 파이썬(Python) 설치 – AI의 심장
AI, 데이터 분석, 자동화 스크립트의 90%는 파이썬으로 돌아갑니다.
- 설치법:python.org에서 최신 버전을 받습니다.
- 주의사항: 설치 창 맨 아래의 [Add Python to PATH] 체크박스를 반드시 체크하세요! 이걸 안 하면 나중에 명령어가 안 먹혀서 처음부터 다시 설치해야 할 수도 있습니다.
Step 2: Node.js(노드) 설치 – 웹의 근육
만약 AI를 활용해 웹사이트를 만들거나, 최신 AI 에이전트 도구들을 실행하고 싶다면 Node.js가 필수입니다.
- 이유: 요즘 유행하는 많은 개발 도구와 웹 프레임워크(React, Next.js 등)가 노드 기반으로 움직입니다. 파이썬이 ‘두뇌’라면 노드는 ‘팔다리(사용자 화면)’를 만드는 데 특화되어 있습니다.
- 설치법:nodejs.org에서 LTS(Long Term Support) 버전을 내려받아 설치하세요.
4. 로컬 설치형 AI 종류 – 보안과 완전 무료
인터넷 연결 없이 내 컴퓨터의 성능만으로 AI를 돌리는 방식입니다. 로컬 AI는 내 컴퓨터의 자원(GPU/CPU)을 사용하기 때문에 보안이 철저하고 인터넷 없이도 작동한다는 공통점이 있습니다.
1. LM Studio (엘엠 스튜디오) – 초보자 강추 UI
Ollama가 명령어를 입력하는 방식(CLI)이라면, LM Studio는 마우스로 클릭해서 사용하는 그래픽 인터페이스(GUI)를 제공합니다.
- 장점: 어떤 모델이 내 컴퓨터 사양에 맞는지 시각적으로 알려줍니다. 허깅페이스(Hugging Face)에 올라온 수만 개의 AI 모델을 검색해서 바로 설치할 수 있습니다.
- 추천: 검은 화면의 명령어가 낯선 초보자에게 가장 좋습니다.
2. AnythingLLM (에니씽 LLM) – 나만의 지식베이스 구축
로컬 AI에 내 문서(PDF, 워드, 메모장)를 학습시켜서 대화하고 싶을 때 최고의 도구입니다.
- 장점: 내 컴퓨터에 있는 파일들을 AI에게 읽히고 그 내용에 대해 질문할 수 있습니다. 윈도우용 앱으로 나와 있어 설치가 매우 쉽습니다.
- 추천: 공부하는 학생이나 업무용 문서를 AI와 분석하고 싶은 직장인에게 좋습니다.
3. Jan (잔) – 가볍고 깔끔한 오픈소스
Ollama처럼 가벼우면서도 예쁜 채팅창 화면을 가진 도구입니다.
- 장점: 오픈소스이며 매우 가볍습니다. 엔비디아(NVIDIA) 그래픽카드가 없어도 CPU만으로 꽤 준수한 속도를 보여줍니다.
- 추천: 디자인이 깔끔한 도구를 선호하는 사용자에게 적합합니다.
로컬 AI 도구 한눈에 비교
| 도구 이름 | 방식 | 주요 특징 | 추천 대상 |
| Ollama | 명령어 중심 | 가볍고 다른 프로그램(Windsurf 등)과 연결성 최고 | 개발자, 숙련자 |
| LM Studio | 클릭 중심 UI | 모델 검색과 설치가 가장 쉬움 | 완전 초보자 |
| AnythingLLM | 문서 학습 특화 | 내 파일(PDF 등)을 기반으로 대화 가능 | 문서 분석가 |
| Jan | 깔끔한 앱 형태 | 가볍고 설정이 직관적임 | 심플한 사용 선호 |
- Ollama (올라마): 내 컴퓨터에 직접 AI 모델을 내려받아 사용합니다.
- 특징: 한 번 설치하면 횟수 제한이나 구독료 없이 완전 무료입니다. Llama 4나 DeepSeek 같은 최신 오픈소스 모델을 연결해 쓸 수 있어 개인 정보 보호가 중요한 작업에 최적입니다.
| 특징 | Codeium (코드이움) | Ollama (올라마) |
| 방식 | 클라우드 방식 (온라인 연결 필요) | 로컬 방식 (내 컴퓨터에서 실행) |
| 설치 | VS Code 플러그인 설치로 끝 | 프로그램 설치 + 모델 다운로드 필요 |
| 컴퓨터 사양 | 저사양 PC에서도 쌩쌩함 | 고사양(특히 그래픽카드)일수록 빠름 |
| 개인정보 | 서버로 코드가 전달됨 (암호화됨) | 100% 내 컴퓨터 안에서만 작동 |
| 주요 기능 | 자동 완성, 채팅, 코드 설명 | 다양한 오픈소스 AI 모델 테스트 및 실행 |
5. Ollama에서 Qwen2.5-Coder 모델 설치
터미널(또는 CMD)을 열고 아래 명령어를 입력하여 모델을 내려받습니다. 모델 크기에 따라 3b, 7b, 32b 등 옵션이 있으나, 일반적으로 7b나 14b 모델이 성능과 속도의 균형이 좋습니다.
ollama run qwen2.5-coder:7b1. VSCode 확장 프로그램 설치
VSCode 마켓플레이스에서 Ollama와 연동되는 확장 프로그램을 설치해야 합니다. 가장 대중적이고 설정이 간편한 도구는 Continue입니다.
- Continue: 개발 워크플로우 전반(채팅, 코드 생성, 편집)을 지원합니다.
- Llama Coder: GitHub Copilot과 유사한 ‘Inline Autocomplete(한 줄 자동 완성)’에 특화되어 있습니다.
2. 연동 설정 (Continue 기준)
- VSCode 왼쪽 사이드바에서 Continue 아이콘을 클릭합니다.
- 하단의 톱니바퀴 아이콘(Open Config)을 눌러
config.json파일을 엽니다. models배열 안에 아래와 같이 Ollama 설정을 추가합니다.
3. 직접 파일 경로로 열기 (가장 확실함)
명령어가 안 먹힐 때는 윈도우에서 직접 파일을 찾아 여는 게 가장 빠릅니다.
- 윈도우 탐색기를 엽니다.
- 상단 주소창에 아래 경로를 그대로 복사해서 붙여넣고 엔터를 치세요.
%USERPROFILE%\.continue - 해당 폴더 안에 있는
config.json파일을 마우스 오른쪽 버튼으로 클릭합니다. - [연결 프로그램] – [Visual Studio Code]를 선택해 엽니다.
4. 사이드바의 톱니바퀴 아이콘 찾기
VSCode 화면 왼쪽의 Continue 아이콘을 누르면 뜨는 가이드 화면이나 채팅창에서 맨 아래 구석을 자세히 보세요.
- 작은 톱니바퀴(설정) 모양 아이콘이 있습니다.
- 그걸 클릭하면
config.json( config.yam) 파일이 VSCode 에디터 창에 바로 뜹니다.
6. Ollama 터미널 주요 명령어
윈도우 ‘명령 프롬프트(CMD)’나 ‘PowerShell’을 열고 아래 명령어들을 입력해 보세요.
1. 내 컴퓨터에 설치된 모델 목록 보기
가장 많이 사용하는 명령어입니다. 현재 내 하드디스크에 다운로드된 AI 모델들을 한눈에 보여줍니다.
ollama list
# 또는 짧게
ollama ls출력 내용: 모델 이름(NAME), ID, 용량(SIZE), 수정된 날짜(MODIFIED) 등이 표 형태로 나타납니다.
2. 현재 실행 중인 모델 확인하기
내 컴퓨터 메모리(RAM)에 올라가서 실제로 작동 중인 AI가 무엇인지 확인할 때 사용합니다.
ollama ps3. 새로운 모델 다운로드하기 (설치)
Ollama 도서관(Library)에서 원하는 모델을 내 컴퓨터로 가져옵니다.
ollama pull llama3.24. 모델 실행하기 (대화 시작)
AI와 바로 대화를 시작하고 싶을 때 사용합니다. 모델이 없다면 자동으로 다운로드 후 실행합니다.
ollama run llama3.2- 종료 방법: 대화창에서
/bye를 입력하거나Ctrl + D를 누르면 터미널로 돌아옵니다.
5. 모델 삭제하기
더 이상 쓰지 않는 모델을 지워 용량을 확보합니다.
ollama rm llama3.21. 모델 선택 확인
VSCode 왼쪽 사이드바의 Continue 창 하단을 보면 모델을 선택하는 드롭다운 메뉴가 있습니다. 거기서 Ollama – Qwen2.5-Coder가 선택되어 있는지 확인해 주세요.
| 모델 이름 | 추천 용도 | 특징 |
| llama3.2 | 일반 대화 & 입문용 | 메타(Meta)에서 만든 가장 대중적인 모델 |
| qwen2.5-coder | 코딩 특화 | 코딩 실력이 매우 뛰어나 개발자들에게 인기 |
| phi3 | 저사양 PC용 | 마이크로소프트에서 만든 작고 가벼운 고성능 모델 |
| deepseek-r1 | 논리 추론 | 복잡한 수학이나 논리 문제를 풀 때 탁월함 |
7. Windsurf 에디터에 Ollama 모델 설정 적용하기
1. 설정 파일 위치 찾기
윈드서프는 로컬 모델 설정을 특정 폴더의 파일로 관리합니다.
- 윈도우 탐색기를 엽니다.
- 주소창에 아래 경로를 복사해서 붙여넣고 엔터를 누릅니다.
- 해당 폴더 안에
user_models.yaml이라는 파일이 있는지 확인합니다. (없다면 마우스 우클릭 – 새로 만들기 – 텍스트 문서로 만든 후 이름을 확장자까지 똑같이 변경해 주세요.)
주소:
%USERPROFILE%\.codeium\windsurf\models2. 코드 복사 및 붙여넣기
user_models.yaml파일을 메모장이나 설치한 윈드서프 에디터로 엽니다.- 아래 내용을 그대로 붙여넣고 저장(
Ctrl + S)합니다.
version: v1
models:
- name: Qwen 2.5 Coder 7B
provider: ollama
model: qwen2.5-coder:7b
roles:
- chat
- edit
- apply
- name: Llama 3.1
provider: ollama
model: llama3.1:latest
roles:
- chat
- edit
- apply
- name: Qwen 1.5B (Auto)
provider: ollama
model: qwen2.5-coder:1.5b-base
roles:
- autocomplete
- name: Nomic Embed
provider: ollama
model: nomic-embed-text:latest
roles:
- embed이 코드는 Windsurf(윈드서프)나 Cursor(커서) 같은 AI 에디터에서 Ollama(로컬 AI)를 연결해 사용하기 위해 작성된 환경 설정 파일(YAML 형식)입니다.
쉽게 말해, 에디터에게 “내 컴퓨터(Ollama)에 이런 AI 모델들이 설치되어 있으니, 상황에 맞춰서 이 모델들을 써라”라고 지시하는 ‘사용 설명서’라고 보시면 됩니다
3. 첫 테스트 (채팅 모드)
- 단축키
Ctrl + L을 눌러 Continue 채팅창을 엽니다. Hello, what model are you?또는간단한 구구단 파이썬 코드 짜줘라고 입력해 보세요.- 답변이 나오기 시작하면 연동에 성공한 것입니다.
4. 실전 테스트 (자동 완성)
- 아무 코드 파일(
.py,.js,.html등)이나 하나 만듭니다. def calculate_area(radius):처럼 함수 이름만 적고 잠시 기다려 보세요.- 회색 글씨로 제안이 뜨면
Tab키를 눌러 수락할 수 있습니다.
팁: 자동 완성 기능 최적화
단순히 채팅뿐만 아니라 코드를 타이핑할 때 바로 추천이 뜨게 하려면, config.json의 tabAutocompleteModel 섹션에도 동일하게 Qwen2.5-Coder를 지정해 주면 됩니다.
8. Qwen2.5-Coder:7b 모델 소개
Qwen2.5-Coder:7b 모델은 현재 로컬 LLM 시장에서 ‘속도’와 ‘성능’의 균형이 가장 잘 잡힌 모델 중 하나로 평가받습니다. 단순히 빠른 것을 넘어, 코딩 실력 대비 리소스 소모가 매우 효율적입니다.
1. 추론 속도 (Token per Second)
Qwen2.5-Coder:7b는 파라미터 수가 70억 개 수준으로, 최신 데스크톱이나 노트북(특히 Apple Silicon 또는 NVIDIA RTX 30/40 시리즈)에서 초당 수십 개에서 백여 개의 토큰을 생성할 수 있습니다.
- 체감 속도: 사용자가 코드를 읽는 속도보다 AI가 코드를 작성하는 속도가 더 빠릅니다.
- 비교: 32b나 70b 모델이 “생각하며 천천히 쓰는” 느낌이라면, 7b는 “막힘없이 쏟아내는” 수준입니다.
2. 코딩 특화 아키텍처
단순히 언어 모델을 줄인 것이 아니라, 방대한 양의 소스 코드를 학습했기 때문에 적은 파라미터로도 복잡한 로직을 정확하게 파악합니다.
- 컨텍스트 윈도우: 최대 128k 토큰을 지원하여 긴 코드 파일도 한 번에 읽고 처리할 수 있습니다.
- FIM(Fill-In-the-Middle) 지원: 코드 중간을 채워넣는 능력이 탁월해, VSCode의 인라인 자동 완성(Ghost Text)에 최적화되어 있습니다.
3. 사양별 체감 성능
사용 중인 하드웨어에 따라 속도 차이가 있을 수 있습니다.
| 하드웨어 구분 | 권장 양자화(Quantization) | 체감 속도 |
| VRAM 12GB 이상 GPU | 4-bit 또는 8-bit (FP16 가능) | 매우 빠름 (즉시 응답) |
| Apple M2/M3 (16GB RAM) | 4-bit (Q4_K_M) | 쾌적함 |
| 일반 사무용 CPU/RAM | 4-bit 이하 | 약간의 지연 발생 가능 |
만약 현재 7b 모델의 응답 속도가 답답하게 느껴진다면, 성능은 조금 양보하더라도 극강의 속도를 자랑하는 0.5b 또는 1.5b 모델을 사용해 보세요