PART 2 · 강의 3/3
오픈 웨이트 모델의 부상
Qwen, DeepSeek, Llama — 오픈소스 LLM이 AI 생태계를 바꾸고 있습니다.
01
Closed vs Open Weight
먼저 용어를 명확히 이해합시다
Closed Model (폐쇄형)
모델 가중치(weights)를 공개하지 않음.
API를 통해서만 사용 가능.
예시: GPT-4, Claude, Gemini
장점: 안정적인 서비스, 보안
단점: 비용, 커스터마이징 불가
API를 통해서만 사용 가능.
예시: GPT-4, Claude, Gemini
장점: 안정적인 서비스, 보안
단점: 비용, 커스터마이징 불가
Open Weight (오픈 웨이트)
모델 가중치를 공개하여 다운로드 가능.
로컬에서 실행, 파인튜닝 가능.
예시: Llama, Qwen, DeepSeek
장점: 무료, 커스터마이징, 프라이버시
단점: 하드웨어 필요, 자체 관리
로컬에서 실행, 파인튜닝 가능.
예시: Llama, Qwen, DeepSeek
장점: 무료, 커스터마이징, 프라이버시
단점: 하드웨어 필요, 자체 관리
💡 "오픈소스" vs "오픈 웨이트"
엄밀히 말하면 오픈 웨이트 ≠ 오픈소스입니다. 진정한 오픈소스는 학습 데이터, 코드, 가중치를 모두 공개합니다. 대부분의 "오픈" 모델은 가중치만 공개하는 오픈 웨이트입니다.
02
2025-2026 오픈 모델 순위
Qwen이 Llama를 넘어섰다
Hugging Face 다운로드 기준 (2025년 말)
1
Qwen (Alibaba)
Qwen3, Qwen2.5 시리즈 · 1조+ 파라미터 (MoE) · 119개 언어 지원
2
DeepSeek
DeepSeek V3, R1 · RLVR 기반 추론 · MIT 라이선스
3
Llama (Meta)
Llama 3.3 70B, Llama 4 · 최대 405B 파라미터 · 배포 용이
4
Mistral
Mistral Large, Mixtral · 유럽 대표 오픈 모델
5
Gemma (Google)
Gemma 2 · 경량 모델 특화 · 연구용으로 인기
📉 Llama의 위상 변화
2023-2024년까지 Llama가 오픈 모델의 절대 강자였지만, 2025년에 Qwen이 다운로드 수와 파인튜닝 베이스 모델 모두에서 1위를 차지했습니다.
03
오픈 모델을 사용해야 하는 이유
비용, 프라이버시, 커스터마이징
비용 절감
API 호출 비용 없음.
대량 처리 시 90% 이상 절감.
대량 처리 시 90% 이상 절감.
데이터 프라이버시
데이터가 외부로 나가지 않음.
온프레미스, 에어갭 환경 가능.
온프레미스, 에어갭 환경 가능.
커스터마이징
파인튜닝으로 도메인 특화.
원하는 대로 수정 가능.
원하는 대로 수정 가능.
다양한 크기
0.5B ~ 405B까지 선택 가능.
용도에 맞는 최적 크기.
용도에 맞는 최적 크기.
벤더 독립성
특정 회사에 종속되지 않음.
서비스 중단 걱정 없음.
서비스 중단 걱정 없음.
낮은 레이턴시
네트워크 왕복 없음.
로컬에서 즉시 응답.
로컬에서 즉시 응답.
🔒 Closed Model 사용 시
GPT-4, Claude API
- ✓ 즉시 사용 가능
- ✓ 하드웨어 불필요
- ✓ 항상 최신 버전
- ✗ 사용량 비례 비용
- ✗ 데이터 외부 전송
- ✗ 커스터마이징 제한
🔓 Open Model 사용 시
Qwen, DeepSeek, Llama
- ✓ 무제한 사용 (무료)
- ✓ 완전한 데이터 통제
- ✓ 자유로운 커스터마이징
- ✗ GPU 하드웨어 필요
- ✗ 자체 운영 책임
- ✗ 업데이트 수동 적용
04
라이선스 이해하기
상업적 사용이 가능한가?
오픈 모델이라고 해서 모두 자유롭게 사용할 수 있는 것은 아닙니다. 라이선스를 반드시 확인해야 합니다.
모델
라이선스
상업적 사용
DeepSeek R1
MIT License
✓ 자유롭게 가능
Qwen
Apache 2.0 / Custom
✓ 자유롭게 가능
Llama 3
Llama 3 Community License
△ 조건 확인 필요
Gemma
Gemma Terms of Use
△ 조건 확인 필요
Mistral
Apache 2.0
✓ 자유롭게 가능
📌 라이선스별 특징
- MIT / Apache 2.0 — 가장 자유로움, 상업적 사용 OK, 수정/배포 OK
- Llama License — 월 7억 MAU 이상 기업은 Meta 허가 필요
- Custom License — 각 모델의 사용 정책(Acceptable Use Policy) 확인 필수
05
언제 오픈 모델을 선택해야 할까?
상황별 최적의 선택
✅ 오픈 모델이 적합한 경우
🏥 민감한 데이터 처리
의료, 금융, 법률 등 데이터가 외부로 나가면 안 되는 경우.
온프레미스에서 완전 격리 운영.
📊 대량 처리
수백만 건의 문서 분석, 대규모 데이터 처리.
API 비용이 천문학적으로 늘어나는 경우.
🎯 도메인 특화
특정 분야(법률, 의학, 코딩 등)에 맞게 파인튜닝이 필요한 경우.
범용 모델로는 부족할 때.
🔌 오프라인 환경
인터넷 연결 없이 작동해야 하는 환경.
에어갭 네트워크, 엣지 디바이스.
⚠️ 오픈 모델 사용 시 주의사항
⚠️ 고려해야 할 리스크
- 하드웨어 비용 — 고성능 GPU 필요 (70B 모델 = A100 80GB 이상)
- 운영 책임 — 보안 업데이트, 모니터링, 장애 대응 자체 수행
- 데이터 편향 — 학습 데이터의 편향이 그대로 반영될 수 있음
- 지정학적 이슈 — 일부 기업은 중국 모델(Qwen, DeepSeek) 사용 제한
- 품질 보장 없음 — API 서비스처럼 SLA가 없음
SUMMARY
핵심 요약
- 오픈 웨이트 모델은 가중치를 공개하여 다운로드/실행/파인튜닝 가능
- Qwen이 2025년 가장 많이 다운로드된 오픈 모델 (Llama 추월)
- DeepSeek R1은 MIT 라이선스로 완전 자유로운 상업적 사용 가능
- 오픈 모델의 장점: 비용 절감, 프라이버시, 커스터마이징
- 주의사항: 하드웨어 비용, 운영 책임, 라이선스 확인 필수