PART 2 · 강의 3/3

오픈 웨이트 모델의 부상

Qwen, DeepSeek, Llama — 오픈소스 LLM이 AI 생태계를 바꾸고 있습니다.

01

Closed vs Open Weight

먼저 용어를 명확히 이해합시다

🔒
Closed Model (폐쇄형)
모델 가중치(weights)를 공개하지 않음.
API를 통해서만 사용 가능.

예시: GPT-4, Claude, Gemini
장점: 안정적인 서비스, 보안
단점: 비용, 커스터마이징 불가
🔓
Open Weight (오픈 웨이트)
모델 가중치를 공개하여 다운로드 가능.
로컬에서 실행, 파인튜닝 가능.

예시: Llama, Qwen, DeepSeek
장점: 무료, 커스터마이징, 프라이버시
단점: 하드웨어 필요, 자체 관리
💡 "오픈소스" vs "오픈 웨이트"

엄밀히 말하면 오픈 웨이트 ≠ 오픈소스입니다. 진정한 오픈소스는 학습 데이터, 코드, 가중치를 모두 공개합니다. 대부분의 "오픈" 모델은 가중치만 공개하는 오픈 웨이트입니다.

02

2025-2026 오픈 모델 순위

Qwen이 Llama를 넘어섰다

Hugging Face 다운로드 기준 (2025년 말)

1
Qwen (Alibaba)
Qwen3, Qwen2.5 시리즈 · 1조+ 파라미터 (MoE) · 119개 언어 지원
🇨🇳 중국
2
DeepSeek
DeepSeek V3, R1 · RLVR 기반 추론 · MIT 라이선스
🇨🇳 중국
3
Llama (Meta)
Llama 3.3 70B, Llama 4 · 최대 405B 파라미터 · 배포 용이
🇺🇸 미국
4
Mistral
Mistral Large, Mixtral · 유럽 대표 오픈 모델
🇫🇷 프랑스
5
Gemma (Google)
Gemma 2 · 경량 모델 특화 · 연구용으로 인기
🇺🇸 미국
📉 Llama의 위상 변화

2023-2024년까지 Llama가 오픈 모델의 절대 강자였지만, 2025년에 Qwen이 다운로드 수와 파인튜닝 베이스 모델 모두에서 1위를 차지했습니다.

03

오픈 모델을 사용해야 하는 이유

비용, 프라이버시, 커스터마이징

💰
비용 절감
API 호출 비용 없음.
대량 처리 시 90% 이상 절감.
🔐
데이터 프라이버시
데이터가 외부로 나가지 않음.
온프레미스, 에어갭 환경 가능.
🎨
커스터마이징
파인튜닝으로 도메인 특화.
원하는 대로 수정 가능.
📏
다양한 크기
0.5B ~ 405B까지 선택 가능.
용도에 맞는 최적 크기.
🚀
벤더 독립성
특정 회사에 종속되지 않음.
서비스 중단 걱정 없음.
낮은 레이턴시
네트워크 왕복 없음.
로컬에서 즉시 응답.

🔒 Closed Model 사용 시

GPT-4, Claude API

  • 즉시 사용 가능
  • 하드웨어 불필요
  • 항상 최신 버전
  • 사용량 비례 비용
  • 데이터 외부 전송
  • 커스터마이징 제한

🔓 Open Model 사용 시

Qwen, DeepSeek, Llama

  • 무제한 사용 (무료)
  • 완전한 데이터 통제
  • 자유로운 커스터마이징
  • GPU 하드웨어 필요
  • 자체 운영 책임
  • 업데이트 수동 적용
04

라이선스 이해하기

상업적 사용이 가능한가?

오픈 모델이라고 해서 모두 자유롭게 사용할 수 있는 것은 아닙니다. 라이선스를 반드시 확인해야 합니다.

모델
라이선스
상업적 사용
DeepSeek R1
MIT License
✓ 자유롭게 가능
Qwen
Apache 2.0 / Custom
✓ 자유롭게 가능
Llama 3
Llama 3 Community License
△ 조건 확인 필요
Gemma
Gemma Terms of Use
△ 조건 확인 필요
Mistral
Apache 2.0
✓ 자유롭게 가능
📌 라이선스별 특징
  • MIT / Apache 2.0 — 가장 자유로움, 상업적 사용 OK, 수정/배포 OK
  • Llama License — 월 7억 MAU 이상 기업은 Meta 허가 필요
  • Custom License — 각 모델의 사용 정책(Acceptable Use Policy) 확인 필수
05

언제 오픈 모델을 선택해야 할까?

상황별 최적의 선택

✅ 오픈 모델이 적합한 경우

🏥 민감한 데이터 처리
의료, 금융, 법률 등 데이터가 외부로 나가면 안 되는 경우. 온프레미스에서 완전 격리 운영.
📊 대량 처리
수백만 건의 문서 분석, 대규모 데이터 처리. API 비용이 천문학적으로 늘어나는 경우.
🎯 도메인 특화
특정 분야(법률, 의학, 코딩 등)에 맞게 파인튜닝이 필요한 경우. 범용 모델로는 부족할 때.
🔌 오프라인 환경
인터넷 연결 없이 작동해야 하는 환경. 에어갭 네트워크, 엣지 디바이스.

⚠️ 오픈 모델 사용 시 주의사항

⚠️ 고려해야 할 리스크

  • 하드웨어 비용 — 고성능 GPU 필요 (70B 모델 = A100 80GB 이상)
  • 운영 책임 — 보안 업데이트, 모니터링, 장애 대응 자체 수행
  • 데이터 편향 — 학습 데이터의 편향이 그대로 반영될 수 있음
  • 지정학적 이슈 — 일부 기업은 중국 모델(Qwen, DeepSeek) 사용 제한
  • 품질 보장 없음 — API 서비스처럼 SLA가 없음
SUMMARY

핵심 요약

  • 오픈 웨이트 모델은 가중치를 공개하여 다운로드/실행/파인튜닝 가능
  • Qwen이 2025년 가장 많이 다운로드된 오픈 모델 (Llama 추월)
  • DeepSeek R1은 MIT 라이선스로 완전 자유로운 상업적 사용 가능
  • 오픈 모델의 장점: 비용 절감, 프라이버시, 커스터마이징
  • 주의사항: 하드웨어 비용, 운영 책임, 라이선스 확인 필수