2-3. 오픈 웨이트 모델의 부상

01

Closed vs Open Weight

먼저 용어를 명확히 이해합시다

🔒

Closed Model (폐쇄형)

모델 가중치(weights)를 공개하지 않음.
API를 통해서만 사용 가능.

예시: GPT-4, Claude, Gemini
장점: 안정적인 서비스, 보안
단점: 비용, 커스터마이징 불가

🔓

Open Weight (오픈 웨이트)

모델 가중치를 공개하여 다운로드 가능.
로컬에서 실행, 파인튜닝 가능.

예시: Llama, Qwen, DeepSeek
장점: 무료, 커스터마이징, 프라이버시
단점: 하드웨어 필요, 자체 관리

💡 "오픈소스" vs "오픈 웨이트"

엄밀히 말하면 오픈 웨이트 ≠ 오픈소스입니다. 진정한 오픈소스는 학습 데이터, 코드, 가중치를 모두 공개합니다. 대부분의 "오픈" 모델은 가중치만 공개하는 오픈 웨이트입니다.

02

2025-2026 오픈 모델 순위

Qwen이 Llama를 넘어섰다

Hugging Face 다운로드 기준 (2025년 말)

1

Qwen (Alibaba)

Qwen3, Qwen2.5 시리즈 · 1조+ 파라미터 (MoE) · 119개 언어 지원

🇨🇳 중국

2

DeepSeek

DeepSeek V3, R1 · RLVR 기반 추론 · MIT 라이선스

🇨🇳 중국

3

Llama (Meta)

Llama 3.3 70B, Llama 4 · 최대 405B 파라미터 · 배포 용이

🇺🇸 미국

4

Mistral

Mistral Large, Mixtral · 유럽 대표 오픈 모델

🇫🇷 프랑스

5

Gemma (Google)

Gemma 2 · 경량 모델 특화 · 연구용으로 인기

🇺🇸 미국

📉 Llama의 위상 변화

2023-2024년까지 Llama가 오픈 모델의 절대 강자였지만, 2025년에 Qwen이 다운로드 수와 파인튜닝 베이스 모델 모두에서 1위를 차지했습니다.

03

오픈 모델을 사용해야 하는 이유

비용, 프라이버시, 커스터마이징

💰

비용 절감

API 호출 비용 없음.
대량 처리 시 90% 이상 절감.

🔐

데이터 프라이버시

데이터가 외부로 나가지 않음.
온프레미스, 에어갭 환경 가능.

🎨

커스터마이징

파인튜닝으로 도메인 특화.
원하는 대로 수정 가능.

📏

다양한 크기

0.5B ~ 405B까지 선택 가능.
용도에 맞는 최적 크기.

🚀

벤더 독립성

특정 회사에 종속되지 않음.
서비스 중단 걱정 없음.

⚡

낮은 레이턴시

네트워크 왕복 없음.
로컬에서 즉시 응답.

🔒 Closed Model 사용 시

GPT-4, Claude API

✓ 즉시 사용 가능
✓ 하드웨어 불필요
✓ 항상 최신 버전
✗ 사용량 비례 비용
✗ 데이터 외부 전송
✗ 커스터마이징 제한

🔓 Open Model 사용 시

Qwen, DeepSeek, Llama

✓ 무제한 사용 (무료)
✓ 완전한 데이터 통제
✓ 자유로운 커스터마이징
✗ GPU 하드웨어 필요
✗ 자체 운영 책임
✗ 업데이트 수동 적용

04

라이선스 이해하기

상업적 사용이 가능한가?

오픈 모델이라고 해서 모두 자유롭게 사용할 수 있는 것은 아닙니다. 라이선스를 반드시 확인해야 합니다.

DeepSeek R1

MIT License

✓ 자유롭게 가능

Qwen

Apache 2.0 / Custom

✓ 자유롭게 가능

Llama 3

Llama 3 Community License

△ 조건 확인 필요

Gemma

Gemma Terms of Use

△ 조건 확인 필요

Mistral

Apache 2.0

✓ 자유롭게 가능

📌 라이선스별 특징

MIT / Apache 2.0 — 가장 자유로움, 상업적 사용 OK, 수정/배포 OK
Llama License — 월 7억 MAU 이상 기업은 Meta 허가 필요
Custom License — 각 모델의 사용 정책(Acceptable Use Policy) 확인 필수

05

언제 오픈 모델을 선택해야 할까?

상황별 최적의 선택

✅ 오픈 모델이 적합한 경우

🏥 민감한 데이터 처리

의료, 금융, 법률 등 데이터가 외부로 나가면 안 되는 경우. 온프레미스에서 완전 격리 운영.

📊 대량 처리

수백만 건의 문서 분석, 대규모 데이터 처리. API 비용이 천문학적으로 늘어나는 경우.

🎯 도메인 특화

특정 분야(법률, 의학, 코딩 등)에 맞게 파인튜닝이 필요한 경우. 범용 모델로는 부족할 때.

🔌 오프라인 환경

인터넷 연결 없이 작동해야 하는 환경. 에어갭 네트워크, 엣지 디바이스.

⚠️ 오픈 모델 사용 시 주의사항

⚠️ 고려해야 할 리스크

하드웨어 비용 — 고성능 GPU 필요 (70B 모델 = A100 80GB 이상)
운영 책임 — 보안 업데이트, 모니터링, 장애 대응 자체 수행
데이터 편향 — 학습 데이터의 편향이 그대로 반영될 수 있음
지정학적 이슈 — 일부 기업은 중국 모델(Qwen, DeepSeek) 사용 제한
품질 보장 없음 — API 서비스처럼 SLA가 없음

SUMMARY

핵심 요약

오픈 웨이트 모델은 가중치를 공개하여 다운로드/실행/파인튜닝 가능
Qwen이 2025년 가장 많이 다운로드된 오픈 모델 (Llama 추월)
DeepSeek R1은 MIT 라이선스로 완전 자유로운 상업적 사용 가능
오픈 모델의 장점: 비용 절감, 프라이버시, 커스터마이징
주의사항: 하드웨어 비용, 운영 책임, 라이선스 확인 필수

📚 참고 자료 (신뢰성 검증됨)

Hugging Face - Open Source LLMs BentoML - Open Source LLMs 2026 Red Hat - State of Open Source AI 2025 Open Models Review