4-3. 모델 선택 전략 | AI 고급 실무

01

트레이드오프 삼각형

성능, 비용, 지연시간의 균형

복잡한 추론, 코딩, 창의적 작업

Claude Opus, GPT-5 Pro

대량 처리, 예산 제약

DeepSeek V3, Gemini Flash

실시간 응답, 음성 에이전트

GPT-4.1-nano, Gemini Flash-Lite

💡 핵심 질문

"어떤 모델이 최고인가?"가 아니라 "어떤 차원이 가장 중요한가?"를 먼저 결정하세요.

02

용도에 맞는 최적 모델

사용 사례	우선순위	권장 모델
실시간 챗봇	지연시간 > 비용	GPT-4o-mini, Claude Haiku, Gemini Flash
음성 에이전트	지연시간 >>> 비용	Gemini Flash-Lite, GPT-4.1-nano
코드 생성	성능 > 지연시간	Claude Opus 4.5, GPT-4.1
문서 요약	비용 > 성능	DeepSeek V3, Mistral Medium
복잡한 추론	성능 >>> 비용	GPT-5 Pro, Claude Opus 4.1

03

TTFT와 출력 속도

⚠️ 지연시간 요구사항

SUMMARY