PART 13 · 강의 1/3
실전 프로젝트 설계
LLM 애플리케이션을 처음부터 끝까지 설계하는 방법을 학습합니다.
01
LLM 프로젝트 단계
체계적인 프로젝트 진행 과정
1
요구사항 분석
무엇을 만들 것인가? 사용자는 누구인가? 성공 기준은 무엇인가?
Use Case 정의
성능 요구사항
비용 예산
보안 요구사항
2
아키텍처 설계
LLM만 쓸지, RAG가 필요한지, Agent가 필요한지 결정.
기술 스택 선택
모델 선정
인프라 설계
데이터 파이프라인
3
프로토타입 개발
빠르게 MVP를 만들고 핵심 가정을 검증.
핵심 기능 구현
프롬프트 작성
초기 테스트
피드백 수집
4
평가 및 최적화
품질, 성능, 비용 측면에서 시스템을 평가하고 개선.
평가 데이터셋
메트릭 측정
프롬프트 최적화
비용 최적화
5
프로덕션 배포
안정적이고 확장 가능한 시스템으로 운영.
인프라 구축
모니터링
에러 처리
A/B 테스트
02
아키텍처 선택 가이드
상황에 맞는 아키텍처 결정
외부 지식이 필요한가?
No → 순수 LLM
모델의 학습 데이터로 충분한 경우
Yes, 정적 → RAG
문서, 지식 베이스 검색이 필요한 경우
Yes, 동적 → Agent
실시간 API, 도구 사용이 필요한 경우
작업의 복잡도는?
단순 → Single LLM/RAG
Q&A, 요약, 번역 등
중간 → Single Agent
다단계 작업, 도구 활용
복잡 → Multi-Agent
역할 분담, 전문성 필요
커스터마이징 수준은?
낮음 → 프롬프트 엔지니어링
지시, 예시, 맥락 제공
중간 → RAG + 프롬프트
도메인 지식 + 행동 지침
높음 → Fine-tuning
특수한 스타일/형식 필요
03
아키텍처 템플릿
실전에서 자주 사용되는 패턴
1. 기본 RAG 시스템
User Query
↓
[Query Processing] → Embedding Model
↓
[Vector Search] ← Vector Database (문서 인덱스)
↓
[Context + Query] → LLM → Response
2. Agentic RAG 시스템
User Query
↓
[LLM Router] → 라우팅 결정
↓
┌─────────┼─────────┐
↓ ↓ ↓
[Vector DB] [Web Search] [SQL DB]
└─────────┼─────────┘
↓
[Result Evaluation] → 충분? → [Generate]
↓ No
[Re-query/Expand]
3. Multi-Agent 시스템
User Task
↓
[Supervisor Agent] ← 작업 분배
↓
┌───────────────────────────┐
↓ ↓ ↓
[Research] [Code] [Review]
↓ ↓ ↓
└───────────┼────────┘
↓
[Supervisor] → 통합/검증 → Final Output
04
비용 추정
프로젝트 비용 계획
| 구성요소 | 비용 요소 | 최적화 방법 |
|---|---|---|
| LLM API | 입력/출력 토큰 수 | 캐싱, 프롬프트 압축, 저렴한 모델 혼용 |
| 임베딩 | 벡터화할 텍스트 양 | 로컬 모델 사용, 배치 처리 |
| Vector DB | 저장량, 쿼리 수 | 메모리 vs 디스크 선택, 인덱스 최적화 |
| 인프라 | 서버, 네트워크 | 서버리스, 오토스케일링 |
| Agent 루프 | 반복 횟수 x LLM 비용 | max_iterations 제한, 조기 종료 |
💡 비용 관리 팁
1. 개발 단계에서는 저렴한 모델(GPT-3.5, Claude Haiku)로 시작
2. 프롬프트 캐싱 적극 활용 (Anthropic, OpenAI 모두 지원)
3. 일별/월별 비용 제한 설정
4. 불필요한 Agent 루프 최소화
05
참고 자료
추가 학습 리소스
SUMMARY
핵심 요약
- 프로젝트 단계: 요구사항 분석 → 아키텍처 설계 → 프로토타입 → 평가 → 배포
- 아키텍처 선택: 외부 지식 필요성, 작업 복잡도, 커스터마이징 수준에 따라 결정
- RAG vs Agent: 정적 지식은 RAG, 동적 작업은 Agent 활용
- 비용 관리: 캐싱, 모델 선택, 프롬프트 최적화로 비용 절감
- 프로덕션: 모니터링, 에러 처리, A/B 테스트로 안정적 운영