PART 13 · 강의 1/3

실전 프로젝트 설계

LLM 애플리케이션을 처음부터 끝까지 설계하는 방법을 학습합니다.

01

LLM 프로젝트 단계

체계적인 프로젝트 진행 과정

1
요구사항 분석
무엇을 만들 것인가? 사용자는 누구인가? 성공 기준은 무엇인가?
Use Case 정의 성능 요구사항 비용 예산 보안 요구사항
2
아키텍처 설계
LLM만 쓸지, RAG가 필요한지, Agent가 필요한지 결정.
기술 스택 선택 모델 선정 인프라 설계 데이터 파이프라인
3
프로토타입 개발
빠르게 MVP를 만들고 핵심 가정을 검증.
핵심 기능 구현 프롬프트 작성 초기 테스트 피드백 수집
4
평가 및 최적화
품질, 성능, 비용 측면에서 시스템을 평가하고 개선.
평가 데이터셋 메트릭 측정 프롬프트 최적화 비용 최적화
5
프로덕션 배포
안정적이고 확장 가능한 시스템으로 운영.
인프라 구축 모니터링 에러 처리 A/B 테스트
02

아키텍처 선택 가이드

상황에 맞는 아키텍처 결정

외부 지식이 필요한가?
No → 순수 LLM
모델의 학습 데이터로 충분한 경우
Yes, 정적 → RAG
문서, 지식 베이스 검색이 필요한 경우
Yes, 동적 → Agent
실시간 API, 도구 사용이 필요한 경우
작업의 복잡도는?
단순 → Single LLM/RAG
Q&A, 요약, 번역 등
중간 → Single Agent
다단계 작업, 도구 활용
복잡 → Multi-Agent
역할 분담, 전문성 필요
커스터마이징 수준은?
낮음 → 프롬프트 엔지니어링
지시, 예시, 맥락 제공
중간 → RAG + 프롬프트
도메인 지식 + 행동 지침
높음 → Fine-tuning
특수한 스타일/형식 필요
03

아키텍처 템플릿

실전에서 자주 사용되는 패턴

1. 기본 RAG 시스템
User Query ↓ [Query Processing] → Embedding Model ↓ [Vector Search] ← Vector Database (문서 인덱스) ↓ [Context + Query] → LLM → Response
2. Agentic RAG 시스템
User Query ↓ [LLM Router] → 라우팅 결정 ↓ ┌─────────┼─────────┐ ↓ ↓ ↓ [Vector DB] [Web Search] [SQL DB] └─────────┼─────────┘ ↓ [Result Evaluation] → 충분? → [Generate] ↓ No [Re-query/Expand]
3. Multi-Agent 시스템
User Task ↓ [Supervisor Agent] ← 작업 분배 ↓ ┌───────────────────────────┐ ↓ ↓ ↓ [Research] [Code] [Review] ↓ ↓ ↓ └───────────┼────────┘ ↓ [Supervisor] → 통합/검증 → Final Output
04

비용 추정

프로젝트 비용 계획

구성요소 비용 요소 최적화 방법
LLM API 입력/출력 토큰 수 캐싱, 프롬프트 압축, 저렴한 모델 혼용
임베딩 벡터화할 텍스트 양 로컬 모델 사용, 배치 처리
Vector DB 저장량, 쿼리 수 메모리 vs 디스크 선택, 인덱스 최적화
인프라 서버, 네트워크 서버리스, 오토스케일링
Agent 루프 반복 횟수 x LLM 비용 max_iterations 제한, 조기 종료
💡 비용 관리 팁

1. 개발 단계에서는 저렴한 모델(GPT-3.5, Claude Haiku)로 시작
2. 프롬프트 캐싱 적극 활용 (Anthropic, OpenAI 모두 지원)
3. 일별/월별 비용 제한 설정
4. 불필요한 Agent 루프 최소화

05

참고 자료

추가 학습 리소스

SUMMARY

핵심 요약

  • 프로젝트 단계: 요구사항 분석 → 아키텍처 설계 → 프로토타입 → 평가 → 배포
  • 아키텍처 선택: 외부 지식 필요성, 작업 복잡도, 커스터마이징 수준에 따라 결정
  • RAG vs Agent: 정적 지식은 RAG, 동적 작업은 Agent 활용
  • 비용 관리: 캐싱, 모델 선택, 프롬프트 최적화로 비용 절감
  • 프로덕션: 모니터링, 에러 처리, A/B 테스트로 안정적 운영