13-1. 실전 프로젝트 설계

01

LLM 프로젝트 단계

체계적인 프로젝트 진행 과정

1

요구사항 분석

무엇을 만들 것인가? 사용자는 누구인가? 성공 기준은 무엇인가?

Use Case 정의 성능 요구사항 비용 예산 보안 요구사항

2

아키텍처 설계

LLM만 쓸지, RAG가 필요한지, Agent가 필요한지 결정.

기술 스택 선택 모델 선정 인프라 설계 데이터 파이프라인

3

프로토타입 개발

빠르게 MVP를 만들고 핵심 가정을 검증.

핵심 기능 구현 프롬프트 작성 초기 테스트 피드백 수집

4

평가 및 최적화

품질, 성능, 비용 측면에서 시스템을 평가하고 개선.

평가 데이터셋 메트릭 측정 프롬프트 최적화 비용 최적화

5

프로덕션 배포

안정적이고 확장 가능한 시스템으로 운영.

인프라 구축 모니터링 에러 처리 A/B 테스트

02

아키텍처 선택 가이드

상황에 맞는 아키텍처 결정

외부 지식이 필요한가?

No → 순수 LLM

모델의 학습 데이터로 충분한 경우

Yes, 정적 → RAG

문서, 지식 베이스 검색이 필요한 경우

Yes, 동적 → Agent

실시간 API, 도구 사용이 필요한 경우

작업의 복잡도는?

단순 → Single LLM/RAG

Q&A, 요약, 번역 등

중간 → Single Agent

다단계 작업, 도구 활용

복잡 → Multi-Agent

역할 분담, 전문성 필요

커스터마이징 수준은?

낮음 → 프롬프트 엔지니어링

지시, 예시, 맥락 제공

중간 → RAG + 프롬프트

도메인 지식 + 행동 지침

높음 → Fine-tuning

특수한 스타일/형식 필요

03

아키텍처 템플릿

실전에서 자주 사용되는 패턴

1. 기본 RAG 시스템

User Query ↓ [Query Processing] → Embedding Model ↓ [Vector Search] ← Vector Database (문서 인덱스) ↓ [Context + Query] → LLM → Response

2. Agentic RAG 시스템

User Query ↓ [LLM Router] → 라우팅 결정 ↓ ┌─────────┼─────────┐ ↓ ↓ ↓ [Vector DB] [Web Search] [SQL DB] └─────────┼─────────┘ ↓ [Result Evaluation] → 충분? → [Generate] ↓ No [Re-query/Expand]

3. Multi-Agent 시스템

User Task ↓ [Supervisor Agent] ← 작업 분배 ↓ ┌───────────────────────────┐ ↓ ↓ ↓ [Research] [Code] [Review] ↓ ↓ ↓ └───────────┼────────┘ ↓ [Supervisor] → 통합/검증 → Final Output

04

비용 추정

프로젝트 비용 계획

구성요소	비용 요소	최적화 방법
LLM API	입력/출력 토큰 수	캐싱, 프롬프트 압축, 저렴한 모델 혼용
임베딩	벡터화할 텍스트 양	로컬 모델 사용, 배치 처리
Vector DB	저장량, 쿼리 수	메모리 vs 디스크 선택, 인덱스 최적화
인프라	서버, 네트워크	서버리스, 오토스케일링
Agent 루프	반복 횟수 x LLM 비용	max_iterations 제한, 조기 종료

💡 비용 관리 팁

1. 개발 단계에서는 저렴한 모델(GPT-3.5, Claude Haiku)로 시작
2. 프롬프트 캐싱 적극 활용 (Anthropic, OpenAI 모두 지원)
3. 일별/월별 비용 제한 설정
4. 불필요한 Agent 루프 최소화

05

참고 자료

추가 학습 리소스

핵심 요약

프로젝트 단계: 요구사항 분석 → 아키텍처 설계 → 프로토타입 → 평가 → 배포
아키텍처 선택: 외부 지식 필요성, 작업 복잡도, 커스터마이징 수준에 따라 결정
RAG vs Agent: 정적 지식은 RAG, 동적 작업은 Agent 활용
비용 관리: 캐싱, 모델 선택, 프롬프트 최적화로 비용 절감
프로덕션: 모니터링, 에러 처리, A/B 테스트로 안정적 운영

실전 프로젝트 설계

LLM 프로젝트 단계

아키텍처 선택 가이드

아키텍처 템플릿

비용 추정

참고 자료

Further Reading

핵심 요약