2-4. 데이터 유출 방지 | AI 고급 실무

01

데이터 유출 공격 유형

LLM에서 발생하는 데이터 유출 위험

LLM은 훈련 과정에서 의도치 않은 암기(Unintended Memorization)가 발생합니다. 모델이 훈련 데이터의 일부(주소, SSN, 전화번호 등)를 저장하고 재생산할 수 있습니다.

⚠️ 2025년 연구 발견

기존 Extraction Rate 지표는 무작위화된 LLM의 유출 위협을 최대 2.14배 과소평가합니다. PII 인스턴스가 한 번만 등장해도 모델이 암기하고 재생산할 수 있습니다.

02

OWASP LLM07:2025 신규 취약점

📌 공격 기법

🚨 OWASP 권고

"시스템 프롬프트는 비밀로 간주되어서는 안 되며, 보안 제어로 사용되어서도 안 됩니다."

📌 방어 원칙

03

데이터 유출을 방지하는 실무 기법

차등 프라이버시 확률적 경사 하강법(DP-SGD) 사용으로 정확한 기록 재현 방지

훈련 데이터 검열, 중복 제거, 민감 정보 마스킹

패턴 매칭, DLP 파이프라인으로 민감 정보 제거

추론 서버를 안전한 환경에 격리, 엄격한 이그레스 필터링

SUMMARY