1-5. AI 편향과 공정성 | AI 고급 실무

01

AI 편향의 현실

연구와 실제 사례에서 발견된 AI 차별

85%

채용 AI가 백인 연관 이름의 이력서를 선호하는 비율

출처: Bloomberg 연구, 2024

AI 시스템의 편향은 단순한 기술적 오류가 아닙니다. 학습 데이터에 내재된 역사적 차별, 알고리즘 설계의 선택, 평가 지표의 정의 등 여러 단계에서 편향이 발생하고 증폭됩니다.

⚠️ 편향의 위험성

AI 편향은 대규모로, 빠르게, 그리고 "객관적"이라는 외피 아래 차별을 확산시킵니다. 인간의 편견과 달리 AI의 결정은 체계적이고 일관되게 적용되어 피해 규모가 훨씬 큽니다.

02

주요 사례 연구

법적 책임과 합의금으로 이어진 실제 사례들

SafeRent - 주거 AI 차별

$2M+ 합의금

세입자 심사 AI가 흑인 및 히스패닉 신청자를 체계적으로 불리하게 평가

신용 점수와 무관하게 특정 인종에게 낮은 점수 부여
FTC(연방거래위원회)가 공정주거법 위반으로 조치
200만 달러 이상 합의금 지불

Amazon - 채용 AI 성차별

프로젝트 폐기

10년간의 이력서 데이터로 학습한 채용 AI가 여성 지원자를 체계적으로 불리하게 평가

"여성"이 포함된 키워드(여대 졸업 등)에 감점
역사적으로 남성 중심이던 기술직 데이터가 원인
수정 시도 후에도 문제 해결 불가, 프로젝트 전면 폐기

COMPAS - 형사 재범 예측

인종 편향 논란

미국 법원에서 사용되는 재범 위험 예측 AI의 인종 편향 문제

흑인 피고인의 재범 위험을 과대 예측
백인 피고인의 재범 위험을 과소 예측
ProPublica 조사로 문제 공개, 지속적 논란 중

03

편향의 유형

AI 시스템에서 발생하는 편향의 분류

📊

데이터 편향

학습 데이터가 특정 집단을 과소/과대 대표하거나, 역사적 차별을 반영

⚙️

알고리즘 편향

모델 설계, 특성 선택, 최적화 목표 설정 과정에서 발생하는 편향

🎯

측정 편향

평가 지표나 프록시 변수가 실제 측정 대상을 왜곡하여 반영

🔄

피드백 루프

편향된 결과가 새로운 학습 데이터가 되어 편향이 증폭되는 악순환

💡 프록시 차별(Proxy Discrimination)

인종이나 성별을 직접 사용하지 않더라도, 우편번호, 이름, 학교 등 관련된 변수를 통해 간접적으로 차별이 발생할 수 있습니다. 이를 "프록시 차별"이라고 합니다.

04

편향 탐지 방법

AI 시스템의 공정성을 평가하는 기법

1

집단별 성능 분석

인종, 성별, 연령 등 보호 집단별로 정확도, 오류율, 긍정/부정 예측 비율을 비교

2

공정성 지표 측정

Demographic Parity, Equalized Odds, Calibration 등 수학적 공정성 지표 적용

3

특성 중요도 분석

SHAP, LIME 등 설명 가능 AI 기법으로 결정에 영향을 미치는 요인 분석

4

레드팀 테스트

다양한 시나리오와 엣지 케이스로 편향 유발 상황 탐색

주요 공정성 지표

지표	정의	한계
Demographic Parity	모든 집단에서 긍정 예측 비율이 동일	실제 적격률 차이 무시
Equalized Odds	모든 집단에서 TPR, FPR이 동일	다른 지표와 동시 충족 어려움
Calibration	예측 확률이 실제 발생 확률과 일치	집단별로 다른 보정 필요

⚠️ 공정성의 불가능 정리

수학적으로 모든 공정성 지표를 동시에 충족하는 것은 불가능합니다(Impossibility Theorem). 따라서 상황에 맞는 공정성 기준을 선택하고, 그 선택의 근거를 문서화해야 합니다.

05

편향 완화 전략

AI 공정성 확보를 위한 실무 접근법

📌 개발 단계별 대응

데이터 수집 — 대표성 있는 데이터 확보, 과소대표 집단 보완, 라벨링 품질 관리
전처리 — 재가중치 부여, 리샘플링, 민감 속성 제거/변환
모델 학습 — 공정성 제약 추가, 적대적 편향 제거(Adversarial Debiasing)
후처리 — 임계값 조정, 결과 보정, 집단별 캘리브레이션
배포 후 — 지속적 모니터링, 피드백 수집, 정기적 재평가

💡 Human-in-the-Loop

고위험 결정(채용, 대출, 의료)에서는 AI 결과를 최종 결정으로 사용하지 않고, 인간 전문가의 검토를 거치는 것이 편향 피해를 줄이는 가장 효과적인 방법입니다.

SUMMARY

핵심 요약

AI 편향은 대규모로 체계적인 차별을 확산시킬 위험이 있음
SafeRent, Amazon 채용 AI 등 실제 사례에서 법적 책임과 금전적 손해 발생
편향은 데이터, 알고리즘, 측정, 피드백 루프 등 여러 단계에서 발생
모든 공정성 지표를 동시 충족은 불가능, 상황에 맞는 기준 선택 필요
Human-in-the-Loop와 지속적 모니터링이 핵심 완화 전략