베이즈 정리 계산기
베이즈 정리로 사후 확률을 계산합니다. 사전 확률, 우도, 위양성율을 입력하세요.
베이즈 정리 계산기는 사전 확률과 새로운 증거를 결합하여 사후 확률을 계산하는 도구입니다. "검사 결과가 양성일 때 실제로 질병이 있을 확률은?"과 같은 조건부 확률 문제를 풀 수 있습니다. 베이즈 정리는 P(A|B) = P(B|A) × P(A) / P(B)로 표현되며, 새로운 정보가 주어졌을 때 기존 믿음(사전 확률)을 어떻게 업데이트해야 하는지를 수학적으로 보여줍니다. 의료 진단, 스팸 필터링, 머신러닝 등 다양한 분야에서 핵심적으로 사용됩니다. 이 계산기에서는 사전 확률, 민감도(참양성률), 특이도(참음성률)를 입력하면 양성예측도(PPV)와 음성예측도(NPV)를 자동으로 계산하고, 시각적인 빈도 트리로 결과를 보여줍니다.
사용 방법
총 소요 시간: 약 1분
사전 확률 입력
사건의 기본 발생률(사전 확률)을 입력합니다.
민감도 입력
실제 양성을 양성으로 판별할 확률(민감도)을 입력합니다.
특이도 입력
실제 음성을 음성으로 판별할 확률(특이도)을 입력합니다.
결과 확인
사후 확률(양성예측도), 빈도 트리, 혼동 행렬을 확인합니다.
계산 원리
베이즈 정리(Bayes' Theorem)는 새로운 증거가 주어졌을 때 기존 믿음(사전 확률)을 업데이트하는 수학적 공식입니다. 18세기 영국의 수학자 토마스 베이즈가 제안했으며, 현대 통계학과 인공지능의 핵심 원리입니다.
공식은 P(A|B) = P(B|A) × P(A) / P(B)입니다. P(A)는 사전 확률(증거 없이 알고 있는 확률), P(B|A)는 A가 참일 때 B가 관찰될 확률(우도), P(B)는 B의 전체 확률, P(A|B)는 사후 확률(증거 B를 보고 업데이트된 확률)입니다.
예를 들어 유병률 1%인 질병에 대해 정확도 95% 검사가 양성이면, 직관적으로 95%가 감염이라 생각하기 쉽지만 실제로는 약 16%에 불과합니다. 이처럼 베이즈 정리는 직관이 틀리기 쉬운 조건부 확률을 정확히 계산해줍니다.
자주 묻는 질문
실생활 예시
희귀 질병 검사 결과 해석
유병률 0.5%인 질병에 대해 민감도 95%, 특이도 98%인 검사를 받아 양성이 나왔습니다. 베이즈 정리를 적용하면 실제 감염 확률은 약 19.3%입니다.
양성이어도 실제 감염일 확률은 20% 미만입니다. 확진을 위해 추가 검사가 필요한 이유를 수학적으로 이해할 수 있습니다.
스팸 메일 필터링
수신 메일 중 스팸 비율이 30%이고, 스팸 필터가 스팸을 정확히 탐지할 확률 95%, 정상 메일을 스팸으로 잘못 분류할 확률 3%입니다. 스팸으로 분류된 메일이 실제 스팸일 확률은?
베이즈 정리를 적용하면 약 93.1%로, 필터가 스팸이라 판단한 메일의 약 7%는 정상 메일입니다.
음주운전 검문 양성 해석
음주운전 비율 2%, 음주 측정기 정확도(민감도 97%, 특이도 95%)일 때 양성 반응이 나온 운전자가 실제 음주일 확률은? 베이즈 정리로 계산하면 약 28.4%입니다.
측정기가 양성이어도 실제 음주 확률은 약 28%에 불과합니다. 이것이 2차 확인 검사(혈중 알코올 측정)가 필요한 이유입니다.
제조 공정 불량 원인 추정
불량률 4%인 A라인과 1%인 B라인이 각각 60%, 40%를 생산합니다. 불량품이 발견됐을 때 A라인에서 온 확률은? P(A|불량) = (0.04×0.6)/(0.04×0.6+0.01×0.4) ≈ 85.7%입니다.
생산 비율과 불량률을 종합하면 불량품의 85.7%가 A라인 출신입니다. 품질 개선 우선순위를 정할 때 베이즈 정리가 유용합니다.
용어 사전
- 사전 확률(Prior)
- 새로운 증거 없이 기존에 알고 있는 확률. 예: 질병의 유병률.
- 사후 확률(Posterior)
- 새로운 증거를 반영하여 업데이트된 확률. 베이즈 정리의 최종 결과.
- 우도(Likelihood)
- 가설이 참일 때 관찰된 증거가 나타날 확률. P(B|A)에 해당합니다.
- 민감도(Sensitivity)
- 실제 양성인 사람을 양성으로 정확히 판별하는 비율. 참양성률이라고도 합니다.
- 특이도(Specificity)
- 실제 음성인 사람을 음성으로 정확히 판별하는 비율. 참음성률이라고도 합니다.
- 양성예측도(PPV)
- 검사 양성인 사람 중 실제로 양성인 비율. 사후 확률과 같은 의미입니다.
- 거짓 양성(False Positive)
- 실제로는 음성인데 양성으로 잘못 판정된 경우. 1-특이도로 계산합니다.
- 빈도 트리(Frequency Tree)
- 전체 인원을 가지치기하여 각 경우의 인원수를 시각적으로 표현하는 도구.