음이항분포 계산기
r번째 성공까지 필요한 총 시행 횟수의 확률을 음이항분포로 계산합니다.
음이항분포 계산기는 성공 확률 p인 독립 시행에서 r번째 성공이 k번째 시행에서 일어날 확률을 계산합니다. PMF는 C(k-1,r-1)×p^r×(1-p)^(k-r)이며, 평균은 r/p, 분산은 r(1-p)/p²입니다. 성공 확률 30%로 3번째 성공까지 평균 10번(3/0.3), 정확히 10번째에 3번째 성공할 확률은 약 8.0%입니다. 15번 안에 3번 성공할 누적 확률은 약 87.2%입니다. 채용, 영업, 품질 검사 등 목표 달성까지의 시행 횟수를 계획하는 데 활용됩니다. PMF/CDF 차트로 달성 시점의 분포를 시각적으로 파악할 수 있습니다.
사용 방법
총 소요 시간: 약 30초
성공 확률 입력
1회 시행의 성공 확률(p)을 입력합니다.
목표 성공 횟수
달성하려는 성공 횟수(r)를 입력합니다.
결과 확인
평균 시행 횟수, PMF/CDF 차트, 특정 횟수 내 달성 확률을 확인합니다.
계산 원리
음이항분포(Negative Binomial Distribution)는 성공 확률 p인 독립 시행에서 r번째 성공이 나올 때까지의 총 시행 횟수의 확률 분포입니다. "목표를 달성하려면 몇 번 시도해야 하는가?"에 답하는 분포로, 파스칼 분포라고도 합니다.
확률질량함수는 P(X=k) = C(k-1, r-1) × p^r × (1-p)^(k-r)입니다. k번째 시행에서 r번째 성공이 나오려면, 앞의 k-1번 중 r-1번 성공하고 k번째에 성공해야 합니다. 기대값은 E(X) = r/p, 분산은 Var(X) = r(1-p)/p²입니다.
기하분포는 음이항분포에서 r=1인 특수한 경우입니다. r이 커질수록 분포는 정규분포에 가까워집니다. 또한 음이항분포는 포아송분포의 일반화로, 분산이 평균보다 큰(과분산) 카운트 데이터 모델링에 포아송 대신 사용됩니다.
자주 묻는 질문
실생활 예시
면접 3곳 합격까지 (합격률 30%)
합격 확률 30%일 때 3곳 합격까지 평균 10곳에 지원해야 합니다. 정확히 10곳째에 3번째 합격할 확률은 약 8.0%이고, 15곳 안에 3곳 합격할 확률은 약 87.2%입니다.
평균 10곳이지만 15곳까지 봐야 약 87%의 확신을 가질 수 있습니다. 여유 있는 지원 계획이 필요합니다.
불량품 5개 발견까지 (불량률 5%)
불량률 5%인 생산 라인에서 5개의 불량품을 발견하려면 평균 100개(5/0.05)를 검사해야 합니다. 80개 안에 5개를 찾을 확률은 약 18.3%입니다.
낮은 불량률에서 여러 개를 찾으려면 예상보다 많은 검사가 필요합니다. 평균의 1.5배 이상을 계획하세요.
영업 목표 달성 계획 (계약률 15%)
계약 성사율 15%인 영업사원이 월 5건 계약을 목표로 합니다. 평균 33.3건(5/0.15)의 미팅이 필요하고, 40건 안에 달성할 확률은 약 72.5%입니다.
목표 달성을 위한 최소 미팅 수를 음이항분포로 계산하면, 현실적인 월간 활동 계획을 세울 수 있습니다.
임상시험 부작용 관찰 (발생률 8%)
부작용 발생률 8%인 신약에서 부작용 사례 10건을 관찰하려면 평균 125명에게 투여해야 합니다. 100명 안에 10건 관찰할 확률은 약 10.7%입니다.
임상시험 설계 시 음이항분포로 필요한 피험자 수를 추정하면 연구 기간과 비용을 정확히 계획할 수 있습니다.
용어 사전
- 음이항분포
- r번째 성공까지 필요한 총 시행 횟수의 확률 분포. 파스칼 분포라고도 합니다.
- 목표 성공 횟수(r)
- 달성하려는 성공의 횟수. r=1이면 기하분포와 동일합니다.
- 성공 확률(p)
- 각 독립 시행에서 성공이 일어날 확률. 0 < p ≤ 1.
- 기대값(E[X])
- 목표 달성까지 평균적으로 필요한 시행 횟수. r/p로 계산합니다.
- 분산(Var[X])
- 달성 시점의 변동 크기. r(1-p)/p²로, r과 (1-p)에 비례합니다.
- 과분산(Overdispersion)
- 분산이 평균보다 큰 상태. 음이항분포가 포아송보다 적합한 경우.
- 파스칼 분포
- 음이항분포의 다른 이름. 프랑스 수학자 블레즈 파스칼에서 유래.