기하분포 계산기
기하분포로 첫 성공까지 필요한 시행 횟수의 확률을 계산합니다.
기하분포 계산기는 성공 확률 p인 독립 시행을 반복할 때 처음 성공까지 걸리는 시행 횟수의 확률 분포를 계산합니다. k번째에 처음 성공할 확률은 (1-p)^(k-1)×p이며, 평균 시행 횟수는 1/p입니다. 성공 확률 10%일 때 평균 10번, 중앙값 7번(ceil(-1/log₂(0.9)))만에 성공합니다. 20번 안에 성공할 누적 확률은 약 87.8%입니다. 가챠, 드랍 아이템, 첫 고객 확보, 불량품 발견 등 "처음 성공까지 몇 번 시도해야 하는가" 문제에 적용됩니다. PMF/CDF 차트로 성공까지의 분포를 시각적으로 확인할 수 있습니다.
사용 방법
총 소요 시간: 약 30초
성공 확률 입력
1회 시행의 성공 확률(p)을 입력합니다.
목표 시행 횟수
분석할 최대 시행 횟수를 입력합니다.
결과 확인
평균, 중앙값, PMF/CDF 차트, 특정 횟수 내 성공 확률을 확인합니다.
계산 원리
기하분포(Geometric Distribution)는 성공 확률이 p인 독립 시행을 반복할 때, 처음으로 성공하기까지 걸리는 시행 횟수의 확률 분포입니다. "언제 처음 성공하는가?"라는 질문에 답하는 분포입니다.
확률질량함수(PMF)는 P(X=k) = (1-p)^(k-1) × p입니다. k번째에 처음 성공하려면 앞의 k-1번은 모두 실패((1-p)^(k-1))하고 k번째에 성공(p)해야 합니다. 기대값(평균)은 E(X) = 1/p, 분산은 Var(X) = (1-p)/p²입니다.
기하분포의 핵심 성질은 무기억성(Memoryless Property)입니다. 이미 몇 번 실패했든 다음 시행의 성공 확률은 여전히 p입니다. 이산 확률 분포 중 무기억성을 가진 유일한 분포이며, 연속 버전은 지수분포입니다.
자주 묻는 질문
실생활 예시
10% 확률 아이템 드랍
드랍률 10%인 아이템을 파밍할 때, 평균 10번, 중앙값 7번 만에 획득합니다. 7번 안에 성공할 확률은 약 52.2%, 20번 안에 성공할 확률은 약 87.8%입니다.
20번 시도에도 못 얻을 확률이 약 12%나 됩니다. 30번까지 가야 약 95.8%로 거의 확실해집니다.
첫 고객 전환 (전환율 2%)
웹사이트 전환율 2%일 때 첫 구매 고객까지 평균 50명, 중앙값 35명의 방문자가 필요합니다. 100명 안에 최소 1명 전환될 확률은 약 86.7%입니다.
전환율이 낮을수록 대기 시간의 변동이 커집니다. 안정적 수익을 위해 충분한 트래픽이 필요합니다.
불량품 첫 발견까지 검사 횟수
불량률 1%인 생산 라인에서 첫 불량품 발견까지 평균 100개, 중앙값 69개를 검사해야 합니다. 50개 안에 발견할 확률은 약 39.5%입니다.
품질 검사에서 "몇 개를 검사해야 불량을 발견할 수 있는가"를 기하분포로 계획할 수 있습니다.
면접 합격까지 지원 횟수
합격률 20%일 때 첫 합격까지 평균 5곳, 중앙값 4곳에 지원해야 합니다. 10곳 안에 합격할 확률은 약 89.3%이지만, 3곳 안에는 약 48.8%에 불과합니다.
합격률이 낮을수록 여유 있는 지원 계획이 중요합니다. 기하분포로 현실적인 목표 지원 수를 계산할 수 있습니다.
용어 사전
- 기하분포
- 첫 번째 성공까지 필요한 시행 횟수의 확률 분포. 음이항분포에서 r=1인 특수한 경우.
- 무기억성(Memoryless)
- 과거의 실패가 미래의 성공 확률에 영향을 주지 않는 성질. 기하분포의 핵심 특성.
- 도박사의 오류
- 연속 실패 후 "곧 성공할 것"이라는 잘못된 믿음. 무기억성을 무시한 오류.
- 확률질량함수(PMF)
- 이산 확률 변수가 특정 값을 가질 확률. P(X=k)를 나타냅니다.
- 누적분포함수(CDF)
- k번 이내에 성공할 확률. P(X≤k) = 1-(1-p)^k로 계산합니다.
- 중앙값(Median)
- 절반의 확률로 이 값 이내에 성공하는 시행 횟수. ceil(-1/log₂(1-p))로 계산.
- 기대값(E[X])
- 평균적으로 걸리는 시행 횟수. 기하분포에서는 1/p입니다.