초기하분포 계산기
비복원 추출의 확률을 초기하분포로 계산합니다. 카드 뽑기, 품질 검사 등에 활용.
초기하분포 계산기는 비복원추출(뽑은 것을 다시 넣지 않는 추출)에서 특정 종류가 몇 개 뽑힐지를 계산합니다. 전체 N개 중 성공 K개에서 n개를 뽑을 때, 정확히 k개가 성공일 확률은 C(K,k)×C(N-K,n-k)/C(N,n)입니다. 52장 카드에서 하트 13장 중 5장을 뽑을 때 하트가 정확히 2장일 확률은 약 27.4%이고 기대값은 1.25장입니다. 품질 검사, 카드 게임 핸드, 로또 추첨 등 비복원추출 상황에 적용됩니다. PMF/CDF 차트로 성공 개수별 확률 분포를 시각적으로 확인하고, 이항분포와의 차이를 비교할 수 있습니다.
사용 방법
총 소요 시간: 약 30초
모집단 설정
전체 개수(N)와 성공 개수(K)를 입력합니다.
표본 설정
추출할 표본 크기(n)를 입력합니다.
결과 확인
기대값, 목표 개수의 확률, PMF/CDF 차트를 확인합니다.
계산 원리
초기하분포(Hypergeometric Distribution)는 비복원추출에서 특정 종류가 몇 개 뽑히는지를 계산하는 확률 분포입니다. 복원추출(뽑고 다시 넣음)의 이항분포와 달리, 뽑을 때마다 남은 구성이 변하므로 확률이 달라집니다.
확률질량함수는 P(X=k) = C(K,k) × C(N-K, n-k) / C(N,n)입니다. N은 전체 개수, K는 성공(관심 대상)의 수, n은 추출할 표본 크기, k는 표본 중 성공의 수입니다. 기대값은 E(X) = n×K/N, 분산은 n×K/N×(N-K)/N×(N-n)/(N-1)입니다.
분산에 포함된 (N-n)/(N-1)을 유한모집단 보정계수라 합니다. 모집단에 비해 표본이 작으면 이 값이 1에 가까워 이항분포와 거의 같지만, 표본 비율이 크면 분산이 작아져 차이가 명확해집니다.
자주 묻는 질문
실생활 예시
포커 핸드 분석
52장에서 5장을 뽑을 때, 특정 무늬(13장) 중 정확히 2장이 올 확률은 약 27.4%입니다. 3장 이상은 약 8.2%, 5장(플러시)은 약 0.05%입니다.
카드 게임의 핸드 확률은 비복원추출이므로 초기하분포로 정확히 계산할 수 있습니다.
로또 번호 분석
45개 번호 중 빨간 공 15개가 있을 때 6개를 뽑아 빨간 공이 3개 이상일 확률은 약 24.0%이고, 기대값은 6×15/45 = 2개입니다.
로또 추첨은 전형적인 비복원추출입니다. 특정 그룹의 번호가 많이 나올 확률을 초기하분포로 계산할 수 있습니다.
TCG 카드 덱 확률
40장 덱에서 핵심 카드 4장이 있을 때 초기 5장 핸드에 1장 이상 올 확률은? 초기하분포로 계산하면 약 41.8%이며, 2장 이상은 약 8.4%입니다.
카드 게임 덱 구축 시 초기하분포로 원하는 카드의 초기 핸드 확률을 계산하여 최적 매수를 결정할 수 있습니다.
선거 여론 조사 표본 추출
유권자 10,000명 중 지지자 4,000명일 때 100명을 무작위 추출하면, 지지자 45명 이상 나올 확률은 약 15.4%이고 기대값은 40명입니다.
비복원추출 기반의 여론 조사에서 표본 구성의 변동성을 초기하분포로 정확히 추정할 수 있습니다.
용어 사전
- 초기하분포
- 비복원추출에서 특정 종류의 개수 분포. 뽑을수록 확률이 변하는 상황을 모델링합니다.
- 비복원추출
- 한 번 뽑은 것을 다시 넣지 않는 추출 방식. 카드 뽑기, 로또 추첨이 대표적.
- 모집단(N)
- 전체 원소의 수. 예: 카드 52장, 제품 100개 등.
- 성공 수(K)
- 모집단 중 관심 대상의 수. 예: 하트 13장, 불량품 5개 등.
- 표본 크기(n)
- 추출할 원소의 수. 검사할 개수 또는 뽑을 카드 수.
- 유한모집단 보정계수
- (N-n)/(N-1). 비복원추출의 분산이 이항분포보다 작아지는 보정 인자.
- 기대값(E[X])
- 표본에서 기대되는 성공 개수. n×K/N으로 계산합니다.
- 피셔의 정확 검정
- 초기하분포를 기반으로 2×2 분할표의 연관성을 검정하는 통계 방법.