쿠폰 콜렉터 계산기
n종류의 쿠폰을 모두 모으는 데 평균 몇 번 구매해야 할까? 조화급수와 시뮬레이션으로 분석.
쿠폰 수집가 문제는 n종류의 쿠폰을 모두 모으려면 평균 몇 개를 구매해야 하는지 분석하는 확률론의 고전 문제입니다. 기대 구매 횟수는 E = n × H(n)이며, H(n)은 조화급수 1 + 1/2 + 1/3 + ... + 1/n입니다. 10종 쿠폰이면 E = 10 × 2.93 ≈ 29.3개가 필요합니다. 마지막 1종을 얻는 데만 평균 10개가 필요하므로, 후반으로 갈수록 급격히 어려워집니다. 시뮬레이션으로 실제 분포도 확인할 수 있습니다. 포켓몬 도감 완성, 야구 카드 수집, 게임 업적 등 전종 수집 시나리오에서 현실적인 기대치를 계산하세요.
사용 방법
총 소요 시간: 약 30초
종류 수 입력
수집해야 할 쿠폰/아이템 종류 수를 입력합니다.
시뮬레이션 설정
시뮬레이션 횟수를 설정합니다.
결과 확인
기대 구매 횟수, 단계별 기대값, 시뮬레이션 분포를 확인합니다.
계산 원리
쿠폰 수집가 문제의 기대값은 조화급수(harmonic series)로 계산됩니다. n종류의 쿠폰이 균등 확률(각 1/n)로 나올 때, i번째 새 쿠폰을 얻을 확률은 (n-i+1)/n이고, 기대 시행 횟수는 n/(n-i+1)입니다. 전체 기대값은 이들의 합: E = n/n + n/(n-1) + n/(n-2) + ... + n/1 = n × (1 + 1/2 + 1/3 + ... + 1/n) = n × H(n).
H(n)은 n번째 조화수로, 근사적으로 H(n) ≈ ln(n) + γ (γ ≈ 0.5772는 오일러-마스케로니 상수)입니다. 따라서 E ≈ n × ln(n) + γn으로, 종류 수에 비해 기대값이 n × log(n) 속도로 증가합니다.
분산도 구할 수 있습니다: Var = n² × Σ(1/i²) - n × H(n) ≈ n²π²/6. 분산이 n²에 비례하므로, 실제 필요 횟수는 기대값 주변에서 상당한 변동이 있습니다. 90% 확률로 완성하려면 기대값의 약 1.5배, 99%로 완성하려면 약 2배의 구매가 필요합니다.
자주 묻는 질문
실생활 예시
5종 캐릭터 랜덤 피규어 수집
5종 피규어를 모두 모으려면 평균 E = 5 × H(5) = 5 × 2.28 ≈ 11.4개를 구매해야 합니다. 처음 4종은 비교적 빠르지만(평균 6.4개), 마지막 1종에만 평균 5개가 더 필요합니다.
5종이라도 완성하려면 평균 2배 이상 구매해야 하므로, 교환이 가능하다면 적극 활용하세요.
50종 트레이딩 카드 컴플리트
50종 카드를 모두 모으려면 평균 E = 50 × H(50) ≈ 50 × 4.50 ≈ 225개가 필요합니다. 마지막 5종을 모으는 데만 약 50 × (1/5 + 1/4 + 1/3 + 1/2 + 1) ≈ 114개가 필요합니다.
컴플리트에 필요한 비용의 절반 이상이 마지막 10%를 채우는 데 소비됩니다. 교환이나 선택권이 있다면 후반에 활용하는 것이 효율적입니다.
편의점 이벤트 스티커 수집
편의점에서 12종 캐릭터 스티커를 모으는 이벤트를 진행합니다. 기대 구매 횟수는 12 × H(12) ≈ 12 × 3.10 ≈ 37.2장입니다. 스티커 1장당 1,000원이면 완성까지 약 37,200원이 예상됩니다.
12종을 모으는 데 3배 이상의 비용이 들 수 있습니다. 가족이나 친구와 교환하면 중복 비용을 크게 줄일 수 있습니다.
포켓몬 도감 완성 (151종)
초대 포켓몬 151종을 균등 확률로 무작위로 만난다면, 모두 수집에 필요한 기대값은 151 × H(151) ≈ 151 × 5.60 ≈ 846회입니다. 마지막 10종에만 약 151 × (1/10 + ... + 1/1) ≈ 440회가 필요합니다.
실제 게임에서는 특정 지역에서만 나오는 포켓몬이 있어 완전 무작위보다 어렵습니다. 교환 기능이 도감 완성의 핵심 전략입니다.
야구 카드 세트 완성
프로야구 10개 팀 × 3명 = 30종 선수 카드를 모으려면 평균 E = 30 × H(30) ≈ 30 × 3.99 ≈ 120팩이 필요합니다. 카드팩이 500원이면 약 60,000원의 예산이 필요합니다.
수집 비용을 절약하려면 20종까지 모은 후(약 55팩) 나머지는 교환으로 해결하는 것이 가장 경제적입니다. 교환 시작 시점이 빠를수록 절약 효과가 큽니다.
용어 사전
- 조화급수
- H(n) = 1 + 1/2 + 1/3 + ... + 1/n. 느리게 발산하는 급수로, 쿠폰 수집가 문제의 기대값 계산에 핵심적으로 사용됩니다.
- 기대값
- 무작위 시행의 평균적 결과. 쿠폰 수집가 문제에서 E = n × H(n)은 "평균적으로 이만큼 구매해야 전종 수집 가능"을 의미합니다.
- 기하 분포
- 첫 번째 성공까지의 시행 횟수가 따르는 분포. 새 쿠폰 하나를 얻기까지의 시행 횟수가 기하 분포를 따릅니다.
- 오일러-마스케로니 상수(γ)
- γ ≈ 0.5772로, 조화급수와 자연로그의 차이에서 나타나는 수학 상수. 쿠폰 기대값 근사에 사용됩니다.
- 복원 추출
- 뽑은 것을 다시 넣고 다음을 뽑는 방식. 쿠폰 수집은 복원 추출이므로 중복이 발생하며, 이것이 전종 수집을 어렵게 만드는 원인입니다.
- 분산
- 결과의 흩어진 정도. 쿠폰 수집에서 분산이 크므로, 기대값보다 훨씬 많거나 적은 횟수에 완성하는 경우가 흔합니다.
- 컴플리트
- 모든 종류를 빠짐없이 수집하는 것. 쿠폰 수집가 문제에서 목표하는 최종 상태입니다.