종류가 많아지면 기대 구매 횟수는 어떻게 변하나요?

종류 수(n)에 비해 기대값은 n × ln(n) + 0.577n 정도로 증가합니다. 10종은 약 29회, 50종은 약 225회, 100종은 약 519회가 필요합니다. 종류가 2배가 되면 구매 횟수는 2배보다 더 많이 늘어납니다.

마지막 하나가 왜 그렇게 어렵나요?

i번째 새 쿠폰을 얻으려면 이미 i-1종을 가진 상태에서 아직 없는 것을 뽑아야 합니다. 마지막 쿠폰은 n개 중 1개만 해당하므로 평균 n번을 더 구매해야 합니다. 10종이면 마지막 1종에만 평균 10번이 필요합니다.

운이 좋으면 최소 몇 번에 모을 수 있나요?

이론적 최소는 n번(모든 종류가 다르게 나올 때)입니다. 10종이면 10번에 모을 확률은 10!/10¹⁰ ≈ 0.036%로 극히 낮습니다. 현실적으로는 기대값(약 29회) 근처를 목표로 하는 것이 합리적입니다.

종류별 출현 확률이 다르면 어떻게 되나요?

출현 확률이 불균등하면 기대 구매 횟수가 더 늘어납니다. 특히 레어(희귀) 쿠폰이 있으면 그 쿠폰을 얻기 위해 훨씬 많은 구매가 필요합니다. 예를 들어 한 종류의 출현 확률이 1%이면, 그것 하나를 얻는 데만 평균 100번이 필요합니다.

교환이나 선택권이 있으면 얼마나 효율적인가요?

교환을 할 수 있으면 중복 쿠폰을 필요한 것으로 바꿀 수 있어 훨씬 효율적입니다. 이론적으로 교환이 완벽하다면 최소 n번만에 완성 가능합니다. 실전에서는 후반부에 교환을 집중적으로 활용하는 것이 가장 효과적입니다.

80% 수집과 100% 수집의 노력 차이는 얼마나 되나요?

10종 기준, 8종(80%) 수집에 필요한 기대값은 약 16회지만, 10종(100%)에는 약 29회가 필요합니다. 마지막 20%를 채우는 데 전체 노력의 약 45%가 소비됩니다. 종류가 많을수록 이 비율은 더 극단적이 됩니다.

게임 가챠에서 이 문제가 어떻게 적용되나요?

가챠 시스템에서 모든 캐릭터를 수집하는 것은 쿠폰 수집가 문제와 동일합니다. 50종 캐릭터(균등 확률)를 모두 얻으려면 평균 225회의 뽑기가 필요하며, 확률이 불균등한 경우(SR, SSR 등급) 필요 횟수는 더 크게 증가합니다.

🧩

쿠폰 콜렉터 계산기

n종류의 쿠폰을 모두 모으는 데 평균 몇 번 구매해야 할까? 조화급수와 시뮬레이션으로 분석.

쿠폰 수집가 문제는 n종류의 쿠폰을 모두 모으려면 평균 몇 개를 구매해야 하는지 분석하는 확률론의 고전 문제입니다. 기대 구매 횟수는 E = n × H(n)이며, H(n)은 조화급수 1 + 1/2 + 1/3 + ... + 1/n입니다. 10종 쿠폰이면 E = 10 × 2.93 ≈ 29.3개가 필요합니다. 마지막 1종을 얻는 데만 평균 10개가 필요하므로, 후반으로 갈수록 급격히 어려워집니다. 시뮬레이션으로 실제 분포도 확인할 수 있습니다. 포켓몬 도감 완성, 야구 카드 수집, 게임 업적 등 전종 수집 시나리오에서 현실적인 기대치를 계산하세요.

사용 방법

총 소요 시간: 약 30초

종류 수 입력

수집해야 할 쿠폰/아이템 종류 수를 입력합니다.

시뮬레이션 설정

시뮬레이션 횟수를 설정합니다.

결과 확인

기대 구매 횟수, 단계별 기대값, 시뮬레이션 분포를 확인합니다.

계산 원리

쿠폰 수집가 문제의 기대값은 조화급수(harmonic series)로 계산됩니다. n종류의 쿠폰이 균등 확률(각 1/n)로 나올 때, i번째 새 쿠폰을 얻을 확률은 (n-i+1)/n이고, 기대 시행 횟수는 n/(n-i+1)입니다. 전체 기대값은 이들의 합: E = n/n + n/(n-1) + n/(n-2) + ... + n/1 = n × (1 + 1/2 + 1/3 + ... + 1/n) = n × H(n).

H(n)은 n번째 조화수로, 근사적으로 H(n) ≈ ln(n) + γ (γ ≈ 0.5772는 오일러-마스케로니 상수)입니다. 따라서 E ≈ n × ln(n) + γn으로, 종류 수에 비해 기대값이 n × log(n) 속도로 증가합니다.

분산도 구할 수 있습니다: Var = n² × Σ(1/i²) - n × H(n) ≈ n²π²/6. 분산이 n²에 비례하므로, 실제 필요 횟수는 기대값 주변에서 상당한 변동이 있습니다. 90% 확률로 완성하려면 기대값의 약 1.5배, 99%로 완성하려면 약 2배의 구매가 필요합니다.

자주 묻는 질문

실생활 예시

5종 캐릭터 랜덤 피규어 수집

5종 피규어를 모두 모으려면 평균 E = 5 × H(5) = 5 × 2.28 ≈ 11.4개를 구매해야 합니다. 처음 4종은 비교적 빠르지만(평균 6.4개), 마지막 1종에만 평균 5개가 더 필요합니다.

5종이라도 완성하려면 평균 2배 이상 구매해야 하므로, 교환이 가능하다면 적극 활용하세요.

50종 트레이딩 카드 컴플리트

50종 카드를 모두 모으려면 평균 E = 50 × H(50) ≈ 50 × 4.50 ≈ 225개가 필요합니다. 마지막 5종을 모으는 데만 약 50 × (1/5 + 1/4 + 1/3 + 1/2 + 1) ≈ 114개가 필요합니다.

컴플리트에 필요한 비용의 절반 이상이 마지막 10%를 채우는 데 소비됩니다. 교환이나 선택권이 있다면 후반에 활용하는 것이 효율적입니다.

편의점 이벤트 스티커 수집

편의점에서 12종 캐릭터 스티커를 모으는 이벤트를 진행합니다. 기대 구매 횟수는 12 × H(12) ≈ 12 × 3.10 ≈ 37.2장입니다. 스티커 1장당 1,000원이면 완성까지 약 37,200원이 예상됩니다.

12종을 모으는 데 3배 이상의 비용이 들 수 있습니다. 가족이나 친구와 교환하면 중복 비용을 크게 줄일 수 있습니다.

포켓몬 도감 완성 (151종)

초대 포켓몬 151종을 균등 확률로 무작위로 만난다면, 모두 수집에 필요한 기대값은 151 × H(151) ≈ 151 × 5.60 ≈ 846회입니다. 마지막 10종에만 약 151 × (1/10 + ... + 1/1) ≈ 440회가 필요합니다.

실제 게임에서는 특정 지역에서만 나오는 포켓몬이 있어 완전 무작위보다 어렵습니다. 교환 기능이 도감 완성의 핵심 전략입니다.

야구 카드 세트 완성

프로야구 10개 팀 × 3명 = 30종 선수 카드를 모으려면 평균 E = 30 × H(30) ≈ 30 × 3.99 ≈ 120팩이 필요합니다. 카드팩이 500원이면 약 60,000원의 예산이 필요합니다.

수집 비용을 절약하려면 20종까지 모은 후(약 55팩) 나머지는 교환으로 해결하는 것이 가장 경제적입니다. 교환 시작 시점이 빠를수록 절약 효과가 큽니다.

용어 사전

조화급수: H(n) = 1 + 1/2 + 1/3 + ... + 1/n. 느리게 발산하는 급수로, 쿠폰 수집가 문제의 기대값 계산에 핵심적으로 사용됩니다.
기대값: 무작위 시행의 평균적 결과. 쿠폰 수집가 문제에서 E = n × H(n)은 "평균적으로 이만큼 구매해야 전종 수집 가능"을 의미합니다.
기하 분포: 첫 번째 성공까지의 시행 횟수가 따르는 분포. 새 쿠폰 하나를 얻기까지의 시행 횟수가 기하 분포를 따릅니다.
오일러-마스케로니 상수(γ): γ ≈ 0.5772로, 조화급수와 자연로그의 차이에서 나타나는 수학 상수. 쿠폰 기대값 근사에 사용됩니다.
복원 추출: 뽑은 것을 다시 넣고 다음을 뽑는 방식. 쿠폰 수집은 복원 추출이므로 중복이 발생하며, 이것이 전종 수집을 어렵게 만드는 원인입니다.
분산: 결과의 흩어진 정도. 쿠폰 수집에서 분산이 크므로, 기대값보다 훨씬 많거나 적은 횟수에 완성하는 경우가 흔합니다.
컴플리트: 모든 종류를 빠짐없이 수집하는 것. 쿠폰 수집가 문제에서 목표하는 최종 상태입니다.