몇%
myutper
통계 기초입문5분 읽기

23명이면 생일이 같은 쌍이 있다?

생일 역설을 수학적으로 증명합니다. 23명만 모이면 생일이 같은 쌍이 있을 확률이 50%를 넘는 놀라운 이유를 알아보세요.

몇퍼 팀·
공유

생일 역설이란?

방 안에 23명이 있으면, 그 중 생일이 같은 쌍이 최소 하나 있을 확률이 약 50.7%입니다. 50명이면 약 97%, 70명이면 99.9% 이상입니다. 365일 중 겨우 23명으로 50%를 넘긴다니, 직관과 크게 어긋나기 때문에 "역설"이라 불립니다(논리적 모순은 아닙니다). 사람들이 이 결과를 놀라워하는 이유는 "내 생일과 같은 사람이 있을 확률"로 잘못 이해하기 때문입니다. 내 생일과 같은 사람이 있을 확률은 23명 중 약 6%에 불과합니다. 하지만 생일 역설은 "아무 두 사람이라도 생일이 같을 확률"을 묻는 것이고, 이때 비교해야 할 쌍의 수가 훨씬 많아집니다.

수학적 증명

핵심은 "쌍의 수"입니다. n명에서 만들 수 있는 쌍의 수는 C(n,2) = n(n-1)/2 입니다. 23명이면 23×22/2 = 253쌍입니다. 겨우 23명인데 253번의 비교가 이루어지는 것입니다. 이 많은 비교 중 하나라도 일치하면 되므로, 확률이 급격히 올라갑니다. 정확한 계산은 여사건(모든 사람의 생일이 다를 확률)을 구한 후 1에서 빼는 것입니다. 첫 번째 사람은 아무 날이나 가능(365/365), 두 번째는 첫 번째와 다른 날(364/365), 세 번째는 앞 두 명과 다른 날(363/365)... 이렇게 23명까지 곱하면 P(모두 다름) = 365/365 × 364/365 × 363/365 × ... × 343/365 ≈ 0.4927. 따라서 P(적어도 한 쌍 일치) = 1 - 0.4927 ≈ 0.5073 = 50.73%.

실제 사례로 확인하기

FIFA 월드컵 축구 대회로 검증해 봅시다. 각 팀 선수 23명의 명단에서 생일이 같은 쌍이 있을 확률은 약 50.7%입니다. 실제로 2014년 브라질 월드컵 32개 팀 중 16개 팀에서 같은 생일 쌍이 발견되었습니다(정확히 50%). 2018년 러시아 월드컵에서도 비슷한 비율이 관찰되었습니다. 학교 교실에서도 확인할 수 있습니다. 한국의 일반적인 학급 인원 25~30명이면 같은 생일 쌍이 있을 확률은 57~70%입니다. 실제로 학급에서 조사해 보면 절반 이상의 반에서 생일이 같은 학생 쌍이 발견됩니다. 이것은 이론이 아니라 실제로 검증되는 수학적 사실입니다.

생일 역설의 실용적 활용

생일 역설의 원리는 컴퓨터 과학에서 매우 중요하게 활용됩니다. 해시 함수의 충돌 확률 분석이 대표적입니다. 해시값의 범위가 N이라면, 약 sqrt(N)개의 입력만으로 충돌 확률이 50%를 넘습니다. 128비트 해시(N=2^128)의 경우 약 2^64개의 입력으로 충돌을 기대할 수 있습니다. 이것이 "생일 공격(Birthday Attack)"이라 불리는 암호학적 공격의 기반입니다. 또한 DNA 데이터베이스에서 우연한 일치를 찾을 때도 같은 원리가 적용됩니다. 데이터베이스에 10만 명의 DNA 프로필이 있으면 비교 쌍의 수는 약 50억 개이므로, 무관한 사람 간에도 부분 일치가 나타날 수 있습니다. 이런 통계적 함정을 이해하는 것이 데이터 분석의 기본입니다.

자주 묻는 질문

다른 통계 기초 가이드