표준편차가 뭐예요?
표준편차는 데이터가 평균에서 얼마나 퍼져 있는지를 하나의 숫자로 나타낸 것입니다. 쉽게 말해 "들쭉날쭉한 정도"를 측정하는 도구입니다. 예를 들어, A반 시험 점수가 48, 50, 52점이고 B반이 20, 50, 80점이라면, 두 반의 평균은 같은 50점이지만 B반이 훨씬 들쭉날쭉합니다. 이때 A반의 표준편차는 약 1.6, B반은 약 24.5로, 숫자가 클수록 데이터가 평균에서 멀리 흩어져 있다는 뜻입니다. 반대로 표준편차가 0이면 모든 값이 평균과 똑같다는 의미입니다. 시험 성적, 키, 몸무게, 주가 등 숫자로 된 데이터를 분석할 때 평균만으로는 전체 모습을 알 수 없고, 표준편차를 함께 봐야 데이터의 진짜 특성을 파악할 수 있습니다.
표준편차 계산 방법
표준편차는 4단계로 계산합니다. 데이터가 2, 4, 4, 4, 5, 5, 7, 9인 경우를 예로 들겠습니다.
1단계 — 평균 구하기: (2+4+4+4+5+5+7+9) ÷ 8 = 5
2단계 — 각 값에서 평균을 빼고 제곱하기: (2-5)²=9, (4-5)²=1, (4-5)²=1, (4-5)²=1, (5-5)²=0, (5-5)²=0, (7-5)²=4, (9-5)²=16
3단계 — 편차 제곱의 평균(분산): (9+1+1+1+0+0+4+16) ÷ 8 = 4
4단계 — 분산에 제곱근 씌우기: √4 = 2
따라서 표준편차는 2입니다. 편차를 제곱하는 이유는 양수·음수가 상쇄되는 것을 막기 위해서입니다. 표본 데이터는 N 대신 N-1로 나누어 보정합니다.
분산과 표준편차의 관계
분산과 표준편차는 쌍둥이 같은 관계입니다. 분산은 편차를 제곱한 값의 평균이고, 표준편차는 분산에 제곱근(√)을 씌운 것입니다. 즉, 분산 = 표준편차²이고, 표준편차 = √분산입니다.
왜 분산을 그대로 쓰지 않고 제곱근을 취할까요? 핵심 이유는 단위 때문입니다. 시험 점수(점)의 분산은 단위가 "점²"이 되어 해석하기 어렵습니다. 제곱근을 씌우면 원래 데이터와 같은 "점" 단위로 돌아와 "평균에서 약 몇 점 퍼져 있다"고 바로 해석할 수 있습니다.
예를 들어 분산이 16점²이면 표준편차는 4점으로, "평균에서 대략 4점 벗어나 있다"고 이해할 수 있습니다. 통계 공식에서는 분산이 계산에 편리하고, 해석에서는 표준편차가 직관적이어서 둘 다 사용됩니다.
정규분포와 68-95-99.7 규칙
데이터가 종 모양의 정규분포를 따를 때, 표준편차는 강력한 해석 도구가 됩니다. "68-95-99.7 규칙"이라는 경험 법칙이 있습니다.
평균 ± 1σ(시그마) 범위에 전체 데이터의 약 68%가, ± 2σ에 약 95%, ± 3σ에 약 99.7%가 포함됩니다.
예를 들어 한국 성인 남성 평균 키가 173cm, 표준편차가 6cm라면: 167~179cm(±1σ)에 약 68%, 161~185cm(±2σ)에 약 95%, 155~191cm(±3σ)에 약 99.7%가 해당합니다. 키 191cm 이상이거나 155cm 이하인 사람은 전체의 0.3%, 약 1,000명 중 3명 수준입니다.
실생활에서 표준편차 활용
표준편차는 다양한 분야에서 핵심 지표로 쓰입니다.
투자 위험 측정: 주식 A의 수익률 표준편차가 5%, B가 20%라면 B는 수익도 크지만 손실 위험도 큽니다. 투자에서 표준편차는 곧 "변동성(위험)"입니다.
품질관리(6시그마): 제조업에서 제품 규격을 표준편차 6배(6σ) 안에 두어 불량률을 100만 개당 3.4개 이하로 줄이는 것이 목표입니다.
시험 성적 분석: 표준편차가 작은 시험은 실력 차이가 적고, 큰 시험은 변별력이 높습니다.
게임 데미지: 무기 데미지 "100 ± 10"은 안정적이고, "100 ± 50"은 한 방이 크게 터지거나 쪽 데미지가 날 수 있습니다.