표준편차와 평균의 차이는 무엇인가요?

평균은 데이터의 "중심"을 나타내는 값이고, 표준편차는 데이터가 그 중심에서 "얼마나 퍼져 있는지"를 나타내는 값입니다. 평균이 같아도 표준편차가 다르면 데이터의 분포가 완전히 다릅니다. 예를 들어 평균 연봉이 같은 두 회사라도 표준편차가 큰 회사는 연봉 격차가 크다는 뜻입니다.

표준편차가 크면 좋은 건가요, 나쁜 건가요?

상황에 따라 다릅니다. 투자에서 표준편차가 크면 위험이 크다는 뜻이므로 보수적 투자자에게는 나쁜 신호입니다. 반면 시험 출제에서 표준편차가 크면 학생 간 실력 차이를 잘 구별한다는 뜻이므로 변별력이 좋은 시험이라고 볼 수 있습니다. 표준편차 자체에 좋고 나쁨은 없으며, 맥락에 따라 해석이 달라집니다.

모표준편차와 표본표준편차는 어떻게 다른가요?

모표준편차는 전체 데이터(모집단)의 표준편차이고, 표본표준편차는 일부 데이터(표본)에서 구한 표준편차입니다. 표본표준편차는 편차 제곱의 합을 N이 아닌 N-1로 나누는데, 이는 표본이 모집단보다 작아서 생기는 오차를 보정하기 위함입니다. 실무에서는 대부분 표본 데이터를 다루므로 N-1로 나누는 표본표준편차를 더 자주 사용합니다.

표준편차란? 데이터 분석의 첫걸음 | 몇퍼

표준편차가 뭐예요?

표준편차는 데이터가 평균에서 얼마나 퍼져 있는지를 하나의 숫자로 나타낸 것입니다. 쉽게 말해 "들쭉날쭉한 정도"를 측정하는 도구입니다. 예를 들어, A반 시험 점수가 48, 50, 52점이고 B반이 20, 50, 80점이라면, 두 반의 평균은 같은 50점이지만 B반이 훨씬 들쭉날쭉합니다. 이때 A반의 표준편차는 약 1.6, B반은 약 24.5로, 숫자가 클수록 데이터가 평균에서 멀리 흩어져 있다는 뜻입니다. 반대로 표준편차가 0이면 모든 값이 평균과 똑같다는 의미입니다. 시험 성적, 키, 몸무게, 주가 등 숫자로 된 데이터를 분석할 때 평균만으로는 전체 모습을 알 수 없고, 표준편차를 함께 봐야 데이터의 진짜 특성을 파악할 수 있습니다.

표준편차 계산 방법

표준편차는 4단계로 계산합니다. 데이터가 2, 4, 4, 4, 5, 5, 7, 9인 경우를 예로 들겠습니다. 1단계 — 평균 구하기: (2+4+4+4+5+5+7+9) ÷ 8 = 5 2단계 — 각 값에서 평균을 빼고 제곱하기: (2-5)²=9, (4-5)²=1, (4-5)²=1, (4-5)²=1, (5-5)²=0, (5-5)²=0, (7-5)²=4, (9-5)²=16 3단계 — 편차 제곱의 평균(분산): (9+1+1+1+0+0+4+16) ÷ 8 = 4 4단계 — 분산에 제곱근 씌우기: √4 = 2 따라서 표준편차는 2입니다. 편차를 제곱하는 이유는 양수·음수가 상쇄되는 것을 막기 위해서입니다. 표본 데이터는 N 대신 N-1로 나누어 보정합니다.

분산과 표준편차의 관계

분산과 표준편차는 쌍둥이 같은 관계입니다. 분산은 편차를 제곱한 값의 평균이고, 표준편차는 분산에 제곱근(√)을 씌운 것입니다. 즉, 분산 = 표준편차²이고, 표준편차 = √분산입니다. 왜 분산을 그대로 쓰지 않고 제곱근을 취할까요? 핵심 이유는 단위 때문입니다. 시험 점수(점)의 분산은 단위가 "점²"이 되어 해석하기 어렵습니다. 제곱근을 씌우면 원래 데이터와 같은 "점" 단위로 돌아와 "평균에서 약 몇 점 퍼져 있다"고 바로 해석할 수 있습니다. 예를 들어 분산이 16점²이면 표준편차는 4점으로, "평균에서 대략 4점 벗어나 있다"고 이해할 수 있습니다. 통계 공식에서는 분산이 계산에 편리하고, 해석에서는 표준편차가 직관적이어서 둘 다 사용됩니다.

정규분포와 68-95-99.7 규칙

데이터가 종 모양의 정규분포를 따를 때, 표준편차는 강력한 해석 도구가 됩니다. "68-95-99.7 규칙"이라는 경험 법칙이 있습니다. 평균 ± 1σ(시그마) 범위에 전체 데이터의 약 68%가, ± 2σ에 약 95%, ± 3σ에 약 99.7%가 포함됩니다. 예를 들어 한국 성인 남성 평균 키가 173cm, 표준편차가 6cm라면: 167~179cm(±1σ)에 약 68%, 161~185cm(±2σ)에 약 95%, 155~191cm(±3σ)에 약 99.7%가 해당합니다. 키 191cm 이상이거나 155cm 이하인 사람은 전체의 0.3%, 약 1,000명 중 3명 수준입니다.

실생활에서 표준편차 활용

표준편차는 다양한 분야에서 핵심 지표로 쓰입니다. 투자 위험 측정: 주식 A의 수익률 표준편차가 5%, B가 20%라면 B는 수익도 크지만 손실 위험도 큽니다. 투자에서 표준편차는 곧 "변동성(위험)"입니다. 품질관리(6시그마): 제조업에서 제품 규격을 표준편차 6배(6σ) 안에 두어 불량률을 100만 개당 3.4개 이하로 줄이는 것이 목표입니다. 시험 성적 분석: 표준편차가 작은 시험은 실력 차이가 적고, 큰 시험은 변별력이 높습니다. 게임 데미지: 무기 데미지 "100 ± 10"은 안정적이고, "100 ± 50"은 한 방이 크게 터지거나 쪽 데미지가 날 수 있습니다.

표준편차란? 데이터 분석의 첫걸음

목차

표준편차가 뭐예요?

표준편차 계산 방법

분산과 표준편차의 관계

정규분포와 68-95-99.7 규칙

실생활에서 표준편차 활용

자주 묻는 질문

관련 계산기

다른 통계 기초 가이드

베이즈 정리 쉽게 이해하기

몬티홀 딜레마: 왜 문을 바꿔야 유리할까?

23명이면 생일이 같은 쌍이 있다?