목차
현실에서 데이터는 이론과는 다르게 여러가지 영향을 받아서 분포를 가집니다.
이런 DATA의 분포를 정확하게 분석하는 방법에 대해 설명드리고자 합니다.
1. 표준편차의 뜻
아래 A와 B 그래프로 먼저 설명을 하겠습니다.
A는 중앙의 평균 선에서 데이터들이 넓게 퍼져 있으며 B는 데이터들이 비교적 평균에 몰려 있습니다.
A는 산포가 크다. B는 산포가 작다고 표현합니다.
데이터를 볼 때 평균을 기준으로 산포의 크기를 나타내는 수가 표준편차입니다.

2. 표준편차의 공식(모집단, 표본집단)
각 값들이 "평균에서 데이터가 얼마나 떨어져 있는지" = "평균과 데이터의 거리가 얼마인지"입니다.
평균과 데이터의 거리들의 평균을 분산이라고 하고 공식으로 정리하면 아래와 같습니다.


이 분산에 제곱근을 취한 형태가 바로 표준편차입니다.
따라서 표준편차는 평균과 값들의 거리와 관련이 있는 값입니다.

표준편차를 보는 방법은 모집단과 표본집단이 있는데 공식에서는 n과 n-1인 것만 차이가 납니다.
그외는 동일하니 앞으로 모집단(n 방식), 표본집단(n-1 방식)이라고 부르겠습니다.

① 모집단(n 방식)은 대상의 모든 값을 입력했을때 사용하고
② 표본집단(n-1 방식)은 대상 중 일부만 본 경우에 사용합니다.
얼핏 대상의 데이터 전체를 볼 때 사용하는 모집단(n 방식) 방식을 많이 사용할 것 같지만 사실 표본집단(n-1 방식)을 많이 사용합니다.
데이터 전체를 모두 알고 있는 경우에는 사실 분석할 의미가 없는 경우가 많습니다.
우선 이 정도만 정리하고 다음 포스팅에서 이 의미에 대해서 자세히 다루어 보겠습니다.
3. 엑셀로 계산하기
엑셀에서는 STDEV 함수를 통해서 이 표준편차를 쉽게 구할 수 있습니다.
표준편차는 표본집단과 모집단 방식으로 나누어 집니다.
STDEV(number1,[number2],...) = STDEV.S(number1,[number2],...) = .STDEVA(number1,[number2],...)
- 표본집단의 표준편차를 구합니다.(n-1 방식)
- number : 범위나 숫자를 입력할 수 있습니다. 여러 개의 범위나 숫자들을 입력할 때는 255개까지 가능합니다.
- 이 3함수 버전에 따라 없을 수도 있지만 정확하게 같은 함수입니다.
- 구버전에는 STDEV 함수만 있었지만 모집단(n 방식)과 표본집단(n-1 방식)을 구별하기 위해서 추가되었습니다.
STDEV.P(number1,[number2],...) = .STDEVP(number1,[number2],...)
- 모집단의 표준편차를 구합니다.(n 방식)
- number : 범위나 숫자를 입력할 수 있습니다. 여러 개의 범위나 숫자들을 입력할 때는 255개까지 가능합니다.
- 이 2함수 버전에 따라 없을 수도 있지만 정확하게 같은 함수입니다.
사실 계산하는데는 함수만 뚝 집어넣으면 되는 표준편차라 엑셀의 스킬과는 상관없습니다.
굳이 별도로 포스팅한 이유는 개인적으로 많이 사용하고 중요하게 생각하기 때문입니다.
모집단과 표본집단의 표준편차의 활용법에 대해서 다음 포스팅을 통해서 설명하고자 합니다.
https://toast-story.tistory.com/28
모집단과 표본집단의 표준편차와 산포 분석하고 활용하기
목차 1. 모집단, 표본집단 왜 나누어야 하죠? 2. 표준편차의 활용 3. 표본집단의 표준편차(n-1 방식)의 의미 4. 표본집단의 표준편차(n-1 방식)의 한계와 극복하기 표준편차의 뜻과 계산에 대해서 지
toast-story.tistory.com