728x90

1. 정규분포의 의미

 

정규분포는
 - 도수 분포 곡선이 평균값을 중앙으로 하여 좌우 대칭인 종 모양을 이루는 분포의 하나로 기댓값, 최빈값, 중앙값이 모두 같다.

 

어려운 통계학 운운하지 않아도 보통 자주 발생하는 기대되는 현상이 있고 거기서 멀면 드믄일이라고 생각합니다.

기차가 정시에서 1분 늦으면 그렇구나 하지만, 10분 늦으면 이상하다고 생각하는 것 처럼요.

이걸 통계적으로 나타낸 정규분포는 평균을 중심에서 멀수로 발생빈도가 점점 작아지는 형태로 되어있습니다.

그래서 자연현상을 잘 표현한 이상적인 확률 모형이라고 합니다.

예시) 사람들의 키, 몸무게, 온도, 소리등등 대부분 관측해서 수로 측정하는 현상들

 

정규분포 곡선

 

정규 분포 F(x)는 아래와 같이 정의 됩니다.

 

정규분포 방정식

 

σ : 표준편차, x_avg : 평균

 

식은 복잡해 보이지만 변수는 평균과 표준편차만으로 정리가 되어있습니다.

나머지 상수들은 정규분포의 모양을 나타내고 평균이 어디있냐? 표준편차가 얼마냐 크냐?를 정리한 식입니다.
정규분포를 이룰때는 N(평균, 표준편차^2)라는 식으로 표기를 합니다.
이 정규분포를 이르는 식을 의미하는 가우시안 분포라는 말은 정규분포와 같은 말입니다.

 

모양이 다른 그래프

 

정규분포는 평균이 이동하면 전체적으로 그래프가 이동하고, 표준편차가 이동하면 그래프가 퍼지게 됩니다.

그래서 평균과 표준분포에 따라 모양이 결정됩니다.

 

320x100

 

 

2. 정규분포의 성질

 

정규분포는 구간별 빈도수를 보여주는데 이 구간의 면적이 사건이 일어날 확률입니다.

그래프의 면적을 구할 때는 해당 범위를 적분하면 확률을 알 수 있습니다.
정규분포의 -∞에서 ∞까지를 모두 적분하면 1, 즉 100%가 나오고 특정구간의 면적을 구하면 그 구간을 알수있습니다.

 

확률

 

평균을 기준으로 표준편차의 몇배만큼의 면적을 확보하는지가 중요합니다.
이것을 산포의 σ(시그마) 수준이라고 말하고, 6 σ를 확보하는 SIX Sigma가 잘 알려져 있습니다.
그런데 이렇게 복잡한 식을 적분해서 값을 뽑으려면야 아무래도 복잡해 집니다.
요즘에야 좋은 앱이 많아서 계산도 다 해주지만 표준화라는 방법도 있으니 알아봅시다.

 

 

3. 표준화 - 표준 정규 분포

 

표준정규 분포는 정규분포의 하나로 평균은 0, 표준편차가 1인 상태를 의미합니다.
아래와 같이 표기합니다.

 

표준정규 분포

 

이 표준정규분포를 대상으로 어려운 확률 계산등을 미리 해두면 다른 정규분포를 파악할수 있습니다.

표준편차 배수와 평균을 이동시켜서 표준정규분포 모양으로 만드는 것을 표준화라고 부릅니다.

표준정규분포에 대해서 z값에 따라 계산해둔 테이블이 존재하니 다른 정규분포도 쉽게 대략적인 확률을 알 수 있습니다.

표준정규분포에 대해서도 포스팅 해 두었으니 관심있으시면 이어서 봐주세요.

표준 정규 분포(Standard Normal distribution) 사용하는 법, 산포를 표준화하여 확률을 구하는 방법을 알아보자

 

 

 

 

반응형

+ Recent posts