728x90

정규분포는 자연을 가장 잘 묘사고 있는 분포라고 불리면서 다양한 분야에서 이용됩니다.

정규 분포에 대해 의미와 활용에 대해서는 아래 링크의 포스팅에서 다루어 보았습니다.

 

세상을 설명하는 정규분포(Normal distribution), 도수분포로 보는 통계학의 지표이자 분석을 하는 유용한 도구

 

정규분포의 의미와 뜻을 알더라도 각 분야에서 활용을 해야 의미가 있습니다.

활용을 하기 위해서는 계산을 해야 하는데 아무리 표준화가 잘 된 공식이라도 숫자로 계산하는 것은 어렵습니다.

간략화가 잘된 정규분포 공식도 EXP가 포함되 직관적으로 알기 어려운 형태입니다.

 

<정규분포의 정규 밀도 함수>

x = 값, &mu; = 평균, &sigma; = 표준편차

 

게다가 우리가 구하는 확률(확률밀도)은 적분하여 계산합니다.

정규분포 함수 f(x)가 있을 때 확율밀도함수 P와 누적분포함수 C(x)는 아래와 같습니다.

 

확율밀도함수와 누적분포함수



안그래도 복잡한 공식에 적분 형식이라 더욱 알기 어렵습니다.

오늘은 평균과 표준편차만 있으면 공식을 전개하여 계산해주는 NORM.DIST 함수에 대해서 알아보겠습니다.

 

 

1. NORM.DIST 함수의 의미

 

NORM.DIST(x,mean,standard_dev,cumulative) : 지정된 평균(mean)과 표준편차(standard_dev)를 가지는 정규분포에서 x위치의 확률분포를 계산해 줍니다.

  • x : 분포를 구하려는 값입니다.
  • mean : 전체 데이터(산포)의 평균입니다. 범위를 입력한다고 해서 자동으로 평균을 구해주지는 않고 AVERAGE 함수로 계산해야 합니다.
  • standard_dev : 전체 데이터(산포)의 표준편차 입니다. 범위를 입력한다고 해서 구해주지는 않고 값으로 미리 계산하여 입력하여야 합니다.
  • cumulative :함수의 모드를 결정합니다. True일 때는 누적분포함수를 False일 때는 확률밀도함수를 구합니다.
    누적분포함수와 확율밀도함수의 차이는 따로 포스팅했습니다.

    정규분포에서 풀이 결과에 해당하는 확률밀도함수와 누적분포함수에 개념을 알아보자

 

예을들어 평균이 0, 표준편차가 1인 표준 정규분포에서 1의 위치의 확률 밀도를 계산할 수 있습니다.

예시) =NORM.DIST(1,0,1,TRUE) → 결과 : 0.841345

 

320x100

 

2. 함수의 사용법

 

일상에 데이터를 히스토그램(산포분포도)로 많이 나타냅니다.

이 때 정규분포화를 시키면 그래프가 보기좋아지는데 통계툴에서 자주 사용하는 방법입니다.

엑셀에서는 NORM.DIST함수를 통해서 이게 가능합니다.

 

분포 그래프 그리기

 

실질 적으로 관측된 DATA는 막대그래프의 Frequency 함수를 사용해서 히스토그램으로 그렸고,

정규분포 곡선은 NORM.DIST 함수를 사용해서 분산형으로 그렸습니다.

이렇게 그래프를 조합하면 좀 더 분석이 편한 그래프가 그려지게 됩니다.

 

예를 들어 위에 그래프는 강수량임으로 비가 가끔 많이 내리기도 하지만 일반적으로 적게 내리는 데 집중되어 있다 

(확율적으로 상방보다 하방에 집중되어 있습니다.)

따라서 폭우 대책은 상습침수지역에 집중하고, 가뭄에 대비하여 전국적인 대책이 필요하다는 결론을 내릴 수 있습니다.

※ 이건 예시일 뿐이고 실 정책결정에는 인명이 걸린 일인만큼  보다 다양한 통계와 의사결정이 필요합니다.

 

 

3. 표준정규분포를 계산하는 NORM.S.DIST 함수

 

평균이 0이고 표준편차가 1인 표준정규분포에 대해서는 따로 함수가 하나 더 존재합니다.

물론 위의 NORM.DIST 함수를 사용해도 결과는 같습니다.

자주 사용하는 사람에 대해서 특별히 제공하는 함수라고 보면 됩니다.

 

NORM.S.DIST(x,cumulative) : 평균이 0이고 표준편차가 1인 가지는 표준정규분포에서 x위치의 확률분포를 계산합니다.

  • x : 분포를 구하려는 값입니다.
  • cumulative :함수의 모드를 결정합니다. True일 때는 누적분포함수를 False일 때는 확률밀도함수를 구합니다.
    누적분포함수와 확율밀도함수의 차이는 따로 포스팅했습니다.
반응형

+ Recent posts