728x90

정규분포는 자연계에 존재하는 각종 현상의 산포를 가장 잘 보여주는 지표라고들 부릅니다.

x = 값, μ = 평균, σ = 표준편차 일때 정규분포 함수 그래프의 공식은 아래와 같습니다.

 

정규분포 함수

 

정규분포 함수를 적분하면 확률(확률밀도)를 구할 수 있습니다.

확률을 풀이하는 여러가지 해 중에 유용한 것이 확률밀도함수와 누적분포함수입니다.

그 정의에 대해서 알아보면,


확률 밀도 함수(確率密度函數, probability density function : pdf)는 확률 변수의 분포를 나타내는 함수로, 정규분포함수 f(x)와 구간 [a, b]에 대해서 확률 변수 P가 구간에 포함될 확률 P(a≤X≤b)는

가 됩니다. 이때, 누적분포함수(累積分布函數, cumulative distribution function : cdf)

가 됩니다.

 

(출처 : 위키백과)


 

이 공식은 개념을 설명하기 위한 것이고 밀도 함수에 대한 다른 해석도 많습니다.

그 의미는 하나이기 때문에 좀 쉬운 공식을 찾아 가져와서 설명했고 좋은 개념입니다.

그래도 공식만으로는 알기 어려울테니 풀어서 추가로 더 설명드리겠습니다.

 

① 확률밀도함수(Probability Density Function)

 

확률밀도함수는 a와 b사이의 확률이고 보통은 아주 좁은 구간 혹은 순간의 확률을 이야기합니다.

아래 그림으로 보면 아래 -1일 때 확률 밀도는 0.24197이 됩니다.

확률밀도함수는 엄밀한 정의로는 미분가능한 연속적인 구성에서만 정의되는 개념입니다.

 

확율밀도함수 P

 

이렇게 일상에서 확률이라고 말하는 것은 보통 확률 밀도 값입니다.

확률밀도함수는 확률분포함수와 많이 닳은 개념입니다.

 

잠깐 확률분포함수 이야기를 하겠습니다. 사건이 비연속적인 분포를 이산확률분포라고 합니다.

이산확률분포에서 확률값 = 확률분포함수이고, 일상에서는 자주 사용이 됩니다.

예1) 동전을 5번 던져서 3번 앞면이 나올 확률(밀도함수값)은 0.3125(31.25%)입니다.

예2) 동전을 5번 던져서 3번 혹은 4번 앞면이 나올 확률은 0.46875(46.87%)입니다.

확율밀도함수는 이것에 연속 개념이 추가된 것이라고 보면 좀 이해하기 쉬울 것입니다.

 

 

320x100

 

 

② 누적분포함수(Cumulative Distribution Function)

 

분포에서 특정값보다 작거나 같은 값들의 범위를 의미합니다.

아래 예를 보면 C(-1) = -1 이하의 모든 범위 : -∞ ~ -1의 면적이 됩니다.

 

누적분포함수 = 값보다 작은 모든 영역의 면적

 

 

누적분포함수를 연산하여 다양한 경우의 수를 뽑을 수 있기 때문에 수학적인 영역에서 자주 사용됩니다.

정규분포는 평균을 기준으로 좌우대칭이고 전체 면적을 다 합치면 1(100%)가 되는 특성이 있습니다.

때문에 C(-1) : -1보다 작을 확률을 알면, 1보다 큰 확률과 같습니다.

또 1(100%)에서 C(-1)를 빼면 -1보다 큰 영역의 면적(확률)과 같습니다.

응용하기 좋아서 통계학의 확률론 뿐만아니라 다양한 곳에서 등장하는 개념입니다.

 

반응형

+ Recent posts