정규분포는 자연계에 존재하는 각종 현상의 산포를 가장 잘 보여주는 지표라고들 부릅니다.
x = 값, μ = 평균, σ = 표준편차 일때 정규분포 함수 그래프의 공식은 아래와 같습니다.

정규분포 함수를 적분하면 확률(확률밀도)를 구할 수 있습니다.
확률을 풀이하는 여러가지 해 중에 유용한 것이 확률밀도함수와 누적분포함수입니다.
그 정의에 대해서 알아보면,
확률 밀도 함수(確率密度函數, probability density function : pdf)는 확률 변수의 분포를 나타내는 함수로, 정규분포함수 f(x)와 구간 [a, b]에 대해서 확률 변수 P가 구간에 포함될 확률 P(a≤X≤b)는

가 됩니다. 이때, 누적분포함수(累積分布函數, cumulative distribution function : cdf)는

가 됩니다.
(출처 : 위키백과)
이 공식은 개념을 설명하기 위한 것이고 밀도 함수에 대한 다른 해석도 많습니다.
그 의미는 하나이기 때문에 좀 쉬운 공식을 찾아 가져와서 설명했고 좋은 개념입니다.
그래도 공식만으로는 알기 어려울테니 풀어서 추가로 더 설명드리겠습니다.
① 확률밀도함수(Probability Density Function)
확률밀도함수는 a와 b사이의 확률이고 보통은 아주 좁은 구간 혹은 순간의 확률을 이야기합니다.
아래 그림으로 보면 아래 -1일 때 확률 밀도는 0.24197이 됩니다.
확률밀도함수는 엄밀한 정의로는 미분가능한 연속적인 구성에서만 정의되는 개념입니다.

이렇게 일상에서 확률이라고 말하는 것은 보통 확률 밀도 값입니다.
확률밀도함수는 확률분포함수와 많이 닳은 개념입니다.
잠깐 확률분포함수 이야기를 하겠습니다. 사건이 비연속적인 분포를 이산확률분포라고 합니다.
이산확률분포에서 확률값 = 확률분포함수이고, 일상에서는 자주 사용이 됩니다.
예1) 동전을 5번 던져서 3번 앞면이 나올 확률(밀도함수값)은 0.3125(31.25%)입니다.
예2) 동전을 5번 던져서 3번 혹은 4번 앞면이 나올 확률은 0.46875(46.87%)입니다.
확율밀도함수는 이것에 연속 개념이 추가된 것이라고 보면 좀 이해하기 쉬울 것입니다.
② 누적분포함수(Cumulative Distribution Function)
분포에서 특정값보다 작거나 같은 값들의 범위를 의미합니다.
아래 예를 보면 C(-1) = -1 이하의 모든 범위 : -∞ ~ -1의 면적이 됩니다.

누적분포함수를 연산하여 다양한 경우의 수를 뽑을 수 있기 때문에 수학적인 영역에서 자주 사용됩니다.
정규분포는 평균을 기준으로 좌우대칭이고 전체 면적을 다 합치면 1(100%)가 되는 특성이 있습니다.
때문에 C(-1) : -1보다 작을 확률을 알면, 1보다 큰 확률과 같습니다.
또 1(100%)에서 C(-1)를 빼면 -1보다 큰 영역의 면적(확률)과 같습니다.
응용하기 좋아서 통계학의 확률론 뿐만아니라 다양한 곳에서 등장하는 개념입니다.
'수학 이야기' 카테고리의 다른 글
행렬(Matrix)의 더하고 빼고 곱하는 연산법(수의 배열을 한번에 계산하는 방법) (0) | 2024.02.01 |
---|---|
수학에서 수를 2차원으로 전개하는 방법인 행렬(MATRIX)와 특별한 행렬들(단위행렬, 역행렬, 전치행렬) (0) | 2024.01.31 |
원의 일부인 부채꼴의 원, 호, 부채꼴, 활꼴의 길이(둘레)와 면적 구하는 공식모음(반지름과 중심각으로 구하기) (0) | 2024.01.24 |
기수법, 수를 세는 진수 체계에 대한 개념과 사용법과 진수 변환하는 방법 (0) | 2023.12.29 |
계승, 팩토리얼(Factorial)의 의미와 경우의 수를 뽑아보자(중복된 경우, 중복이 없는 경우) (0) | 2023.12.19 |