엑셀(EXCEL), 정규분포의 확률을 알려주는 NORM.DIST 함수는 무엇이고 사용하는 예시에 대해서 알아봅시다.
정규분포에서 분포값 대비 확률값(확률밀도)를 계산하는 NORM.DIST는 위에 먼저 포스트 했습니다.
확률밀도를 구하는 것도 어렵지만, 역함수를 계산하는 것은 더 어려울 수 있습니다.
확률로 분포를 구해주는 NORM.INV 함수에 대해서 알아보겠습니다.
1. NORM.INV 함수의 뜻
NORM.INV(probability,mean,standard_dev) : 지정된 평균(mean)과 표준편차(standard_dev)를 가지는 정규분포에서 확률(probability) 값을 가지는 누적 분포값을 구해줍니다.
- probability : 분포상에서 확률입니다. 0 < P < 1의 범위여야 하고 넘어갈 경우 #NUM! 오류값이 출력됩니다.
- mean : 전체 데이터(산포)의 평균입니다. 범위를 입력한다고 해서 자동으로 평균을 구해주지는 않고 계산해서 값을 입력해야 합니다.
- standard_dev : 전체 데이터(산포)의 표준편차 입니다. 범위를 입력한다고 해서 구해주지는 않고 값으로 미리 계산하여 입력하여야 합니다. 0보다 큰 값이어야 합니다.
표준분포에서 누적 확률 밀도는 밀도 그래프 상에서 왼쪽 끝(- ∞)에서 분포값까지 면적입니다.
NORM.INV는 면적이 입력한 확률(probability)이 되는 "분포값"을 계산해 줍니다.
정규분포가 평균을 기준으로 좌우대칭인 것을 이용해서 확률값을 오른쪽과 왼쪽일때 계산해서 입력해야 합니다.
따라서 확률이 0.5인 경우 이 함수에서는 언제나 평균(mean) 값입니다.
2. NORM.INV 함수의 사용법
예를 들어보겠습니다. 중심이 10이고 표준편차가 1.5인 어떤 제품이 있다고 보겠습니다.
이 제품의 불량률을 95%로 잡으려고 한다고 합시다.
전체가 5% 발생하려면 - 방향에서 2.5%와 + 방향에서 2.5%가 불량이 발생하면 됩니다.
=NORM.INV(0.25,10,1.5) 라고 입력할 경우 값은 8.988
=NORM.INV(0.975,10,1.5)라고 입력할 때 12.940이 됩니다.
따라서 스펙은 8.988 ~ 12.940으로 설정하면 보통은 95%의 불량이 발생할 꺼라고 예상할 수 있습니다.
이렇게 분야에 따라서는 상당히 활용법이 다양합니다.
3. 표준정규분포일 경우에 사용하는 NORM.S.INV 함수
표준정규분포는 정규분포 중에 평균(mean) 0이고, 표준편차(standard_dev)가 1인 경우를 말합니다.
정규분포에서 대표성을 가지기 때문에 이 함수를 따로 지원합니다.
NORM.S.INV(probability,mean,standard_dev) : 평균(mean)이 0이고 표준편차(standard_dev)가 1인 표준정규분포에서 확률(probability) 값을 가지는 누적 분포값을 구해줍니다.
- probability : 분포상에서 확률입니다. 0 < P < 1의 범위여야 하고 넘어갈 경우 #NUM! 오류값이 출력됩니다.