728x90
목차

1. 산포 그래프 - 점수표 보기

2. 산포 그래프 - 날씨

3. 산포 그래프 - 공정

4. 결론 - 그래프에 대해서

 

히스토그램의 또다른 이름은 산포 그래프입니다. 저는 이 이름이 더 마음에 듭니다.

지난번에 히스토그램을 기능적으로 만드는 법을 다뤘습니다.(히스토그램을 만드는 FREQUENCY 함수와 통계 차트)

오늘은 예시 몇개와 함께 데이터 해석하는 방법을 알아 보겠습니다.

 

※ 다분히 저의 주관과 경험을 기준으로 작성 되었습니다. 각자의 상황에 따라 필요한 기술과 판단이 다릅니다. 그런 여러분들의 현실 속에서 조금이라도 도움이 되길 바라며 작성해 봅니다.

 

 

320x100

 

 

1. 산포 그래프 - 점수표 보기

 

지난번에 사용했던 데이터입니다.

이 표를 보면서 산포 그래프의 사용법을 알아 보겠습니다.

 

① 최빈과 평균이 거의 일치한다 : 데이터가 정규성이 있습니다. 높고 낮은 점수의 값이 변별성이 있다고 여겨집니다.

② 저구간이 거의 없습니다 : 이건 케이스 바이 케이스로 두가지로 해석 될 수 있습니다.

하나는 학업성취도가 최소한의 수준을 만족한다는 것이고 점수를 올리려는 무의미한 문제가 있었다는 것입니다.

③ 아무리 그래도 최빈값에 많은 수가 몰려있습니다.

틀리는 문제는 많이 틀리고 맞추는 문제 많이 맞추어 난이도 차이가 큰 시험인 것으로 예상되네요

 

이렇게 해석을 했다면 저라면 2가지를 결론을 내릴 것입니다.

상황에 따른 다른 해석이 무수히 존재 할 것입니다.

① 변별성이 있고, 90점이상이 5%로 유지할 필요가 있는 시험 수준임

추후부터는 지나치게 맞추거나 틀리는 문제를 파악해서 난이도 조절이 필요함

→ 이게 포인트입니다. 산포그래프를 보면 언제나 일이 추가로 생깁니다.

 

 

 

2. 산포 그래프 - 날씨

 

이번에는 산포 그래프가 여러개 섞인 상황입니다.

대한민국의 계절별 강수량입니다.

출처 - 기상청, 기준 - 봄(3~5월), 여름(6~8월), 가을(9~11월), 겨울(12~익년2월)

(전국 및 광역별 평균 산출에 사용되는 지점은 62개 지점이며 제주도 4개 지점은 제주지역 산출에만 사용됩니다.)

 

 

강수량이 그래프임으로 가뭄과 홍수 양 끝에 집중해야 할 것같습니다.

 

① 일반적으로 봄(파란막대)에서 가뭄이 많이 보이지만 최악의 가뭄은 가을에 보인다.

② 홍수는 여름(주홍막대)에서 압도적으로 많지만 가을에 나는 경우도 있다.

따라서 일반적인 관리는 여름에는 홍수, 봄에는 가뭄을 대비해야 하지만 가을은 두가지를 다 대비해야 함으로 가을에는 기상 회의를 별도로 마련하여 매년 상황을 모니터링한다는 대책이 서네요.

홍수의 경우 평년과 심한 경우가 매우 산포가 큽니다. 심한 해의 사고사례를 종합하여 매뉴얼화 시켜야 겠네요.

 

 

 

3. 산포 그래프 - 공정

 

공정에서 일하지 않으시는 분은 어려운 이야기 입니다.

제조업에서야 말로 가장 산포그래프를 많이 사용하는 곳 이라 예시를 들고 가겠습니다.

아래는 -3 ~ 3의 규격을 가지고 있는 제품의 측정결과입니다.

점선이 규격이니 규격바깥에 있는 불량이 발생했습니다. 그래서 원인 분석이 필요한 상황입니다.

 

① 최빈값이 중심인 0에서 +에 있는데 불량은 - 방향에서 발생했음

② 데이터가 중간에 빈도수가 높은 것이 하나 더 생김

이런경우를 현장에서는 쌍봉이라고 부릅니다. 2개의 군이 나누어진 상황입니다.

시간, 일자, 생산장소등으로 데이터를 나누어 2개의 군을 파악해야 합니다.

원인을 정리하다 보니 날짜별로 다른것을 발견했습니다.

 

아직 일이 끝난것은 아니죠.

이제 다른 기록과 증거들로 기계, 자재, 인적사항, 그외 셋팅등을 정리해서 날짜별로 다른 것을 찾아야 합니다.

그런 후 그 인자들이 실제로 저런 현상을 유도한 근거를 만들어야 하고요

할일이 태산이네요.

 

그리고 25일 데이터 역시 최빈값이 +로 생산되고 있습니다.

나중에 원인을 구체적으로 파악한다면 이것도 추가적으로 개선할 수 있습니다.

+방향에서 불량이 나온건 아니니까 급한 일은 아니네요.

 


4. 결론 - 그래프에 대해서

 

감이 오십니까? 산포그래프는 그 자체만으로는 많은 것을 알 수 없습니다.

다음 행동을 결정하고 실행하는 길을 제공합니다.

다양한 데이터에 접근하고 인자를 컨트롤 할 수 없다면 오히려 산포그래프는 별로 중요하지 않습니다.

(원인을 정확하게 알 수 없고 가능성만 제시하기 때문입니다.)

하지만 해당 분야의 직책자, 전문가들은 이런 힌트들로 효율적인 운영이 가능합니다.

이 사실을 정확하게 알아야 산포그래프만 보거나 중요한 데이터에 산포를 파악하지 않는 우를 피하게 됩니다.

 

 

 

데이터를 분석하는 것은 유용하지만 그자체로 문제가 해결되지 않습니다.

결국 원인을 찾고 또 해결을 하는 일이 고스란히 남습니다.

하지만 데이터를 분석하지 않으면 그 원인과 해결방법을 찾는 다양한 비용이 증가하게 되죠.

일을 할 때는 이런 벨런스 감각이 중요합니다.

반응형

+ Recent posts