728x90
목차

1. 데이터 분석 활성화 하기

2. 난수생성 기능 사용하기

3. RAND 함수와의 차이점

4. 데이터 생성과 분석의 필요성

 

 

RAND() 함수로 하나의 난수를 만들 수는 있지만 산포를 형성하기에는 부족합니다.

엑셀에서는 다양한 상황에서 원하는 난수를 형성할 수 있도록 합니다.

데이터를 무작위로 만들어서 모의분석을 하는데 사용할 수 있습니다.

오늘은 "난수 생성" 기능에 대해서 알아보겠습니다.

 

 

1. 데이터 분석 활성화 하기

 

엑셀의 초기 설정으로는 데이터 분석기능이 활성화 되어있지 않습니다.

먼저 분석 기능부터 활성화 시켜야 합니다.

 

① 기능 활성화 하기

 

[상단매뉴]에 있는 [파일]을 선택하고 "엑셀 옵션"에 들어가야 합니다.

[옵션] - [추가기능] - [분석 도구 팩]을 선택 - [(추가기능) 이동]을 클릭합니다.

"추가 기능 선택" 상자가 활성화 되는데 여기서 "분석 도구 팩"에 체크를 해주고 확인합니다.

 

분석 도구 팩 활성화 하기

 

 

② DATA 분석 기능 확인하기

 

선택이 끝나면 엑셀이 추가도구를 설치하게 됩니다.

추가도구를 모두 선택하면 [상단매뉴] - [데이터] 탭에 [데이터 분석] 기능이 추가됩니다.

이후 엑셀이 실행하면 항상 이 기능을 사용할 수 있고, 재설치할 때까지는 유지됩니다.

 

추가된 기능

 

 

2. 난수 생성 기능 사용하기

 

① 통계 데이터 분석기능

 

데이터 분석 매뉴 아이콘을 클릭해서 실행합니다.

분석도구에는 여러가지 기능이 있지만 오늘은 그 중 "난수 생성"을 사용하겠습니다.

매뉴를 선택하고 활성합니다.

 

난수 생성 선택합니다.

 

② 난수의 종류 선택하기

 

다양한 종류의 난수가 있습니다.

분포에 따라서 선택할 할 수 있는 옵션이 조금씩 다릅니다.

이번에는 "정규 분포"를 선택해 보겠습니다.

 

정규분포 선택하기

 

③ 인수입력하기

 

그외의 옵션을 선택합니다.

정규 분포의 고유 인수는 평균과 표준편차입니다.

 

  • 변수와 난수 : 데이터의 배치를 선택합니다. 변수는 가로줄의 수이고 난수는 세로 데이터의 개수입니다.
  • 모수 : 정규분포의 고유 인수인 평균과 표준편차를 입력합니다. 입력한 양에 추종하여 데이터를 형성합니다. 그리고 다른 분포를 선택하면 각자 다른 인수를 입력할 수 있습니다.
  • 난수 시드 : 난수의 베이스가 되는 엑셀의 난수표를 선택할 수 있습니다. 필요한 경우에는 정수로 입력합니다.
  • 출력 옵션 : 데이터가 입력되는 장소를 지정합니다. 새로운 시트나 파일을 만들 수도 있고 셀에 출력할 수도 있습니다. 입력 범위내에 이미 데이터가 있으면 덮어쓸 것인지를 확인하고 진행합니다.

 

난수 생성

 

 

④ 난수 형성결과 보기

 

변수는 가로줄 열의 개수가 되고 난수는 세로줄의 데이터의 수가 됩니다.

위에 처럼 입력하면 3 x 100개의 난수가 형성됩니다.

이렇게 여러 조건의 난수도 복잡하게 만들 수 있는 장점이 있습니다.

형성결과

 

 

3. RAND 함수와의 차이점

 

RAND 함수는 난수를 일정하게 형성합니다.

즉 수가 많아지면 범위내에서 일정하게 형성된다는 뜻입니다.

데이터 분석 기능으로 정규분포로 만든 데이터와 비교를 하면 더욱 알기 쉽습니다.

 

형성한 DATA

 

위의 그래프를 보면 특성을 명확히 알 수 있습니다.

RAND 함수는 벽에 막힌 것처럼 네모나게 산포가 형성됩니다.

반면 정규분포로 형성된 경우에는 평균인 0에 가까우면 많아지고 튀는 데이터가 잘 만들어져 있습니다.

필요한 데이터를 형성할 때 RAND 만으로는 힘든 일도 할 수 있는 것입니다.

 

 

4. 데이터 생성과 분석의 필요성

데이터 생성 기능은 통계 스터디를 하기가 좋습니다.

DATA만 보고 미래가 예측이 어려울 때는 비슷비슷한 산포를 여러 개 만들어 보는 것이 좋은 방법입니다.

그 과정에서 분석 실력도 늘게되고요. 이런 공부를 안하면 꽤 답답하게 일이 진행되는데요.

제 사례를 하나 공유해서 왜 이런 데이터 생성작업과 분석이 필요한지 보여드리겠습니다.

 

<사례>

 

우리가 개발을 할 때는 초도 산포를 얻어내고는 합니다.

그리고 양산을 시작하고 2 ~ 3달만에 문제가 발생하는 경우가 많습니다.

(실제로 있던 일이 모델이지만, 이 데이터는 가상의 데이터입니다.)

 

똑같은 산포입니다.

 

① 어떤 사유로 월 생산량 500대의 모델이 개발에만 1000대를 생산해서 납품하게 됨

② 개발시에는 불량이 1개도 나오지 않고 충분히 많은 수량을 생산했기 때문에 순조롭게 양산 이관됨

③ 양산시 불량이 0.5% 이상 발생 이슈가 발생함 

→ 해당 불량은 사용자의 부상을 만들 수 있어 마침 다른 프로젝트가 끝난 필자가 급하게 투입됨

 

당연하다면 당연한 일이지만 개발팀에서는 개발시 상당수량 제작한 점을 무기삼아 생산팀의 관리 문제를 주로 삼았으며,

생산팀은 억울하다는 입장이며 산발적으로 불량이 계속 발생한다는 말만 되풀이 했습니다.

문제를 파악하고 말고를 떠나 개발시의 "초기산포"를 뽑아보자마자 답이 나왔습니다.

충분히 불량이 발생할 수 있는 산포로 순전히 "우연히" 개발 때 문제가 발견안된 것 뿐이였습니다.

관리부분이 아니라 개발 스펙을 만지고 부품 산포를 축소해서 산포 자체를 축소해야 했습니다.

 

가장 기본 산포만 뽑아도 제조 팩터를 개선할 것이냐 개발 펙터를 개선할 것인지 방향을 잡을 수 있습니다.

지금 생각해도 데이터 생성을 몇 번만 해도 개발 때 산포가 나쁘다는 것을 알았을 것인데,

기계적으로 불량만 안난다고 안심한 것이 문제가 아닌가 합니다.

 


 

이 과정에서 저는 통계적인 분석을 내세우기보다는 그냥 각 팀을 설득시켜서 개선을 진행했습니다.

여러 날을 데이터 조차 보지 않고 불량율만 가지고 소모전을 펼쳐 옆 팀에서 제가 투입되야 하는 상황을 만든 사람들을 상대로 논리적인 분석이 필요없다고 판단했기 때문입니다.

 

이렇게 데이터에 대한 이해가 떨어지면 끝도 없이 문제가 해결되지 않고 서로 입장만 반복하는 상황이 벌어집니다.

물론 개발자들이 데이터에 대한 공부를 할 짬이 없다는 것을 잘 알지만 정도란 것이 있습니다.

조금이라도 시간을 내서 한번 공부해두면 상황을 인식하는데 있어서 좀더 나은 눈을 얻을 수 있을꺼라고 생각합니다.

 

반응형

+ Recent posts