가설 검증(hypothesis test) 예

CODEDRAGON Development/Big Data, R, ...

반응형



 

 

가설 검증(hypothesis test)

제품을 생산하는 공장있습니다.

공장에서 올해 생산량이 작년 생산량보다 큰지를 알아보기 위해 전국에 있는 전체 공장 100 20곳의 생산량을 조사했습니다.

 

 

 

case1

귀무가설(H0) '올해 생산량은 작년의 생산량과 같다'이고 대립가설(H1) '올해 생산량은 작년의 생산량보다 크다'이다. '크다' 형태의 대립가설에서 p-value 아래의 그래프와 같습니다.

 

그래프에서 곡선은 귀무가설이 참일 (올해 생산량과 작년의 생산량이 같을 ) 10곳의 생산량이 어떻게 관찰되어야 하는지의 확률 분포를 나타낸것입니다. 확률 분포는 작년의 생산량을 중심으로 서서히 작년의 생산량과 다른 값을 확률이 낮아지는 형태입니다.

 

p-value 조사 결과 알게 10곳의 생산량 또는 그보다 생산량이 관찰될 확률로, 색칠된 영역에 해당됩니다.

 


 

 

 

 

case2

대립가설을 'H1: 올해의 생산량은 작년의 생산량과 다르다' 놓으면 귀무가설 그래프와 반대쪽 영역도 p-value 계산에 포함합니다. 이유는 생산량이 같다는 귀무가설이 참이라고 ' 극단적' 영역이란 작년의 생산량에 해당하는 가운데 부분에서 멀리 떨어지는 것을 의미하기 때문입니다.

 



 

 

반응형