CODEDRAGON ㆍDevelopment/AI
가설 검증(hypothesis test) 예
제품을 생산하는 공장있습니다.
공장에서 올해 생산량이 작년 생산량보다 큰지를 알아보기 위해 전국에 있는 전체 공장 100곳 중 20곳의 생산량을 조사했습니다.
case1
귀무가설(H0)은 '올해 생산량은 작년의 생산량과 같다'이고 대립가설(H1)은 '올해 생산량은 작년의 생산량보다 크다'이다. '크다' 형태의 대립가설에서 p-value는 아래의 그래프와 같습니다.
그래프에서 곡선은 귀무가설이 참일 때(올해 생산량과 작년의 생산량이 같을 때) 10곳의 생산량이 어떻게 관찰되어야 하는지의 확률 분포를 나타낸것입니다. 이 확률 분포는 작년의 생산량을 중심으로 서서히 작년의 생산량과 다른 값을 볼 확률이 낮아지는 형태입니다.
p-value는 조사 결과 알게 된 10곳의 생산량 또는 그보다 큰 생산량이 관찰될 확률로, 색칠된 영역에 해당됩니다.
case2
대립가설을 'H1: 올해의 생산량은 작년의 생산량과 다르다'로 놓으면 귀무가설 그래프와 반대쪽 영역도 p-value 계산에 포함합니다. 그 이유는 생산량이 같다는 귀무가설이 참이라고 할 때 '더 극단적'인 영역이란 작년의 생산량에 해당하는 가운데 부분에서 더 멀리 떨어지는 것을 의미하기 때문입니다.
'Development > AI' 카테고리의 다른 글
수도권 월세 노선도 (0) | 2018.02.17 |
---|---|
올바른 수학 용어 (0) | 2018.02.16 |
꼬꼬마 프로젝트, 꼬꼬마 한글 형태소 분석기 (0) | 2018.02.14 |
구글차트(Google Chart), Google Visualization API Reference (0) | 2018.02.14 |
포아송 분포의 확률 질량 함수(Probability Mass Function) (0) | 2018.02.13 |