k-fold 교차검증 도식도

CODEDRAGON Development/Big Data, R, ...

반응형



 

 

k-fold 교차검증 도식도

·         전체 데이타를 k개로 나눕니다. 나눠진 각각을  폴드(fold) 또는  하부집합(subset)이라고 합니다.

·         첫번째 학습에서는 첫번째 폴드를 테스트 데이터로 쓰고, 두번째 학습에서는 두번째 폴드를 테스트 데이터로 쓰고, , n번째 학습에서는 n번째 폴드를 테스트 데이터로 사용합니다.

·         하나의 데이터가 아니라 랜덤한 하나의 군집을 만들어 k만큼 나눈 다음 반복적으로 Test data(Validation Se)t Training Set으로 나누어서 검증합니다.

 


폴드가 5개면 5 Fold CV (Cross validation)이라고 합니다.

 

 

 

 

 

 


폴드가 10개면 10 Fold CV (Cross validation)이라고 합니다.

 

 

 

 

 

 

Training Data Test Data 나눈 K개의 분할마다 정확도를 측정하여 평균값을 낸것이 정확도가 됩니다.



반응형

'Development > Big Data, R, ...' 카테고리의 다른 글

투표(Majority Voting)  (0) 2020.03.08
배깅 알고리즘  (0) 2020.03.07
홀드아웃 교차 검증 개념도  (0) 2020.03.06
의사결정나무 주요 방법  (0) 2020.03.06
재현율 & 정밀도  (0) 2020.03.03