달력

7

« 2020/7 »

  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  •  



 

 

k-fold 교차검증 도식도

·         전체 데이타를 k개로 나눕니다. 나눠진 각각을  폴드(fold) 또는  하부집합(subset)이라고 합니다.

·         첫번째 학습에서는 첫번째 폴드를 테스트 데이터로 쓰고, 두번째 학습에서는 두번째 폴드를 테스트 데이터로 쓰고, , n번째 학습에서는 n번째 폴드를 테스트 데이터로 사용합니다.

·         하나의 데이터가 아니라 랜덤한 하나의 군집을 만들어 k만큼 나눈 다음 반복적으로 Test data(Validation Se)t Training Set으로 나누어서 검증합니다.

 


폴드가 5개면 5 Fold CV (Cross validation)이라고 합니다.

 

 

 

 

 

 


폴드가 10개면 10 Fold CV (Cross validation)이라고 합니다.

 

 

 

 

 

 

Training Data Test Data 나눈 K개의 분할마다 정확도를 측정하여 평균값을 낸것이 정확도가 됩니다.



'Development > Big Data, R, ...' 카테고리의 다른 글

투표(Majority Voting)  (0) 2020.03.08
배깅 알고리즘  (0) 2020.03.07
k-fold 교차검증 도식도  (0) 2020.03.06
홀드아웃 교차 검증 개념도  (0) 2020.03.06
의사결정나무 주요 방법  (0) 2020.03.06
재현율 & 정밀도  (0) 2020.03.03
Posted by codedragon codedragon

댓글을 달아 주세요