홀드아웃 (Holdout) 방법 ≒ Holdout Cross Validation; 홀드아웃 교차 검증 ≒ 홀드아웃 교차 방법

CODEDRAGON Development/Big Data, R, ...

반응형

 

 

 

홀드아웃 (Holdout) 방법

·         Holdout Cross Validation; 홀드아웃 교차 검증 홀드아웃 교차 방법

·         주어진 원천 데이터를 랜덤(random)하게 분류로 분리하여 교차 검정을 실시하는 방법입니다. 하나는 모형의 학습 구축을 위한 훈련용 데이터로 하나는 성과 평가를 위한 검증용 데이터로 사용합니다.

·         데이터 집합을 서로 겹치지 않는 훈련 집합(training set) 시험 집합(test set)으로 무작위 구분한 , 훈련 집합을 이용하여 분석 모형을 구축하고 시험 집합을 이용하여 분석 모형의 성능을 평가하는 기법입니다. (P. Tan, M. Steinbach, and V. Kumar, 2007)

·         훈련 집합과 시험 집합의 비율은 50:50, 70:30 등으로 결정할 있으며 일반적으로 전체 데이터 70% 데이터는 훈련용 데이터로 사용하고 나머지 30% 검증용 데이터로 사용합니다.

·         검증용 데이터 결과는 분류 분석 모형에는 영향을 주지 않고 모형의 성과 측정만을 위해서 사용합니다.

 

https://en.wikipedia.org/wiki/Cross-validation_(statistics)

 

 

 

 

반응형

'Development > Big Data, R, ...' 카테고리의 다른 글

ㄱㄴㄷ워드클라우드  (0) 2019.04.24
ML Algorithm - 머신러닝 algorithm 자료  (0) 2019.04.19
Tidy Animated Verbs  (0) 2019.04.08
최빈값(mode), 최빈수  (0) 2019.04.02
Apriori 알고리즘 연관 분석절차  (0) 2019.03.28