CODEDRAGON ㆍDevelopment/Big Data, R, ...
홀드아웃 (Holdout) 방법
· ≒ Holdout Cross Validation; 홀드아웃 교차 검증 ≒ 홀드아웃 교차 방법
· 주어진 원천 데이터를 랜덤(random)하게 두 분류로 분리하여 교차 검정을 실시하는 방법입니다. 하나는 모형의 학습 및 구축을 위한 훈련용 데이터로 하나는 성과 평가를 위한 검증용 데이터로 사용합니다.
· 데이터 집합을 서로 겹치지 않는 훈련 집합(training set)과 시험 집합(test set)으로 무작위 로 구분한 후, 훈련 집합을 이용하여 분석 모형을 구축하고 시험 집합을 이용하여 분석 모형의 성능을 평가하는 기법입니다. (P. Tan, M. Steinbach, and V. Kumar, 2007)
· 훈련 집합과 시험 집합의 비율은 50:50, 70:30 등으로 결정할 수 있으며 일반적으로 전체 데이터 중 70%의 데이터는 훈련용 데이터로 사용하고 나머지 30%는 검증용 데이터로 사용합니다.
· 검증용 데이터의 결과는 분류 분석 모형에는 영향을 주지 않고 모형의 성과 측정만을 위해서 사용합니다.
https://en.wikipedia.org/wiki/Cross-validation_(statistics)
'Development > Big Data, R, ...' 카테고리의 다른 글
ㄱㄴㄷ워드클라우드 (0) | 2019.04.24 |
---|---|
ML Algorithm - 머신러닝 algorithm 자료 (0) | 2019.04.19 |
Tidy Animated Verbs (0) | 2019.04.08 |
최빈값(mode), 최빈수 (0) | 2019.04.02 |
Apriori 알고리즘 연관 분석절차 (0) | 2019.03.28 |