Development/AI(891)
-
투표(Majority Voting)
투표(Majority Voting)· ≒ 다수결 ≒ 다수결 방법· ≒ 과반수 투표· 가장 단순한 모형 결합 방법· 동일한 훈련세트로 여러 모델을 구축합니다.
-
배깅 알고리즘
배깅 알고리즘 · 각 훈련치를 평균하면, 분산을 낮추는 효과가 있습니다. · 배깅(Bagging)은 분산을 낮춰 과적합을 막아줍니다. 원자료(훈련세트)에서 무작위로 추출하여 표본 데이터를 뽑습니다. 뽑은 표본 데이터로 예측 모델을 모델링해서 최종 모델을 만듭니다.
-
k-fold 교차검증 도식도
k-fold 교차검증 도식도 · 전체 데이타를 k개로 나눕니다. 나눠진 각각을 폴드(fold) 또는 하부집합(subset)이라고 합니다. · 첫번째 학습에서는 첫번째 폴드를 테스트 데이터로 쓰고, 두번째 학습에서는 두번째 폴드를 테스트 데이터로 쓰고, … , n번째 학습에서는 n번째 폴드를 테스트 데이터로 사용합니다. · 하나의 데이터가 아니라 랜덤한 하나의 군집을 만들어 k만큼 나눈 다음 반복적으로 Test data(Validation Se)t과 Training Set으로 나누어서 검증합니다. 폴드가 5개면 5 Fold CV (Cross validation)이라고 합니다. 폴드가 10개면 10 Fold CV (Cross validation)이라고 합니다. Training Data와 Test Data로 ..
-
홀드아웃 교차 검증 개념도
홀드아웃 교차 검증 개념도 · 전체 데이터에서 훈련집합과 시험집합을 70:30으로 추출하여 훈련집합으로 모형을 구축한 후 해당 모형을 시험집합으로 모형 평가를 수행하게 됩니다.
-
의사결정나무 주요 방법
의사결정나무 주요 방법
-
재현율 & 정밀도
오분류표를 활용하여 모형을 평가하는 지표3 · 재현율(Recall) · 정밀도(Precision) Recall↑ Precision↓ Recall↓ Precision↑ 재현율(Recall) · ≒ 민감도(Sensitivity) · https://codedragon.tistory.com/8206 정밀도 (Precision) · ≒ 정밀도 ≒ 적합율 · Positive로 검출한 것 중 실제 Positive의 비율 · 예측한 데이터가 실제와 얼마나 적합한지를 표현한 비율입니다. · 선택한 항목이 얼마나 연관성이 있는지를 나타냅니다. · True로 예측한 관측치 중 실제값이 True인 정도를 나타내는 정확성(Exactness)지표입니다. · 양성인 것으로 예측된 샘플에서, 실제로 양성인 샘플인 비율 · ex) 악..