전체 글(14827)
-
graph_from_dot_data()
graph_from_dot_data() · {pydotplus} 패키지의 graphviz를 통한 그래프 생성 함수입니다. · 그래프 저장용 텍스트 파일 포맷인 dot 형식의 데이터로 정의된 그래프를 로드(load)하여 그래프를 생성해줍니다. # graphviz를 통한 그래프 생성 함수 from pydotplus import graph_from_dot_data # 그래프를 생성하기위해 data 생성 dot_data = export_graphviz(tree, filled=True, rounded=True, class_names=target_name, feature_names=feature_names, out_file=None) # graphviz data통해 그래프 생성 graph = graph_from_d..
-
배깅 알고리즘
배깅 알고리즘 · 각 훈련치를 평균하면, 분산을 낮추는 효과가 있습니다. · 배깅(Bagging)은 분산을 낮춰 과적합을 막아줍니다. 원자료(훈련세트)에서 무작위로 추출하여 표본 데이터를 뽑습니다. 뽑은 표본 데이터로 예측 모델을 모델링해서 최종 모델을 만듭니다.
-
learning_curve()
learning_curve() 학습 곡선을 그려줍니다. sklearn.model_selection.learning_curve(estimator, X, y, groups=None, train_sizes=array([0.1, 0.33, 0.55, 0.78, 1. ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=None, pre_dispatch='all', verbose=0, shuffle=False, random_state=None, error_score=nan, return_times=False) https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.l..
-
export_graphviz()
export_graphviz() · {sklearn.tree}모듈의 export_graphviz() 메소드를 사용하여 의사결정트리를 시각화시켜줍니다. · export_graphviz() 메소드는 그래프 저장용 텍스트 파일 포맷인 .dot 파일포멧을 생성합니다. # graphviz data 생성함수 임포트 from sklearn.tree import export_graphviz parameter description decision_tree decision tree classifier 의사결정나무 분류기(모델) filled=True bool, optional (default=False) filled=True: True로 지정하면 노드의 클래스가 구분되도록 색으로 칠해집니다 rounded bool, opti..
-
k-fold 교차검증 도식도
k-fold 교차검증 도식도 · 전체 데이타를 k개로 나눕니다. 나눠진 각각을 폴드(fold) 또는 하부집합(subset)이라고 합니다. · 첫번째 학습에서는 첫번째 폴드를 테스트 데이터로 쓰고, 두번째 학습에서는 두번째 폴드를 테스트 데이터로 쓰고, … , n번째 학습에서는 n번째 폴드를 테스트 데이터로 사용합니다. · 하나의 데이터가 아니라 랜덤한 하나의 군집을 만들어 k만큼 나눈 다음 반복적으로 Test data(Validation Se)t과 Training Set으로 나누어서 검증합니다. 폴드가 5개면 5 Fold CV (Cross validation)이라고 합니다. 폴드가 10개면 10 Fold CV (Cross validation)이라고 합니다. Training Data와 Test Data로 ..
-
홀드아웃 교차 검증 개념도
홀드아웃 교차 검증 개념도 · 전체 데이터에서 훈련집합과 시험집합을 70:30으로 추출하여 훈련집합으로 모형을 구축한 후 해당 모형을 시험집합으로 모형 평가를 수행하게 됩니다.