달력

3

« 2020/3 »

'2020/03/07'에 해당되는 글 3

  1. 배깅 알고리즘
  2. learning_curve()
  3. export_graphviz()



 

 

 

배깅 알고리즘

·         훈련치를 평균하면, 분산을 낮추는 효과가 있습니다.

·         배깅(Bagging) 분산을 낮춰 과적합을 막아줍니다.

 


 

 

 

 

 

원자료(훈련세트)에서 무작위로 추출하여 표본 데이터를 뽑습니다. 뽑은 표본 데이터로 예측 모델을 모델링해서 최종 모델을 만듭니다.



 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

Human neuron & Artificial neuron  (0) 2020.03.09
투표(Majority Voting)  (0) 2020.03.08
배깅 알고리즘  (0) 2020.03.07
k-fold 교차검증 도식도  (0) 2020.03.06
홀드아웃 교차 검증 개념도  (0) 2020.03.06
의사결정나무 주요 방법  (0) 2020.03.06
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

learning_curve()

학습 곡선을 그려줍니다.

 

 

sklearn.model_selection.learning_curve(estimator, X, y, groups=None, train_sizes=array([0.1, 0.33, 0.55, 0.78, 1. ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=None, pre_dispatch='all', verbose=0, shuffle=False, random_state=None, error_score=nan, return_times=False)

 

https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.learning_curve.html

 

parameter

description

estimatorobject

예측 방법 지정

X, y

데이터

train_sizes

learning curve 생성시 사용할 데이터 사이즈 지정

cv

cross-validation 지정

n_jobs

연산을 위한 CPU 개수 지정

 

value

description

n_jobs=None

1 의미

None means 1 unless in a joblib.parallel_backend context.

n_jobs=-1

모든 프로세스 사용

-1 means using all processors.

 

 

 


 


'Development > Python' 카테고리의 다른 글

VotingClassifier()  (0) 2020.03.08
graph_from_dot_data()  (0) 2020.03.08
learning_curve()  (0) 2020.03.07
export_graphviz()  (0) 2020.03.07
UniversalBank.csv  (0) 2020.03.06
re.RegexObject 클래스  (0) 2020.03.06
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

 

export_graphviz()

·         {sklearn.tree}모듈의 export_graphviz() 메소드를 사용하여 의사결정트리를 시각화시켜줍니.

·         export_graphviz() 메소드 그래프 저장용 텍스트 파일 포맷인 .dot 파일포멧 생성합니다.

 

 

# graphviz data 생성함수 임포트

from sklearn.tree import export_graphviz

sklearn.tree.export_graphviz(decision_tree, out_file=None, max_depth=None, feature_names=None, class_names=None, label='all', filled=False, leaves_parallel=False, impurity=True, node_ids=False, proportion=False, rotate=False, rounded=False, special_characters=False, precision=3)

 

 

parameter

description

decision_tree

decision tree classifier

의사결정나무 분류기(모델)

filled=True

bool, optional (default=False)

 

filled=True: True 지정하면 노드의 클래스가 구분되도록 색으로 칠해집니다

rounded

bool, optional (default=False)

 

rounded=True: 둥근 노드상자와 Helvetica 폰트를 사용합니다.

 

When set to True, draw node boxes with rounded corners and use Helvetica fonts instead of Times-Roman.

class_names

list of strings, bool or None, optional (default=None)

class 변수의 이름 설정

 

Names of each of the target classes in ascending numerical order.

feature_names

list of strings, optional (default=None)

컬럼이름들 지정

 

Names of each of the features.

out_file

file object or string, optional (default=None)

파일 저장 유무

 

out_file=None: 문자열인 dot tree포멧으로 표현

 

Handle or name of the output file. If None, the result is returned as a string.

 

 

https://scikit-learn.org/stable/modules/generated/sklearn.tree.export_graphviz.html

 


'Development > Python' 카테고리의 다른 글

graph_from_dot_data()  (0) 2020.03.08
learning_curve()  (0) 2020.03.07
export_graphviz()  (0) 2020.03.07
UniversalBank.csv  (0) 2020.03.06
re.RegexObject 클래스  (0) 2020.03.06
바이트 코드  (0) 2020.03.05
Posted by codedragon codedragon

댓글을 달아 주세요