가지치기(Pruning)

CODEDRAGON Development/Big Data, R, ...

반응형

 

 

가지치기(Pruning)

끝마디가 너무 많으면 모형이 과대 적합된 상태로 현실문제에 적용할 있는 적절한 규칙이 나오지 않게됩니다. 따라서 분류된 관측치의 비율 또는 MSE(Mean Squared Error)등을 고려한 수준의 가지치기 규칙을 제공해야 합니다. , overfitting 막아주어야 합니다.

 

방법

설명

pre-pruning

tree 생성을 사전에 중단합니다.

post-pruning

데이터 포인트가 적은 node를 삭제하거나 병합합니다.

 


반응형

'Development > Big Data, R, ...' 카테고리의 다른 글

의사결정나무분석 활용  (0) 2019.12.06
의사결정나무 분류  (0) 2019.12.06
지니 불순도 곡선  (0) 2019.12.05
반복적 분리 과정  (0) 2019.12.05
확률 이해  (0) 2019.12.05