가지치기(Pruning)
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
가지치기(Pruning)
끝마디가 너무 많으면 모형이 과대 적합된 상태로 현실문제에 적용할 수 있는 적절한 규칙이 나오지 않게됩니다. 따라서 분류된 관측치의 비율 또는 MSE(Mean Squared Error)등을 고려한 수준의 가지치기 규칙을 제공해야 합니다. 즉, overfitting을 막아주어야 합니다.
방법 |
설명 |
pre-pruning |
tree 생성을 사전에 중단합니다. |
post-pruning |
데이터 포인트가 적은 node를 삭제하거나 병합합니다. |
'Development > Big Data, R, ...' 카테고리의 다른 글
의사결정나무분석 활용 (0) | 2019.12.06 |
---|---|
의사결정나무 분류 (0) | 2019.12.06 |
지니 불순도 곡선 (0) | 2019.12.05 |
반복적 분리 과정 (0) | 2019.12.05 |
확률 이해 (0) | 2019.12.05 |