분리기준
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
분리기준
반복적 분할과정에서의 분리기준은 목표변수(이산형, 연속형)에 따라 다른 기준을 적용합니다.
이산형 목표변수
구분 |
설명 |
카이제곱 통계량 p값 |
P값이 가장 작은 예측변수와 그 때의 최적분리에 의해서 자식마디를 형성합니다. |
지니 지수 |
지니 지수를 감소시켜주는 예측변수와 그 때의 최적분리에 의해서 자식마디를 선택합니다. |
엔트로피 지수 |
엔트로피 지수가 가장 작은 예측 변수와 이 때의 최적분리에 의해 자식마디를 형성합니다. |
연속형 목표변수
구분 |
설명 |
분산분석에서 F 통계량 |
P값이 가장 작은 예측변수와 그 때의 최적분리에 의해서 자식마디를 형성합니다. |
분산의 감소량 |
분산의 감소량을 최대화하는 기준의 최적분리에 의해서 자식마디를 형성합니다. |
'Development > Big Data, R, ...' 카테고리의 다른 글
overfitting 이해 이미지 (0) | 2020.09.14 |
---|---|
AI First, AI Everywhere로 전개되는 인공지능 (0) | 2020.09.06 |
CRISP-DM 분석 방법론, CRISP-DM Level (0) | 2020.08.24 |
AI history (0) | 2020.08.02 |
업 샘플링(up sampling) & 다운 샘플링(down sampling) (0) | 2020.07.21 |