분리기준

CODEDRAGON Development/Big Data, R, ...

반응형

 

 

분리기준

반복적 분할과정에서의 분리기준은 목표변수(이산형, 연속형) 따라 다른 기준을 적용합니다.

 

 

이산형 목표변수

구분

설명

카이제곱 통계량 p

P값이 가장 작은 예측변수와 그 때의 최적분리에 의해서 자식마디를 형성합니다.

지니 지수

지니 지수를 감소시켜주는 예측변수와 그 때의 최적분리에 의해서 자식마디를 선택합니다.

엔트로피 지수

엔트로피 지수가 가장 작은 예측 변수와 이 때의 최적분리에 의해 자식마디를 형성합니다.

 

 

 

연속형 목표변수

구분

설명

분산분석에서 F 통계량

P값이 가장 작은 예측변수와 그 때의 최적분리에 의해서 자식마디를 형성합니다.

분산의 감소량

분산의 감소량을 최대화하는 기준의 최적분리에 의해서 자식마디를 형성합니다.