불순도(impurity)

CODEDRAGON Development/Big Data, R, ...

반응형



 

 

 

불순도(impurity)

·       불순도는 노드에 여러 분류가 섞여 있을수록 높아집니다. 반면 하나의 분류만 있다면 낮아집니다.

·       가장 흔히 사용하는 불순도 함수는 지니 불순도(Gini Impurity)입니다.

 

 

 

 

 

 

불순도 함수

불순도 함수 f가 있다고 할 때 노드 A의 불순도 I(A)는 다음과 같이 정의합니다.