지니지수(Gini index)

CODEDRAGON Development/Big Data, R, ...

반응형



 

 

지니지수(Gini index)

·         노드의 불순도 나타내는 값입니다.

·         지니지수의 값이 클수록() 이질적(Diversity)이며 순수도(Purity) 낮다() 있습니다.

 

구분

지니지수(Gini index)

High diversity,

Low purity

G=1-(2/6)2-(2/6)2-(1/6)2-(1/6)2=1-0.11-0.11-0.03-0.03=0.72

 


 

Low diversity,

High purity

G=1-(5/6)2-(1/6)2= 1-0.69-0.03=0.28

 


 

 

image.google.com