RandomSeed

CODEDRAGON Development/Java

반응형



 

 

 

RandomSeed

·         무작위 검증

·         분류기의 변동성을 추정함으로써 과적합을 줄이기 위한 모델성능 분석 방법 하나입니다.

·         HOLDOUT 같이 원본데이터를 무작위로 일정비율로 분할 검증하지만 seed 분류기의 평균과 편차를 산출하여 향후 분류기의 성능변동성을 추정하게 됩니다.

 

 

 

 

 

RandomSeed 도식도

데이터 분할시 seed 값을 이용하여 매번 다른 랜덤값으로 테스트 데이터를 생성하게 되므로 분류정확도가 달라지게 됩니다.


반복실험 나온 분류정확도에서 평균과 분산(변동성) 산출합니다.

평균

(96+97+94)/3=95.6667

분산

1.555556

분류정확도는 95.6%이며 변동성은 +/- 1.5 내외라는 것을 의미합니다.