Bias & Variance

CODEDRAGON Development/Big Data, R, ...

반응형



 

 

 

Bias & Variance

Bias

Variance

실제값에서 얼마나 떨어져 있는지에 대한 척도

예측된 파란색점들끼리 서로 얼마나 떨어져 있는지를 나타내는 척도

 

 


http://scott.fortmann-roe.com/docs/BiasVariance.html

 

red

실제값

blue

예측값

 

 

구분

상태

underfitting Model

High Bias-Low Variance 상태

하나의 특성으로 모델링 되어진 경우로 편견을 가지고 있는 상태입니다.

bias 높고 variance 낮기 때문에 error rate 상태입니다.

 


 

overfitting

Low Bias-High Variance 상태

테스트 데이터에 대해서는 예측하지만 새로운 데이터에 대해서는 예측을 못하는 상태입니다.

 


 

Optimum model complexity

Low Bias-Low Variannce 상태

이상적인 모델

feature 추가해서 variance 올라고 feature 많이지니까 bias 낮아지므로 error rate 낮아지게됩니다. 낮아지다가 최소가 되는 지점이 머신러닝에서 우리가 선택해야될 모델입니다.

 

 


 


'Development > Big Data, R, ...' 카테고리의 다른 글

과적합 도식도  (0) 2019.10.21
과적합 방지 방법 (cross validation)  (0) 2019.10.21
Cross-Entropy(CE)  (0) 2019.10.18
초음파 광물 데이터  (0) 2019.10.17
평균 제곱 오차(MSE; Mean Squared Error)  (0) 2019.10.16