CODEDRAGON ㆍDevelopment/Big Data, R, ...
오분류표를 활용하여 모형을 평가하는 지표1
· 정분류율(Accuracy, recognitionrate)
· 오분류율(Error rate, misclassification rate)
정분류율(Accuracy, recognitionrate)
· 탐지율(맞게 검출한 비율)
· 전체 관측치중 실제값과 예측치가 일치한 정도를 나타냅니다.
· 정분류율은 범주의 분포가 균형을 이룰 때 효과적인 평가지표입니다.
· ex) 실제 악성/정상인지 맞게 예측한 비율
· 전제 중에서 올바르게 예측한 정도를 의미합니다.
· TP(True Positive)와 TN(True Negative)을 더하여 전부의 합계로 나눈 값입니다.
오분류율(Error rate, misclassification rate)
· ≒ 오차비율
· 전체 값에서 오차의 값이 발생한 비율을 나타냅니다.
· 모형이 제대로 예측하지 못한 관측치를 평가하는 지표입니다.
· 오분류율은 전체 관측치 중 실제값과 예측치가 다른 정도를 나타내며 1-accuracy 또는 다음과 같은 식으로 평가됩니다.
'Development > Big Data, R, ...' 카테고리의 다른 글
이상치(anomaly) 처리 (0) | 2019.11.11 |
---|---|
맥주와 기저귀 (0) | 2019.11.11 |
일반 분류기 vs 컨볼루션 신경망 (0) | 2019.11.10 |
Jitter(지터) (0) | 2019.11.09 |
Bayesian networks, 베이즈 네트워크 (0) | 2019.11.08 |