분석 모형 구축시 오류(error) - 일반화 오류(generalization error), 훈련 오류(training error)

CODEDRAGON Development/AI

반응형


 

 

분석 모형 구축시 오류(error)

분석 모형을 구축하는 데에는 일반화 오류와 훈련 오류라는 가지 종류의 오류가 발생할 있고, 구축된 분석 모형은 이를 고려하여 검증되어야 합니다(P. Tan, M. Steinbach, and V. Kumar, 2007)

 

 

구분

설명

일반화 오류

·         Generalization error

·         분석 모형을 만들 주어진 데이터 집합의 특성을 지나치게 반영하여 발생하는 오류입니다.

·         주어진 데이터 집합은 모집단 일부분임에도 불구하고 그것이 가지고 있는 주변적인 특성, 단순 잡음 등을 모두 묘사하기 때문에 일반화 오류가 발생합니다. 이러한 모형은 특별히 과적합(overfitting) 되었다라고 합니다.

훈련 오류

·         Training error

·         일반화 오류와는 반대되는 개념입니다.

·         주어진 데이터 집합에 부차적인 특성과 잡음이 있다는 점을 고려하여 그것의 특성을 반영하도록 분석 모형을 만들어 생기는 오류입니다.

·         훈련 오류가 지나치게 많이 발생하는 모형은 과적합에 반대되는 개념으로 미적합(underfitting) 되었다고 합니다.