imbalanced data

imbalanced data

CODEDRAGON ㆍDevelopment/AI

imbalanced data

· imbalanced data는 각 측정항목이 동일한 크기의 dataset을 가지지 못한 것을 의미합니다. (total)

· A는 220개인데 B, C, D는 10개밖의 input을 가지고 있어 모두 동일한 크기의 dataset을 가지고 있지 못합니다. 이 경우가 imbalanced data가 됩니다.

Accuracy Comparison

Result

MODEL1 0.544 < MODEL2 0.88

Accuracy로 생성된 모델을 판단하면 MODEL2가 MODEL1보다 Accuracy가 더 커서 더 좋은 모델이라고 판단할 수 있어 MODEL2를 채택하게 됩니다.

하지만 A, B, C, D 전체의 예측률을 보면 MODEL1이 전반적으로 잘 맞추고 있어 MODEL1이 MODEL2보다 더 좋아 MODEL1 를 선택하는 것이 좋습니다.

imbalanced data에서 사용할 수 있는 F1 core 지표를 확인해야 합니다.

SMOTE(Synthetic Minority Oversampling Technique), SMOTE 수행 단계 (0)	2019.12.20
1.Summary - 1.저장모델 설계하기 (0)	2019.12.19
2.Summary - 2.빅데이터 분석시스템 구성하기 (0)	2019.12.17
공공 인공지능 오픈 API·DATA 서비스 포털 (0)	2019.12.17
SC-FEGAN (0)	2019.12.16

CodeDragon