CODEDRAGON ㆍDevelopment/Big Data, R, ...
교사 학습 도식도
· 이미 주어진 입력에 대해 어떤 결과가 나올지 알고 있는( labeling이 된) , 출력과의 관계를 이용해서 데이터들을 해석할 수 있는 모델을 만들게 됩니다. 즉, 입력 데이터를 주입하여 지도학습을 통해 정답에 해당되는 모델을 만들어내게 됩니다. 그것을 바탕으로 새로운 데이터를 추정(predict)하게 됩니다.
· [입력(Known data), 출력(Known response)] => 모델(Model) => 예측(predict)
· 고양이 사진과 강아지 사진을 입력 데이터로 주어 머신러닝을 통해 학습수행하면 사진에서 고양이와 강아지를 구분해 내는 모델을 생성하게 됩니다. 이 모델을 통해서 새로운 사진에 대해 추정을 하게 됩니다.
학습용 데이터 집합 준비
· 개를 찍은 사진을 입력하면 "개"라고 출력하고, 고양이를 찍은 사진을 입력하면 "고양이"라고 펭귄을 찍은 사진을 입력하면 "펭귄"라고 출력하는 예측 시스템을 만들려면 개를 찍은 사진과 고양이를 찍은 사진, 펭귄을 찍은 사진을 준비해서 다음과 같이 학습 데이터 집합을 만들어야 합니다.
· 만들어진 학습데이터는 분석 모델에 입력해서 예측을 수행합니다.
학습 데이터 |
입력 데이터 |
출력 데이터 |
1 |
개를 찍은 사진 |
개 |
2 |
개를 찍은 사진 |
개 |
3 |
펭귄를 찍은 사진 |
펭귄 |
4 |
고양이를 찍은 사진 |
고양이 |
5 |
개를 찍은 사진 |
개 |
6 |
고양이를 찍은 사진 |
고양이 |
7 |
펭귄를 찍은 사진 |
펭귄 |
8 |
개를 찍은 사진 |
개 |
9 |
고양이를 찍은 사진 |
? |
10 |
개를 찍은 사진 |
? |
'Development > Big Data, R, ...' 카테고리의 다른 글
이상치(Outlier; Anomaly) (0) | 2019.12.01 |
---|---|
군집 vs 분류 (0) | 2019.11.30 |
데이터 마이닝(Data Mining) (0) | 2019.11.29 |
2.Summary - 워크숍, 워크숍 사전준비 사항 (0) | 2019.11.27 |
SQOOP(스쿱) (0) | 2019.11.27 |