데이터 마이닝 수행 절차
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
데이터 마이닝 수행 절차
단계 |
설명 |
Ask Question |
· 데이터에서 무엇을 알고 싶은지 문제를 도출합니다. |
Collect data |
· 문제를 해결하기 위한 데이터를 수집합니다. · 알고리즘(모델)을 최적화하는 데 시간을 소비하지 않고 더 많은 데이터를 획득하는 데 집중합니다. |
Clean data |
· 데이터 정재 · 시간이 많이 소요되며 어려운 작업니다. · 이상치/결측값 처리를 어떻게 해야 할 지를 항상 고민해 봐야 합니다. |
Define new features |
· 눈에 보이지 않는 현실의 문제를 데이터로 보여주기 위한 작업니다. · Discretize, PCA, TimeSeries Filter 기법을 사용합니다.
|
Deploy
|
· 배포 방법은 다양합니다. · 구현된 결과를 배포해야 할때 수행하는 단계입니다. · |
'Development > Big Data, R, ...' 카테고리의 다른 글
코헨의 Kappa(Cohen's kappa) (0) | 2019.12.04 |
---|---|
Square Error (0) | 2019.12.04 |
데이터 분석 시장 전망 (0) | 2019.12.03 |
분산 파일 시스템(Distributed File System; DFS) (0) | 2019.12.02 |
이상치(Outlier; Anomaly) (0) | 2019.12.01 |