데이터 마이닝 수행 절차

CODEDRAGON Development/Big Data, R, ...

반응형



 

데이터 마이닝 수행 절차

단계

설명

Ask Question

·       데이터에서 무엇을 알고 싶은지 문제를 도출합니다.

Collect data

·       문제를 해결하기 위한 데이터를 수집합니다.

·       알고리즘(모델) 최적화하는 시간을 소비하지 않고 많은 데이터를 획득하는 집중합니다.

Clean data

·       데이터 정재

·       시간이 많이 소요되며 어려운 작업니다.

·       이상치/결측값 처리 어떻게 해야 지를 항상 고민해 봐야 합니다.

Define new features

·       눈에 보이지 않는 현실의 문제를 데이터로 보여주기 위한 작업니다.

·       Discretize, PCA, TimeSeries Filter 기법을 사용합니다.

 

Deploy

 

·       배포 방법은 다양합니다.

·       구현된 결과를 배포해야 할때 수행하는 단계입니다.

·      

 


'Development > Big Data, R, ...' 카테고리의 다른 글

코헨의 Kappa(Cohen's kappa)  (0) 2019.12.04
Square Error  (0) 2019.12.04
데이터 분석 시장 전망  (0) 2019.12.03
분산 파일 시스템(Distributed File System; DFS)  (0) 2019.12.02
이상치(Outlier; Anomaly)  (0) 2019.12.01