Python 데이터 분석 절차

CODEDRAGON Development/Python

반응형


 

Python 데이터 분석 절차

 

단계

세부단계

기본 package 설정

·         분석용 package install / import

1.

데이터 준비

·         데이터 수집(obtain the data)

·         수집할 데이터 결정(determine what data you can access)

·         데이터 가져오기

·         샘플링(sampling)

2.

데이터 탐색

·         데이터프레임(dataframe)으로 저장

·          

3.

데이터 전처리

·         데이터 정리(clean the data)

·         data target으로 분리

·         이상적인 데이터셋 정의(define the ideal data set)

·         필터

·         수치형변수 표준화

·         범주형변수 인코딩

 

·         data(X) 레이블 인코딩

·         Class(target) 레이블 인코딩

4.

훈련/검증용 데이터분할

 

·         교차 검증(CV)

5.

모델 구축

·         다양한 분석기법 적용

·         학습 알고리즘 적용

·         성능 지표

·         하이퍼파라미터 최적화

6.

모델 평가

·         모델 검정

·         검증용데이터로예측

·         정오분류표로검정

·         정확도, 민감도확인

·         ROC 곡선그리기

7.

최적화

·         교차검정

·         학습곡선

·         검증곡선

·         하이퍼파라미터튜닝

 

 


'Development > Python' 카테고리의 다른 글

unique() vs bincount()  (0) 2020.01.31
객체와 할당  (0) 2020.01.31
Set Comprehension  (0) 2020.01.30
ndarray 클래스  (0) 2020.01.30
numpy 불린 인덱싱 (boolean indexing)  (0) 2020.01.29