달력

6

« 2020/6 »

  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  •  
  •  
  •  
  •  


 

Python 데이터 분석 절차

 

단계

세부단계

기본 package 설정

·         분석용 package install / import

1.

데이터 준비

·         데이터 수집(obtain the data)

·         수집할 데이터 결정(determine what data you can access)

·         데이터 가져오기

·         샘플링(sampling)

2.

데이터 탐색

·         데이터프레임(dataframe)으로 저장

·          

3.

데이터 전처리

·         데이터 정리(clean the data)

·         data target으로 분리

·         이상적인 데이터셋 정의(define the ideal data set)

·         필터

·         수치형변수 표준화

·         범주형변수 인코딩

 

·         data(X) 레이블 인코딩

·         Class(target) 레이블 인코딩

4.

훈련/검증용 데이터분할

 

·         교차 검증(CV)

5.

모델 구축

·         다양한 분석기법 적용

·         학습 알고리즘 적용

·         성능 지표

·         하이퍼파라미터 최적화

6.

모델 평가

·         모델 검정

·         검증용데이터로예측

·         정오분류표로검정

·         정확도, 민감도확인

·         ROC 곡선그리기

7.

최적화

·         교차검정

·         학습곡선

·         검증곡선

·         하이퍼파라미터튜닝

 

 


'Development > Python' 카테고리의 다른 글

unique() vs bincount()  (0) 2020.01.31
객체와 할당  (0) 2020.01.31
Python 데이터 분석 절차  (0) 2020.01.31
Set Comprehension  (0) 2020.01.30
ndarray 클래스  (0) 2020.01.30
numpy 불린 인덱싱 (boolean indexing)  (0) 2020.01.29
Posted by codedragon codedragon

댓글을 달아 주세요