CODEDRAGON ㆍDevelopment/Python
Python 데이터 분석 절차
단계 |
세부단계 |
기본 package 설정 |
· 분석용 package install / import |
1. 데이터 준비 |
· 데이터 수집(obtain the data) · 수집할 데이터 결정(determine what data you can access) · 데이터 가져오기 · 샘플링(sampling) |
2. 데이터 탐색 |
· 데이터프레임(dataframe)으로 저장 · |
3. 데이터 전처리 |
· 데이터 정리(clean the data) · data와 target으로 분리 · 이상적인 데이터셋 정의(define the ideal data set) · 필터 · 수치형변수 표준화 · 범주형변수 인코딩
· data(X) 레이블 인코딩 · Class(target) 레이블 인코딩 |
4. 훈련/검증용 데이터분할
|
· 교차 검증(CV) |
5. 모델 구축 |
· 다양한 분석기법 적용 · 학습 알고리즘 적용 · 성능 지표 · 하이퍼파라미터 최적화 |
6. 모델 평가 |
· 모델 검정 · 검증용데이터로예측 · 정오분류표로검정 · 정확도, 민감도확인 · ROC 곡선그리기 |
7. 최적화 |
· 교차검정 · 학습곡선 · 검증곡선 · 하이퍼파라미터튜닝 |
'Development > Python' 카테고리의 다른 글
unique() vs bincount() (0) | 2020.01.31 |
---|---|
객체와 할당 (0) | 2020.01.31 |
Set Comprehension (0) | 2020.01.30 |
ndarray 클래스 (0) | 2020.01.30 |
numpy 불린 인덱싱 (boolean indexing) (0) | 2020.01.29 |