값이 누락된 데이터 처리
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
값이 누락된 데이터 처리
누락 데이터 삭제 또는 추정해서 채우기를 합니다.
구분 |
처리방법 |
데이터가 충분한 경우 |
값이 누락된 데이터를 제거합니다. |
데이터가 제한적일 경우 |
누락된 값을 대표값을 추정해서 채웁니다. |
<전처리 전>
이름 |
나이 |
키 |
몸무게 |
거주지 |
홍길동 |
39 |
160cm
|
50kg |
서울 |
도레미 |
27 |
175cm |
NA |
부산 |
이순신 |
25 |
NA |
62kg |
수원 |
<전처리 후>
이순신의 키: (175+160)/2 = 167.5
도레미의 몸무게: (50+62)/2 = 56
이름 |
나이 |
키 |
몸무게 |
거주지 |
홍길동 |
39 |
160cm
|
50kg |
서울 |
도레미 |
27 |
175cm |
56 |
부산 |
이순신 |
25 |
167.5 |
62kg |
수원 |
'Development > Big Data, R, ...' 카테고리의 다른 글
데이터 분석용 파이썬 패키지 (0) | 2020.01.30 |
---|---|
강화학습 도식도 (0) | 2020.01.30 |
데이터 교정 (0) | 2020.01.29 |
다중 공선성(multicollinarity) (0) | 2020.01.29 |
F1지표(F1 score) 예시 2 (0) | 2020.01.29 |