값이 누락된 데이터 처리

CODEDRAGON Development/Big Data, R, ...

반응형


 

 

값이 누락된 데이터 처리

누락 데이터 삭제 또는 추정해서 채우기 합니다.

 

구분

처리방법

데이터가 충분한 경우

값이 누락된 데이터를 제거합니다.

데이터가 제한적일 경우

누락된 값을 대표값을 추정해서 채웁니다.

 

 

 

 

 


 

 

 

<전처리 >

 

이름

나이

몸무게

거주지

홍길동

39

160cm

 

50kg

서울

도레미

27

175cm

NA

부산

이순신

25

NA

62kg

수원

 

 



 

 

<전처리 >

이순신의 : (175+160)/2 = 167.5

도레미의 몸무게: (50+62)/2 = 56

 

이름

나이

몸무게

거주지

홍길동

39

160cm

 

50kg

서울

도레미

27

175cm

56

부산

이순신

25

167.5

62kg

수원

 

 


반응형

'Development > Big Data, R, ...' 카테고리의 다른 글

데이터 분석용 파이썬 패키지  (0) 2020.01.30
강화학습 도식도  (0) 2020.01.30
데이터 교정  (0) 2020.01.29
다중 공선성(multicollinarity)  (0) 2020.01.29
F1지표(F1 score) 예시 2  (0) 2020.01.29