달력

7

« 2020/7 »

  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  •  


 

LAB

불린 인덱스를 통한 데이터 정제

 

 

시나리오

·       데이터 분석을 하는 중에 의뢰인이 데이터셋 dirty 들어 있는 데이터는 절대 음수가 없다고 전해 왔다고 가정하겠습니다.

·       , 음수 값은 진짜 값이 아닌 오류이며,

·       여러분이(분석가가) 직접 이를 말이 되는 (0 )으로 바꿔야 합니다.

·       , 데이터 클리닝(data cleaning), 데이터 정제, 데이터 전처리 작업을 해야 합니다.

 

 

 

제공된 데이터

[9, 4, 1, -0.01, -0.02, -0.001]

 

 

 

데이터 전처리

·       더러운 데이터(음수) 깨끗이 하려면 이상한 값을 찾아내어 합리적인 대안(0)으로 교체해야 합니다.

·       {Numpy} 불린 인덱싱을 활용 하여 처리

 

 

 

예상 출력 결과

[9. 4. 1. 0. 0. 0.]

 

 

 


'Development > Python' 카테고리의 다른 글

:  (0) 2020.01.09
Anaconda User Guide  (0) 2020.01.08
LAB-불린 인덱스를 통한 데이터 정제  (0) 2020.01.07
Anaconda Python - install(설치하기)  (0) 2020.01.07
데이터 프레임 연산  (0) 2020.01.06
newaxis  (0) 2020.01.06
Posted by codedragon codedragon

댓글을 달아 주세요