LAB-불린 인덱스를 통한 데이터 정제
CODEDRAGON ㆍDevelopment/Python
반응형
LAB
불린 인덱스를 통한 데이터 정제
시나리오
· 데이터 분석을 하는 중에 의뢰인이 데이터셋 dirty에 들어 있는 데이터는 절대 음수가 될 수 없다고 전해 왔다고 가정하겠습니다.
· 즉, 음수 값은 진짜 값이 아닌 오류이며,
· 여러분이(분석가가) 직접 이를 더 말이 되는 값(0 등)으로 바꿔야 합니다.
· 즉, 데이터 클리닝(data cleaning), 데이터 정제, 데이터 전처리 작업을 해야 합니다.
제공된 데이터
[9, 4, 1, -0.01, -0.02, -0.001]
데이터 전처리
· 더러운 데이터(음수)를 깨끗이 하려면 이상한 값을 찾아내어 합리적인 대안(0)으로 교체해야 합니다.
· {Numpy} 불린 인덱싱을 활용 하여 처리
예상 출력 결과
[9. 4. 1. 0. 0. 0.]
'Development > Python' 카테고리의 다른 글
: (0) | 2020.01.09 |
---|---|
Anaconda User Guide (0) | 2020.01.08 |
Anaconda Python - install(설치하기) (0) | 2020.01.07 |
데이터 프레임 연산 (0) | 2020.01.06 |
newaxis (0) | 2020.01.06 |