CODEDRAGON ㆍDevelopment/Java
WeKa - 결측률이 특정값 이상인 속성 찾기
labor.arff 데이터셋에서 결측률이 33% 이상인 속성 찾아보겠습니다.
Step by Step
· 데이터 불러오기
· 데이터 확인 - 결측값 확인
· 데이터 확인 - 결측률 확인
· Filter 적용
데이터 불러오기
[Preprocess] 탭 >>
[Open file…] 클릭
labor.arff
데이터 확인 - 결측값 확인
[Edit…]
회색으로 표시된 부분이 결측값입니다.
데이터 확인 - 결측률 확인
[Preprocess] 탭에서 데이터를 불러온 상태에서
왼쪽 "Attributes" 패널에 있는 속성을 항목을 클릭하며 해당 속성에 대한 세부 정보가 오른쪽 "Selected attribute" 패널창에 표시됩니다.
여기해서 Missing 항목을 통해 해당 속성의 결측률을 판단할 수 있습니다.
Missing: 33% 이상인 항목들만 찾아서 No 항목을 정리합니다.
No |
name |
number |
percentage |
4 |
wage-increase-third-year |
42 |
74% |
5 |
cost-of-living-adjustment |
20 |
35% |
7 |
pension |
30 |
53% |
8 |
standby-pay |
48 |
84% |
9 |
shift-differential |
26 |
46% |
10 |
education-allowance |
35 |
61% |
13 |
longterm-disability-assistance |
29 |
51% |
14 |
contribution-to-dental-plan |
20 |
35% |
15 |
bereavement-assistance |
27 |
47% |
16 |
contribution-to-health-plan |
20 |
35% |
4,5,7-10,13-16
Filter 적용
찾은 항목 번호로 Filter를 적용하면 됩니다.
'Development > Java' 카테고리의 다른 글
무한 루프(infinite loop), 무한루프(무한반복)와 break (0) | 2020.03.15 |
---|---|
RandomSeed (0) | 2020.03.12 |
LibSVM - download (0) | 2020.03.03 |
ZeroR을 통한 BaseLine 모델 평가 (0) | 2020.02.26 |
BaseLine accuracy (0) | 2020.02.20 |