달력

6

« 2020/6 »

  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  •  
  •  
  •  
  •  



 

 

 

WeKa - 결측률이 특정값 이상인 속성 찾기

labor.arff 데이터셋에서 결측률이 33% 이상인 속성 찾아보겠습니다.

 

 

 

 

Step by Step

·         데이터 불러오기

·         데이터 확인 - 결측값 확인

·         데이터 확인 - 결측률 확인

·         Filter 적용

 

 

 

 

데이터 불러오기

[Preprocess] >>

[Open file] 클릭

labor.arff


 

 

 

 

 

데이터 확인 - 결측값 확인

[Edit]


 

 

회색으로 부분이 결측값입니다.


 

 

 

 

 

데이터 확인 - 결측률 확인

[Preprocess] 탭에서 데이터를 불러온 상태에서

왼쪽 "Attributes" 패널에 있는 속성을 항목을 클릭하며 해당 속성에 대한 세부 정보가 오른쪽 "Selected attribute" 패널창에 표시됩니다.

여기해서 Missing 항목을 통해 해당 속성의 결측률을 판단할 있습니다.


 

 

Missing: 33% 이상인 항목들만 찾아서 No 항목을 정리합니다.


 

No

name

number

percentage

4

wage-increase-third-year

42

74%

5

cost-of-living-adjustment

20

35%

7

pension

30

53%

8

standby-pay

48

84%

9

shift-differential

26

46%

10

education-allowance

35

61%

13

longterm-disability-assistance

29

51%

14

contribution-to-dental-plan

20

35%

15

bereavement-assistance

27

47%

16

contribution-to-health-plan

20

35%

 

 













4,5,7-10,13-16

 

 

 

 

Filter 적용

찾은 항목 번호로 Filter 적용하면 됩니다.


 

 


'Development > Java' 카테고리의 다른 글

무한 루프(infinite loop), 무한루프(무한반복)와 break  (0) 2020.03.15
RandomSeed  (0) 2020.03.12
WeKa - 결측률이 특정값 이상인 속성 찾기  (0) 2020.03.03
LibSVM - download  (0) 2020.03.03
ZeroR을 통한 BaseLine 모델 평가  (0) 2020.02.26
BaseLine accuracy  (0) 2020.02.20
Posted by codedragon codedragon

댓글을 달아 주세요