Development/Java(855)
-
RandomSeed
RandomSeed · ≒ 무작위 검증 · 분류기의 변동성을 추정함으로써 과적합을 줄이기 위한 모델성능 분석 방법 중 하나입니다. · HOLDOUT과 같이 원본데이터를 무작위로 일정비율로 분할 후 검증하지만 seed별 분류기의 평균과 편차를 산출하여 향후 분류기의 성능변동성을 추정하게 됩니다. RandomSeed 도식도 데이터 분할시 seed 값을 이용하여 매번 다른 랜덤값으로 테스트 데이터를 생성하게 되므로 분류정확도가 달라지게 됩니다. 반복실험 후 나온 분류정확도에서 평균과 분산(변동성)을 산출합니다.
-
WeKa - 결측률이 특정값 이상인 속성 찾기
WeKa - 결측률이 특정값 이상인 속성 찾기 labor.arff 데이터셋에서 결측률이 33% 이상인 속성 찾아보겠습니다. Step by Step · 데이터 불러오기 · 데이터 확인 - 결측값 확인 · 데이터 확인 - 결측률 확인 · Filter 적용 데이터 불러오기 [Preprocess] 탭 >> [Open file…] 클릭 labor.arff 데이터 확인 - 결측값 확인 [Edit…] 회색으로 표시된 부분이 결측값입니다. 데이터 확인 - 결측률 확인 [Preprocess] 탭에서 데이터를 불러온 상태에서 왼쪽 "Attributes" 패널에 있는 속성을 항목을 클릭하며 해당 속성에 대한 세부 정보가 오른쪽 "Selected attribute" 패널창에 표시됩니다. 여기해서 Missing 항목을 통해 해..
-
LibSVM - download
LibSVM - download LibSVM 제공 git 사이트로 이동합니다. >> 우측 상단의 [Clone or download] >> [Donwload ZIP] https://github.com/cjlin1/libsvm or git clone https://github.com/cjlin1/libsvm.git or 직접 다운로드
-
ZeroR을 통한 BaseLine 모델 평가
ZeroR을 통한 BaseLine 모델 평가 기준분류기로 ZeroR로 사용하여 supermarket.arff 데이터에 대한 BaseLine 모델 평가 결과입니다.
-
BaseLine accuracy
BaseLine accuracy · 원본 데이터를 동일한 조건에 두고 기준이 되는 기준분류알고리즘과 나머지 분류 알고리즘의 상대적인 비교를 통해 성능을 평가하는 방법입니다. · WEKA 에서는 100 개 이상의 많은 분류기를 제공하므로 어떤 데이터에 어떤 분류기가 적합한지 실험을 통해 확인해야 합니다. · 기준 분류기로 복잡한 분류기를 적용하지 말고 처음에는 간단한 분류기를 기준을 설정해서 성능을 점검해 더 복잡한 분류기의 성능과 비교해 봐서 더 복잡한 분류기를 점차적으로 적용해 정분류률을 높여나가는 방법을 권장하고 하고 있습니다. ZeroR을 통한 BaseLine 모델 평가 · ZeroR은 작동원리가 단순한 분류 알고리즘입니다. · ZeroR을 기준분류기로 사용하여 좀 더 복잡한 분류기의 성능을 비교할..
-
오버라이딩(Overriding), 재정의된 멤버 함수의 호출 순서, 오버라이딩 사용 이유
오버라이딩(Overriding)· 오버라이딩은 메서드 재정의라고도 불리며 이는 서로 상속관계로 이루어진 객체들간의 관계에서 비롯됩니다.· Inherited methods can be overridden; instance variables cannot be overridden (although they can be redefined in the subclass, but that’s not the same thing, and there’s almost never a need to do it. · super클래스가 가지고 있는 메서드를 sub클래스에서 똑 같은 것을 새로 만들게 되면 더 이상 super클래스에 있는 이름이 같은 메서드로 호출할 수 없게 됩니다. 이를 오버라이딩 또는 멤버 은폐라고도 합니다.· ..