Development/Java(855)
-
WEKA(웨카) 구성 컴포넌트
WEKA(웨카) 구성 컴포넌트· WEKA(웨카)를 구성하는 주요 기능이 들어가 있는 컴포넌트들입니다.· 웨카를 구성하는 주요 컴포넌트는 weka.core, weka.filters, weka.classifiers, weka.clusters, weka.associations 등이 있습니다.
-
diabetes.arff
diabetes.arff · Pima Indians 당뇨병에 관한 데이터 셋 · 마지막 9번째 속성이 목적변수 (class) 이며, tested_negative 와 tested_possitive 2개 라벨로만 구성되어 있습니다. (명목형 데이터) C:\Program Files\Weka-3-8\data\diabetes.arff
-
Weka - OneR, minBucketSize 매개변수
minBucketSize 매개변수 · OneR 에는 규칙의 복잡성을 제한하는 minBucketSize 라는 매개변수를 제공합니다. · minBucketSize 매개변수의 목적은 OneR 분류기의 분류깊이의 복잡도를 제한하는 역할을 합니다. · minBucketSize 매개변수는 규칙을 간단하게 하나 정분류율은 낮아지지 않게 해 줍니다. 구분 설명 minBucketSize 값이 1에 가까우면 단순한 문제를 복잡하게 해결하되 정분류율은 높아집니다↑. minBucketSize 값이 6에 가까우면 단순한 문제를 단순하게 해결하되 정분류율은 낮아집니다↓.
-
OneR
OneR · 1993년 발표된 제일 간단한 의사결정나무 분류기 · 논문에서 16개 밖에 안되는 데이터세트를 OneR 분류기로 교차검증했을때 복잡한 분류기 보다 더 성능이 좋다는 것을 발견하였고 매우 간단한 분류규칙이 가장 잘 수행된다는 논문을 발표하였습니다. 왜냐하면 실제 일부 데이터세트의 구조는 정말 간단하기 때문이며 간섭이 많고 복잡한 데이터세트들은 오히려 기계학습이 제대로 작동하지 않을 수 있기 때문입니다. · 1개의 특정 속성이 모든것을 대표할 수 있다는 가정에서 출발하는 1단계 의사결정나무입니다. · 1개 속성으로 모든 일을 수행합니다. 즉, 1개 속성이든 1000개의 속성이든 하나의 속성으로 목표변수를 맞추는 방법입니다. Class OneR http://weka.sourceforge.net/d..
-
IBk vs k-means
IBk vs k-means · IBk 분류분석은 k-means 군집분석과 유사합니다. 그래서 IBk 분류분석은 데이터간 거리측정 즉 유사도를 기준으로 군집화를 하는 것까지는 똑같습니다. 그러나 k-means은 군집화까지만 수행하지만 IBk는 더 나아가 군집간에 기준선을 만들어 새로운 데이터가 어느 군집에 분류될지까지 결정합니다. · 또 다른 차이점은 k means 군집분석은 군집개수를 수동으로 지정하여 어느정도 군집개수가 적절한지 일일히 실험을 해야 하나, IBk 는 crossvalidate 옵션을 사용하면 적정군집수를 제안해 줍니다.
-
Number of international phone calls from Belgium, 1950–1973.
Number of international phone calls from Belgium, 1950–1973. 연도별로 데이터측정 방법이 달라서 일관된 데이터가 나오지 않고 이상값이 나온 실제 데이터 사례입니다. http://bit.ly/2siIBKI 직접 다운로드