분류 전체보기(14727)
-
WEKA IBk
IBk · Instance Based paremeter k · IBk 분류분석은 k-means 군집분석과 유사합니다. · Weka GUI Explorer 로 실행하면 정분류율은 산출되지만 모델은 출력되지 않으며 노이지 데이터세트의 경우 k 가 적을수록 정분류율이 향상됩니다. · IBk는 NaiveBayes 처럼 모든 속성은 똑같이 중요하다고 가정하고 있습니다. · IBk는 분석 성능이 느릴 수 있지만 좋은 기계학습법중 하나입니다. · IBk는 훈련 인스턴스의 수(n)와 k가 무한대에 도달하고 k/n 이 0에 수렴할때 오차는 최소화 됩니다. 결국 많은 양의 데이터세트와 큰 값의 k 를 사용하면 이론적으로 분류정확도가 보장되게 됩니다. Class IBk http://weka.sourceforge.net/do..
-
2.Summary - 2.빅데이터 입출력구조 설계하기
하둡 에코시스템(Ecosystem), 도식도, 구성요소 · 하둡과 관련된 프레임워크들을 하둡 에코시스템이라 합니다. · 하둡 코어 프로젝트(HDFS, MapReduce)와 하둡 서브 프로젝트(수집, 분석, 마이닝 등)로 구성됩니다. · 다양한 프레임워크가 존재하며, 사용자의 상황에 맞추어 조립하여 사용할 수 있습니다. https://codedragon.tistory.com/9570 빅데이터 플랫폼 아키텍처의 외부 시스템 외부 시스템은 빅데이터 플랫폼 아키텍처의 기본 아키텍처에 포함되지 않습니다.
-
분석방법 로드맵
분석방법 로드맵
-
신경망 종류
신경망 종류신경망은 방향을 갖는 연결 그래프(뉴런이라는 노드와 연결강도를 갖는 간선으로 구성)입니다. · 퍼셉트론(Perceptron)· 아달라인(ADALINE: Adaptive Linear Neuron)· 로지스틱 회귀분석(Logistic Regression)· SVM(Support Vector Machine)· 다층 퍼셉트론(MLP: Multi-Layer Perceptron)· 합성곱 신경망(CNN: Convolutional Neural Network)
-
교차검증(Cross-validation)방법, k-fold 교차검증 ( k-fold CV; k-fold Cross-validation)
k-fold 교차검증 (k-fold CV) · ≒ K-fold Cross Validation ≒ K-fold Cross Validation Scheme · ≒ K겹 교차 검증 ≒ 다중 교차 검증 · 과다한 연산량을 줄여주는 방법입니다. · 수집된 샘플들의 검증을 위한 통계적인 분석방법의 하나로 강한 성능 추정 방법입니다. · 전체 집합을 k개로 나눈 뒤 하나를 다른 것들과 비교하여 전체적으로 특이한 집합이 없는지 확인하는 방식입니다. · 데이터를 무작위(Random)로 섞은 후 K등분 한 것 중 하나를 검정(Validation) Set으로 사용하는 방법입니다. · 교차 검증은 데이터를 훈련 데이터와 검증 데이터로 나누어 모델링 및 평가하는 작업을 K회 반복합니다. · 전체 데이터를 사이즈가 동일한 k개의..
-
데이터 분석 절차
데이터 분석 절차