2019/12(246)
-
신경망 종류
신경망 종류신경망은 방향을 갖는 연결 그래프(뉴런이라는 노드와 연결강도를 갖는 간선으로 구성)입니다. · 퍼셉트론(Perceptron)· 아달라인(ADALINE: Adaptive Linear Neuron)· 로지스틱 회귀분석(Logistic Regression)· SVM(Support Vector Machine)· 다층 퍼셉트론(MLP: Multi-Layer Perceptron)· 합성곱 신경망(CNN: Convolutional Neural Network)
-
교차검증(Cross-validation)방법, k-fold 교차검증 ( k-fold CV; k-fold Cross-validation)
k-fold 교차검증 (k-fold CV) · ≒ K-fold Cross Validation ≒ K-fold Cross Validation Scheme · ≒ K겹 교차 검증 ≒ 다중 교차 검증 · 과다한 연산량을 줄여주는 방법입니다. · 수집된 샘플들의 검증을 위한 통계적인 분석방법의 하나로 강한 성능 추정 방법입니다. · 전체 집합을 k개로 나눈 뒤 하나를 다른 것들과 비교하여 전체적으로 특이한 집합이 없는지 확인하는 방식입니다. · 데이터를 무작위(Random)로 섞은 후 K등분 한 것 중 하나를 검정(Validation) Set으로 사용하는 방법입니다. · 교차 검증은 데이터를 훈련 데이터와 검증 데이터로 나누어 모델링 및 평가하는 작업을 K회 반복합니다. · 전체 데이터를 사이즈가 동일한 k개의..
-
데이터 분석 절차
데이터 분석 절차
-
과적합 발생 여부을 알아내는 방법
과적합 발생 여부을 알아내는 방법 · 과적합은 층이 너무 많거나 변수가 복잡해서 발생하기도 하고 테스트셋과 학습셋이 중복될 때 생기기도 합니다. · 딥러닝은 학습 단계에서 입력, 은닉층, 출력층의 노드들에 상당히 많은 변수들이 투입됩니다. 따라서 딥러닝을 진행하는 동안 과적합에 빠지지 않게 늘 주의해야 합니다. · 과적합 발생 여부를 알아내려면 주어진 데이터 중 일부는 모델을 만드는 훈련 데이터로 사용하고, 나머지 일부는 테스트 데이터로 사용해 모델을 평가해야 합니다. · 즉, 데이터 추출을 통한 모형평가가 필요합니다.
-
supermarket.arff 데이터 셋
supermarket.arff 데이터 셋· 고객이 백화점의 여러 매장에서 구매한 제품을 기록한 데이터입니다.· 고객이 여러 매장에서 구매한 제품을 기록한 것으로 매장을 나타내는 변수들과 고객이 구매한 제품을 나타내는 변수들, 그리고 총구매액의 크기를 나타내는 변수로 구성되어 있습니다.· 매장에서 특정제품을 구매했을 경우, 't' 값을 가지고, 구매하지 않았을 경우 빈 값으로 표현되어 있습니다.· 데이터는 4627건이 존재합니다. C:\Program Files\Weka-3-8\data\supermarket.arff
-
3.Summary - 3.빅데이터 적재모듈 개발하기
데이터 저장을 위한 ERD를 통한 최적화된 Table로 도식화 CASE 1 - 1NF 반복 집합이 있는 비정규 테이블 - Before 정규화 학번 과목명 성적 이름 100 전자계산기 구조 92 김사랑 100 운영체제 90 김사랑 101 데이터베이스 82 오지호 101 데이터 통신 76 오지호 102 운영체제 82 이선균 CASE 2 - 2NF 1NF 정규 테이블 - Before 정규화 학번 과목명 성적 100 전자계산기 구조 92 100 운영체제 90 101 데이터베이스 82 101 데이터 통신 76 102 운영체제 82 학생 테이블 학번 지도교수 학과 100 이순재 컴퓨터 공학과 101 김연아 멀티미디어학과 102 이순재 컴퓨터 공학과 103 강부자 경영 정보학과 104 이순재 컴퓨터 공학과 105 김..