Development/Big Data, R, ...(885)
-
회귀분석(Regression Analysis), 회귀(回歸; Regression)
회귀분석(Regression Analysis) · 전통적인 통계분석에서 많이 사용하는 예측 방법입니다. · 하나 또는 그 이상의 변수들(독립변수)이 또 다른 변수(종속변수)에 미치는 영향(관계)를 수학적인 모형을 이용하여 설명하고 추론할 수 있는 통계 기법입니다. 즉, 일정한 패턴을 활용하여 무엇인가를 예측하는 분석기법입니다. · 한 개의 종속 변수(dependent variable)와 설명 변수들(explanatory variable(s))과의 관계를 모델링합니다. · 여러 가지 변수가 나타내는 선형관계를 모형화한 것입니다. · 독립변수가 종속변수에 영향을 미치는지 확인하기 위해 실시하는 분석 방법입니다. · 독립변수와 종속변수 사이에 인과관계가 존재할 때, 그 관계의 정도를 분석하고 통계적 유의성을 ..
-
Human neuron & Artificial neuron
Human neuron & Artificial neuron · 생물학적 뉴런의 구조 와 인공 뉴런은 병렬 계산(parallel computing), 분산 표현(distributed representation)을 한다는 유사성이 존재합니다. · 사람의 신경망과 인공신경망을 서로 비교한 것입니다. · 생물적인 뉴런(Neuron)이 노드(Node)로 생물적인 시냅스(Synapse)가 가중치(Weight)로 모델링이 됩니다. · 일정 정보가 임계치(Threshold)를 넘어서면 다른 뉴런에 결과를 전송합니다. (활성화)
-
투표(Majority Voting)
투표(Majority Voting)· ≒ 다수결 ≒ 다수결 방법· ≒ 과반수 투표· 가장 단순한 모형 결합 방법· 동일한 훈련세트로 여러 모델을 구축합니다.
-
배깅 알고리즘
배깅 알고리즘 · 각 훈련치를 평균하면, 분산을 낮추는 효과가 있습니다. · 배깅(Bagging)은 분산을 낮춰 과적합을 막아줍니다. 원자료(훈련세트)에서 무작위로 추출하여 표본 데이터를 뽑습니다. 뽑은 표본 데이터로 예측 모델을 모델링해서 최종 모델을 만듭니다.
-
k-fold 교차검증 도식도
k-fold 교차검증 도식도 · 전체 데이타를 k개로 나눕니다. 나눠진 각각을 폴드(fold) 또는 하부집합(subset)이라고 합니다. · 첫번째 학습에서는 첫번째 폴드를 테스트 데이터로 쓰고, 두번째 학습에서는 두번째 폴드를 테스트 데이터로 쓰고, … , n번째 학습에서는 n번째 폴드를 테스트 데이터로 사용합니다. · 하나의 데이터가 아니라 랜덤한 하나의 군집을 만들어 k만큼 나눈 다음 반복적으로 Test data(Validation Se)t과 Training Set으로 나누어서 검증합니다. 폴드가 5개면 5 Fold CV (Cross validation)이라고 합니다. 폴드가 10개면 10 Fold CV (Cross validation)이라고 합니다. Training Data와 Test Data로 ..
-
홀드아웃 교차 검증 개념도
홀드아웃 교차 검증 개념도 · 전체 데이터에서 훈련집합과 시험집합을 70:30으로 추출하여 훈련집합으로 모형을 구축한 후 해당 모형을 시험집합으로 모형 평가를 수행하게 됩니다.