2020/02(330)
-
k-fold 교차검증 수행 단계
k-fold 교차검증 수행 단계· 데이터 집합을 무작위로 동일 크기를 갖는 k개의 부분 집합으로 나누고, 그중 1개를 시험집합으로, 나머지 k-1개를 훈련 집합으로 선정하여 분석 모형을 평가합니다(P. Tan, M.· The data set is randomly divided into k subsets. One of the k subsets is used as the ‘test set’ and the other k-1 subsets are put together to form a ‘training set’. · Steinbach, and V. Kumar, 2007). 이러한 방식으로 모든 부분 집합들을 시험 집합으로 정확히 1회씩 선정하여 총 k번 반복합니다.
-
Bayes' Theorem proof
Bayes' Theorem proof 조건부 확률을 통해 나이브 베이즈 이론을 증명할 수 있습니다.최종적으로 P(B|A) = P(A|B)*P(B) / P(A) 라는 나이브 베이즈 공식이 나옵니다. P(A|B) = P(A∩B) / P(B)P(A∩B) = P(A|B)*P(B)P(B∩A) = P(B|A)*P(A)P(B∩A) = P(A∩B)P(A∩B) = P(B|A)*P(A) = P(A|B)*P(B)P(B|A)*P(A) = P(A|B)*P(B) P(B|A) = P(A|B)*P(B) / P(A)
-
평활 방법
평활 방법평활(smoothing) 방법은 구간화(binning), 군집화(clustering) 등이 사용됩니다. · 구간화(binning)· 군집화(clustering)
-
구간화(binning)
구간화(binning) 구간 너비를 10, 또하나는 5로 구간 너비를 작게 해서 히스토그램으로 표현하는 구간화 방법을 활용한 평활의 사례입니다.
-
naiveBayes()
naiveBayes() 베이즈 분류/예측 모델 (Naive Bayes classificatio) Arguments discription y Class vector. data Either a data frame of predictors (categorical and/or numeric) or a contingency table. laplace Laplace smoothing 여부
-
R 코드 예시 - 나이브 베이즈
R 코드 예시 - 나이브 베이즈 나이브 베이즈 기법을 적용하여 iris dataset를 훈련과 검증 그리고 분류 결과를 도출하는 R code 예시입니다.훈련용 데이터셋은 iris_train, 검증용 데이터셋은 iris_test 로 저장되어 있습니다.