Development/AI(891)
-
분류 종류(분류 기법)
분류 종류(분류 기법) 분류는 크게 이진 분류와 다중 분류로 나누어집니다.
-
Elbow Method
Elbow Method· ≒ 엘보법· ≒ 엘보우 차트· 클러스터의 수를 순차적으로 늘려가면서 결과를 모니터링합니다.· 하나의 클러스터를 추가했을 때, 이전보다 훨씬 더 나은 결과를 나타내지 않으면 이전의 클러스터의 수를 최종 클러스터의 수로 설정합니다. http://bit.ly/2NJo1Lq
-
3.Summary - 3.변수간 관계 확인하기
R Code 예시 R을 통해 주어진 데이터를 통해 데이터 분석을 수행합니다.성적과 IQ간의 회귀식을 구해서 IQ가 125인 사람의 성적을 예측하시오 학생별로 성적 과 IQ, 학원수, 게임하는 시간, TV 시청시간을 정리한 데이터입니다. > # 현재 언어 설정 확인 > Sys.getlocale() [1] "LC_COLLATE=English_United States.1252;LC_CTYPE=English_United States.1252;LC_MONETARY=English_United States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252" > # 강제 언어 삭제 > Sys.setlocale("LC_ALL","C") [1] "C" > # 한글로 언어 설정 ..
-
인공신경망(ANN; Artificial Neural Network)
인공신경망(ANN; Artificial Neural Network)· 인공신경망 뉴런들은 multi-layer로 구성을 하며, 역전파(back-propagation) 알고리즘을 통해 신경망의 학습 결과가 기대치와 비슷한 결과를 낼 수 있도록 뉴런의 입력으로 들어오는 시냅스의 가중치를 계속 조절해가는 과정을 거치며 훈련(training)을 하게됩니다.· 훈련 데이터를 통한 반복 훈련을 통해 가중치(w1, w2, …, wn)의 최적값이 정해지게 됩니다.
-
5.Summary - 5. 모델성능 평가하기
K-교차검증(K-fold Cross-Validation) 단일한 훈련 데이터와 평가 데이터로 1회만 분할하는 것이 아니라, 전체 데이터를 K개로 등분한 뒤, k=1,2...K번째 데이터 세트를 차례로 검증 데이터(Validation Data)로 사용하고 나머지 데이터 세트를 모델 훈련에 반복적으로 사용하면서 모델 성능을 측정하는 방법입니다. 결국 K-교차 검증은 데이터 세트를 훈련 데이터와 검증 데이터(Validation Data)로 나누어 모델링 및 성능 평가를 K회 반복하게 되며, 모든 K개 중첩에 대한 성능 평가결과들에 대한 평균치를 통해 최종 모델 성능 평가를 도출할 수 있습니다. https://codedragon.tistory.com/6884 https://codedragon.tistory.co..
-
불순도(impurity)
불순도(impurity) · 불순도는 노드에 여러 분류가 섞여 있을수록 높아집니다↑. 반면 하나의 분류만 있다면 낮아집니다↓. · 가장 흔히 사용하는 불순도 함수는 지니 불순도(Gini Impurity)입니다. 불순도 함수 불순도 함수 f가 있다고 할 때 노드 A의 불순도 I(A)는 다음과 같이 정의합니다.