Development/Big Data, R, ...(885)
-
형태소 분석(Morphological analysis)
형태소 분석(Morphological analysis) · 자연어 처리에서는 토큰(token)으로 형태소를 사용합니다. · 형태소 분석은 단어로부터 어근, 접두사, 접미사, 품사 등 다양한 언어적 속성을 파악하고 이를 이용하여 형태소를 찾아내거나 처리하는 작업을 말합니다.
-
덴드로그램(Dendrogram)
계층적 군집의 결과 계층적 군집의 결과는 계통도 또는 덴드로그램(Dendrogram)의 형태로 표현됩니다. 덴드로그램(Dendrogram) · 어떤 특정 단계에서 병합 혹은 분할되는 군집들 간 관계를 파악하고 전체 군집들 간의 구조적 관계를 살펴보는 데 사용되는 도표입니다. · 정보를 트리 다이어그램 형태로 보여주는 그래프입니다. · 그래프의 구조를 통해서 항목간의 거리, 군집간의 거리를 알 수 있고 군집내의 항목간 유사정도를 파악함으로써 군집의 견고성을 해석할 수 있습니다. Resulting dendrograms with the original data matrix 계층구조 덴드로그램 - image.google.com http://bit.ly/36mI60p
-
분류 종류(분류 기법)
분류 종류(분류 기법) 분류는 크게 이진 분류와 다중 분류로 나누어집니다.
-
Elbow Method
Elbow Method· ≒ 엘보법· ≒ 엘보우 차트· 클러스터의 수를 순차적으로 늘려가면서 결과를 모니터링합니다.· 하나의 클러스터를 추가했을 때, 이전보다 훨씬 더 나은 결과를 나타내지 않으면 이전의 클러스터의 수를 최종 클러스터의 수로 설정합니다. http://bit.ly/2NJo1Lq
-
3.Summary - 3.변수간 관계 확인하기
R Code 예시 R을 통해 주어진 데이터를 통해 데이터 분석을 수행합니다.성적과 IQ간의 회귀식을 구해서 IQ가 125인 사람의 성적을 예측하시오 학생별로 성적 과 IQ, 학원수, 게임하는 시간, TV 시청시간을 정리한 데이터입니다. > # 현재 언어 설정 확인 > Sys.getlocale() [1] "LC_COLLATE=English_United States.1252;LC_CTYPE=English_United States.1252;LC_MONETARY=English_United States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252" > # 강제 언어 삭제 > Sys.setlocale("LC_ALL","C") [1] "C" > # 한글로 언어 설정 ..
-
인공신경망(ANN; Artificial Neural Network)
인공신경망(ANN; Artificial Neural Network)· 인공신경망 뉴런들은 multi-layer로 구성을 하며, 역전파(back-propagation) 알고리즘을 통해 신경망의 학습 결과가 기대치와 비슷한 결과를 낼 수 있도록 뉴런의 입력으로 들어오는 시냅스의 가중치를 계속 조절해가는 과정을 거치며 훈련(training)을 하게됩니다.· 훈련 데이터를 통한 반복 훈련을 통해 가중치(w1, w2, …, wn)의 최적값이 정해지게 됩니다.