2019/12(246)
-
비계층적 군집화(Nonhierarchical Cluster Procedures)
비계층적 군집화(Nonhierarchical Cluster Procedures) · 사전에 결정된 군집들의 수를 사용하여 개체들을 분류합니다. · N개의 구성인자를 M개의 클러스터로 분류하는 것입니다. · K-평균 알고리즘(K-means algorithm)을 사용합니다. Hierarchical 하게 군집을 형성시키지 않고 개체들을 몇 개의 군집으로 구분합니다. 군집의 수를 사전에 정의하고, 군집들 내부의 분산(dispersion)을 최소화 하도록 각각의 케이스를 k개의 군집들 중 하나에 할당합니다. 초기에 부적절한 병합(분리)이 일어났을 때 회복 가능합니다. · 레코드들을 각각의 군집에 할당하는 방법입니다. · 계산량이 많지 않기 때문에 대량의 데이터베이스에서 유용합니다.
-
군집간 거리 측정 방법 도식도
군집간 거리 측정 방법 도식도 계층적 병합 군집화 알고리즘 종류
-
계층적 군집(Hierarchical clustering)
계층적 군집(Hierarchical clustering) · ≒ 계층적 클러스터링 · 가장 유사한 개체를 묶어 나가는 과정을 반복하여 원하는 개수의 군집을 형성하는 방법입니다. · 보통 계통도 또는 덴드로그램(Dendrogran)의 형태로 결과가 주어지며 각 개체는 하나의 군집에만 속하게 됩니다. · 개체간의 유사성(거리)에 대한 다양한 정의가 가능합니다. · 군집간의 연결법(최단연결법, 최장연결법, 평균연결법, 중심연결법, 와드연결법)에 따라 군집의 결과가 달라질 수 있습니다. · 개체의 수가 적을 때 유용합니다.
-
군집 분석 기법
군집 분석 기법계층적 군집기법과 비계층적 군집기법으로 구분할 수 있습니다.· 계층적 기법(Hierarchical)· 비계층적 기법(Non-Hierarchical) 계층적 기법(Hierarchical methods)· 개체간 거리를 계산한 후에 비슷한 개체를 군집화합니다.· 클러스터를 만들어 가는 과정에서 여러 개의 클러스터가 만들어지는 기법입니다.· 병합(agglomerative), 분할(divisive)· 군집간 거리계산법(최단연결법, 최장연결법, 평균연결법, 중심연결법, 와드연결법)을 사용합니다. 비계층적 기법(Non-Hierarchical methods))· 사전에 결정된 군집들의 수를 사용하여 개체들을 분류합니다.· N개의 구성인자를 M개의 클러스터로 분류하는 것입니다. 군집화 기법 분류
-
군집의 유형
군집의 유형
-
분류시 주의사항
분류시 주의사항 집단간의 이질성을 통해 데이터에 대한 인사이트를 얻을 수 있습니다. 군집분류시 나라마다 문화적특성으로 분류방식이 다를 수 있습니다. 예를 들어 사자, 원숭이, 바나나를 분류하는 경우 동양('동사' 위주)에서는 {원숭이, 바나나}, {사자}로 그룹을 묶는 반면 서양('명사'위주)에서는 {원숭이, 사자}, {바나나}로 그룹을 묶는 문화적 특징이 있으므로 통계적으로 분류를 할때 주의를 해야 합니다.