군집 분석(Cluster analysis)

CODEDRAGON Development/Big Data, R, ...

반응형


 

 

군집 분석(Cluster analysis)

·         군집화

·         동일한 성격을 가진 여러 개의 그룹으로 대상을 분류하는 것입니다.

·         대상 개체를 유사하거나 서로 관련있는 항목끼리 묶어 개의 집단으로 그룹화는 하는 것입니다. 집단의 성격을 파악함으로써 데이터 전체의 구조에 대한 이해를 돕고자 하는 탐색적 분석 방법입니다.

·         데이터간의 유사도를 측정한 이를 바탕으로 특성이 비슷한 데이터를 합쳐가면서 최종적으로 유사 특성의 데이터 집합(Group) 추출하는데 사용됩니다.

·         객체에 대해 관측된 여러 개의 변수(X1, X2, …, Xp)값들로 부터 n개의 개체를 유사한 성격을 가지는 개의 군집으로 집단화하고, 형성된 군집들의 특성을 파악하여 군집들 사이의 관계를 분석하는 다변량분석 기법입니다.

·         군집 분석에 이용되는 다변량 데이터는 별도의 반응 변수가 요구되지 않으며, 오로지 개체들 간의 유사성(similarity)에만 기초하여 군집을 형성합니다.

·         수많은 데이터들을 유사한 특성을 지닌 개의 소그룹으로 분할하는 것을 의미합니다.

·         유사성이 많은 것을 그룹으로 묶음으로써 그룹 내에서는 동질성을 극대화하고 서로 다른 그룹 상호 간에는 이질성을 극대화시킵니다. 그래서 군집분석은 특정한 가설을 세우지 않고도 수많은 데이터내에 숨겨진 패턴들을 찾을 있다 특징이 있습니다.

 

·         데이터 안에 존재하는 알지 못하는 특성들이 있을 , 데이터 점들이 군집을 이루게 하면서 특성들이 나타나도록 하게 하는 것입니다.

 

·         군집분석은 주어진 데이터로부터 특징에 따라 그룹화 하기 위한 기법입니다. 다시 말하면, 유사한 특징을 가지는 데이터들을 같은 군집에 서로 다른 특징을 가지는 데이터들은 다른 군집에 속하도록 데이터를 나누는 작업입니다.

 

 

http://bit.ly/2PTdShv

http://bit.ly/2qB59Cu

 


반응형