CODEDRAGON ㆍDevelopment/AI
군집 분석(Cluster analysis)
· ≒ 군집화
· 동일한 성격을 가진 여러 개의 그룹으로 대상을 분류하는 것입니다.
· 대상 개체를 유사하거나 서로 관련있는 항목끼리 묶어 몇 개의 집단으로 그룹화는 하는 것입니다. 각 집단의 성격을 파악함으로써 데이터 전체의 구조에 대한 이해를 돕고자 하는 탐색적 분석 방법입니다.
· 데이터간의 유사도를 측정한 후 이를 바탕으로 특성이 비슷한 데이터를 합쳐가면서 최종적으로 유사 특성의 데이터 집합(Group)을 추출하는데 사용됩니다.
· 각 객체에 대해 관측된 여러 개의 변수(X1, X2, …, Xp)값들로 부터 n개의 개체를 유사한 성격을 가지는 몇 개의 군집으로 집단화하고, 형성된 군집들의 특성을 파악하여 군집들 사이의 관계를 분석하는 다변량분석 기법입니다.
· 군집 분석에 이용되는 다변량 데이터는 별도의 반응 변수가 요구되지 않으며, 오로지 개체들 간의 유사성(similarity)에만 기초하여 군집을 형성합니다.
· 수많은 데이터들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하는 것을 의미합니다.
· 유사성이 많은 것을 그룹으로 묶음으로써 그룹 내에서는 동질성을 극대화하고 서로 다른 그룹 상호 간에는 이질성을 극대화시킵니다. 그래서 군집분석은 특정한 가설을 세우지 않고도 수많은 데이터내에 숨겨진 패턴들을 찾을 수 있다는 특징이 있습니다.
· 데이터 안에 존재하는 알지 못하는 특성들이 있을 때, 데이터 점들이 군집을 이루게 하면서 그 특성들이 나타나도록 하게 하는 것입니다.
· 군집분석은 주어진 데이터로부터 특징에 따라 그룹화 하기 위한 기법입니다. 다시 말하면, 유사한 특징을 가지는 데이터들을 같은 군집에 서로 다른 특징을 가지는 데이터들은 다른 군집에 속하도록 데이터를 나누는 작업입니다.
'Development > AI' 카테고리의 다른 글
군집분석 방법 (0) | 2019.12.11 |
---|---|
군집 분석 도식도 (0) | 2019.12.11 |
3.Summary - 3.분산처리 수행모듈 개발하기 (0) | 2019.12.11 |
1.Summary - 1.빅데이터 처리시스템 설계하기 (0) | 2019.12.11 |
절대 오차(Absolute Error) (0) | 2019.12.10 |