CODEDRAGON ㆍDevelopment/Big Data, R, ...
k평균 클러스터링 특징
특징 |
설명 |
반복 작업 |
· 초기에 잘못 병합된 경우를 보완합니다. · 여러 번 반복 수행하여 초기 오류를 회복합니다. · 여러 번 반복의 결과로 최적의 결과를 만들어 냅니다. |
짧은 계산 시간 |
· 간단한 알고리즘으로 계산 시간 이 최소화됩니다. · 대규모 시스템에 적용 가능합니다. |
탐색적 방법 |
· 새로운 자료에 대한 사전정보가 필요하지 않습니다. 자료에 대한 정보 없이도 자료구조 탐색을 수행할 수 있습니다. · 새로운 자료에 대한 탐색을 통해 의미 있는 자료를 찾아냅니다. · 대용량 데이터에 대한 탐색적인 기법입니다. |
다양한 데이터에 적용 |
· 거의 모든 형태의 데이터에 대하여 적용 가능합니다. · 관찰할 데이터 간의 거리를 데이터형에 맞게만 정의하면 분석 가능합니다. |
분석방법의 적용이 쉬움 |
· 클러스터링 방법은 데이터에 대해 사전정보를 요구하지 않습니다. · 사전에 특정 변수에 대한 역할 정의가 필요하지 않습니다. · 관찰할 데이터 간의 거리만이 분석에 필요한 입력값입니다. |
거리 기반 분류 |
· 유클리디안 거리의 측정 · 중심점과의 거리 최소화 |
가중치와 거리 정의 필요 |
· 관찰할 데이터들 사이의 거리를 정의하는 것이 어렵습니다. · 각 변수에 대한 가중치를 결정하는 것이 어렵습니다. |
초기 클러스터링 수 결정 |
· 사전에 정의된 클러스터링 수 k 기준으로 찾습니다. · 초기 설정 클러스터링 수가 적합하지 않으면 결과가 좋지 못합니다. |
결과해석이 어려움 |
· 사전에 주어진 목적이 없어 결과의 해석에 어려움이 있습니다. |
'Development > Big Data, R, ...' 카테고리의 다른 글
불확실성 측정지표(Uncertainty measure) (0) | 2020.12.29 |
---|---|
엔트로피 지수(Entropy index) (0) | 2020.12.22 |
머신러닝 사례(기계학습 활용) (0) | 2020.12.04 |
lines() (0) | 2020.12.04 |
QUICK, DRAW 머신러닝 게임, 머신러닝 경험하기 (0) | 2020.12.01 |