k평균 클러스터링 특징

CODEDRAGON Development/Big Data, R, ...

반응형


 

 

k평균 클러스터링 특징 

특징

설명

반복 작업

·       초기에 잘못 병합된 경우를 보완합니다.

·       여러 번 반복 수행하여 초기 오류를 회복합니다.

·       여러 반복의 결과최적의 결과를 만들어 냅니다.

짧은 계산 시간

·       간단한 알고리즘으로 계산 시간 이 최소화됩니다.

·       대규모 시스템에 적용 가능합니다.

탐색적 방법

·       새로운 자료에 대한 사전정보가 필요하지 않습니다. 자료에 대한 정보 없이도 자료구조 탐색을 수행할 수 있습니다.

·       새로운 자료에 대한 탐색을 통해 의미 있는 자료를 찾아냅니다.

·       대용량 데이터에 대한 탐색적인 기법입니다.

다양한 데이터에 적용

·       거의 모든 형태의 데이터에 대하여 적용 가능합니다.

·       관찰할 데이터 간의 거리를 데이터형에 맞게만 정의하면 분석 가능합니다.

분석방법의 적용이 쉬움

·       클러스터링 방법은 데이터에 대해 사전정보를 요구하지 않습니다.

·       사전에 특정 변수에 대한 역할 정의가 필요하지 않습니다.

·       관찰할 데이터 간의 거리만이 분석에 필요한 입력값입니다.

거리 기반 분류

·       유클리디안 거리의 측정

·       중심점과의 거리 최소화

가중치와 거리 정의 필요

·       관찰할 데이터들 사이의 거리를 정의하는 것이 어렵습니다.

·       변수에 대한 가중치를 결정하는 것이 어렵습니다.

초기 클러스터링 수 결정

·       사전에 정의된 클러스터링 수 k 기준으로 찾습니다.

·       초기 설정 클러스터링 수가 적합하지 않으면 결과가 좋지 못합니다.

결과해석이 어려움

·       사전에 주어진 목적이 없어 결과의 해석에 어려움 있습니다.