k-평균군집의 절차 도식도

CODEDRAGON Development/Big Data, R, ...

반응형


 

 

k-평균군집의 절차 도식도


 

 

클러스터 각각은 센트로이드(centroid; '평균'이라고도 부르므로 'k-means'라는 이름이 붙었습니다), 개체 거리를 측정했을 중심 지점이 있습니다.( 표시)

클러스터는 센트로이드에서 가장 가까운 개체와의 거리를 반복 계산하며 정해집니다. 이것이 비지도 학습입니다. 알고리즘이 알아서 처리하고 결과를 보면, 개체가 이상 다른 센트로이드로 이동하지 않는 지점까지 반복하여 계산합니다. 이상 반복이 없으면 k-means 클러스터링은 끝이 납니다.

 

 

 

새로운 데이터가 들어오면 거리를 계산해서 기준선에 따라 새로운 데이터를 분류해 주게 됩니다.

회색 점과의 거리가 녹색점과의 거리보다 가까우므로 새로운 빨간점은 회색으로 묶어집니다.


 


반응형

'Development > Big Data, R, ...' 카테고리의 다른 글

사전확률 vs 사후확률  (0) 2019.12.09
그래프 이론 - 노드(node), 에지(edge), 아크(arc)  (0) 2019.12.09
k개의 클러스터로 만드는 방법  (0) 2019.12.09
1.Summary  (0) 2019.12.09
요구사항 수집  (0) 2019.12.09