2019/12(246)
-
이질성 vs 동질성
이질성 vs 동질성
-
군집분석 방법
군집분석 방법 군집분석은 유사성을 기초로 그룹화하는 방법과 그룹 내 분산 개념을 기초로 그룹화하는 방법이 있습니다.
-
군집 분석 도식도
군집 분석 도식도다양한 집단에서 군집화(Clustering)를 수행하면 유사한 모양으로 군집(Cluster)을 나눌 수 있습니다.
-
군집 분석(Cluster analysis)
군집 분석(Cluster analysis) · ≒ 군집화 · 동일한 성격을 가진 여러 개의 그룹으로 대상을 분류하는 것입니다. · 대상 개체를 유사하거나 서로 관련있는 항목끼리 묶어 몇 개의 집단으로 그룹화는 하는 것입니다. 각 집단의 성격을 파악함으로써 데이터 전체의 구조에 대한 이해를 돕고자 하는 탐색적 분석 방법입니다. · 데이터간의 유사도를 측정한 후 이를 바탕으로 특성이 비슷한 데이터를 합쳐가면서 최종적으로 유사 특성의 데이터 집합(Group)을 추출하는데 사용됩니다. · 각 객체에 대해 관측된 여러 개의 변수(X1, X2, …, Xp)값들로 부터 n개의 개체를 유사한 성격을 가지는 몇 개의 군집으로 집단화하고, 형성된 군집들의 특성을 파악하여 군집들 사이의 관계를 분석하는 다변량분석 기법입니다..
-
3.Summary - 3.분산처리 수행모듈 개발하기
하이브(Hive) · 피그와 유사한 대규모 데이터 세트에 대한 분석을 위해 페이스북(facebook)에서 개발된 데이터 분석용 서비스입니다. · 하이브는 하이브 큐엘(Hive QL)이라는 명령어를 사용해서 질의를 수행하고 데이터를 분석하는 서비스입니다. · 하이브도 맵리듀스 프로그램으로 전환이 되어서 데이터 처리를 진행하지만, 기존 RDBMS의 SQL에 익숙한 사용자들에게 거의 동일한 명령어를 제공하므로 맵 리듀스 프로그램에 익숙하지 않은 사용자에게 원하는 정보를 쉽게 이용할 수 있도록 해줍니다. https://codedragon.tistory.com/9570 하둡 에코시스템(Ecosystem), 도식도, 구성요소 하둡 에코시스템(Ecosystem) 하둡은 특정 모듈 보다는 데이터처리 플랫폼 전체를 뜻합..
-
1.Summary - 1.빅데이터 처리시스템 설계하기
빅데이터 처리 시스템 구축을 위한 세부 계획 수립 항목