Development/Big Data, R, ...(885)
-
R - 빅데이터 분석환경, 통계계산 및 그래픽을 위한 프로그래밍 언어
R 뉴질랜드 오클랜드(Auckland) 대학의 로스이하카(Ross Ihaka)와 로버트 젠틀맨(Robert Gentleman)에 의해 시작 통계계산과 그래픽을 위한 프로그래밍 언어 GNU GPL을 따르고 있어 자유롭게 누구나 사용 가능 멀티 플랫폼(윈도우, 리눅스, OS X등)지원 소스코드의 수정 없이 재사용이 가능 통계연구 및 비주얼라이제이션에 널리 활용 통계계산과 패키지 개발 외에도 다양한 계산이 필요한 곳에서 우수한 성능 구현가능 R homepage 빅데이터 분석환경인 R은 “R Development Core Team”에서 운영하는 “The R Foundation” 공식사이트를 통해서 다운로드 및 다양한 정보를 이용할 수 있습니다.http://www.r-project.org/
-
R 응용분야
R 응용분야R은 생각보다 많은 분야에서 응용되고 있습니다.· R은 우리 생활 곳곳에 있지만 주로 통계 분석이나 자료 분석 등의 분석 역할을 하며, · 모델링이나 그래픽 작업, 조직화 및 시각화 작업 시에도 R이 쓰이고 있습니다.· 학문에서도 R이 쓰이고 있는데요. 재정학이나 생물정보학, 의료 등 다양한 학문에서 활발히 사용되고 있습니다.
-
k-평균 군집화(k-means clustering)
k-평균 군집화(k-means clustering) · ≒ k-평균 클러스터링 · 사전에 결정된 군집 수 K에 기초하여 전체 데이터를 상대적으로 유사한 K개의 군집으로 구분하는 방법입니다. · 상호배반적인 K개의 군집을 형성합니다. · 군집의 수 K를 사전에 결정해야 합니다. · 모집단 또는 범주에 대한 사전 정보가 없을 때 주어진 관측값들 사이의 거리를 측정하고 유사성을 이용하여 분석합니다. · 전체 데이터를 여러 개의 집단으로 그룹화함으로써 각 집단의 성격을 파악할 수 있고 데이터 전체의 구조를 이해하기 위한 방법입니다. · 새로운 데이터와 기존 데이터 간의 유클리디안 거리가 최소가 되도록 클러스터링합니다. 기존 데이터를 기준점으로 하여 유클리디안 거리 측정 거리가 최소화되도록 k개의 군집들로 클러스..