CODEDRAGON ㆍDevelopment/Big Data, R, ...
빅데이터에서의 데이터
· 디지털시대에 생성되는 규모가 방대하고 생성주기가 짧은 빅데이터는 결과를 이해할 수 있는 내용을 데이터 시각화하는 작업이 필요합니다.
· 그러나 기존의 방법이나 도구로는 데이터를 수집하고 저장하고 가공하고 분석하기 어렵고 데이터를 프로그래밍하여 분석하기에는 너무 많은 시간과 비용이 들어갑니다.
· 최근에는 이를 해결한 자바스크립트로 만든 오픈 소스형태의 라이브러리들이 많이 나오고 있습니다. 이를 통해 데이터를 쉽고 멋지게 시각화해 낼 수 있습니다.
· 데이터의 집합은 방대하고 복잡한 데이터 집합을 정보 그래픽스, 과학적 시각화, 통계그래픽스와 연관지어 사용자가 상호작용하거나 직관적으로 이해할 수 있도록 해 줍니다.
· 방대한 데이터를 분석하고 '시각화'하는 작업이 필요합니다.
데이터 시각화(Data Visualization)
· 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정을 의미합니다.
· 데이터 시각화의 목표는 도표(graph)라는 수단을 통해 정보를 명확하고 효과적으로 전달합니다.
· 수치화된 한분에 보기 불편한 데이터(excel에 저장된 수치데이터)를 도표를 만들어서전달하다면 정보를 빠르게 전달할 수 있습니다.
· 지식 정보 사회에 필요한 데이터 분석 결과를 누구나 쉽게 이해할 수 있도록 의미있느 형태의 이미나 그래프로 표현하는 것을 의미합니다.
· 데이터 시각화는 점점 방대해지고 의미의 연관성이 높아지는 정보에 대해 복잡함을 줄여주고 패턴과 상관관계를 추론할 수 있게 해줍니다.(데이터의 여러 속성들 간 상관관계에 대한 통찰을 제공고, 데이터의 통계적인 속성도 한눈에 파악 할 수 있습니다.)
· 즉, 데이터를 시각화하여 그래프로 표현하면 텍스트로 표현했을 때보다 데이터를 직관적으로 이해할 수 있으며 데이터의 변화하는 흐름을 한눈에 파악할 수 있어 현재 상황을 이해하기 쉬울 뿐 아니라, 앞으로의 변화 추이까지 예측할 수 있게 도와줍니다.
· 대표적인 예로 보고서, 프리젠테이션에서 일일방문자 수를 꺽은선 그래프로 표시, 트래픽 유형을 파이 그래프로 표시, 국가별 데이터 표시하는 것이 여기에 해당됩니다.
'Development > Big Data, R, ...' 카테고리의 다른 글
데이터 수집 불가 원인 및 대안 (0) | 2021.08.09 |
---|---|
시그모이드 함수(Sigmoid function) (0) | 2021.08.03 |
pima-indiansdiabetes (0) | 2021.07.26 |
Keras 패키지 (0) | 2021.07.20 |
Search for datasets - DATAHUB (0) | 2021.06.22 |