CODEDRAGON ㆍDevelopment/Big Data, R, ...
데이터 유형
빅데이터는 유형에 따라 정형, 비정형, 반정형의 데이터를 가지고 있습니다.
정형 데이터, 비정형데이터, 반정형데이터의 존재 유무 및 유형을 파악하는 것이 필요합니다.
유형 |
설명 |
정형 데이터 (Structured data) |
· 형식이 정해져 있는 데이터 · 고정된 필드에 저장된 데이터 · 정량 데이터(Quantitative data) · DB형태의 데이터 · 수치화된 데이터 · 엑셀 데이터
· 기간계, 관리계, 정보계, 분석계등 업무 시스템 데이터 · 관계형 데이터베이스나 스프레드시트, 사무정보 등에 저장된 데이터 · 재무정보, 급여테이블, 인사정보, 재고관리, 거래정보, 거래처 정보 |
비정형 데이터 (Unstructured data) |
· 형태와 구조가 복잡한 데이터 · 정성데이터Qualitative data) ·
· 설문조사, 주간식 응답, 블로그 · 이미지, 오디오, 비디오, 동영상, 멀티미디어 · 이메일, 보고서, 문서, · SNS 데이터(소셜 데이터) |
반정형 데이터 (Semi-structured data) |
· 값과 형식이 다소 일관성이 없는 데이터 · 정형구조의 데이터 모델을 준수하지 않는 정형데이터의 한 형태 · 일반적으로 파일(file) 형태로 저장됩니다. · 센서를 중심으로 스트리밍(Streaming) 되는 IoT 머신 데이터(Machine Data)
· HTML, XML, 웹문서, 웹로그, 센서 데이터, RFID, 사물통신 정보, 인지 정보 · 마케팅 정보, 다양한 장치 데이터 |
'Development > Big Data, R, ...' 카테고리의 다른 글
과대적합 vs 과소적합 (0) | 2020.03.01 |
---|---|
Demographic Statistics By Zip Code - DATA.GOV (0) | 2020.02.27 |
TPR(True Positive Rate) vs FPR(False Positive Rate) (0) | 2020.02.24 |
TPR vs FPR 예시 (0) | 2020.02.23 |
통계적 가설 검정(statistical hypothesis test) (0) | 2020.02.18 |