데이터 유형 - 정형, 비정형, 반정형

CODEDRAGON Development/Big Data, R, ...

반응형

 

 

데이터 유형

빅데이터는 유형에 따라 정형, 비정형, 반정형의 데이터를 가지고 있습니다.

정형 데이터, 비정형데이터, 반정형데이터의 존재 유무 유형을 파악하는 것이 필요합니다.

유형

설명

정형 데이터

(Structured data)

·         형식이 정해져 있는 데이터

·         고정된 필드에 저장된 데이터

·         정량 데이터(Quantitative data)

·         DB형태의 데이터        

·         수치화된 데이터

·         엑셀 데이터

 

 

·         기간계, 관리계, 정보계, 분석계등 업무 시스템 데이터

·         관계형 데이터베이스나 스프레드시트, 사무정보 등에 저장된 데이터

·         재무정보, 급여테이블, 인사정보, 재고관리, 거래정보, 거래처 정보

비정형 데이터

(Unstructured data)

·         형태와 구조가 복잡한 데이터

·         정성데이터Qualitative data)

·        

 

 

·         설문조사, 주간식 응답, 블로그

·         이미지, 오디오, 비디오, 동영상, 멀티미디어

·         이메일, 보고서, 문서,

·         SNS 데이터(소셜 데이터)

반정형 데이터

(Semi-structured data)

·         값과 형식이 다소 일관성이 없는 데이터

·         정형구조의 데이터 모델을 준수하지 않는 정형데이터의 형태

·         일반적으로 파일(file) 형태로 저장됩니다.

·         센서를 중심으로 스트리밍(Streaming) 되는 IoT 머신 데이터(Machine Data)

 

 

·         HTML, XML,  웹문서, 웹로그, 센서 데이터, RFID, 사물통신 정보, 인지 정보

·         마케팅 정보, 다양한 장치 데이터