데이터 유형 - 정형, 비정형, 반정형

CODEDRAGON Development/AI

반응형

 

 

데이터 유형

빅데이터는 유형에 따라 정형, 비정형, 반정형의 데이터를 가지고 있습니다.

정형 데이터, 비정형데이터, 반정형데이터의 존재 유무 유형을 파악하는 것이 필요합니다.

유형

설명

정형 데이터

(Structured data)

·         형식이 정해져 있는 데이터

·         고정된 필드에 저장된 데이터

·         정량 데이터(Quantitative data)

·         DB형태의 데이터        

·         수치화된 데이터

·         엑셀 데이터

 

 

·         기간계, 관리계, 정보계, 분석계등 업무 시스템 데이터

·         관계형 데이터베이스나 스프레드시트, 사무정보 등에 저장된 데이터

·         재무정보, 급여테이블, 인사정보, 재고관리, 거래정보, 거래처 정보

비정형 데이터

(Unstructured data)

·         형태와 구조가 복잡한 데이터

·         정성데이터Qualitative data)

·        

 

 

·         설문조사, 주간식 응답, 블로그

·         이미지, 오디오, 비디오, 동영상, 멀티미디어

·         이메일, 보고서, 문서,

·         SNS 데이터(소셜 데이터)

반정형 데이터

(Semi-structured data)

·         값과 형식이 다소 일관성이 없는 데이터

·         정형구조의 데이터 모델을 준수하지 않는 정형데이터의 형태

·         일반적으로 파일(file) 형태로 저장됩니다.

·         센서를 중심으로 스트리밍(Streaming) 되는 IoT 머신 데이터(Machine Data)

 

 

·         HTML, XML,  웹문서, 웹로그, 센서 데이터, RFID, 사물통신 정보, 인지 정보

·         마케팅 정보, 다양한 장치 데이터