빅데이터 품질 요소 및 품질 전략

CODEDRAGON Development/Big Data, R, ...

반응형


 

 

빅데이터 품질 요소

빅데이터의 특징인 volume, variety, velocity, complexity 고려하여 다양한 접근 방법의 품질 관리가 필요하다.

 

데이터 품질 요소

설명

정확성(accuracy)

데이터 사용 목적에 따른 정확한 데이터 제공

완전성(completeness)

필요한 데이터를 식별하여 완전성 향상

적시성(timeliness)

데이터 활용 시점의 활용도 향상

일관성(consistency)

사용목적에 따른 일관된 데이터 활용 기준 제시

 

 

 

 

 

 

빅데이터 품질 요소 품질 전략

데이터 품질 요소

데이터 품질 전략

정확성(accuracy)

데이터 사용 목적에 따라 데이터 정확성의 기준을 다르게 적용합니다.

 

ex) 사용자가 접속한 사이트와 이동 지점을 분석하는 클릭스트링 분석과 부정이나 사기를 탐지하는 경우 데이터의 품질 수준은 다릅니다.

완전성(completeness)

필요한 데이터의 완전한 확보보다는 필요한 데이터를 식별하는 수준으로 적용 가능합니다.

적시성(timeliness)

소멸성이 강한 데이터에 대해 어느 정도의 품질 기준을 적용할 것인지 결정합니다.

 

ex) 로그 데이터, 트윗 데이터, 위치 데이터 등은 하루, 시간, 동안만 타당성을 가집니다.

일관성(consistency)

같은 데이터라 할지라도 사용 목적에 따라 달라지는 데이터 수집 기준 때문에 데이터 의미가 달라질 있습니다.