CODEDRAGON ㆍDevelopment/Big Data, R, ...
빅데이터 품질 요소
빅데이터의 특징인 volume, variety, velocity, complexity를 고려하여 다양한 접근 방법의 품질 관리가 필요하다.
데이터 품질 요소 |
설명 |
정확성(accuracy) |
데이터 사용 목적에 따른 정확한 데이터 제공 |
완전성(completeness) |
필요한 데이터를 식별하여 완전성 향상 |
적시성(timeliness) |
데이터 활용 시점의 활용도 향상 |
일관성(consistency) |
사용목적에 따른 일관된 데이터 활용 기준 제시 |
빅데이터 품질 요소 및 품질 전략
데이터 품질 요소 |
데이터 품질 전략 |
정확성(accuracy) |
데이터 사용 목적에 따라 데이터 정확성의 기준을 다르게 적용합니다.
ex) 사용자가 접속한 사이트와 이동 지점을 분석하는 클릭스트링 분석과 부정이나 사기를 탐지하는 경우 데이터의 품질 수준은 다릅니다. |
완전성(completeness) |
필요한 데이터의 완전한 확보보다는 필요한 데이터를 식별하는 수준으로 적용 가능합니다. |
적시성(timeliness) |
소멸성이 강한 데이터에 대해 어느 정도의 품질 기준을 적용할 것인지 결정합니다.
ex) 웹 로그 데이터, 트윗 데이터, 위치 데이터 등은 하루, 몇 시간, 몇 분 동안만 타당성을 가집니다. |
일관성(consistency) |
같은 데이터라 할지라도 사용 목적에 따라 달라지는 데이터 수집 기준 때문에 데이터 의미가 달라질 수 있습니다. |
'Development > Big Data, R, ...' 카테고리의 다른 글
수행 내용-빅데이터 저장 계획 수립하기 (0) | 2020.01.03 |
---|---|
가설 검정 방법 (0) | 2020.01.03 |
4.Summary - 4.수집 데이터 검증모듈 개발하기 (0) | 2020.01.02 |
1.Summary - 1.빅데이터 수집시스템 설계하기 (0) | 2020.01.02 |
비즈니스 도메인과 원천데이터 정보 (0) | 2020.01.02 |