3.Summary - 3.빅데이터 품질관리모듈 개발하기

CODEDRAGON Development/Big Data, R, ...

반응형



 

 

 

데이터 품질 관리 시스템의 4가지 필수 요소

조직 모든 데이터를 종합하라

·         데이터는 조직 여러 곳에 동시에 존재한다.

·         성공적인 이니셔티브는 기업 데이터를 전체적으로 조망할 있느냐에 성패가 달려 있으며, 이를 가능하게 해주는 핵심이 바로 데이터의 품질이다. 따라서 데이터 품질 관리 시스템 데이터 소스의 종류에 상관 없이 모든 데이터 유형의 통합을 지원해야 한다.

데이터를 준비된 상태로 프로파일링하라

·         데이터 완전성과 정확성을 평가할 없다면 원하는 목적에 맞게 데이터를 정의하고 연계하는 작업이 어려워질 있다.

·         데이터 완전성 전제조건은 특정 데이터가 최신 버전이고 제품에 대한 상세 정보를 담고 있다는 사실을 보장하는 것이다. 이와 달리 데이터 정확성에서는 데이터가 담고 있는 가치 중요하다.

·         따라서 데이터 프로파일링이 제대로 수행되어야 파일명을 통해 있는 데이터의 내용보다 많은 것을 파악할 있다.

데이터 품질을 보장하라

·         데이터의 완전성과 정확성이 확보된다면, 이를 통해 사용자는 품질이 보장된 데이터를 가치 있고 연관성 있는 비즈니스 정보로 전환할 있다.

·         데이터는 본래 의미가 훼손되지 않으면서 정화, 표준화, 확대 기술을 거쳐 사용자의 목적에 부합하는 유용한 정보로 재탄생하는 것이다.

데이터 시큐리티를 보장하라

·         데이터 품질 관리 시스템의 핵심은 사용자가 원하는 시점에, 가장 정확한 최고 품질의 데이터 사용 있도록 지원하는 것이다.

·         특히 문제가 있는 데이터에 액세스하려는 사용자의 역할을 검증 있도록 기업 보안 서비스와의 통합을 지원하고, 사용자의 데이터 액세스가 세분화된 단위로 관리, 통제돼야 하는 상황까지도 지원해야 한다

 

https://codedragon.tistory.com/9893

 

 

 

 

 

 

 

빅데이터의 통계 품질 검증 체계