데이터 정제 대상 유형

CODEDRAGON Development/Database

반응형

 

 

데이터 정제 대상 유형

데이터 정제는 전환에 불필요한 데이터를 사전 정리하여 전환 시간을 축소하고, 원천 시스템 내의 오류 데이터 및 목적 시스템과의 DB 특성이 상이함에 따라 발생하는 데이터의 교정 작업 등 원천 시스템 데이터에 대하여 변화 또는 변경을 발생시키는 일련의 데이터의 삭제, 수정 작업을 의미합니다.

 

 

<> 데이터 정제 대상 항목 정의

정제대상 항목

상세내역

전환 제외 대상

·       데이터 전환에 불필요한 데이터(사전 관련자 협의가 필수임.)

·       프로그램 유지·보수 과정에서의 생성된 임시 데이터

정합성 미비

·       데이터 상호간의 동일한 정보가 서로 불일치 하는 경우

·       중복 관리되는 정보의 상호 불일치

불필요한 데이터 필드

·       사용하지 않는 필드에 데이터 값이 존재하는 경우

·       DB 초기 생성 시 초기화되어 있지 않은 불필요한 데이터가 존재하는 경우

손실된 데이터

·       지정된 필드의 사이즈가 작아 일부 데이터가 손실되는 경우

·       (한글 필드의 정의된 사이즈보다 긴 데이터가 저장될 경우 뒤의 일부가 손실됨)

불일치 데이터 타입

·       숫자형 필드에 영문자 또는 한글이 존재하는 경우

오류 데이터

·       일자 오류: 일자 타입이 년//(yy/mm/d) 형태로 되어 있지 않고 일반 숫자형태로 되어 있는 경우, 또는 윤년 등이 감안되지 않은 경우(윤년이 아닌데도 2 29일로 되어 있는 경우 등)

전환 테스트 결과 발견된 오류 데이터

·       1단계 정제 대상 중에서 사전에 인지하지 못하여 1단계에서 정제가 완료되지 않은 데이터

·       오류 데이터는 아니지만 매핑 과정에서 사전에 데이터 정제가 필요하다고 인정되는 데이터(데이터의 중복 관리, 보관 형태의 상이)

전환 과정에서의 정제

·       오류의 유형이 일정하고 단순하게 수정이 가능한 경우

·       일정한 로직에 의하여 수정이 가능한 경우

·       현재는 알 수 없으나, 매핑값을 알 수 있는 경우

·       지정된 값으로 일괄 수정이 가능한 경우

·       기타 매핑 과정에서 수정이 필요한 경우