데이터 표준화 방법론 - 데이터 표준화의 원칙 정립, 현행 체계 분석, 표준 체계 설계

CODEDRAGON Development/Database

반응형

 

 

데이터 표준화 방법론

데이터 표준화를 수행하기 위한 일련의 방법과 절차를 체계적으로 정립한 접근 방법으로써, 데이터 표준화를 위한 원칙을 정립하고, 현행 체계의 개선점과 개선 대안을 마련하여 표준화 원칙에 준거한 표준 체계를 설계한 후, 표준화 원칙과 표준 체계에 따라 데이터를 정제(Cleansing)하여 활용 시스템을 구축하는 등의 전반적인 절차와 방법, 사용되는 양식등으로 구성합니다.

 

·       데이터 표준화의 원칙 정립

·       현행 체계 분석

·       표준 체계 설계

 

 

데이터 표준화의 원칙 정립

데이터 표준화 원칙은 데이터 표준체계 설계의 기본 요건으로 적용된다. 데이터 표준화 원칙 수립 시에는 중복의 제거, 글로벌 표준(Global Standards)의 준수, 데이터표준화 우수 사례(Best Practice), 데이터 오너십(Ownership)의 부여, 경영 측면의 가치(Business Value)에 대한 우선 등을 고려할 필요가 있습니다.

 데이터 표준화의 기본원칙은 공통적으로 적용되어야 할 원칙과 데이터 표준화 대상 별 원칙을 정의합니다.

 

데이터 표준화 기본원칙 정의 - 예시

구성 요소

표준화 기본 원칙()

공통 원칙

·       관용화된 용어를 우선하여 사용한다.

·       영문명(물리명) 전환 시 발음식은 지양한다.

·       일반적인 명명 규칙 시 띄어쓰기는 하지 않는다.

·       한글명에 대해서는 복수의 영문명을 허용하지 않는다.(동음이의어 불가)

·       영문명에 대해서는 복수의 한글명을 허용한다.(이음동의어 허용)

표준 용어

·       '고객',회원'등은 '회원'으로 사용한다.

·       적용 일자, 유효 일자 등의 내용은 유효일자로 통일하여 사용한다.

·       용어는 띄어쓰기를 허용하지 않는다.

·       용어의 길이는 한글의 경우 12자 이내, 영문의 경우 24자 이내로 제한한다.

·       일련 번호, ID, SEQ ID로 통일한다.

·       영문 약어의 경우 5자 이내로 제한한다.

·       필요시 단어와 단어의 구분은 _(언더바)로 한다.

표준 코드

·       코드성 속성은 맨 뒤에 '코드'를 붙인다. () 상태 코드, 결과 코드

·       코드는 알파벳과 문자열을 조합하여 일정한 길이로 구성한다.

·       코드 속성에는 기본적으로 3자리 문자열인 코드 도메인을 지정한다.

·       코드는 전체 모델 내에서 유일하게 정의한다.

표준 도메인

·       표준 도메인은 기본적으로 숫자(Number), 문자열(String), 일시(Datetime)로 정의한다.

·       금액 도메인은 (18,0),(18,2)로 정의한다.

·       표준 도메인은 대표 속성을 기준으로 정의한다.

·       상세 도메인의 구별이 필요한 경우는 별도의 원칙으로 정의한다.

 

 

 

현행 체계 분석

현행 체계 분석에서는 고객, 서비스, 상품, 업체 등을 대상으로 소스 시스템별 분류 체계, 코드 체계, 객체(Entity), 속성 항목, 업무 규칙(Business Rule)을 조사하여 관리 체계상의 개선점과 요구 사항을 정리합니다.

 

 

표준 체계 설계

전사 통합 분류체계, 코드 체계 및 명명 규칙 등을 정립하고, 속성 항목 및 데이터 값의 표준에 대한 정의와 업무 규칙(Business Rule), 관리 절차에 대해 전사적인 표준화의 이슈를 중심으로 접근합니다.

 

반응형