데이터 비식별화 기법 - 가명처리(pseudonymisation), 총계처리(aggregation), 데이터 값 제거(data reduction), 범주화(data suppression), 데이터 마스킹(data masking)

CODEDRAGON Security/InformationSecurity

반응형

 

 

 

데이터 비식별화 기법

대표적인 비식별화 기법으로는 다음과 같은 것들이 있습니다.

 

·         가명처리(pseudonymisation)

·         총계처리(aggregation)

·         데이터 제거(data reduction)

·         범주화(data suppression)

·         데이터 마스킹(data masking)

 


 

 

가명처리(pseudonymisation)

·         식별 가능한 변수값을 다른 값으로 대체합니다.

·         세부기법으로 휴리스틱 가명화, 암호화교환방법등을 사용합니다.

 

 

비식별화 데이터 비식별화
나실명, 38, 수원 거주 홍길동, 38, 수원 거주
홍길동, 27, 서울 거주, 한국대 재학 홍길동, 27, 서울 거주, A 재학

 

 

 

 

총계처리(aggregation)

·         개인정보 보호를 위해 데이터를 총합하거나 평균 사용합니다.

·         세부기법으로 총계처리, 라운딩, 부분총계, 재배열 방법등을 사용합니다.

 

비식별화 데이터 비식별화
A 직원 연봉 4,500
B 직원 연봉 5,200
C 직원 연봉 4,600
평균 연봉 4,766
A 학생 182cm
B 학생 174cm
C 학생 160cm
3학년 학생 516cm
3학년 학생 평균 172cm
 
182+174+160=516
(182+174+160)/3=172

 

 

 

 

 

데이터 제거(data reduction)

·         개인 식별이 유의한 변수값을 제거합니다.

·         세부기법으로 식별자 삭제, 레코드 삭제, 식별자 부분 삭제, 식별 요소 전부 삭제등의 방법을 사용합니다.

 

비식별화 데이터 비식별화
나실명, 38, 수원 거주 38 , 수원 거주
홍길동, 741225-1586034 홍길동, 70 남자

 

 

 

 

 

범주화(data suppression)

·         데이터값을 범주화하여 명확한 값을 범주의 으로 대체합니다.

·         세부기법으로 감추기, 범위화, 랜덤 라운딩, 제어 라운딩등을 사용합니다.

 

 

비식별화 데이터 비식별화
나실명, 38, 수원 거주 나실명, 30, 경기도 거주
나실명, 38 나실명, 30~40

 

 

 

 

데이터 마스킹(data masking)

·         개인 식별에 유의한 변수값을 보이지 않도록 처리합니다.

·         세부기법으로 임의잡음 추가, 공백과 대체, 기호와 대체등의 방법을 사용합니다.

 

비식별화 데이터 비식별화
나실명, 38, 수원 거주 **, 38, 수원 거주
나실명, 38, 한국대 재학 OO, 38, OO 재학
홍길동, 741225-1586034 홍길동, 7412**-1******