달력

1

« 2020/1 »

  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  •  



 

 

데이터 비식별화 기법

대표적인 비식별화 기법으로는 다음과 같은 것들이 있습니다.

 

·         가명처리(pseudonymisation)

·         총계처리(aggregation)

·         데이터 제거(data reduction)

·         범주화(data suppression)

·         데이터 마스킹(data masking)

 

 

 

가명처리(pseudonymisation)

·         식별 가능한 변수값을 다른 값으로 대체합니다.

·         세부기법으로 휴리스틱 가명화, 암호화교환방법등을 사용합니다.

 

 

비식별화

데이터 비식별화

나실명, 38, 수원 거주

홍길동, 38, 수원 거주

홍길동, 27, 서울 거주, 한국대 재학

홍길동, 27, 서울 거주, A 재학

 

 

 

 

총계처리(aggregation)

·         개인정보 보호를 위해 데이터를 총합하거나 평균 사용합니다.

·         세부기법으로 총계처리, 라운딩, 부분총계, 재배열 방법등을 사용합니다.

 

비식별화

데이터 비식별화

A 직원 연봉 4,500

B 직원 연봉 5,200

C 직원 연봉 4,600

평균 연봉 4,766

A 학생 182cm

B 학생 174cm

C 학생 160cm

3학년 학생 516cm

3학년 학생 평균 172cm

 

182+174+160=516

(182+174+160)/3=172

 

 

 

 

 

데이터 제거(data reduction)

·         개인 식별이 유의한 변수값을 제거합니다.

·         세부기법으로 식별자 삭제, 레코드 삭제, 식별자 부분 삭제, 식별 요소 전부 삭제등의 방법을 사용합니다.

 

비식별화

데이터 비식별화

나실명, 38, 수원 거주

38 , 수원 거주

홍길동, 741225-1586034

홍길동, 70 남자

 

 

 

 

 

범주화(data suppression)

·         데이터값을 범주화하여 명확한 값을 범주의 으로 대체합니다.

·         세부기법으로 감추기, 범위화, 랜덤 라운딩, 제어 라운딩등을 사용합니다.

 

 

비식별화

데이터 비식별화

나실명, 38, 수원 거주

나실명, 30, 경기도 거주

나실명, 38

나실명, 30~40

 

 

 

 

데이터 마스킹(data masking)

·         개인 식별에 유의한 변수값을 보이지 않도록 처리합니다.

·         세부기법으로 임의잡음 추가, 공백과 대체, 기호와 대체등의 방법을 사용합니다.

 

비식별화

데이터 비식별화

나실명, 38, 수원 거주

**, 38, 수원 거주

나실명, 38, 한국대 재학

OO, 38, OO 재학

홍길동, 741225-1586034

홍길동, 7412**-1******

 

 



Posted by codedragon codedragon

댓글을 달아 주세요