CODEDRAGON ㆍSecurity/InformationSecurity
데이터 비식별화 기법
대표적인 비식별화 기법으로는 다음과 같은 것들이 있습니다.
· 가명처리(pseudonymisation)
· 총계처리(aggregation)
· 데이터 값 제거(data reduction)
· 범주화(data suppression)
· 데이터 마스킹(data masking)
가명처리(pseudonymisation)
· 식별 가능한 변수값을 다른 값으로 대체합니다.
· 세부기법으로 휴리스틱 가명화, 암호화, 교환방법등을 사용합니다.
비식별화 전 | 데이터 비식별화 |
나실명, 38세, 수원 거주 | 홍길동, 38세, 수원 거주 |
홍길동, 27세, 서울 거주, 한국대 재학 | 홍길동, 27세, 서울 거주, A대 재학 |
총계처리(aggregation)
· 개인정보 보호를 위해 데이터를 총합하거나 평균을 사용합니다.
· 세부기법으로 총계처리, 라운딩, 부분총계, 재배열 방법등을 사용합니다.
비식별화 전 | 데이터 비식별화 |
A 직원 연봉 4,500만 B 직원 연봉 5,200만 C 직원 연봉 4,600만 |
평균 연봉 4,766만 |
A 학생 키 182cm B 학생 키 174cm C 학생 키 160cm |
3학년 학생 키 합 516cm 3학년 학생 키 평균 172cm 182+174+160=516 (182+174+160)/3=172 |
데이터 값 제거(data reduction)
· 개인 식별이 유의한 변수값을 제거합니다.
· 세부기법으로 식별자 삭제, 레코드 삭제, 식별자 부분 삭제, 식별 요소 전부 삭제등의 방법을 사용합니다.
비식별화 전 | 데이터 비식별화 |
나실명, 38세, 수원 거주 | 38세 남, 수원 거주 |
홍길동, 741225-1586034 | 홍길동, 70년 생 남자 |
범주화(data suppression)
· 데이터값을 범주화하여 명확한 값을 큰 범주의 값으로 대체합니다.
· 세부기법으로 감추기, 범위화, 랜덤 라운딩, 제어 라운딩등을 사용합니다.
비식별화 전 | 데이터 비식별화 |
나실명, 38세, 수원 거주 | 나실명, 30대, 경기도 거주 |
나실명, 38세 | 나실명, 30~40대 |
데이터 마스킹(data masking)
· 개인 식별에 유의한 변수값을 보이지 않도록 처리합니다.
· 세부기법으로 임의잡음 추가, 공백과 대체, 기호와 대체등의 방법을 사용합니다.
비식별화 전 | 데이터 비식별화 |
나실명, 38세, 수원 거주 | 나**, 38세, 수원 거주 |
나실명, 38세, 한국대 재학 | 나OO, 38세, OO대 재학 |
홍길동, 741225-1586034 | 홍길동, 7412**-1****** |
'Security > InformationSecurity' 카테고리의 다른 글
개인정보보호를 위한 기술적 조치 (0) | 2019.05.18 |
---|---|
데이터 비식별화(de-identification) (0) | 2019.05.08 |
데이터 비식별화 목적 (0) | 2019.04.25 |
공인인증서 저장경로 (0) | 2019.04.18 |
PC의 공인인증서 삭제 (0) | 2019.04.12 |