겉바속촉

[ARX] ARX 실습4 - Risk Analysis 본문

IT 일기 (상반기)/가명처리

[ARX] ARX 실습4 - Risk Analysis

겉바속촉 2021. 11. 10. 15:17
728x90
반응형

 

2021.11.10 - [IT 일기 (상반기)/가명처리] - [ARX] ARX 실습1 - 성별 마스킹

 

[ARX] ARX 실습1 - 성별 마스킹

ARX 소개 1. ARX 비식별화 프로세스 Configure Explore Analyze Raw Data를 Import하여 데이터 변환 모형과 프라이버시 모형을 설정하는 단계 설정된 모형을 만족하는 모든 가능한 변환을 도식화하여 보여주는

2-juhyun-2.tistory.com

 

2021.11.10 - [IT 일기 (상반기)/가명처리] - [ARX] ARX 실습2 - 나이 Interval, 주소 변환

 

[ARX] ARX 실습2 - 나이 Interval, 주소 변환

지난번 포스팅 참고해서 실습 계속 해보겠습니다. 2021.11.10 - [IT 일기 (상반기)/가명처리] - [ARX] ARX 실습1 - 성별 마스킹 [ARX] ARX 실습1 - 성별 마스킹 ARX 소개 1. ARX 비식별화 프로세스 Configure Expl..

2-juhyun-2.tistory.com

 

2021.11.10 - [IT 일기 (상반기)/가명처리] - [ARX] ARX 실습3 - Anonymize

 

[ARX] ARX 실습3 - Anonymize

지난번 포스팅 참고해서 실습 계속 해보겠습니다. 2021.11.10 - [IT 일기 (상반기)/가명처리] - [ARX] ARX 실습1 - 성별 마스킹 [ARX] ARX 실습1 - 성별 마스킹 ARX 소개 1. ARX 비식별화 프로세스 Configure Expl..

2-juhyun-2.tistory.com

 

 

지난번에 이어서 Risk Analysis에 대해 알아보겠습니다:)

 

ARX에서는 재식별 가능성에 대한 분석을 3가지 모형으로 수행합니다.

1) Prosecutor Model

특정 개인이 이 Dataset에 포함되어 있음을 알고 있다는 가정하에 그 개인을 찾을 수 있는 가능성을 분석하는 것

 

2) Journalist model

다른 데이터 베이스와 결합하여 개인 식별 가능성을 분석하는 것

 

3) marketer model

개인을 식별하는 것에는 관심이 없고, 집단의 부분집합 전체가 식별되는 가능성을 분석하는 것

Latanya Sweeney는 성별, 생년월일, 우편번호를 가지고 전체 미국민의 87%의 개인을 식별할 수 있기 때문에

비식별화를 했다고 해도 이를 재식별할 수 있는 가능성이 “0”이 된다는 것이 아님을 이해해야 합니다.

 

 

 

<Re-Identification Risk>

 

Prosecutor, Journalist, Marketer Model에 대한 Records at risk, Highest risk, Success rate 값이 출력되는 곳입니다.

변환 전의 자료로 Risk가 100%라면 변환 후의 결과로 리스크가 낮아졌음을 알 수 있습니다.

 

- Records at risk : Proportion of records with risk above the threshold

- 위험기록 : 위험도가 기준치 이상인 기록물의 비율

 

- highest risk: Highest risk of a single record

- 최고 위험: 단일 레코드의 가장 높은 위험

 

- Success rate: Proportion of records that can be re-identified on average

- 성공률 : 평균 재식별 가능한 기록의 비율




728x90
반응형