겉바속촉
[ARX] ARX 실습4 - Risk Analysis 본문
2021.11.10 - [IT 일기 (상반기)/가명처리] - [ARX] ARX 실습1 - 성별 마스킹
2021.11.10 - [IT 일기 (상반기)/가명처리] - [ARX] ARX 실습2 - 나이 Interval, 주소 변환
2021.11.10 - [IT 일기 (상반기)/가명처리] - [ARX] ARX 실습3 - Anonymize
지난번에 이어서 Risk Analysis에 대해 알아보겠습니다:)
ARX에서는 재식별 가능성에 대한 분석을 3가지 모형으로 수행합니다.
1) Prosecutor Model
특정 개인이 이 Dataset에 포함되어 있음을 알고 있다는 가정하에 그 개인을 찾을 수 있는 가능성을 분석하는 것
2) Journalist model
다른 데이터 베이스와 결합하여 개인 식별 가능성을 분석하는 것
3) marketer model
개인을 식별하는 것에는 관심이 없고, 집단의 부분집합 전체가 식별되는 가능성을 분석하는 것
Latanya Sweeney는 성별, 생년월일, 우편번호를 가지고 전체 미국민의 87%의 개인을 식별할 수 있기 때문에
비식별화를 했다고 해도 이를 재식별할 수 있는 가능성이 “0”이 된다는 것이 아님을 이해해야 합니다.
<Re-Identification Risk>
Prosecutor, Journalist, Marketer Model에 대한 Records at risk, Highest risk, Success rate 값이 출력되는 곳입니다.
변환 전의 자료로 Risk가 100%라면 변환 후의 결과로 리스크가 낮아졌음을 알 수 있습니다.
- Records at risk : Proportion of records with risk above the threshold
- 위험기록 : 위험도가 기준치 이상인 기록물의 비율
- highest risk: Highest risk of a single record
- 최고 위험: 단일 레코드의 가장 높은 위험
- Success rate: Proportion of records that can be re-identified on average
- 성공률 : 평균 재식별 가능한 기록의 비율
'IT 일기 (상반기) > 가명처리' 카테고리의 다른 글
[ARX] ARX 실습 - Example 파일 활용(연봉) (0) | 2021.11.10 |
---|---|
[ARX] ARX 실습 - Example 파일 활용(성별, 나이, 지역) (0) | 2021.11.10 |
[ARX] ARX 실습3 - Anonymize (0) | 2021.11.10 |
[ARX] ARX 실습2 - 나이 Interval, 주소 변환 (0) | 2021.11.10 |
[ARX] ARX 실습1 - 성별 마스킹 (0) | 2021.11.10 |