겉바속촉

[ARX] ARX 실습 - Example 파일 활용(성별, 나이, 지역) 본문

IT 일기 (상반기)/가명처리

[ARX] ARX 실습 - Example 파일 활용(성별, 나이, 지역)

겉바속촉 2021. 11. 10. 16:55
728x90
반응형

 

그동안 공부하고 연습해온 것들로 한 번 해보도록 하겠습니다.

 

input.csv
2.37MB

 

 

 

 

데이터를 우선 가져왔습니다:)

 

다시 가져왔습니다.

 

 

 

그냥 제가 하기 헷갈릴까바 건드릴 필드값의 컬럼명을 한글로 바꿔주었습니다.

그리고 성별, 나이, 지역은 준식별자로 바꿔주었습니다.

 

 

1. 성별 마스킹

 

 

2. 나이 인터벌

 

 

 

그럼 우선 최솟값을 0, 최댓값을 100으로 주겠습니다.

그리고 15보다 작은값과 95보다 큰값들은 일괄적으로 처리해주겠습니다.

 

범위에 속하는 값들은 5단위로 묶어줄게요

 

그리고 레벨을 추가해서 그룹 SIZE를 2배로 준 후에 식별하기 더 어렵도록 했습니다.

 

이번에는 또 추가한 후에 20살 단위의 그룹을 만들어주었습니다.

 

그럼 최종적으로 이렇게 만들어집니다.

 

 

 

3. 지역 그룹화

 

 

 

 

 

순서는 알파벳 순서로 정리되어 있습니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

그리고 저는 C- 지역들을 한 그룹으로 묶어주기 위해 그룹 사이즈를 5로 주었습니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

그리고 그룹을 추가해서 앞자리가 같은 것들끼리 묶어볼게요

 

 

 

 

 

 

 

최종적으로 다음과 같이 구성해주었습니다

 

 

4. 프라이버시 모델 추가해주기

 

K-익명성 : 최소한 같은 값이 몇 개 나오느냐를 기준으로 하는 모델

 

 

 

그리고 ANONYMIZE 클릭한 후에 Explore results 탭으로 이동

 

가장 아랫부분의 (0,1,2)에 마우스를 올려보면 다음과 같이 뜨는 것을 볼 수 있습니다.

 

그럼 가장 최상단인 (6,4,2)에 마우스를 올려보면 3가지 필드 모두 가장 높은 레벨로 비식별처리가 진행된 것을 확인할 수 있습니다. 

 

 

그리고 어떻게 처리되었는지 궁금하다면 마우스 우클릭 후에 Apply trnasformation - 상단에 Analyze utility 탭 클릭

 

 

 

가장 높은 수준의 (6,4,2)를 확인해보니 다음과 같이 모두 마스킹처리되어있네요:)

 

 

 

728x90
반응형