겉바속촉

[ARX] ARX 실습1 - 성별 마스킹 본문

IT 일기 (상반기)/가명처리

[ARX] ARX 실습1 - 성별 마스킹

겉바속촉 2021. 11. 10. 11:21
728x90
반응형

ARX 소개

 

1. ARX 비식별화 프로세스

 

 

Configure Explore Analyze
Raw Data를 Import하여 데이터 변환 모형과 프라이버시 모형을 설정하는 단계 설정된 모형을 만족하는 모든 가능한 변환을 도식화하여 보여주는 단계 재식별화 가능성 등 위험수준을 분석하여 최종 Export 여부 결정 단계

 

 

2. ARX 실습

 

지난번에 설치는 끝냈습니다:)

 

[ARX] ARX 설치 및 실행해야되는 경우 참고해주세요.

 

[ARX] ARX 설치 및 실행

ARX를 설치해보도록 하겠습니다. ARX는 간단하게 비식별화를 수행하는 오픈소스 프로그램입니다. https://arx.deidentifier.org/downloads/ Downloads | ARX - Data Anonymization Tool Downloads The current ver..

2-juhyun-2.tistory.com

 

 

 

-Configure -

[성별 masking]

 

이제 DATA를 임포트해오도록 하겠습니다.

 

Data는 CSV, Excel, Database 형식으로 Import 할 수 있습니다.

다음과 같이 임포트를 진행해주세요.

 

 

Import하면 Input Data 창에 하단과 같이 Data가 나타납니다.

 

  1. 식별자(Identifier)는 “*” 로 처리

  2. 성별, 나이, 주소 등은 준식별자(Quasi-identifier) 로 처리

  3. 연봉은 Insentive 또는 Sensitive로 지정
    Dataset 안에 Sensitive 변수가 없으면 l 다양성, t 근접성 모형을 사용할 수 없음 주의
    우선, 연봉은 Insensitive로 해보겠습니다.
     
  4. 좌측에서 성별을 선택하고 우측에서 type은 Quasi-identifying, transformation은 generalization을 선택
    generalization은 15세 --> 10대의 형식으로 변환하는 것.


    ***참고사항***
    1. Data Type

    2. Data Transformation


  5. type과 transformation을 선택하였다면
    다음으로는 Transformation Hierarchy를 만들기 위해 아래의 그림과 같이 화살표 방향의 메뉴버튼을 클릭.

    use interval, ordering, masking의 메뉴가 나타남.


    성별의 경우는 문자이므로 interval은 선택할 수 없고 ordering 혹은 masking인데 여기서는 masking을 선택.
    그럼 다음과 같이 되겠네요





728x90
반응형