목록IT 일기 (상반기)/가명처리 (35)
겉바속촉
데이터 거버넌스에 대해서 알아보도록 하겠습니다. 가명정보를 위한 체계를 위해서는 필요한 개념입니다. 데이터 거버넌스 필요성을 살표보도록하죠. 다음 보시는 survey는 데이터 거버넌스를 어떻게 정의할지에 대한 답변들을 정리한 것입니다. 1위. 조직 전체의 데이터 흐름에 대한 이해 2위. 데이터 중심의 조직을 관리하는 일련의 정책을 구축하는 것 3위. 배포된 데이터에 대한 이해 4위. 데이터 책임자와 데이터 프로세스의 프레임워크를 구축하는 것 데이터 사용이 정의된 규칙을 따르는 지 확인하는 것 순으로 답변했습니다. 답변들을 보며 대략적으로 데이터 거버넌스가 어떤 것인지 감이 오시나요?? 거버넌스 자체의 의미는 "어떠한 체제를 어떠한 사상으로 통제하는 것"을 의미합니다. 추상화에서 구체화시켜가는 것이 바로 ..
이제 개인정보를 알았으니 가명정보와 익명정보에 대해서 살펴봐야 합니다:) ...(* ̄0 ̄)ノ 가명정보 추가정보 없이 개인을 식별할 수 없는 정보 식별의 기준은 개인정보처리자 판단을 기준으로 합니다. 특이 정보 관찰방식 : 3시그마(수치형), 도수분포표(빈도) 이용 범주형 -> 등급, 분류, (빈도) 수치형 -> 범주형을 제외한 나머지, 연속형..., 정규분포표형태 BOXPLOT으로 그려 연속형 특이정보 관찰 1. 3시그마 규칙 : 정규분포형태의 데이터 분포에서 3시그마를 벗어나는 데이터는 특이치로 판단 2. BOXPLOT : 1.5IQR방법 -> Q1에서 하단으로 1.5IQR을 벗어난 값과 익명정보 개인의 시간, 노력을 들여서도 식별 불가한 정보 기밀성 보호모델(KLT보호모델)이용 객관적 증명 절차와 기..
이번에는 개인정보에 대해서 알아보도록 하겠습니다 (๑•̀ㅂ•́)و✧ 1. 개념 인적사항 : 일반정보, 가족정보 신체적 정보 : 신체정보, 의료 및 건강 정보 정신적 정보 : 기호나 성향 정보(잡지 구독정보, 물품구매내역..), 내연의 비밀 정보(사상, 종교, 가치관..) 사회적 정보 : 교육, 병역, 근로, 법정정보 재산적 정보 : 소득, 신용, 부동산 정보 여기서 질문!!!╰(*°▽°*)╯ 네이버에 올라와 있는 부동산 정보들은.... 개인정보일까요~ 아닐까요~~ (⊙_⊙)? 정답은 아닙니다!!!!!! 개인이 그 데이터셋에 있어야지나 개인정보이기 때문에 네이버에 올라온 여러 부동산 정보들은 개인정보라고 할 수 없습니다. 물론 개인의 부동산 정보는 당연히!! 개인정보라고 할 수 있겠죠:) 2. 중요성 사회..
개인정보보호 관련 자료는 다음 링크들에서 참고할 수 있습니다:) 1. 국가법령정보센터 https://www.law.go.kr/ 국가법령정보센터 1 2 3 4 5 6 7 8 9 0 Bksp ㅂ ㅈ ㄷ ㄱ ㅅ ㅛ ㅕ ㅑ ㅐ ㅔ Shift ㅁ ㄴ ㅇ ㄹ ㅎ ㅗ ㅓ ㅏ ㅣ ㅋ ㅌ ㅊ ㅍ ㅠ ㅜ ㅡ 띄어쓰기 검색 www.law.go.kr 2. 개인정보보호위원회 https://www.pipc.go.kr/np/ [개인정보보호위원회] 메인사이트 [개인정보보호위원회] 메인사이트 www.pipc.go.kr 3. 개인정보보호포털 https://www.privacy.go.kr/ 개인정보보호 포털 공지 2021년 상반기 가명정보 활용 동향 온라인 세미나 안내 가명처리 관련 제도·기술 동향 및 가명정보 활용 사례 공유를 위한 온..
[용어정의] 개인정보 성명, 주민등록번호 및 영상 등을 통하여 살아있는 개인을 알아볼 수 있는 정보 다른 정보와 쉽게 결합하여 개인을 알아볼 수 있는 정보 별도로 보관된 추가 정보의 사용, 결합 없이는 특정 개인을 알아볼 수 없는 정보 개인정보 처리자 업무를 목적으로 개인정보파일을 운용하기 위해 스스로 또는 다른 사람을 통하여 개인정보를 처리하는 공공기관, 법인, 단체, 개인 등 정보주체 처리되는 정보에 의해 알아볼 수 있는 그 정보의 주체가 되는 사람 추가정보 개인정보의 정부 또는 일부를 대체하는 데 이용된 수단이나 방식(알고리즘 등), 가명정보와의 비교, 대조 등을 통해 삭제 또는 대체된 개인정보를 복원할 수 있는 정보 가명처리 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로 추..
통계 모수 기법 난수 생성 난수란 정의된 범위 내에서 무자구이로 추출된 수 난수는 누구라도 그 다음에 나올 값을 확신할 수 없어야 함 난수를 만들기 위해 주사위던지기, 숫자공 뽑기 등 방법을 사용 하지만, 불편해서 컴퓨터를 활용해서 난수 생성 게임, 시뮬레이션 등 많은 컴퓨터 분야에서 난수가 사용됨 실행할 때 마다 다른 값이 나와서 난수처럼 보이지만 컴퓨터는 어떻게 다른 값을 만들 수 있을까? as.integer(1 + runif(1, 0, 1) * 5) --> 1부터 5까지의 수 > runif(1,0,1) [1] 0.6314401 > runif(1,0,1) [1] 0.1096426 > runif(1,0,1) [1] 0.3773332 > runif(1,0,1) [1] 0.9704749 > runif(1,..
머신러닝 인간은 몸의 센서로부터 데이터를 받아들이면서 뇌는 그 데이터를 시각, 소리, 냄새, 맛, 모양으로 변환하여 반응 이것을 컴퓨터에서 구현해보는 시도가 바로 기계학습 기계학습 : 데이터를 지식으로 변환하고 이를 통해 의사결정을 하는 과학적 과정을 컴퓨터로 구현하는 과정 기계학습의 예 : Spam Filtering, 자동 주차, 숫자/문자 인식, Target Marketing .... 지도학습 : Supervised Learning 기계에서 케이스와 정답을 알려주는 학습을 시행 후 케이스를 제시하면 기계가 정답을 추정 자율학습 : Unsupervised Learning 정답이 없는 케이스들을 통해 학습하고 학습된 결과를 지식화 Prediction : 예)월드컵 우승팀 맞추기, 미래 판매량 맞추기.....
지난번에는 금융정보 가명처리를 해봤습니다. 2021.06.22 - [IT 일기 (상반기)/가명처리] - [가명처리] 금융정보 가명처리 [가명처리] 금융정보 가명처리 금융정보를 가명처리할 때에는 우선 가명처리 수준을 정의해주는 수준 정의표를 작성해야 합니다. 저는 다음과 같이 작성해주었어요. 이제 R로 돌아와서~ 해당 파일에 header가 있는 지 확인해줍 2-juhyun-2.tistory.com 이번에는 의료정보 가명처리를 해보도록 할게요~ 우선 제가 가지고 있는 테이블은 다음과 같습니다. **여기서 주의할 점** 누군가에게 데이터를 넘길 때에는 반드시 검토 보고서를 작성해야합니다. 그리고 누구에게 넘겼는지 보고 라인을 통해 근거를 다 남기는 과정이 중요합니다. 즉 데이터 처리를 하는 경우 필요한 보고서..
**R설치** 2021.06.22 - [IT 일기 (상반기)/가명처리] - [가명처리] R설치 [가명처리] R설치 R을 설치해보도록 하겠습니다:) 다음 링크로 가주세요~ https://www.r-project.org/ R: The R Project for Statistical Computing www.r-project.org Download 에 CRAN을 클릭 Korea의 아무거나 클릭 각자의 운.. 2-juhyun-2.tistory.com **RSTUDIO설치** 2021.06.22 - [IT 일기 (상반기)/가명처리] - [가명처리] RStudio 설치 [가명처리] RStudio 설치 RStudio를 설치해보도록 하겠습니다. 다음 링크로 가주세요~ https://www.rstudio.com/produ..