목록분류 전체보기 (659)
겉바속촉
머신러닝 인간은 몸의 센서로부터 데이터를 받아들이면서 뇌는 그 데이터를 시각, 소리, 냄새, 맛, 모양으로 변환하여 반응 이것을 컴퓨터에서 구현해보는 시도가 바로 기계학습 기계학습 : 데이터를 지식으로 변환하고 이를 통해 의사결정을 하는 과학적 과정을 컴퓨터로 구현하는 과정 기계학습의 예 : Spam Filtering, 자동 주차, 숫자/문자 인식, Target Marketing .... 지도학습 : Supervised Learning 기계에서 케이스와 정답을 알려주는 학습을 시행 후 케이스를 제시하면 기계가 정답을 추정 자율학습 : Unsupervised Learning 정답이 없는 케이스들을 통해 학습하고 학습된 결과를 지식화 Prediction : 예)월드컵 우승팀 맞추기, 미래 판매량 맞추기.....
지난번에는 금융정보 가명처리를 해봤습니다. 2021.06.22 - [IT 일기 (상반기)/가명처리] - [가명처리] 금융정보 가명처리 [가명처리] 금융정보 가명처리 금융정보를 가명처리할 때에는 우선 가명처리 수준을 정의해주는 수준 정의표를 작성해야 합니다. 저는 다음과 같이 작성해주었어요. 이제 R로 돌아와서~ 해당 파일에 header가 있는 지 확인해줍 2-juhyun-2.tistory.com 이번에는 의료정보 가명처리를 해보도록 할게요~ 우선 제가 가지고 있는 테이블은 다음과 같습니다. **여기서 주의할 점** 누군가에게 데이터를 넘길 때에는 반드시 검토 보고서를 작성해야합니다. 그리고 누구에게 넘겼는지 보고 라인을 통해 근거를 다 남기는 과정이 중요합니다. 즉 데이터 처리를 하는 경우 필요한 보고서..
**R설치** 2021.06.22 - [IT 일기 (상반기)/가명처리] - [가명처리] R설치 [가명처리] R설치 R을 설치해보도록 하겠습니다:) 다음 링크로 가주세요~ https://www.r-project.org/ R: The R Project for Statistical Computing www.r-project.org Download 에 CRAN을 클릭 Korea의 아무거나 클릭 각자의 운.. 2-juhyun-2.tistory.com **RSTUDIO설치** 2021.06.22 - [IT 일기 (상반기)/가명처리] - [가명처리] RStudio 설치 [가명처리] RStudio 설치 RStudio를 설치해보도록 하겠습니다. 다음 링크로 가주세요~ https://www.rstudio.com/produ..
RSTUDIO 열기 제가 가진 파일의 경로는 다음과 같습니다 setwd 로 파일 경로 설정해주기 CrossTable은 R의 기본 명령어가 아니기 때문에 패키지를 따로 설치해주어야합니다:) install.packages("gmodels") R은 전체 코드가 실행되는 것이 아니라 한 줄 한 줄씩 실행이 됩니다:) 그래서 커서를 첫줄에 놓고 한 줄씩 실행시켜주어야해요 그럼 다음과 같이 테이블이 나오게됩니다. 하나씩 해석을 해보면 첫줄과 둘째줄을 비교해서 각각의 workclass군이 50 이하일지 50 초과일지 예상이 가능합니다. 그럼 예상값이 같은 것끼리 묶어서 통계를 내야지 그냥 다 묶어서 통계를 도출하는 경우 p값이 커집니다. 하지만 지금은 같은 것끼리 통계가 나와서 p값이 0이 되는 것입니다. 테이블의 ..
R을 설치해보도록 하겠습니다:) 다음 링크로 가주세요~ https://www.r-project.org/ R: The R Project for Statistical Computing www.r-project.org Download 에 CRAN을 클릭 Korea의 아무거나 클릭 각자의 운영체제에 맞는 것 클릭 install 클릭 Download 클릭 한국어로 선택해주고 다 디폴트값으로 둔채 설치를 합니다
RStudio를 설치해보도록 하겠습니다. 다음 링크로 가주세요~ https://www.rstudio.com/products/rstudio/download/#download Download the RStudio IDE RStudio is a set of integrated tools designed to help you be more productive with R. It includes a console, syntax-highlighting editor that supports direct code execution, and a variety of robust tools for plotting, viewing history, debugging and managing www.rstudio.com DOWNL..
정보손실 비식별 처리는 익명화 수준과 분석에 필요한 정보량이 조화를 이루는 변환 information loss : 증가 Data Quality : 감소 Privacy Level : 증가 엔트로피 비식별화 변환을 수행한 모든 컬럼에 대해 계산하고 각 컬럼의 변화량을 산술평균, 기하평균 등을 사용하여 하나의 값으로 변환하면 그 값이 바로 Information Loss
가명정보/ 가명처리 가명정보 개인정보를 가명처리 원래의 상태로 복원하기 위한 추가 정보의 사용, 결합 없이는 특정 개인을 알아볼 수 없는 정보 가명처리 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법 추가 정보 없이는 특정 개인을 알아볼 수 없도록 처리하는 것 익명정보/ 익명처리 익명정보 다른 정보를 사용해도 더 이상 개인을 알아볼 수 없는 정보 개인정보보호법이 적용되지 않는 정보 익명처리 더 이상 특정 개인인 신용정보주체를 알아볼 수 없도록 처리 무작위화 기술 순열(치환) 잡음 추가 부분 총계 해부화 기술 - 하나의 테이블을 두 개 이상의 테이블로 분할하여 개인의 식별성을 낮추는 기법 - 일반적으로 해부화를 적용할 때 식별성이 있는 컬럼과 분석 대상 컬럼을 분할 재현 데이터 생성 완전..
가명정보/ 가명처리 가명정보 개인정보를 가명처리 원래의 상태로 복원하기 위한 추가 정보의 사용, 결합 없이는 특정 개인을 알아볼 수 없는 정보 가명처리 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법 추가 정보 없이는 특정 개인을 알아볼 수 없도록 처리하는 것 익명정보/ 익명처리 익명정보 다른 정보를 사용해도 더 이상 개인을 알아볼 수 없는 정보 개인정보보호법이 적용되지 않는 정보 익명처리 더 이상 특정 개인인 신용정보주체를 알아볼 수 없도록 처리 총계 처리 - 특정 컬럼을 통계적으로 처리하는 기법 - 데이터 전체 또는 부분을 집계로 처리 - 집계 방법은 일반적으로 평균값, 중앙값, 최대값, 최소값, 최빈값 중 하나로 처리 평균값 : =AVERAGE 중앙값 : = MEDIAN 최대값 :..