겉바속촉
[가명처리] R 사용해보기 (feat.카이제곱검정) 본문
728x90
반응형
RSTUDIO 열기
제가 가진 파일의 경로는 다음과 같습니다
setwd 로 파일 경로 설정해주기
CrossTable은 R의 기본 명령어가 아니기 때문에 패키지를 따로 설치해주어야합니다:)
install.packages("gmodels")
R은 전체 코드가 실행되는 것이 아니라
한 줄 한 줄씩 실행이 됩니다:)
그래서 커서를 첫줄에 놓고 한 줄씩 실행시켜주어야해요
그럼 다음과 같이 테이블이 나오게됩니다.
하나씩 해석을 해보면
첫줄과 둘째줄을 비교해서 각각의 workclass군이 50 이하일지 50 초과일지 예상이 가능합니다.
그럼 예상값이 같은 것끼리 묶어서 통계를 내야지
그냥 다 묶어서 통계를 도출하는 경우 p값이 커집니다.
하지만 지금은 같은 것끼리 통계가 나와서 p값이 0이 되는 것입니다.
테이블의 3번째 줄의 합 = Chi^2 인데요
Chi-square 제곱
: 카이제곱 통계량은 데이터 분포와 가정된 분포 사이의 차이를 나타내는 측정값입니다.
위에서 실습했던 테이블의 카이제곱 통계량은 1610.752값이네요??
728x90
반응형
'IT 일기 (상반기) > 가명처리' 카테고리의 다른 글
[가명처리] 의료정보 가명처리 (0) | 2021.06.22 |
---|---|
[가명처리] 금융정보 가명처리 (0) | 2021.06.22 |
[가명처리] R설치 (0) | 2021.06.22 |
[가명처리] RStudio 설치 (0) | 2021.06.22 |
[익명처리] 정보손실 이해 (0) | 2021.06.22 |