겉바속촉

[가명처리] R 사용해보기 (feat.카이제곱검정) 본문

IT 일기 (상반기)/가명처리

[가명처리] R 사용해보기 (feat.카이제곱검정)

겉바속촉 2021. 6. 22. 14:45
728x90
반응형

 

 

 

RSTUDIO 열기

 

 

 

제가 가진 파일의 경로는 다음과 같습니다

 

 

 

setwd 로 파일 경로 설정해주기

 

CrossTable은 R의 기본 명령어가 아니기 때문에 패키지를 따로 설치해주어야합니다:)

install.packages("gmodels")

 

R은 전체 코드가 실행되는 것이 아니라

한 줄 한 줄씩 실행이 됩니다:)

 

그래서 커서를 첫줄에 놓고 한 줄씩 실행시켜주어야해요

 

 

그럼 다음과 같이 테이블이 나오게됩니다.

 

 

 

하나씩 해석을 해보면

첫줄과 둘째줄을 비교해서 각각의 workclass군이 50 이하일지 50 초과일지 예상이 가능합니다.

 

그럼 예상값이 같은 것끼리 묶어서 통계를 내야지

그냥 다 묶어서 통계를 도출하는 경우 p값이 커집니다.

하지만 지금은 같은 것끼리 통계가 나와서 p값이 0이 되는 것입니다.

 

 

 

 

 

테이블의 3번째 줄의 합 = Chi^2 인데요

 

 

Chi-square 제곱

 

: 카이제곱 통계량은 데이터 분포와 가정된 분포 사이의 차이를 나타내는 측정값입니다.

 

 

 

 

 

위에서 실습했던 테이블의 카이제곱 통계량은 1610.752값이네요??

 

 

 

 

 

728x90
반응형