티스토리 뷰

t-분포
현업에서는 Z를 쓰지 못한다. 왜냐하면 모수치를 구할 수 없기 때문이다.

이를 대체하는 것이 바로 t분포이다. t분포는 표본수치로 구할 수 있다.

 

t = (X - X(바)) / s 

출처 : http://jupiter.hallym.ac.kr/ftpdata/data/distribution.pdf

샘플링 개수(N)가 많을 수록 t는 Z에 근사한다. 특히 N > 30 인 경우에는 t는 Z와 결과가 거의 같다.

 

t-검증 활용법

1. 집단간 설계(between, independent) 

- 조건을 나누고 각 조건에 데이터를 배치하여 조건간 차이를 구하는 방법의 실험설계

- 각 조건의 결과가 서로의 결과에 영향을 미치지 못함

2. 집단내 설계(within, repeated, related)

- 조건을 나누지 않고 모든 샘플이 동일한 환경에 반복 노출되는 방법의 실험설계

- 조건을 나누지 않고 모든 샘플에 적용되기 때문에 앞의 결과가 뒤의 결과에 영향을 받음

 

t-검증 계산 분석

1. 정규성(정상성)

모집단이 정상분포 형태인지를 확인하는 것이다. 분포의 모양을 보고 모집단이 정상이었는지, 정상분포였는지 확인한다.

만약 정규분포가 아니라면 비모수 검정을 사용한다. ( 모수검정과 비모수검정은 다음 포스팅에서 다룰 예정 )

2. 독립성 

조건을 2개로 나눴을 때 서로가 서로의 결과에 영향을 미치는지 확인한다.

3. 등분산성

두 조건별 데이터 분산이 서로 같은지 확인한다.

댓글