Research/Research methodology

[디자인 연구 방법론 - t-test와 One-way ANOVA] 평균 비교

익명132 2020. 10. 2. 18:09

parametric statistics 중 t-test와 One-way ANOVA에 대해서 알아본다.

엄청 잘 요약되어있는 그림을 찾아서 가져왔다.

출처: https://www.iuj.ac.jp/faculty/kucc625/method/anova.html

 

t-test

null hypothesis에서 t-distribution을 따르는 통계 가설 검정이다.
두 그룹의 평균값에 차이가 있는지 확인한다. sample은 정규성, 등분산성, 독립성을 만족해야 한다.
평가자가 반복되는지에 따라서 세 가지로 구분된다.

$t = \frac{\text{obtained difference}} {\text{difference by random error}}$

'불확실도에 따른 차이'라고 이해할 수 있다.
여기서 불확실도에 standard error를 대입해볼 수 있다. 

 S.E(Standard Error): 평균값이 가변하리라 예상되는 범위, 표본 평균의 standard deviation

$\sqrt{Var(X)}$

그러다보니 두 평균 간의 차이가 클 수록 t 값이 커지지만, 표본의 크기가 클수록 역시 t 값이 커진다.

 

1. One sample t-test

관찰된 평균이 예상 값과 차이가 있는지를 검증한다.

difference = $\mu - M$
standard error = $ \sqrt{Var(\bar{X})}$ = $\frac{s}{\sqrt{n}}$
d.f. = $N-1$

 

2. paired-samples t-test

같은 항목에 대해서 짝 지어진 데이터가 존재하는 경우에 얻어진 두 관찰치의 평균을 비교한다.

standard error = $ \sqrt{Var(\bar{X})}$ 
d.f. = $N-1$

 

3. independent samples t-test

2개의 독립된 그룹에서 나온 평균을 비교한다. 표본의 크기가 다를 수 있다.

difference = $M_{1}-M_{2}$
standard error = $ \sqrt{Var(\bar{X}-\bar{Y})}$ 
d.f. = $N_{1}-1 + N_{2}-1$


 

ANOVA (Analysis of Variance)

그룹이 2개 이상인 경우 ANOVA를 이용할 수 있다. 보통 두 그룹인 경우 t-test를 사용하고, 세 그룹부터 이용한다.
F distribution을 통해 여러 집단간의 평균치 차이를 알아낸다.
t-test와 마찬가지로 sample은 정규성, 등분산성, 독립성을 만족해야 한다.

출처: http://commres.net/wiki/anova

 

f-value = between group variance / within-group variance

집단의 특성에 따른 차이(between group difference)와 하나의 그룹 내에서 구성원 간의 무작위적인 차이(within group difference)의 비율이 작다면, independent variable의 조작에 의해 생기는 효과가 유의미하지 못하다는 것이다.

실험 설계에 따라 다른 종류의 ANOVA를 사용한다.

  • dependent variable 갯수: ANOVA, MANOVA
  • independent variable 갯수: One-way, Two-way
  • 비교 집단: between-group, within-group, mixed

 

 

MANOVA

동시다발적으로 한 가지의 원인에 의해서 움직인다.

One-way

1개의 continuous dependent variable 과 1개의 categorical independent variable을 사용한다.
여기서 independent variable이 두 개이상의 level을 가지고 비교된다.

Two-way

1개의 continuous dependent variable과 2개의 categorical independent variable을 사용한다.


post-hoc test

실제적 변화량이 어디서 발생하였는지 분석한다. 디자인학에서는 Scheffe, Duncan을 많이 사용한다. 비교하는 군집의 갯수가 동일 시에는 Tukey로 사용된다.

 

 

 


참고자료
이주일, SPSS를 활용한 심리연구 분석
en.wikipedia.org/wiki/Analysis_of_variance
commres.net/wiki/anova