분산분석(Analysis of Variance: ANOVA)
정의: 두 집단 혹은 그 이상 간 어떤 검정변수(종속변수)에 대한 평균의 차이가 통계적으로 유
의한가를 검정하는 통계기법.
1) 일원배치 분산분석: 검정변수(종속변수, 결과변수: 비례 혹은 등간척도임)가 하나이며, 독립
변수(집단변수, 실험변수)도 하나임.(단, 집단변수는 2개 이상의 집단이 있음)
2) 이원배치 분산분석: 검정변수가 하나임은 일원배치ANOVA와 같으나 독립변수가 2개이며,
독립변수와 종속변수간의 상호작용효과를 검정할 수 있다.
예) 대학교 1~4학년의 학습만족도에 차이가 있는지? (일원배치 ANOVA)
성과 만화영화의 유형에 따라 폭력성지수에 차이가 있는지? (이원배치 ANOVA)
<집단이 두 개 혹은 그 이상일 경우 t검정 대신 왜 분산분석을 하는가?>
* t검정은 두 집단만 비교할 수 있으므로 3개 이상의 경우 여러 번 해야 한다.
* 집단이 많을 경우 제 1형 오류(Ho가 사실인데 기각)가 게재될 경우가 증가한다.
* 독립변수가 2개 이상일 경우 t검정은 상호작용효과를 알 수 없으나 ANOVA는 알 수 있다.
<분산분석의 주요인 효과와 상호작용효과의 개략적인 판별법>
성(M: 남성 F:여성)
만화영화유형(V:폭력성
NV:비폭력) - 숫자는 폭력지수
<성, 만화유형효과 모두 없음>
<만화유형의 효과만 있음> <성의 효과만 있음>
-------------------------
-------------------
-----------------
V
NV
평균
V
NV
평균
V
NV
평균
M
10
10
10
10
0
5
10
10
10
F
10
10
10
10
0
5
0
0
0
------------------
------------------
------------------
평균
10
10
=10
10
0
=5
5
5
=5
<성, 만화유형의 합동효과>
<성, 만화유형의 상호작용효과>
-------------------------
-------------------
V
NV
평균
V
NV
평균
M
20
10
15
35
10
22.5
F
10
0
5
10
0
5
------------------
------------------
평균
15
5
=10
22.5
5
=13.75
* 위의 합동효과(각 셀 당 F에서 M으로 똑같이 10씩 증가, NV에서 V로 똑같이 10씩 증가)가
나타나는 3가지 이유.
a) 성의 효과 때문
b) 만화유형의 효과 때문
c) 성과 만화유형이 연합한 효과 때문