상관관계(corelation): 변수간 상호관련성의 정도를 수치로 표현한 것
찰스 다윈(Charles Darwin)의 사촌인 Francis Galton은 특성의 개인차와 유전과의 관계(r)에
관심을 가짐. 즉 부모의 키(stature)와 자녀의 키(신장)의 유전적 관계가 있는지 연구함.
그 후 이것을 Galton의 제자인 Karl Pearson이 체계화시켜 정립시킨 것이 상관관계(r)임.
1. 판매원의 수와 총판매액 사이의 단순 적률상관관계(Pearson product-moment
correlation)를 계산해보고 해석하라. 또 이것을 컴퓨터를 이용하여 구한 것과 비교해보시오.
--------------------------------------------------------------------------
X
Y
(X-
)
(X-
)
2 Y-
(Y-
)
2 Zx
Zy
ZxZy
--------------------------------------------------------------------------
15
135
-5
25
-65
4,225
-1.20
-1.19
1.43
18
165
-2
4
-35
1,225
-0.48
-0.64
0.31
18
180
-2
4
-20
400
-0.48
-0.37
0.18
22
230
2
4
30
900
0.48
0.55
0.26
27
290
7
49
90
8,100
1.69
1.65
2.79
---------------------------------------------------------------------------
∑X=100
∑Y=1,000 ∑(X-
)
2
∑(Y-
)
2
∑ZxZy=4.97
=
∑X/N
=
∑Y/N
=86
=14,850
=100/5=20
=1,000/5=200
X의 분산=
∑(X-
)
2/N= 86/5=17.2 X의 표준편차 =
=4.15
Y의 분산=
∑(Y-
)
2 /N= 14,850/5=2,970 Y의 표준편차 =
=54.5
* 참고 Zx = (X-
)/x표준편차 ; Zy= (Y-
)/y표준편차
r=sum of standardized cross-product/number of observation
r=
∑ZxZy/N=4.97/5=0.994 (판매원의 수와 총판매액 간에는 극히 높은 상관관계가 있다.)
상관관계를 해석할 경우 교재 216쪽을 참고할 것.
2. 위의 두 변인들간의 관계를 Spearman의 순위차상관관계(rank-order correlation)로
계산해보고 해석하라. 또 이것을 컴퓨터를 이용하여 구한것과 비교해보시오.
X
Y
순위값(Xr)
순위값(Yr)
순위차(Xr-Yr)
(Xr-Yr)
2
15
135
1
1
0
0
18
165
2.5
2
0.5
0.25
18
180
2.5
3
-0.5
0.25
22
230
4
4
0
0
27 290
5
5
0
0
---------------------------------------------------------------------------
∑(Xr-Yr)2=0.50
Formula:
Rho= 1- [(6*sum of squared ranking difference)/n(n2-1)]
1-(6x0,50)/5(52-1) = 1-(3.0/120) = 0.97 매우 높다.
1. Kendall의 순위상관계수(rank correlation coefficient, 또는 τ(타우))를 계산하시오.
공식 τ=실제로 얻은 점수의 총합/가능한 최대점수의 총합 = Sum/ [n(n-1)/2]
* 최대 가능한 자연순 = nCr = 6C2 = n(n-1)/2
자료1을 평가자 X의 평가순위를 기준으로 자연 순서가 되도록 정리한다.
(* 평가자 Y의 평가순위를 기준으로 정리해도 그 결과는 같음에 유의할 것)
b
f
d
c
a
e
평가자 X
1
2
3
4
5
6
평가자 Y
2
1
4
3
6
5
--------------------------------------------------------------
이후 자연순(+)
4개
4개
2개
2개
0개
이후 역순(-)
1
0
1
0
1
Sum = 자연순-역순 = (4-1) + (4-0) + (2-1) + (2-0) + (0-1) =9
Kendall의 τ(타우) = Sum/ [n(n-1)/2] = 9 /[6(6-1)/2] =9/15 =3/5 = 0.6
그러므로 평가자 X와 평가자 Y의 평가간의 순위상관은 비교적 높다고 할 수 있다.
2. 지위를 높여보려는 지위추구성향(social status strivings)과의 순위상관관계( τ )를
계산해보고, 또 이 값을 컴퓨터를 이용해서 얻은 값과 비교하시오.
* 원 점수(raw score)가 등간척도나 비례척도로 평가되지 않고 F척도로 잰 점수임.
1번과 같은 맥락으로 권위주의 성격을 기준으로 자연 순서가 되도록 정리한다.
D A H I C B K G F E L J
권위주의 성격 1 2 3 4 5 6 7 8 9 10 11 12
지위추구 성향 1 3 6 7 2 4 5 10 11 8 9 12
----------------------------------------------------------------------
이후 자연순(+) 11개 9 6 5 7 6 5 2 1 2 1
이후 역순(-) 0 1 3 3 0 0 0 2 2 0 0
Sum=자연순-역순=(11-0)+(9-1)+(6-3)=(5-3)+(7-0)+(6-0)+(5-0)+(2-2)+(1-2)+(2-0)+(1-0)=44
Kendall의 τ(타우) = Sum/ [n(n-1)/2] = 44/ [12x11/2] = 44/66 =2/3 = 0.667
그러므로 권위주의 성격과 지위추구성향의 순위상관은 비교적 높다고 할 수 있다.
즉 권위주의 성격의 소유자는 지위추구성향이 있다고 말할 수 있다.
* 컴퓨터에 입력할 때는 원 점수 그대로 입력해서 분석하면 된다.
즉 여기서는 수기계산의 편리성을 위해 순위로 변경했으나 컴퓨터에서는 변경의 수고를
할 필요가 없이 자동으로 계산함에 유의할 것
상관관계의 해석 (교재 216쪽을 참고할 것)
상관계수 r의 범위는 -1≤ r≤ +1 (교재에서 부등호의 방향이 잘못되었으니 주의할 것)
(상관계수는 –1보다 크거나 같고 +1보다 작거나 같다. 즉 절대값 1보다 클 수는 절대 없음)
상관계수 r의 절대값이
1.00이면 완전한 상관관계
0.90이면 매우 높은 상관관계
0.70~0.80이면 높은 상관관계
0.50~0.60이면 보통의 상관관계
0.30~0.40이면 약한 상관관계
0.10~0.20이면 매우 낮은 상관관계
0이면 상관관계가 전혀 없다고 말할 수 있다.
여가서 부호에 따라 +이면 정적인(양의) 상관관계
-이면 부적인(음의) 상관관계에 있다고 하면 됨.
(a) 정의 상관
(b)음의 상관
(c) 무상관
o o
Y
o o
Y o o
Y o o o o
o o
o o
o o o o o
o o
o o
o o o o
o o
o o
o o
X
X
X