회귀분석
정의: 회귀분석은(regression analysis)은 변수들 중 하나를 종속변수로 나머지 변수(하나=단
순회귀분석 혹은 여러 개=다중회귀분석)를 독립변수로 하여 이들 변수들이 서로 상관관계를
가질 때 독립변수가 변화함에 따라서 종속변수가 어떻게 변화하는가를 규명하는 통계방법임.
[예, 광고비, 점포수, 판매원 수, 전년도 매출액 등 (독립변수 들)을 가지고 올해의 매출액(종
속변수)을 예측하고자 할 때 다중회귀분석이 사용될 수 있음.]
Yi = α + βXi + ei Yi: 종속변수 Xi: 독립변수 ei: 오류(오차) α:상수항(절편) β:기울기
독립변수와 종속변수에 관한 자료를 이용해서 모수(α와 β)를 추정하는 것이 회귀분석임.
(관측치-평균)자승합 = (추정치-평균)자승합 + (관측치-추정치) 자승합
SST(Sum of Square Total)= SSR(Sum of Square Regression)+SSE(Sum of Square Error)
<연구사례>
어떤 인터넷 쇼핑몰업체가 인터넷 쇼핑몰이용자들의 이용(X)이 쇼핑몰에 대한 태도(Y)에 유의
적인 영향을 미치는지를 알아보고자 할 때 회귀분석을 사용할 수 있다. (독립변수가 1개일 경
우 R값은 단순 적률상관계수 r과 같으며 설명력은 R 임) 입력자료 Regre1.sav를 활용할 것.
연구가설(Ha): 소비자들의 인터넷 월 이용회수는 인터넷쇼핑몰업체에 대한 태도에 유의적인
영향을 미칠 것이다.
선형회귀분석의 종속변수에 쇼핑태도, 독립변수에 이용회수, 방법에 입력을 친(옮긴) 후;
통계량(S)버튼을 선택하고 회귀계수의 추정값, 신뢰구간 선택, 모형적합, 기술통계에 체크(V)
후 계속버튼; 표준예측치(ZPRED) 선택 후 Y박스로 옮김, 표준잔차(ZRESD)를 선택 후 X박스
로 옮김. 히스토그램, 정규확률도표, 편회귀잔차도표출력에 체크(V), 계속버튼, 저장상자에서도
계속, 옵션버튼 후 진입에 .05 제거에 .10 넣고 방정식에 상수항 포함에 체크(V), 목록별 결측
제외가 기본설정 됨, 계속버튼, 확인버튼
<다중회귀분석>
독립변수 2개 이상을 가지고 종속변수를 예측할 때 사용되며 원리는 단순회귀분석과 같음.
독립변수의 투입방법
1. 입력방법(enter method): 모든 변수를 회귀방정식에 동시에 투입하는 방법
2. 단계선택방법(stepwise method): 설명력이 가장 높은 순서로 독립변수를 투입하는 방법
<연구사례>
어떤 연구자는 최고경영자(CEO)의 수출의지(종속변수)를 예측하기 위해 독립변수들인 종업원
수, 수익률, 기업운영경험, 생산제품 수를 활용할 경우의 연구방법. 어떤 변수가 예측에 상대
적으로 중요한지, 그리고 예측설명력 등을 알아볼 필요가 있음. Regre2.sav 활용할 것.
<분석(A) -> 회귀분석(R)-> 선형(L)> 종속변수에 수출의지, 독립변수에 위의 4개 옮김, 방법엔 입력선
택, 통계량버튼, 추정값, 신뢰구간, 모형적합, R제곱변화, 기술통계, 공선성진단 체크, 계속, 확인 버튼
수출의지 = -1.654 + 0.425사업년수 + 0.036종업원수 +
0.305수익률 + 0.004제품수