표본조사
표본조
1. 표본 조사란?
첫째
, 연구대상이 되는 모집단(population)을 정함
둘째
, 모집단을 구성하고 있는 각 사람 중에서 일부를 뽑기
위한 표집틀
(sampling frame)을 만듦
셋째
, 표집틀에 기초하여 표본추출(sampling)을 하게 됨
이러한 과정을 거쳐 만들어진 집단을 표본
(sample)
이라 함
연구자는 표본에서 얻게 되는 자료를 바탕으로 다양한
통계 결과를 만들어 내고
, 이러한 결과를 바탕으로
모집단이 가지고 있을 것이라 추정하는 모수치
(parameter)를 예측함
결과적으로 표본의 통계치가 모집단의 값일거라는
일반화를 하게 됨
1.표본 조사란?
1) 표본조사의 주요 개념
①
모집단과 모수
모집단은 연구자가 관심을 갖는 연구대상이 되는
집단이며
, 모수는 모집단의 특성이 수치로 표현된 것을
의미
예
) 대전지역의 고등학생의 학교폭력실태를 조사한다면
대전지역의 고등학생은 모집단이 되고
, 대전지역의
실제적인 학교폭력 수준은 모수가 됨
모집단은 표본조사를 통한 연구결과를 일반화시킬 수
있는 범위가 되므로 명확하고 구체적으로 규정해야 함
1.표본 조사란?
1) 표본조사의 주요 개념
②
요소
(element)
요소는 모집단을 구성하는 개별단위로 개인
, 가족,
집단 조직 등이 될 수 있음
. 즉, 요소들의 총집합을
모집단이란 함
자료수집
, 분석되는 단위와 요소는 일치하는 경우가
많음
예를 들어 대전 지역고등학생은 요소이면서 자료의
수집 및 분석단위가 됨
1.표본 조사란?
1) 표본조사의 주요 개념
③
표집틀
표본을 추출하기 위한 모집단의 목록으로 모집단의
요소를 모두 포함하여야 함
예를 들어
, 대전 지역 고등학생의 학교폭력을
조사할 경우 대전 지역고등학생의 명단이 표집틀이
됨
지역주민의 욕구를 전화조사로 파악할 경우에는
전화번호부가 표집틀이 됨
1.표본 조사란?
1) 표본조사의 주요 개념
④
표집단위
(sample unit)
표집을 할 때 적용되는 단위로서 대개 분석 단위 혹은
요소와 일치하지만 반드시 일치하지 않을 수 있음
예를 들어 대전 지역 고등학생을 대상으로
학교폭력을 조사할 때 학생은 연구의 분석단위이며
,
요소가 되는 동시에 표집단위가 됨
, 그러나 대전
지역에 위치한 고등학교 중 일부를 표본추출한 후 그
학교에서 학생을 조사하였다면
, 최초의 표본추출
단위는 학교가 되며 두 번째 표집단위는 학생이 됨
1.표본 조사란?
1) 표본조사의 주요 개념
⑤
표집간격
모집단으로부터 표본을 추출할 때 추출되는 간격을
의미함
예를 들면
, 모집단 100명 중에서 10명을 표본으로
선정한다면 표집간격은
10이 됨
1.표본 조사란?
1) 표본조사의 주요 개념
⑥
표집오차
모수와 통계치의 차이를 말하면
, 표본의 통계치로
모수를 추정할 때 발생하는 오차
표집오차를 줄이기 위한 방법은
첫째
, 표본의 수를 늘리는 것: 표본의 수가 증가할 수록
일부 표본으로 인해 발생하는 오차는 줄어들게 되며
,
표집오차가 작을 수록 표본은 모집단의 특성을 정확하게
반영하게 됨
. 단, 표본 크기의 증가는 비용의 증가를
의미하므로 적정 표본 수를 결정하는 것이 중요함
둘째
, 확률표집을 하는 것임
1.표본 조사란?
1) 표본조사의 주요 개념
⑦
비표집오차
비표집오차는 조사과정에서 발생하는 오차
예를 들어 조사자가 누군지에 따라
, 응답자의 개인적인
특성에 따라
, 조사자의 주변환경에 따라, 측정 도구에
따라 수집된 자료를 편집하고 부호화
(coding)하는 과정
중에서 발생하는 오차를 말함
전수 조사와 표본 조사 모두에서 발생하지만 모집단 규모가
큰 전수 조사가 상대적으로 발생할 여지가 높음
비표집오차를 줄이기 위해서는 조사방법에 대한 충분한
검토 및 사전조사와 질문 조사원에 대한 충분한 훈련을
실시할 필요가 있음
2) 표본조사의 장점과 한계
•
신속성
(관련 현상에 대한 변화가 일어나기
전에 조사를 마침
)
•
경제성
(전수조사에 비해 소표본)
•
비표집오차를 줄여 정확도를 높임
•
조사의 실현가능성이 높음
(전수조사
불가능한 경우에 활용 할 수 있음
)
장
점
•
대표성 있는 표본을 선정하기 쉽지 않음
•
복잡하고 치밀한 표본설계를 필요로 하는
경우 오히려 시간과 비용이 더 많이 소요될 수
있음
한
계
2) 표본조사의 장점과 한계
이러한 문제점은 모집단을 대표할 수 있는
표본추출방법을 활용하거나 표본의 크기를 어느 정도만
확보한다면 극복할 수 있고 오차를 최소화 할 수 있음
모집
단
규정
표본
틀
확보
표집
방법
선정
표본
크기
결정
표집
실시
2. 표집 과정
2. 표집 과정
1) 모집단 규정
연구결과를 일반화하고자 하는 모집단을 명확하고
구체적으로 규정하여야 함
모집단의 정의가 분명하지 않으면 조사에 편견의 결과를
유도할 수 있게 됨
예를 들어 학교폭력을 조사함에 있어 전체 고등학교
학생을 모집단으로 할 것인지 특성화 고등학교를
모집단으로 할 것인지 정해야 함
2. 표집 과정
2) 표본틀 확보
모집단 내에 포함된 조사대상자의 명단이 수록된 목록을
확보해야 함
좋은 표본틀은 모집단이 구성요소를 모두 포함한 정확한
정보를 가지고 있어야 하며 그 정보나 자료는 가장 최근의
것이어야 함
2. 표집 과정
3) 표집방법 선정
표본추출방법을 결정해야 함
표본추출방법은 크게 확률표집과 비확률표집으로 구분되며
연구목적과 조사도구
, 표본단위의 특성과 모집단의 대표성 확보
등을 고려해서 선정함
4) 표본크기 결정
표본의 크기는 모집단의 크기와 특성
, 연구목적, 동질성
여부에 좌우됨
모집단의 크기가 작으면 전수조사를 하는 것이 좋을 것이며
,
모집단이 동질성이 강한 요소들로 구성되어 있다면 이질성이
강한 모집단에 비해 적은 표본으로도 모집단의 대표성을 유지할
수 있게 됨
2. 표집 과정
5) 표집 실시
표본을 체계적으로 선정하는 작업을 실시
조사원을 선발하여 교육시키고
, 선별된 표본을 대상으로
자료를 수집함
3. 표집 방법
표본추출
확률표집
단순무작위표집
체계적표집
층화표집
집락
(군집)표집
비확률표집
편의표집
의도적 표집
눈덩이표집
할당표집
3. 표집방법
표본을 추출하는 방법은 크게 확률표집과 비확률표집이
있음
①
확률표집
모집단에서 표본을 선정할 때에 미리 각 요소가 뽑힐
확률을 지정하고 표본을 구하는 것
.
좀 더 복잡하고 표본을 구하는데 오랜 시간이 걸리며
비용이 많이 듦
, 하지만, 각 요소가 선택될 확률을
계산할 수 있기 때문에 표집오차의 추정이 가능하며 보다
신뢰할만한 모집단 추론이 이루어 질 수 있음
3. 표집방법
②
비확률표집
표본으로 뽑힐 확률을 모르거나 요소들 중 표집될 확률이
0이 되는 경우가 발생하는 표집방법
표본을 추출하는데 빠르고 쉽고 비용이 적게 드는
방법이지만 추출 과정의 주관성으로 인해 모집단을
대표하지 못할 수 있고
, 얻어진 추정 값 들에 대해
일반화된 통계적 결론을 내리기 어려운 점이 있음
3. 표집방법
표집방식은 양적연구자와 질적연구자에 따라 상이함
①
양적 연구자
•
대표성 있는 표본을 통해 모집단에 대한 정확한 일반화를 이끌어
내기 위해 표본추출을 가장 중요한 과제로 여김
. 그래서
확률이론에 근거한 여러가지 표집 유형을 활용하여 표본을 추출함
②
질적 연구자
•
표본의 대표성이나 확률표집에는 덜 민감함
•
어떠한 사건
, 사례, 행동 등에 대한 깊이 있고 명확한 이해를
제공할 수 있는 표본을 선택하는데 주의를 기울임
따라서 대부분의 양적연구자는 확률표집을 사용하고
질적연구자는 비확률표집을 선택하는 경향이 있음
3. 표집 방법
1)
확률표집
: 조사자가 대체로 모집단의 규모와 구성원 특성에
대해 알고 있으며
, 모집단의 각 요소가 표본으로 선정될
확률이 동일함
(동일 확률의 선택방법)
①
단순무작위표집
확률표집 가운데 가장 기본적인 유형으로 모집단의 각 요소가
표본으로 뽑힐 확률이 동일하다는 원칙이 적용됨
예로
, 조사대상자 모두에게 번호표를 부여한 후 하나씩
번호표를 뽑는 방법
, 난수표 사용하여 원하는 표본의 수만큼
해당되는 번호를 추출하는 방법
3. 표집 방법
1) 확률표집
①
단순무작위표집
장점
? 손쉽게 표집 할 수 있다는 것
단점
? 모집단이 큰 경우 적용하기 힘듦. 단순 무작위표집을
시행하기 위한 가장 기본적인 조건이 모집단의 각 요소에
일련번호를 부여할 수 있어야 하는데
, 모집단의 규모가 클
경우
, 일련번호를 모두 부여하는 것이 불가능하게 됨
②
체계적 표집
일정한 순서에 따라 표본을 추출하는 방법
조사모집단의 크기가 클 때 주로 사용함
조 사 모 집 단 의 크 기 가 크 면 표 본 에 일 련 번 호 를
부여하거나 난수표를 이용하여 표본을 선정하는
단순무작위표집은 비효율적인 방법이 됨
전체 모집단에서 매
n번째 사례를 표본으로 선정하는
것임
예 를 들 어 만 약
400 명 의 표 본 틀 에 서 100 명 의
표본을 선정할 때 매
4번째 요소가 선택되는 것이며
여기에서
4는 표본추출 간격이 된다(4=400/100)
②
체계적 표집
체계적 표집은 규칙적인 간격에 의해 표본을 선정하므로
표본틀의 목록 순서가 일정한 패턴을 갖고 있으면 문제가
발생함
, 즉, 일정한 주기성이 없어야 함
예 를 들 어 아 파 트 세 대 의 표 본 을 선 정 할 경 우
표본추출간격으로 인해 일부 특정층의 세대만이 뽑힐 위험이
있음
연구자는 표집틀에 주기성이 나타나는지 살펴야 함
③
층화표집
모집단을 우선 층화
(소집단)로 나누고, 각 층화에서
무작위표집을 하는 방법
일반적으로 층화를 구분하는 기준은 성별
, 지역 등,
모집단의 특성에 따라 나누는 것으로 조사하고자 하는 목적에
따라 다르게 적용됨
모집단의 층화는 비례적 혹은 비비례적 방법으로 수행됨
비례층화는 각 하위집단에서 동일한 비율로 표본단위를
추출하는 것
(예를 들면, 모집단 500명에서 표본 100명을
뽑는데
, 남녀의 성비가 4:6이다. 남자 200명중 40명을,
여자
300명중 60명을 무작위로 표집하는 것임)
③
층화표집
비비례층화는 층화된 하위집단마다 차등비율로 표본단위를
추출하는 것
(예를 들면, 위 사례와 같은 경우 남녀의 성비가
9:1이면 남자 450명중 90명, 여자 50명중 10명이
포함되어
10명으로 여자 학생의 생각을 일반화하기에 문제가
생김
. 이러한 경우 남녀의 성비와 관계없이 소규모
하위집단은 더 높은 비율로 표본을 선정함
. 예를 들어
여자는
50명중에 20명을, 남자는 450명중에 80명을
무작위로 추출함
)
④
집락
(군집)표집
표집단위를 개인이 아닌 집락
, 즉, 자연집단을 단위로 하는
표본추출방법
이상적인 집락표본이 되기 위해서는 집락간에 동질성이
있어야 하고 집락 내에서는 이질적인 형태가 되어야 함
일반적으로 집락표집은 다단계집락표집 방법을 많이 활용함
예를 들면
, 행정구를 주로 활용하는데, 서울시민의
복지욕구를 조사할 경우
, 25개구 중 5개구를 무작위로
선정하고
5개 구에서 3개 동을 무작위로 선정하여 표본을
구하는 것
(큰 단위를 더 많이 뽑을수록 표본의 대표성이
증대됨
)
④
집락
(군집)표집
집락표집은 광범위한 모집단을 대상으로 효율적인 조사를
가능하게 하여 시간과 비용을 줄일 수 있는 장점이 있지만
집락 간에 동질성이 확보되지 않으면 표집오차 발생 가능성이
커진다는 단점이 있음
.
예를 들어 모집단이 일반계
, 실업계, 특목고, 대안학교
등의 이질적 특성을 가진 학교 중에 무작위로 표본을
구한다면 표본의 대표성을 확보하기 어렵게 되어 표본 추출
오차를 증가시킴
. 따라서 이러한 경우는 모집단을
특정지역의 일반계 고등학교로 한정 지어 모집단 내 집락간의
동질성을 확보해야 함
3.표집방법
2) 비확률표집
모집단에 대해 잘 모르고 있어 확률표집이 불가능하거나
현실적으로 확률표집을 활용하기 어려운 경우에 사용
표본추출과정에 동일확률의 선택방법을 사용하지 않아
확률이론을 적용한 표준오차가 계산될 수 없으므로
, 모수
추정에 따른 오차 범위를 확인할 수 없어 표본이 모집단을 어느
정도 정확하게 대변하는지에 대한 정보가 부재
장점
? 저렴하고 신속하여 쉽게 수행할 수 있음
단점
? 모집단에 대한 대표성을 갖지 못함으로 연구의
일반화에 자유롭지 못함
2) 비확률표집
①
편의표집
연구자가 간편하게 획득할 수 있는 표본 단위를 추출하여
표본을 만드는 방법
예를 들면
, 연구자가 길거리에서 쉽게 만날 수 있는 200
명을 선택하여 지역의 주민을 대표하는 표본으로 만드는 방법
가설검증을 위한 엄격한 연구에서는 사용할 수 없음
②
의도적표집
조사자가 조사 의도에 맞는 대상을 표본추출하는 것으로서 그
대상은 조사 목적을 가장 잘 반영하는 사람들이 됨
예를 들면
, 학생운동을 하는 학생의 이념적 성향을 조사하기
위해 운동권 학생을 조사할 경우
, 학교에서 쉽게 접촉할 수
있는 운동권 학생들을 대상으로 일정 규모에 이를 때 까지
표본으로 선정하는 경우
, 표본으로 선정된 학생들이 전체
운동권 학생을 대표한다고 볼 수 없음
이런 유형의 표본은 특정 관심사안을 의도적으로 선택해서
깊이 접근해 들어가는 사례연구와 같은 질적연구방법 등에
유용하게 사용됨
③
할당표집
조사자가 임의로 만든 할당표본을 이용하여 표본을 선정함
모집단의 여러 속성을 참고하여 표본 수를 할당하고 각
할당된 범위 내에서 표본을 선정함
예를 들면
, 복지관 이용자 100명의 표본을 할당표집할 경
우
, 이용자 남녀 비율을 고려하여(예6:4)비례적으로
표본수를 할당하면
(60명: 40명)이 할당표집됨.
층화표집과 유사해 보이지만 실제 표본을 선정하는데
무작위추출방법을 사용하지 않는 다는 점이 다름
④
눈덩이 표집
최초의 표본에서 시작하여 조사 대상자를 점진적으로 확대해
나가는 방법
조사자는 최초의 표본에서 얻은 정보를 바탕으로 다음
표본으로 연결 범위를 확대해 나감
모집단에 대한 사전 정보가 거의 없어 탐색적으로 조사할 때
주로 사용함
예를 들면
, 에이즈 환자에 대해 조사를 하는 경우, 한
환자에서 다른 환자에 대한 정보를 얻어
, 점차 표본을
확대해 나감
4. 표본의 크기
확률표집에 의한 양적 연구는 꽤 많은 표본을 필요로 하지만
,
질적연구는 모집단에 대한 풍부한 정보를 제공할 수 있는 적은
표본으로도 연구가 가능함
표본의 크기에 대한 명확한 답은 없음
. 표본크기는 모집단
요소간의 동질성
, 조사목적과 조사방법, 시간 및 비용의
제약
, 자료분석 상의 제약 등에 따라 달라질 수 있음.
4. 표본의 크기
연구자가 표본크기를 결정할 때 고려할 사항
①
연구에서 요구되는 정확도의 수준을 어느 수준에서 정할 것인가
?
결과의 정확성을 높이기 위해서 표본은 크게 하는 것이 좋음
. 하지만
단순히 표본의 수가 증가한다고 표본의 대표성이 증가하는 것이 아님
(
확률표집이 아니거나
, 빈약한 표집틀에서 추출된 표본은 표본수가 아무리
많아도 대표성이 약할 수 있음
)
표본의 크기에서 발생하는 오차의 차이를 고려한다면 표본을 무한정 크게
하는 것이 바람직하지 않음
(예를 들어, 표본크기를 50명에서 100명으로
증가시키면
, 오차는 7.1%에서 2.1%로 크게 줄지만, 표본크기를 1,000
명에서
2,000명으로 증가시키면 오차는 1.6%에서 1.1%로 소폭 감소함)
따라서 표본이 크면 표집오차가 줄어드는 것은 사실이지만 무조건적으로
표본을 크게 하는 것이 효율적이라고 말하기 어렵고
, 오히려 많은 표본
조사로 인한 조사인력 및 시간의 낭비를 가져 올 수 있어 비효율을 초래할 수
있으며
, 많은 표집으로 인한 비표집오차가 증가하는 문제를 발생시킬 수
있음
4. 표본의 크기
연구자가 표본크기를 결정할 때 고려할 사항
②
모집단 내의 다양성이 얼마나 존재하는가
?
모집단 내의 이질적인 부분이 많은 경우는 표본이 커야 함
적은 집단을 선정하여 모집단 내의 이질적인 집단을 표본으로
반영하지 못한다면 모집단을 정확히 설명하지 못함
예를 들어
A지역 초등학교 전교생을 대상으로 학교폭력을 연구할
경우 다문화 가정 학생의 분포를 고려하지 않는 표본추출은 그들을
표본에서 제외시킬 수 있음으로 모집단 내의 이질적인 집단이
반영될 수 충분한 표본수가 확보되어야 함
일반적으로 이질적인 모집단보다 동질적인 모집단에서
표본오차를 줄일 수 있고
, 상대적으로 적은 표본으로도 모집단
추론이 가능함
4. 표본의 크기
연구자가 표본크기를 결정할 때 고려할 사항
③
조사에서 함께 분석될 변수들의 수는 어느 정도인가
?
조사가설에서 많은 변수는 표본크기를 정하는데 영향을 미침
표본크기는 변수 당 사례의 수를 곱하여 결정하는 경우가 많음
.
예를 들어
, 10개의 변수를 고려한 연구를 수행하면, 각 변수당
10개의 사례를 요구하기 때문에 100개의 표본을 선정하게 됨
변수를 다양한 범주로 세분화하여 분석하려면 세부항목을 설명할
수 있을 만큼의 충분한 표본 수를 확보하는 것이 중요함
조사를 하다 보면
, 문항에 응답을 하지 않아 결측치가 발생하거나
응답의 일관성이 없어 질문지를 버려야 하는 경우도 발생한다
.
따라서 표본 수는 약간의 여유를 두고 정하는 것이 바람직함
표본은 모집단의 규모가 클수록
, 변수의 종류와
범주의 수가 다양할수록
, 모집단의 이질성이
클수록 표본의 크기는 증가되어야 함