샘플링
샘플링
1. 샘플링(sampling)이란?
- 자료수집의 표본 단위를 추출하는 것
- 표본은 어떤 대상의 전체를 대표하기 위해 그
전체에서 선택된 일부
- 표본을 선택하는 과정을 표본추출 또는
표집이라고 함
- 전체 조사 대상에서 표본을 추출하여 이들을
대상으로 조사를 하는 경우를 표본조사라고 함
2. 표본추출의 장점과 한계
•
신속성
•
경제성
•
표본오차의 확인을 통한 신뢰성 확보
장
점
•
모집단 전체를 조사하는 것이 아니므로
표본추출방법
, 표본 수에 의해 적합성이
결정됨
•
모집단에 대한 대표성을 띠기 위해서는
반드시 확률표본추출이 이루어져야 함
한
계
3.표본오차(sampling error)의 개념
표본을 추출하는 과정에서 나타나는 오류를 수치로
계산한 것
표본이 모집단을 대표하는 정확성은 표본오차에
반비례함
표본오차가 적을수록
, 표본이 모집단을 대표하는
정확성은 커짐
표본오차는 표준오차
(standard error)와 같은
개념으로 쓰임
4.신뢰수준과 신뢰구간
한 표본의 통계치로 모수를 추정하고자 할 때는 오차가 필히 수반됨
.
이를 감안하기 위해 표준오차를 계산해 내고
, 이를 모수 측정시에
포함함
오차의 폭
(margin of error)? 조사 결과의 정확도. 5%
오차란 실제 결과치가
±5% 만큼 변경될 수 있다는 의미. 예를 들어
65%가 매우 만족한다고 응답하면 이것은 실제 모집단에서는 60~70%
가 매우 만족한다고 볼 수 있음
신뢰수준이란
? 표본에서 얻은 결과로 모수를 추정하려고 할 때 어느
정도로 신뢰할 수 있을지를 확률로 나타내는 것
. 예를 들어 신뢰수준
95%에 오차 ±5%라고 한다면, 조사 결과가 모집단 실제값의 5%
이상을 벗어나는 경우가
100번 조사하였을 때 5번 정도 나오는 것을
의미
신뢰구간이란
? 해당 신뢰수준에서 모수가 추정되는 범위를 말하는 것
4.신뢰수준과 신뢰구간
신뢰수준과 신뢰구간은 다음과 같이 규정됨
①
68% 정도의 신뢰수준에서 모수를 추정하자면,
신뢰구간은 표본값
±1×표준오차(SE)의범위로
설정
②
95% 정도의 신뢰수준에서 모수를 추정하자면,
신뢰구간은 표본값
±2×표준오차(SE)의범위로
설정
③
99% 정도의 신뢰수준에서 모수를 추정하자면,
신뢰구간은 표본값
±3×표준오차(SE)의범위로
설정
4.신뢰수준과 신뢰구간
신뢰구간과 신뢰수준이 어떻게 사용되는지 예를
들면 어떤 지역에서 장애인 출현율
(인구 100명당
장애인 수
)을 알기 위해 표본조사를 실시했는데,
표본 평균 통계치가
3.08명, 표준오차가 .75
정도로 계산 됨
68%수준
3.08-1×.75 =
2.33
3.08+1×.75 =
3.83
장애인 출현율이
100명당
2.33에서 3.83명
95%수준
3.08-2×.75 =
1.58
3.08+2×.75 =
4.58
장애인 출현율이
100명당
1.58에서 4.58명
99%수준
3.08-3×.75 =
0.83
3.08+3×.75 =
5.33
장애인 출현율이
100명당
0.83에서 5.33명
4.신뢰수준과 신뢰구간
어느 정도의 신뢰수준이 적절한지는 사안에 따라 차이가 있으나
일반적인 학술연구에서는
95%의 신뢰수준에 오차 ±5%를
표준으로 함
신뢰수준과 신뢰구간의 관계
? 동일한 표본결과를 가지고 모수를
추정할 때
, 신뢰수준과 신뢰구간은 상대적으로 엇갈려 나타남.
즉
,신뢰수순을 높게 잡으면 신뢰구간은 상대적으로 분산되고,
신뢰구간을 집중시키면 신뢰수준을 상대적으로 낮아지게 됨
실천 조사연구에서는 신뢰수준과 신뢰구간에 대한 고려가
병행되어야 함
. 조사가 끝난 다음에는 신뢰구간을 좁힐 수 있는
방법이 없고
, 억지로 좁힐 수는 있지만, 신뢰수준을 많이
떨어뜨려야만 가능함
. 신뢰수준을 손상시키지 않고 신뢰구간을
좁히려면 사전에 표준오차를 줄이는 방법밖에 없음
표준오차는 표본 크기에 민감하게 좌우되고
, 오차율과
표본크기는 반비례함
5.표본크기
표본 크기를 결정할 때 고려해야 할 사항
①
표본의 크기는 클수록 좋음
②
연구의 심도에 따라 표본의 크기가 결정됨
. 연구가
다루고 있는 개념 및 변수들의 수가 많으면
, 그에
따라 표본의 크기도 늘어나야 함
③
표본의 크기는 처음 생각보다 크게 해두는 것이
좋음
. 연구 과정 중에 새로운 통제 변수들이
추가로 투입되어야 할 필요성이 흔히 생겨나기 때문
④
사용하려는 통계분석의 성격을 고려하여 표본의
크기를 결정함
6. 표본추출 방법
표본추출
확률표집
단순무작위표집
체계적표집
층화표집
집락
(군집)표집
비확률표집
편의표집
의도적 표집
눈덩이표집
할당표집
6. 표본추출방법
1) 확률표집: 조사자가 대체로 모집단의 규모와 구성원 특성에 대해 알고
있으며
, 모집단의 각 요소가 표본으로 선정될 확률이 동일함(동일 확률의
선택방법
)
①
단순무작위표집
확률표집 가운데 가장 기본적인 유형으로 모집단의 각 요소가 표본으로
뽑힐 확률이 동일하다는 원칙이 적용됨
예로
, 조사대상자 모두에게 번호표를 부여한 후 하나씩 번호표를 뽑는
방법
, 난수표 사용하여 원하는 표본의 수만큼 해당되는 번호를 추출하는
방법
장점
? 손쉽게 표집 할 수 있다는 것
단점
? 모집단이 큰 경우 적용하기 힘듦. 단순 무작위표집을 시행하기
위한 가장 기본적인 조건이 모집단의 각 요소에 일련번호를 부여할 수
있어야 하는데
, 모집단의 규모가 클 경우, 일련번호를 모두 부여하는
것이 불가능하게 됨
②
체계적 표집
일정한 순서에 따라 표본을 추출하는 방법
전체 모집단에서 무작위표집의 표집틀
-모집단의 구성원
리스트
-에 일련번호를 부여하고, 전체모집단을 원하는
표본 수로 나누어 표집비율을 정함
. 이렇게 결정된
표 집 비 율 에 따 라 모 집 단 에 서 일 정 비 율 로 표 본 을
반복적으로 뽑음
예를 들면
, 모집단이 1만명인 경우 표본을 100명으로
결정하면 표집비율은
1/100이 됨. 최초의 시작점은
난수표 등을 이용하여 무작위로 결정하며
, 매 100번째
숫자를 표본으로 결정
. 만약 시작점이 7로 결정되면
7, 107, 207 순으로 100명이 될 때까지 뽑음
③
층화표집
모집단을 우선 층화
(소집단)으로 나누고, 각 층화에서 무작위표집을
하는 방법
일반적으로 층화를 구분하는 기준은 성별
, 지역 등, 모집단의 특성에
따라 나누는 것으로 조사하고자 하는 목적에 따라 다르게 적용됨
모집단의 층화는 비례적 혹은 비비례적 방법으로 수행됨
비례층화는 각 하위집단에서 동일한 비율로 표본단위를 추출하는 것
(예를 들면, 모집단 300명에서 표본 50명을 뽑는데, 성별분포가
남자가 여자보다
4배 많으면, 남자 240명 여자 60명이 됨으로 남녀
둘다 모집단의
1/6을 적용하여 남자 40명, 여자 10명을 무작위로
추출함
)
비비례층화는 층화된 하위집단마다 차등비율로 표본단위를 추출하는
것
(예를 들면, 위 사례와 같은 경우 남자가 여자보다 9배 많으면
여성이
5명만 포함됨으로 여성의 경우 2/6를 적용하여 10명이
포함되고
, 남자는 270명에서 40명을 무작위로 추출함)
④
집락
(군집)표집
표집단위를 개인이 아닌 집락
, 즉, 자연집단을 단위로 하는
표본추출방법
모집단을 기존의 지리적 구획 혹은 행정적 구분 단위로
나누어진 집락을 기초로 해서 몇 개의 부분 단위로 나누고
,
이러한 구분 단위에서 무작위로 표본을 추출하는 방법
예를 들면
, 행정구를 주로 활용하는데, 표본 지역이
집락으로 선정되고 나면
, 선정된 표본 지역의 가구 명부를
기초로 표본 가구를 선정한 다음 선정된 가구의 가구원을
모두 조사하거나 가구원 중에서 다시 표본을 선정하여 조사
할 수 있음
큰단위를 더 많이 뽑을수록 표본의 대표성이 증대됨
6. 표본추출방법
2) 비확률표집
모집단에 대해 잘 모르고 있어 확률표집이 불가능하거나
현실적으로 확률표집을 활용하기 어려운 경우에 사용
표본추출과정에 동일확률의 선택방법을 사용하지 않아
확률이론을 적용한 표준오차가 계산될 수 없으므로
, 모수
추정에 따른 오차 범위를 확인할 수 없어 표본이 모집단을
어느 정도 정확성하게 대변하는지에 대한 정보가 부재
장점
? 저렴하고 신속하여 쉽게 수행할 수 있음
단점
? 모집단에 대한 대표성을 갖지 못함으로 표본의
과학성을 보장 할 수 없음
2) 비확률표집
①
편의표집
연구자가 간편하게 획득할 수 있는 표본 단위를
추출하여 표본을 만드는 방법
예를 들면
, 연구자가 길거리에서 쉽게 만날 수
있는
200명을 선택하여 지역의 주민을 대표하는
표본으로 만드는 방법
가설검증을 위한 엄격한 연구에서는 사용할 수
없음
②
의도적표집
조사자가 조사 의도에 맞는 대상을 표본추출하는 것으로서
그 대상은 조사 목적을 가장 잘 반영하는 사람들이 됨
예를 들면
, 학생운동을 하는 학생의 이념적 성향을
조사하기 위해 운동권 학생을 조사할 경우
, 학교에서 쉽게
접촉할 수 있는 운동권 학생들을 대상으로 일정 규모에
이를 때 까지 표본으로 선정하는 경우
, 표본으로 선정된
학생들이 전체 운동권 학생을 대표한다고 볼 수 없음
이런 유형의 표본은 특정 관심사안을 의도적으로 선택해서
깊이 접근해 들어가는 사례연구와 같은 질적연구방법 등에
유용하게 사용됨
③
할당표집
조사자가 임의로 만든 할당표본을 이용하여 표본을
선정함
모집단의 여러 속성을 참고하여 표본 수를 할당하고
각 할당된 범위 내에서 표본을 선정함
예를 들면
, 복지관 이용자 100명의 표본을
할당표집할 경우
, 이용자 남녀 비율을 고려하여(예
6:4)비례적으로 표본수를 할당하면(60명: 40명)
이 할당표집됨
.
층화표집과 유사해 보이지만 실제 표본을 선정하는데
무작위추출방법을 사용하지 않는 다는 점이 다름
④
눈덩이 표집
최초의 표본에서 시작하여 조사 대상자를
점진적으로 확대해 나가는 방법
조사자는 최초의 표본에서 얻은 정보를 바탕으로
다음 표본으로 연결 범위를 확대해 나감
모집단에 대한 사전 정보가 거의 없어 탐색적으로
조사할 때 주로 사용함
예를 들면
, 에이즈 환자에 대해 조사를 하는 경우,
한 환자에서 다른 환자에 대한 정보를 얻어
, 점차
표본을 확대해 나감