Anda di halaman 1dari 69

SESI 2

Sampling methods
Organizing Presentation
and summarizing data
Population and sampling
distribution,
PARAMETER

POPULASI
SAMPEL

STATISTIK

ESTIMASI
Apabila kita melakukan pengukuran terhadap sampel dan hasil
pengukurannya terdapat penyimpangan atau berbeda dengan
nilai populasi disebut Sampling Bias
( kekhilafan pengukuran terhadap sampel )

Bias

Nilai Nilai
Populasi Sampel
Agar kesimpulan statistik yang diperoleh dari sampel
tidak berbeda dari keadaan sebenarnya pada populasi (
Unbiased Estimate) maka diusahakan agar karakteristik
populasi sama persis dengan karakteristik sampel
yang dipilih . representatip sample
Contoh :
Bila populasi sasaran ( mahasiswa ) terdiri 40 % pria dan 60 % putri
seyogyanya sampel juga memiliki proporsi yang sama dengan
populasi
Upaya memperkecil sampling bias :

1. Memperbesar sampel ..BESAR SAMPEL

2. Subjek anggota populasi diberi peluang yang sama


untuk menjadi subjek sampel.TEHNIK SAMPLING
Bagaimana cara memilih
sampel ..Sampling
methods ?
SAMPLING METHODS

NON RANDOM
RANDOM SAMPLING
SAMPLING

Simple Random Sampling


Accidental Sampling
Systematic Random Sampling
Purposive Sampling
Stratified Random Sampling
Kuota Sampling
Cluster Random Sampling
Snow Ball sampling
Multistage Random Sampling*
Simple Random Sampling
o Tentukan batasan populasi yang akan diukur
dimensi/variabelnya
o Tetapkan target populasi dan populasi akses
o Susun Sampling Frame ( daftar subjek
/anggota populasi )
o Hitung jumlah populasi ( N )
o Tetapkan jumlah sample yang diperlukan (n)
o Pilih sampel
Simple Random Sampling
Kelebihan :
- Peluang setiap anggota populasi untuk menjadi
sampel sama besar
- Lebih objektip, Representatip
Kelemahan :
- Sering kesulitan untuk mendapatkan sampling
frame
-Bila jumlah sample banyak, pemilihan angka acak
memerlukan waktu lama.
-Kemungkinan untuk terpilihnya sampel sedikit
pada wilayah yang jauh ( lokasi subjek ), sehingga
tidak efektip dan efisien
Systematic Random
Sampling
Tentukan batasan populasi yang ingin diukur
dimensi/variabelnya
Tetapkan populasi
Susun sampling frame, hitung jumlah populasi ( N )
Tetapkan jumlah sampel yang diperlukan ( n )
Hitung angka intervalnya = k = N/n
Pilih satu angka 1 s/d k dari tabel random, undian atau
komputer
Setelah menemukan angka pertama ( X1 ) maka X2 = X1+k,
X3 = X2 + k dst sampai terkumpul n subjek
Systematic Random
Sampling
Kelebihan :
Lebih cepat dari simple random karena hanya
butuh menetapkan 1 angka untuk undian.

Kelemahan :
Tergantung dari susunan sampling frame
Kadang tidak efektip dan efisien karena lokasi subjek
Stratified Random Sampling
Apabila pada populasi terdapat distribusi karakteristik dan
kita menginginkan masing masing karakteristik terwakili
sebagai sampel.
Misal : karakteristik ekonomi pada populasi ada 3 strata
yaitu rendah ( 40 % ), menengah ( 30 % ), tinggi ( 30 %
Tetapkan populasi dan dimensi / variabelnya
Susun sampling frame sesuai stratanya ( N1, N2,N3 )
Tentukan jumlah sampel n
Pilih sampel secara proporsional
n1= proporsi N1 x n , n2= proporsi N2 x n ..dst
n = n1 + n2 + .nx.
Stratified Random Sampling
Kelebihan :
- masing strata dapat terwakili sebagai sampel

Kelemahan :
- Sering tidak jelas batas antar strata
- Sampling Frame sulit disusun
- Lokasi subjek
Cluster Random Sampling
Tetapkan populasi , dimensi / variabelnya
Tetapkan wilayah populasinya
Bagi wilayah populasi menjadi cluster ( kelompok wilayah )
Susun sampling frame dari cluster
Pilih cluster cluster yang terpilih sebagi sampel
Susun sampling frame populasi dari masing masing cluster
terpilih
Tetapkan jumlah sampel n subjek dari masing masing cluster
terpilih sesuai karakteristik populasi
Susun sampling frame Sampel n2
Sampel n3

Susun
Sampling 1 2 4
3
frame
8 7 6 5

Susun sampling frame

Sampel n1

* Wilayah populasi dibagi 8 cluster


Cluster random sampling
Kelebihan :
-Efektifitas dan efisiensi
- sangat representatip

Kelemahan :
- Pada wilayah populasi yang besar sulit
membagi cluster
Multistage Random
Sampling
Menggabungkan dua atau lebih metoda pemilihan sampel
Umumnya gabungan metoda cluster dan simple random

Lakukan tahap metoda cluster


Susun sampling frame subjek pada cluster terpilih
Pilih subjek dari Cluster terpilih secara simple random
sampai sejumlah n yang ditetapkan
KOTA MALANG

STAGE -1 KEC KEC KEC

STAGE -2 KEL-1 KEL-2

STAGE-3 RW-1 RW-2 RW-1 RW-2


Simple random n1 n2 n3
Non Random sampling
KUOTA SAMPLING :
PEMILIHAN SUBJEK SAMPEL SAMPAI JUMLAH YANG
DISEPAKATI ATAU JUMLAH SAMPEL SAMPAI WAKTU
TERTENTU
MISAL : SAMPAI 80 SAMPEL SAJA atau
MULAI 1 SEPT 2001 s/d 10 SEPT 2001

PURPOSIVE SAMPLING :
PENGAMBILAN SUBJEK SAMPEL DENGAN MAKSUD
atau PERTIMBANGAN KARAKTERISTIK TERTENTU
ACCIDENTAL SAMPLING :
PENGAMBILAN SAMPEL TANPA PANDUAN TERTENTU
DAN SESUAI DENGAN KEMAUAN PENELITI DENGAN
PERTIMBANGAN KEMUDAHAN MENDAPATKAN
JUMLAH SAMPEL.

SNOW BALL SAMPLING :


PENGAMBILAN SAMPEL MERUPAKAN NETWORK
ATAU JARINGAN DAN BIASANYA INFORMASI SAMPEL
BERIKUTNYA DIPEROLEH DARI SAMPEL SEBELUMNYA
Penyajian data
( presentasi data )
Data Presentation
A. Table :
* Frequency distribution
* Relative frequency

B. Graph :
* Bar Chart ( Bar Diagram )
* Histogram
* Polygon
* Pie Chart ( Pie Diagram )
* Pictogram
* Line Diagram
* Scatter diagram
* Map diagram
STRUKTUR DASAR TABEL
Nomor tabel dan judul tabel

Judul jumlah
Judul kolom
Baris
SEL

Badan Tabel

Footnote dan Sumber data


BENTUK TABEL
1. TABEL INDUK ( MASTER TABEL )
2. TABEL FREKWENSI DISTRIBUSI
3. TABEL SILANG
4. TABEL 2X2
5. TABEL KONTAGENSI
Graph ( gambar )
BAR
HISTOGRAM
POLIGON
PIE
LINE ( GARIS )
SCATTER
PICTOGRAM
MAP
Bar diagram

Paritas penderita Ca Cervix


10

2
Count

0
1 2 3 4 5 6 7 8

GRAVIDA

Graph, 1 . Paritas penderita Ca Cervix di RSCM


minggu I bulan Januari 2003
MULTIPLE BAR DIAGRAM

TYPHOID

DIARE

ACCIDENT

2000 2001 2002


PICTOGRAM

2002



2001


2000
TRAUMA
ALKOHOLIK
HISTOGRAM
8

Std. Dev = 5.88


Mean = 43.0
0 N = 28.00
32.5 35.0 37.5 40.0 42.5 45.0 47.5 50.0 52.5

UMUR
GRAPH-2 . UMUR PENDERITA Ca Cervix
DI RSSA MINGGU I JANUARI 2002
PIE DIAGRAM
LINE DIAGRAM
SCATTER DIAGRAM
10

4
PARITAS

0
30 40 50 60

UMUR
MAP DIAGRAM

DIARE
TBC

MALARIA
MERINGKAS
DATA NUMERIK
Numerical Summary
Measures

A. Measures of central tendency


* Mean
* Median
* Mode

B. Measures of Dispersion
* Range
* Interquartile Range
* Variance and Standard Deviation
* Coefficient of Variation
Central tendency
ARITHMATIC MEAN ( MEAN, RERATA )
Ungroup data :
Data pengukuran Tinggi Badan 10 orang Mahasiswa PSIK 2002

160 156 162 165 158 145 150 160 160 167
xi
X = ( 160 + 156 + 162 ..+ 167 ) / 10 = 158.3
X=
n
Group data :
Berat badan 32 balita umur 4 bulan :

5 4 4 4 6 5 5 7 5 5 5 5 5 5 5 5
5 5 5 5 5 5 5 5 3 3 5 6 6 5 5 5

Class Interval = ( 7 3 ) / 3 = 1.33

Kelas interval x f %
X = 1/n ( fx )
3 - 4 3.5 5 15.62
5 - 6 5.5 26 81.25 x = mid class
7 - 8 7.5 1 3.13
32 100.0

X = ( 3.5 x 5 ) + ( 5.5 x 26 ) + ( 7.5 x 1 ) ] / 32 = 168/32 =5.25


Mean tak digunakan pada data
katagorikal ( nominal ) dan ordinal
*Dapat untuk data descret maupun kontinyu
Contoh :
7 orang mahasiswa UMM : 5 orang laki laki dan 2 orang wanita

Laki-laki diberi skore : 1 , wanita : 2

X = ( 5x1 ) + (2 x 2 ) / 7 = 11/7 = 1.7 tak punya arti


Median
160 156 162 165 158 145 150 160 160 167

Peurutan
145 150 156 158 160 160 160 162 165 167

Md = Nilai urutan ke ( n + 1 ) / 2 Urutan ke (10 + 1 )/2 = 5.5


antara ke 5 dan ke 6

( 160 + 160 ) / 2 = 160


Median lebih sesuai untuk data skala ordinal
Dapat untuk data descret maupun kontinyu
Mode ( Modus )

145 150 156 158 160 160 160 162 165 167

Mo = 160
* Modus dapat digunakan untuk semua tipe data
Sifat Curve Distribusi

Unimodal
Bimodal

Skewed to right Skewed to left


Frekwensi distribusi yang mempunyai Mean = Md = Mo
Curve distribusinya Simetris.

Dua frekwensi distribusi yang mempunyai nilai Mean , Md dan Mo


Yang sama apakah curve distribusinya sama ?

n1 = 50 n2 = 50

Mean =Md=Mo Mean = Md = Mo


60 60

Sample A Sample B
* Tergantung ukuran dispersinya.
Measures of Dispersion
Range : The difference between its largest ( maximum )
and smallest ( minimum ) values.

145 150 156 158 160 160 160 162 165 167

Range = 167 145 = 22


Interquartile Range

Posisi Q1= ( n+1 ) / 4


Posisi Q3 = [3(n+1)] / 4
Posisi Q2 = Md

25 % 25 %

25 % 25 %
Q1 Q2 Q3

Interquartile Range = Q3 Q1 Dispersi Median.


Contoh :
Suatu outbreak Hepatitis A, 6 orang menunjukkan gejala klinis
24 sampai 31 hari setelah terpapar.dengan sebaran data sbb :

24 25 29 29 30 31
Mean = ( 24 + 25 + + 31 ) /6 = 108 / 6 = 28 hari
Posisi Md = ( n+1 ) /2 = (6+1 ) / 2 = 3.5 ( posisi ke 3 dan 4 )
Md = ( 29 + 29 ) /2 = 29 hari
Sebaran data :
Posisi Q1 = (n + 1 )/4 = 7/4 = 1.75.Q1 = 24 + (25-24)=24.75
Posisi Q3 = ( 3 Q1 ) / 4 = 21/4 = 5.25 Q3= 30 + (31-30)=30.25
Interquartile rage = 30.25 24.75 = 5.5 hari
Inkubasi periode hepatitis A = 29 5.5 hari
Varian ( s 2 ) dan Standar Deviasi ( sd , s )
* Variabilitas terhadap Mean.

24 25 29 29 30 31
A B C D E F X = 28

A B C,D
E F Rata rata Kuadrat
penyebaran setiap nilai
pengamatan terhadap
Mean nya = Varian
24 25 X 29 30 31
28
s2 = ( x x )2 / n-1 sd = varian

24 25 29 29 30 31 X = 28

(24-28)2+(25-28)2+..(31-28)2
s2 = = 8 sd = 8 = 2.83
( 6-1 )

Bila tanpa mengetahui Mean :

s2 = n xi 2 (x1)2 / n(n-1)
Standard Error of the Mean

n1 x1
POPULASI
X
x2
n2

x3
n3

xi
dst

Variabilitas dari Mean disebut Standar Error ( SE )

SE = s / n
Normal distribusi dan
Sampling distribusi
DISTRIBUSI
TEORETIK
Distribusi frekwensi empirik

Distribusi
Nilai
sampel Pengamatan

POPULASI
Nilai
pengamatan
Contoh : nilai pengamatan Berat Badan 30 mahasiswa
Distribusi probabilitas
(Distribusi Teoritik )
Distrribusi yang mendasarkan pada
teori peluang disebut pula distribusi
probabilitas
Distribusi probabilitas data Deskrit
seperti distribusi binomial, distribusi
poisson dsb
Distribusi probabilitas dengan data
kontinyu adalah distribusi normal.
Distribusi teoritik
Antara lain :
Distribusi Normal
Distribusi Sample mean
Distribusi t
Distribusi F
Distribusi Binomial
Distribusi Chi - Square
DATA YG MEMILIKI
DISTRIBUSI MENDEKATI
DISTRIBUSI NORMAL
Sebagian besar data yg berasal dari
hasil pengukuran variabel
kuantitatif;
Sampling distribution of any
quantitative data with n 30;
Sampling distribution of data from
dummy variables (yes or no, 0 or 1,
etc) in which pxn 5.00.
Examples n = 20, p = 0.25 (25% perokok)
Ciri distribusi normal
Disusun dari variabel random kontunyu
Memiliki satu puncak
Kurva simetris.
Nilai mean , median dan modus terletak
pada satu titik
Event bersifat independent.
Ekor kurva mendekati absis pada
penyimpangan kekiri dan ke kanan sebesar
3 SD dari mean, dan ekor grafik dapat
dikembangkan terus tanpa menyentuh absis
AREA DISTRIBUSI NORMAL

0.500 0.500
0.6813
0.025 0.9500 0.025

-1.96 -1 +1 +1.96

Bellshape, Simetry
Total Area under the curve = 1.00 (Probability)
Area of or cover 0.500 part of total area
Area of 1.00 cover 0.6813 part of total area
Area of 1.96 cover 0.9500 part of total area
or 0.05 part of the area are { 1.96 } +
{ 1.96 }
MENGHITUNG LUAS AREA
DIBAWAH KURVA NORMAL
Lihat tabel 6.1 hal 70 Kuzma
z .00 .01 .02 .03 .04 .05 .06 .07
.08 .09
1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .
3577 .3599 .3621
etc
1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .
4756 .4812 .4817
etc
2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .
4949 .4963 .4964
.3413

A = 0.500 - .3413 = 0.1587

Z=0.0 1.0
Distribusi Normal standard
Standarisasi penting karena variabel
random mempunyai satuan yang berbeda
beda misal : cm , kg , hari
Proses standarisasi dapat digunakan
transformasi dengan rumus :

X = nilai var random


x- = rata rata populasi
= standard deviasi
Z= Z =besarnya penyimpangan
rata rata yang dinyatakan
dalamunit SD
Contoh penggunaan
Areas under the Normal
curve
We assume that the systolic blood pressure of large group
Of adult men are approximately normally distributed,
That the mean systolic BP is 120 mmHg, and standard
deviation is 10 mmHg. If one adult men is randomly selected
What is the probabilty that his systolic BP will be less than
140 mmHg

X-
Z = -------

= 120 mmHg
= 10 mmHg
Probabilitas < 140 mm Hg ?

120 140

Z = ( 140 120 ) / 10 = 2.0 Lihat Tabel Z


= 0,0228
BP < 140 = 1 0,0228 = 0,9772 ( 97.72 % )
Berapa peluang untuk mendapatkan BP
antara 100 dan 130 mm Hg ?

0.0228 0,1587

100 130

Z = -2.0 Z = 1.0

Tabel : 0,0228 0.1587

BP antara 100 dan 130 = 1 ( 0.0228 + 0.1587 ) = 0,8185 ( 81,85 % )


CONTOH PEMAKAIAN
Hasil tes UMPTN, terdapat 3500 peserta. Skor
nilai mengikuti distribusi normal; x = 780; s = 45;
Ketentuan lulus UMPTN hanya apabila Skor 825.
Berapa % perkiraan yang lulus UMPTN ?
Z = [(skor x)/sd] = [(825-780)/45] = 1.00.
Dari tabel normal, untuk Z=1 probabiitanya = 0.5
- .3413 = 0,1587 atau 16%

Nilai skor UAS si Abbas pd mata kuliah IKM3 = 76, dengan


Z-score = 1.07. Berapa % jumlah mhs dikelasnya yang
nilainya diatas nilai si ABBAS ?
Tabel-Z : z=1.07 ~ .3577
Jml mhs dg nilai > z 1.07 = 0.5000 - .3577 = 0.1423 (14.23%)
HIMPUNAN NILAI x SAMPEL
(distribusi sampel )

POPULASI n1 x1
X
x2
n2

x3
n3

xi
dst

Gambar grafik
Ciri-ciri distribusi
himpunan nilai x ini
normal dapat
mempunyai gambar
diterapkan utk
spt distribusi normal
menduga X dan x
Distribusi rata rata sampel
Sampel dapat diambil dari populasi
berdistribusi normal atau dari populasi
yang tidak berdistribusi normal
Populasi distribusi Normal :
Kesalahan baku (SE) lebih kecil dari simpangan
baku (sd ) populasi
Makin besar sampel makin kecil kesalahan baku
Populasi distribusi tidak normal :
penambahan sampel distribusinya akan
mendekati distribusi normal
Dalil limit pusat ( Central Limit
Theorem )
1. Rata rata dari rata rata sample sama
dengan rata rata populasi dan tidak
bergantung pada besarnya sampel
dan bentuk distribusi populasi
2. Dengan penambahan jumlah sampel
maka distribusi rata rata sampel akan
mendekati distribusi normal dan tidak
bergantung pada bentuk distribusi
populasinya
Distribusi proporsi sampel
Ketentuan sama dengan distribusi
rata rata sampel
Rata rata proporsi = np
Standard deviasi = pq / n
Distribusi Binomial
Ciri ciri ;
Bila jumlah n tetap dan p kecil maka
distribusi yang dihasilkan akan menceng
kanan dan bila p makin besar maka
kemiringan akan berkurang dan bila p =
0.5 maka distribusi akan simetris dan bila
p > 0.5 maka distribusi yang dihasilkan
menceng kiri
Bila p tetap dengan jumlah n yang makin
besar maka akan dihasilkan distribusi
yang mendekati distribusi simetris
Syarat distribusi Binomial
1. Tiap peristiwa mempunyai 2 hasil
2. Probabilitas dari setiap peristiwa
harus selalu tetap
3. Event yang dihasilkan bersifat
independen

X = np
sd = npq
Kemungkinan yang terjadi adalah :
1. Kelahiran pertama laki, kelahiran kedua laki
2. Kelahiran pertama laki, kelahiran kedua wanita
3. Kelahiran pertama wanita, kelahiran kedua laki
4. Kelahiran pertama wanita, kelahiran kedua wanita

Kelahiran -1 Kelahiran -2 Jml kel wanita Probabilitas


Laki wanita 0 0.25
Laki wanita 1 0.25
Wanita laki 1 0,25
Wanita wanita 2 0.25

fw flk Probabilitas
0 2 0.25 Distribusi
1 1 0.50 Teoretis
2 0 0.25