INFERENSIAL
Ns. Riska Amalya Nasution, M.Kep., Sp.Kep.J
Kelompok data yang diolah disebut sampel
Kelompok data yang diwakili disebut populasi
ISTILAH- Prosedur statistika yang dimaksud(untuk menarik
ISTILAH kesimpulan tentang populasi berdasarkan informasi
pada sampel) disebut statistika inferensial
UMUM Pernyataan dugaan sementara (dari kajian teori)
tentang populasi disebut hipotesis Hipotesis
selanjutnya diuji dari informasi yang ada pada sampel
ANALISIS STATISTIK
ANALISIS DESKRIPTIF
1. Cara pengumpulan data
2. Penyederhanaan angka-angka pengamatan
3. Pengukuran pemusatan
4. Penyebaran data
Dengan statistik deskriptif kumpulan data yang diperoleh akan
tersaji dengan ringkas dan rapi serta memberikan informasi inti
dari kumpulan data yang ada.
DEFINISI
Yaitu statistik yang digunakan untuk
menggeneralisasikan data sampel terhadap
populasi
Untuk memberi peluang sejauh mana kebenaran
data sampel terhadap populasi, maka peneliti
menentukan nilai α (tingkat signifikansi).
Statistik inferensial ada dua macam yaitu statistik
parametrik dan non parametrik
STATISTIK
INFERENSIAL
Secara umum mempelajari hubungan beberapa variabel dengan
berbagai skala pengukuran atau pencacahan
Dapat pula merupakan persoalan sederhana hanya menduga
(menaksir) pemusatan populasi (parameter) berdasarkan pemusatan
sampel (statistik)
Hubungan antara variabel nominal dapat ditafsirkan sebagai
perbedaan kelompok. Misalnya mempelajari hubungan jenis kelamin
(laki-perempuan) dengan prestasi belajar statistika ekuivalen dengan
mempelajari perbedaan prestasi belajar statistika antara kelompok
laki-laki dan perempuan.
STATISTIKA INFERENSIAL
Taksiran parameter dapat berupa taksiran titik dan interval
(dengan tingkat keyakinan tertentu berdasarkan sebaran data)
Variabel (objek yang diamati) dibedakan menjadi variabel bebas
(penjelas/ explanatory) dan variabel respon (terikat/response)
Jenis kelamin (penjelas) vs prestasi belajar (respons)
Tingkat pendidikan (penjelas) vs jumlah anak (respons) atau
penghasilan
Wilayah (penjelas) vs persentase buta huruf (respons)
Penghasilan (respon) vs tingkat pendidikan, jenis kelamin
JENIS STATISTIK INFERENSIAL
Statistik parametrik
Ilmu statistik yang digunakan untuk data-data yang memiliki
sebaran normal dan memiliki skala interval atau rasio.
Statistik non parametrik
Statistik nonparametrik disebut juga statistik bebas sebaran.
Statistik nonparametrik dapat digunakan pada data yang
memiliki sebaran normal atau tidak dan memiliki skala
nominal atau ordinal.
Langkah-Langkah Pemilihan
Metode Statistik
1. Apakah distribusi data diketahui?
Jika distribusi data tidak diketahui maka statistik yang sesuai adalah
statistik nonparametrik. Jika distribusi data diketahui, maka kita harus
melihat jenis distribusi data tersebut.
2. Apakah data berdistibusi normal?
Jika data tidak berdistribusi normal, maka statistik yang sesuai adalah
statistik nonparametrik. Jika data berdistribusi normal, maka statistik
yang sesuai adalah statistik parametrik.
3. Apakah sampel ditarik secara random?
Jika sampel tidak ditarik secara random, maka statistik yang sesuai adalah
statistik nonparametrik. Jika sampel ditarik secara random, maka statistik yang
sesuai adalah statistik parametrik.
4. Apakah varians kelompok sama?
Jika varians kelompok tidak sama, maka statistik yang sesuai adalah statistik
nonparametrik. Jika varians kelompok sama, maka statistik yang sesuai adalah
statistik parametrik.
5. Bagaimana jenis skala pengukuran data?
Jika skala pengukuran data nominal dan ordinal, maka statistik yang sesuai
adalah statistik nonparametrik. Jika skala pengukuran data interval dan rasio,
maka statistik yang sesuai adalah statistik parametrik.
STATISTIK PARAMETRIK
e. Mengambil keputusan
Hal ini ditentukan dengan membandingkan nilai statistik
hitung dengan nilai statistik tabel atau nilai kritisnya.
2.Berbagai Metode Parametrik
a. Inferensi terhadap sebuah rata-rata populasi
Tujuan pengujian ini adalah ingin mengetahui apakah sebuah sampel
berasal dari sebuah populasi yang mempunyai rata-rata (mean) yang
sudah diketahui. Atau, bisa juga dikatakan ingin menguji apakah rata-
rata sebuah sampel sudah bisa mewakili populasinya. Pada inferensi ini,
perlu diperhatikan ukuran sampel, apakah termasuk sampel besar
ataukah sampel kecil.
· Sampel Besar
Dalam kasus dimana jumlah sampel yang diambil cukup besar atau
varians populasi diketahui, maka bisa dipakai rumus (uji) z.
· Sampel Kecil
Jika sampel kecil (<30) dan varians populasi tidak diketahui,
metode parametrik yang digunakan adalah uji t (student).
b. Inferensi terhadap dua rata-rata populasi
Dalam inferensi dua populasi, tujuan utama adalah ingin mengetahui apakah ada perbedaan
antara dua rata-rata populasi.
· Sampel Besar
Metode yang digunakan adalah z test yang dimodifikasi.
· Sampel Kecil
Metode yang digunakan adalah:
-> t test yang dimodifikasi : sampel bisa saling berhubungan (dependen) maupun kedua
sampel tidak ada hubungannya (independen).
-> F test
c. Inferensi terhadap lebih dari dua rata-rata populasi
Untuk lebih dari dua populasi, misal tiga jenis sampel, empat jenis sampel dan seterusnya,
dipakai analisis ANOVA, yang terdiri atas:
ANOVA satu faktor
ANOVA dua faktor dengan replacement
ANOVA dua faktor tanpa replacement
d. Inferensi untuk mengetahui apakah ada hubungan antara
variabel
Inferensi ini bertujuan untuk mengetahui apakah ada hubungan
yang signifikan antara dua variabel. Beberapa alat statistik untuk
mengetahui hubungan antar variabel:
Hubungan antar dua variabel, menggunakan korelasi dan
regresi sederhana.
Hubungan antara lebih dari dua variabel (tiga, empat, dan
seterusnya), menggunakan metode korelasi dan regresi
berganda.
JENIS UJI STATISTIK
Bentuk Hipotesis
Mean
Median
Modus
Penggunaan Mean, Median, Modus
Mean (Arithmatic Mean)
X = 55 + 60 + 55 + 65 + 70 + 75
6
= 63,3 th
Mean (lanjutan - 2)
Range
Interkuartil range
Mean deviasi
Varian
SD (standar deviasi)
Koefisien varian (COV)
Range
IQR = Q3 - Q1
2
Mean deviasi
V (S2) = [( x – x ) 2 ]
n–1
x (th) x–x (x–x)2
55 8,3 68,89
55 8,3 68,89
60 3,3 10,89
65 1,7 2,89
70 6,7 44,89
75 11,7 136,89
380 40 333,34
Akar dr varian.
Disebut jg simpangan baku, krn
merupakan patokan luas area di
bawah kurva normal.
x ± 1 s = 68%
x ± 2 s = 95%
x ± 3 s = 99%
Koefisien Deviasi (COV)
COV = (s / x ) x 100%
Ukuran posisi
Median
Kuartil: nilai yg m’bagi
pengamatan mjd 4 bagian
Desil: nilai yg m’bagi pengamatan
mjd 10 bagian
Persentil : nilai yg m’bagi
pengamatan mjd 100 bagian
Ukuran posisi (lanjutan)
A B
Hukum pertambahan
B
A B
b
b
Perluasan
A B
Hukum perkalian
Peristiwa Independen
P(A∩B) = P(A) x P(B)
Contoh….
Peristiwa Bersyarat
P(A∩B)= P(A) x P(B|A)
Contoh…………..
Dalil-dalil probabilitas
Dalil I (kaidah umum penggandaan)
Suatu peristiwa dapat menghasilkan n
hasil, selanjutnya dapat menghasilkan
m hasil maka hasil akhir adalah:
K=nxm
Diagram pohon
H T
H T H T
HH HT TH TT
hasil
Dalil II (Permutasi)
Contoh:
P(x) = n . Px . (1-P)n-x
x
n
= nCr = nCx
x
Variabel diskrit
P <<<< n >>>>
Rumus: P(x)= 𝜆 x . e -λ
x!
𝜆 = nilai rata-rata = n.p
e = konstanta = 2.71828
x = variabel diskrit
Distribusi normal
Variabel kontinu
Berbentuk lonceng: simetris, seperti lonceng, luas
probabilitas = 1= 100%
Transformasi Z
Rumus: Ζ =
Z=
LATIHAN
Berikut ini adalah data pasien yg dirawat kr PJK
ˆ
ˆ
q
Statistik sampel
Parameter
ˆ
Estimasi
Estimasi adalah suatu metode, dimana kita
dapat menduga nilai/karakteristik (parameter)
populasi dari hasil nilai (statistics) sampel
Dua macam estimasi:
Estimasi titik (Point Estimate)
Estimasi selang ( Interval Estimate)
Estimasi Titik
Nilai populasi (parameter) ditentukan hanya
oleh satu nilai.
Nilai yang dipakai untuk menduga disebut
“estimator”
Ciri –ciri Estimator yang baik
Beberapa kriteria yang lazim dipergunakan untuk menetapkan suatu penduga
yang baik:
1. Tidak bias
Statistik sampel yang digunakan sebagai penduga harus sama atau mendekati
populasi yang diduga.
2. Konsisten
Jika ukuran sampel meningkat maka statistik sampel akan semakin mendekati
parameter populasinya. Atau jika n (jumlah sampel) membesar maka s
(standar deviasi) mengecil, dan jika n = ~ maka s = 0
3. Efisien
Statistik sampel memiliki standar deviasi yang kecil
Estimasi Titik
Mean populasi: μ, dapat diduga dari bermacam-
macam nilai yang ada didalam sampel seperti, x1,
x2….xn, Mo, Md dan x (mean)
Nilai mean ( x ) : estimator yang terbaik.
Jadi x μ
s σ
p π
Estimasi Titik
Dari survey cepat, 210 ibu hamil di Bekasi didapat
rata-rata kadar Hb 9,5 gr%
Dimpulkan bahwa kadar Hb bumil di Bekasi adalah
9,5 gr%
Kelemahan pendugaan titik ini adalah:
Sering meleset/salah
Tidak diketahui derajat kebenaran dari pendugaan
……. untuk ini dipakai Estimasi Selang
Estimasi Selang (Interval Estimate)
Konsep estimasi selang, semua sampel yang diambil
dari populasi akan berdistribusi normal (CLT) dengan
simpangan baku SE
1/2α
95% (CI) 1/2α
Z
ZZ
Rumus umum
atau
ˆ x z1/ 2 SE
Contoh
Pada penelitian di Jambi, 144 bumil didapat kadar Hb x = 9,5 gr% Perkirakan, berapa nilaia Hb populasinya
kalau diketahui σ = 2 gr%. CI 95%
Penyelesaian:
μ = x ± z1/2α σ/√n
μ= 9,5 ± 1,96 x 2/√144
= 9,5 ± 0,3
= { 9.2 sampai 9.8 } gr% … CI 95%
Apa artinya ?
Contoh:
Penelitian terhadap 25 orang penderita penyakit
jantung kronis (PJK) terhadap kadar kolesterol mereka.
Dari sampel tersebut didapatkan rata-rata 210 gr/dl
dengan simpangan baku 50 gr/dl. Berapakah kadar
kolesterol pada penderita PJK pada 95% CI?
Penyelesaian:
Dalam kasus ini varian populasi tidak diketahui dengan
demikian tidak dapat dipakai distribusi Z dan harus
dipakai distribusi t (Student)
Penyelesaian
s
x t1 / 2
df n
50
210 2.064 x 210 20.64
25
μ= 210 ± 20,64
μ= { 189.36 ; 231.64} gr/dl………CI 95%
Data kategorik
Untuk data kategorik pendekatannya selalu ke kurva normal.
Dalam analisis univariabel maka X= p
Simpangan baku pq
Standar Error
pq
SE
n
Pendugaan interval untuk rata-rata
1. Untuk sampel besar (n > 30)
a. Utk populasi tdk terbatas/ populasi terbatas yg pengambilan
sampelnya dgn pengembalian dan σ diketahui
X Z / 2 . X Z / 2 .
n n
Penaksiran rata-rata sampel adalah menentukan
interval nilai rata-rata sampel yang dapat memuat
parameter rata-rata populasi, jika dipakai distribusi
probabilitas normal, confedence interval untuk rata-
rata ditentukan.
ˆ x z dan ˆ x z
1 /2 2 /2
n
Didapat dua batas kepercayaan
n
z
-zα/2 0 zα/2
Contoh: Rata-rata IPK sampel acak 36 mahasiswa tingkat S-1 adalah 2.6.
Hitung selang kepercayaan 95% dan 99% untuk rata-rata IP semua
mahasiswa S-1! Anggap bahwa standar deviasi populasinya 0.3.
Solusi:
Diketahui x-bar = 2.6; σ = 0.3; z0.025 = 1.96; z0.005 = 2.575
Selang kepercayaan 95% untuk rata-rata IP semua mahasiswa S-I:
0.3 0.3
2.6 1.96 2.6 1.96
36 36
2.50 2.70
Interpretasi: Dapat dipercaya sebesar 95% bahwa rata-rata IPK semua mahasiswa S-1 antara 2.50 hingga
2.70
Selang kepercayaan 99% untuk rata-rata IPK semua mahasiswa S-I:
0.3 0.3
2.6 2.575 2.6 2.575
36 36
2.47 2.73
Interpretasi: Dengan tingkat kesalahan 1%, dapat dinyatakan bahwa rata-rata IPK semua
mahasiswa S-1 antara 2.47 hingga 2.73.
--00--
Perhatikan:
galat
x z / 2 x x z / 2
n n
b. Untuk populasi terbatas, pengambilan sampel tanpa pengembalian dan
σ diketahui atau n/N > 5%
N n N n
X Z / 2 . . X Z / 2 . .
n N 1 n N 1
2. Untuk sampel kecil (n ≤ 30)
s s
X t / 2 . X t / 2 .
n n
s
X 2
( X ) 2
n 1 n( n 1)
SOAL
Sebuah perusahaan ingin mengestimasi rata-rata waktu yang
diperlukan oleh sebuah mesin yang digunakan untuk
memproduksi satu jenis kain. Diambil secara acak 36 pis kain,
waktu rata-rata yang diperlukan untuk memproduksi 1 pis kain
adalah 15 menit. Jika diasumsikan standar deviasi populasi 3
menit, tentukan estimasi interval rata-rata dengan tingkat
confidence (tingkat kepercayaan) 95% ?
JAWABAN
X (Rata-rata) = 15 menit
n = 36
Simpangan Baku = 3
n
Nilai standar Deviasi = = 3 : √36 = 0.5
Estimasi titik p
Astimasi selang:
ˆ p Z1/ 2 SE
p.q
ˆ p Z1/ 2
n
Contoh Kasus
99
100 Uji Korelasi
Besar kecilnya hubungan Antara dua variable dinyatakan dalam bilangan yang
disebut Koefisien Korelasi
UJI HUBUNGAN
statistik parametrik & non-parametrik
Rendah a b
Tinggi c d
Rendah e F
Tinggi g h
Proses Uji Korelasi
105 Aktifkan kembali SPSS pada tampilan “Variable View”, kemudian masukkan variable serta kolom
Label dengan nama variabel penelitian berikut ini
Proses Uji Korelasi (Lanjutan)
106
Proses uji korelasi dimulai dengan Analyze, correlate, Bivariate. Klik Bivariate untuk masuk dalam
proses berikutnya. Perhatikan tampilan dibawah ini:
108 Uji Korelasi (Lanjutan)
Numerik Kategorikal
Statistik parametrik
Dalam kesempatan ini akan dibahas uji beda
proporsi (non-parametrik).
Uji beda proporsi digunakan pada data
kategorikal (nominal, ordinal) yang mengukur
frekuensi suatu kejadian (event). Meskipun
menguji perbedaan proporsi, perhitungan
didasarkan atas distribusi frekuensi dalam
suatu tabulasi silang.
Berbeda dengan uji beda rerata parametrik,
maka uji beda proporsi tidak
menggunakan banyak asumsi. Uji beda
proporsi dapat digunakan pada sampel
yang tidak terdistribusi normal atau
berjumlah kecil (<30)
Hal ini berakibat pada berkurangnya „power‟
uji statistik ini. Di samping itu, besarnya
perbedaan tidak dapat dihitung dalam uji
beda non-parametrik
χ2 (chi-square test)
Yates correction (contigency
coefficient)
Fisher‟s exact test
Salah satu uji beda proporsi yang digunakan
pada skala data nominal.
Dapat diterapkan tanpa asumsi distribusi
normal data, baik pada sampel besar maupun
kecil.
Selain digunakan untuk menguji perbedaan
proporsi, dapat juga digunakan sebagai
„goodness-of-fit test‟ dan dapat menguji
adanya asosiasi antara dua variabel.
Source: http://www.geography-site.co.uk/pages/skills/fieldwork/statimage/chisqu.gif
Observed: frekuensi yang didapatkan dari
observasi
Expected: merupakan hasil dari total baris
dikalikan total kolom dibagi total sampel
Expected count: Total row x total
column
Total sampel
Anemia Tidak anemia TOTAL
Perempuan 24 (a) 16 (c?) 40
tamat SMP atau
kurang
Perempuan 6 (d?) 34 (b) 40
tamat SMU atau
lebih
TOTAL 30 50 80
Angka di luar kurung adalah “Observed count”, angka
di dalam kurung adalah “expected count”
a= (30*40)/80 = 15
b= (50*40)/80 =
25
Hitunglah c dan d!
1. Tentukan hipotesis yang akan diuji
Berikan contohnya!
Level signifikansi menuntun kita untuk
memilih titik kritis. Level signifikansi
ditentukan oleh nilai α.
Pada α = 5% maka level signifikansi pada
0.05
Pada α = 5%, maka interval kepercayaan
sebesar 95% (1- α)
Semakin kecil nilai α, semakin tinggi interval
kepercayaan, maka tingkat kesalahan tipe 1
semakin kecil.
Tentukan lebih dahulu tabulasi silang
frekuensi yang ingin diuji df dapat
dihitung.
df= (row-1)(column-1)
Tentukan nilai kritis berdasarkan α
dan df!
Gunakan rumus Chi-square di atas untuk
menghitung chi-square hitung!
Bandingkan χ2 hasil perhitungan dengan titik
kritis χ2 yang telah diperoleh!
Apabila χ2 hitung > titik kritis χ2 maka H0
ditolak dan Ha diterima
Apabila χ2 hitung < titik kritis χ2 maka H0
diterima dan Ha ditolak
Gizi lebih normal Gizi kurang
Laki-laki 18 (18,75) 17 (18,75) 15 (12,5) 50
Perempuan 12(11,25) 13 (11,25) 5 (12,5) 30
30 30 20 80
Keterangan:
Angka dalam kurung menunjukkan expected
value
• Hipotesis alternatif(H1)
Lawannya hipotesis nol, adanya perbedaan data populasi dengan data
sampel
Merupakan hipotesis yang menyatakan adanya perbedaan, hubungan atau
pengaruh antar variabel tidak sama dengan nol. Atau dengan kata lain
terdapat perbedaan, hubungan atau pengaruh antar variabel (merupakan
kebalikan dari hipotesis alternatif)
Bentuk Hipotesis
• Hipotesis Deskriptif
• Hipotesis Komparatif
• Hipotesis Hubungan (Asosiatif)
Hipotesis Deskriptif
• Rumusan hipotesis:
• Tidak ada hubungan antara harga buah appel dengan
volume
penjualan buah apel. Ho: = 0 Ha: 0
• Tidak ada pengaruh pemupukan tanaman terhadap kadar gula
Ciri Hipotesis yang Baik
• Dinyatakan dalam kalimat yang tegas
– Upah memiliki pengaruh yang berarti terhadap produktifitas karyawan
(jelas)
– Upah memiliki pengaruh yang kurang berarti terhadap produktifitas
karyawan (tidak jelas)
• Dapat diuji secara alamiah
– Upah memiliki pengaruh yang berarti terhadap produktifitas karyawan
(dapat diuji)
– Batu yang belum pernah terlihat oleh mata manusia dapat berkembang
biak (Pada hipotesis ini tidak dapat dibuktikan karena kita tidak dapat
mengumpulkan data tentang batu yang belum terlihat manusia)
• Dasar dalam merumuskan hipotesis kuat
– Harga barang berpengaruh negatif terhadap permintaan (memiliki dasar
kuat yaitu teori permintaan dan penawaran)
– Uang saku memiliki pengaruh yang signifikant terhadap jam belajar
mahasiswa. (tidak memiliki dasar kuat)
Hipotesis Statistik
penolakan H0 penolakan H0
daerah penerimaan H0
Z Z
2 2
H0 diterima jika: Z Z Z
hitung
2
2
Macam Uji Hipotesis untuk
Mean
2. Uji satu ekor kanan
H0: μ ≤ μ0
H1: μ > μ0
daerah penolakan H0
daerah penerimaan H0
Zα
penolakan H0
d
a
e
r
a
h
p
Statistika Uji untuk Mean
n (0 ,1) atau n ≥ 30
2. t h i t u n g X 0 t n 1
s Digunakan jika σ2 tidak
diketahui, dan n < 30
n
Macam Uji Hipotesis untuk Beda Mean
penolakan H0 penolakan H0
daerah penerimaan H0
Z Z
2 2
H0 diterima jika: Z Z Z
hitung
2
2
Macam Uji Hipotesis untuk Beda Mean
daerah penerimaan H0
Zα
penolakan H0
d
a
e
r
a
h
p
PENGUJIAN HIPOTESIS
UNIVARIAT
PERBEDAAN UJI-T DAN UJI-Z
UJI T
Semua titik data independen.
Ukuran sampel kecil. Secara umum, ukuran sampel melebihi 30 unit
sampel dianggap besar, jika tidak kecil tetapi tidak boleh kurang dari
5, untuk menerapkan uji-t.
Nilai sampel harus diambil dan dicatat secara akurat.
n sample size
x
x sample mean z
population mean
RUMUS UMUM : H : μ ≤ μ0
A : μ >μ0
Pada suatu pabrik pakan dihasilkan rata-rata 15.7 ton sekali produksi. Hasil
produksi mempunyai simpangan baku = 1.51 ton. Metode produksi baru,
diusulkan untuk mengganti yang lama, jika rata-rata per sekali produksi
menghasilkan paling sedikit 16 ton. Untuk menentukan apakah metode yang
lama diganti atau tidak, metode pemberian pakan yang baru dicoba 20 kali
dan ternyata rata-rata per sekali produksi menghasilkan 16.9 ton. Pemilik
bermaksud mengambil resiko 5% untuk menggunakan metode baru apabila
metode ini rata-rata menghasilkan lebih dari 16 ton. Bagaimana
keputusannya
Penyelesaian
DISTRIBUSI NORMAL
BAKU
1,64
UJI PIHAK KIRI
1. σ DIKETAHUI
RUMUS UMUM : H : μ ≥ μ0
A : μ <μ0
2. σ TIDAK DIKETAHUI
RUMUS UMUM : H : μ ≤ μ0
A : μ >μ0
Step-step menjawab soal 1
Miu= 880 ton
N= 50
Xbar=875
Std.dev=21 ton
Alfa=0.05
======================
jawab:
1. H0: Miu=880 ton
H1: Miu != 880 ton
2. Alfa: 0.05 => Z dua sisi=1.96(nilai kritis)
3. Kriteria pengujian:
H0 Diterima bila -1.96<=Z<=1.96
H1 diterima bila Z> 1.96 atau Z<-1.96
4. Z= ((Xbar-Miu)/(Std.dev/sqrt(N)))=?
5. Z apakah < or > 1.96?
Kesimpulan: Hsil rata2 per hari (Sama or Tidak sama) dengan 880 ton
SOAL: