STATISTIK INFERENSIAL
Pada statistik induktif/ inferensial kita akan melakukan penyimpulan /
pengambilan keputusan dari suatu populasi tertentu berdasarkan sebagian data
(sampel) yang dikumpulkan.
Konsep dasarnya:
- Distribusi sampling yaitu distribusi dari mean-mean sampel yang diambil
secara berulang kali dari suatu populasi.
- Sampling Error adalah kesalahan karena penelitiannya menggunakan sampel.
- Standard Error (SE) adalah simpangan baku dari distribusi rata-rata sampel.
- Estimasi adalah suatu metode dimana diperkirakan nilai populasi (parameter)
dengan menggunakan nilai sampel (statistik).
- Uji hipotesis. Tujuannya adalah untuk menguji apakah data dari sampel yang
ada sudah cukup kuat untuk menggambarkan populasinya. Atau apakah bisa
dilakukan generalisasi tentang populasi berdasarkan hasil sample
STATISTIKA PARAMETRIK
I. PENDAHULUAN
Statistik adalah ukuran yang menyimpulkan karakteristik suatu sampel. Statistik
digunakan untuk penaksiran parameter populasi dan menguji hipotesis tentang
keadaan parameter populasi.
Parameter adalah ukuran yang menyimpulkan karakteristik suatu populasi
Parameter di populasi statistik pada sampel
Rata-rata x
Standard deviasi s atau SD
Varians 2 s2
Proporsi ∏ p
Koef. Korelasi ρ r
Ciri dalam statistika parametrik adalah data yang mempunyai skala pengukuran
interval dan rasio.
Jadi distribusi variabel random ini mempunyai peran yang besar dalam statistika
parametrik
R Astuti 1
II. TEKNIK STATISTIKA PARAMETRIK
A. Asumsi
1. Data yang digunakan mempunyai skala pengukuran interval atau rasio
2. Data diambil dari populasi yang mempunyai distribusi normal.
Distribusi normal mrp distribusi probabilitas dengan ciri:
a). Mempunyai bentuk lonceng (bell-shaped).
b). Simetris dimana nilai mean= nilai median=nilai modus
c). Kedua ekor mendekati sumbu x secara asimptotik
d). Merupakan distribusi probabilitas dengan peluang sebagai berikut:
Pada uji hipotesis, dikenal uji statistik parametrik dan non parametrik
R Astuti 2
Uji-uji non parametrik adalah:
1. Satu sampel: Uji Chi Square (goodness of fit), uji binomial, uji tanda dsb
2. Dua sampel independent: Uji Chi Square (independensi), uji median, uji Man
Whitney dsb
3. Dua sampel dependent: Uji Mac Nemar, Wilcoxon dsb.
4. Tiga atau lebih sampel independent: Uji Kruskal Wallis
PENGERTIAN :
Hipotesis sesuai dengan asal katanya (hypo berarti dibawah, thesis berarti
dalil, kaidah, hukum), adalah pernyataan tentang suatu dalil atau kaidah, tetapi
kebenarannya belum terujikan secara empirik. Dengan demikian, dikaitkan dengan
dengan masalah penelitian, hipotesis merupakan jawaban sementara terhadap
permasalahan yang diajukan, yang kebenaran jawaban ini akan dibuktikan secara
empirik dengan penelitian yang akan dilakukan.
Secara lebih operasional yaitu :
“Suatu pernyataan sementara yang perlu diuji kebenarannya.”
MACAM HIPOTESIS
Dalam pernyataannya, terdapat dua macam hipotesis statistik yaitu hipotesis nol (Ho)
dan hipotesis alternatif (Ha).
Contoh :
1. Tidak ada hubungan antara kehamilan dengan kadar hemoglobin ibu
2. Tidak ada perbedaan rata-rata kadar hemoglobin antara ibu yang hamil dengan
ibu yang tidak hamil. Atau Rata-rata kadar hemoglobin populasi ibu hamil
sama dengan rata-rata kadar hemoglobin populasi ibu yang tidak hamil..
R Astuti 3
b). Hipotesis alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan suatu kejadian antara kedua kelompok.
Atau hipotesis yang menyatakan ada hubungan variabel satu dengan variabel yang
lain.
Contoh :
1. Ada hubungan antara kehamilan dengan kadar hemoglobin ibu.
2. Ada perbedaan rata-rata kadar hemoglobin antara ibu yang hamil dengan ibu
yang tidak hamil. Atau Rata-rata kadar hemoglobin populasi ibu hamil
berbeda dengan rata-rata kadar hemoglobin populasi ibu yang tidak hamil.
ARAH/BENTUK HIPOTESIS
Bentuk hipotesis alternatif akan menentukan arah uji statistik apakah satu arah
(one tail) atau dua arah (two tail).
1. One tail (satu sisi) : Bila hipotesis alternatifnya menyatakan adanya perbedaan dan
ada pernyataan yang mengatakan hal yang satu lebih tinggi/rendah dari hal yang
lain.
Contoh :
Rata-rata kadar hemoglobin populasi ibu tidak hamil lebih tinggi dari rata-rata
kadar hemoglobin populasi ibu yang hamil.
2. Two tail (dua sisi) : merupakan hipotesis alternatif yang hanya menyatakan
perbedaan tanpa melihat apakah hal yang satu lebih tinggi/ rendah dari hal yang
lain.
Contoh :
Ada perbedaan rata-rata kadar hemoglobin antara ibu yang hamil dengan ibu yang
tidak hamil. Atau Rata-rata kadar hemoglobin populasi ibu hamil berbeda dengan
rata-rata kadar hemoglobin populasi ibu yang tidak hamil.
Ho : 1 = 2 ( Tidak ada perbedaan mean tekanan darah antara orang yang merokok
dengan yang tidak merokok ).
Ha : 1 2 (Ada perbedaan mean tekanan darah antara orang yang merokok
Dengan yang tidak merokok ).
Ho : = 0 (Tidak ada korelasi antara jumlah rokok yang dihisap dengan tekanan
darah)
Ha : > 0 (Ada korelasi positif antara jumlah rokok yang dihisap dengan tekanan
darah)
R Astuti 4
Dapat diingat bahwa sejak awal proses pengujian, maka hipotesis nol dianggap atau
diasumsikan benar.
1. Kesalahan tipe I ( )
Merupakan kesalahan menolak Ho padahal sesungguhnya Ho benar. Artinya
menyimpulkan adanya perbedaan padahal sesungguhnya tidak ada perbedaan.
Peluang kesalahan tipe I adalah atau sering disebut Tingkat Signifikansi
(significance level). Sebaliknya peluang untuk tidak membuat kesalahan tipe I
adalah sebesar 1 - , yang disebut dengan Tingkat Kepercayaan (confidence level).
2. Kesalahan tipe II ( )
Merupakan kesalahan tidak menolak Ho padahal sesungguhnya Ho salah. Artinya
menyimpulkan tidak ada perbedaan padahal sesungguhnya ada perbedaan. Peluang
untuk membuat kesalahan tipe II adalah sebesar . Peluang untuk tidak membuat
kesalahan tipe II adalah sebesar 1 - , dan dikenal sebagai Tingkat Kekuatan Uji
(power of the test).
Kesalahan pengambilan keputusan
Keputusan Populasi
Ho benar Ho salah
Tidak menolak Ho Benar (1 - )
Menolak Ho Benar ( 1 - )
R Astuti 5
biasanya digunakan nilai sebesar 5 %. Sedangkan untuk pengujuan obat-obatan
digunakan batas toleransi kesalahan yang lebih kecil misalnya 1 %, karena
mengandung risiko yang fatal.
KEPUTUSAN UJI STATISTIK
Hasil pengujian statistik menghasilkan dua kemungkinan keputusan yaitu
menolak hipotesis nol dan gagal menolak hipotesis nol. Keputusan uji statistik dapat
dicari dengan dua pendekatan yaitu pendekatan klasik dan penekatan probabilistik.
1. Pendekatan klasik
Untuk memutuskan apakah Ho ditolak atau gagal ditolak, dapat digunakan dengan
cara membandingkan nilai perhitungan uji statistik dengan nilai pada tabel. Nilai
tabel yang dilihat sesuai dengan jenis distribusi uji yang kita lakukan.
Ketentuan :
Bila nilai perhitungan uji statistik lebih besar dibandingkan nilai yang berasal
dari tabel (nilai perhitungan > nilai tabel), maka keputusannya : Ho ditolak.
Ho ditolak, artinya: ada perbedaan kejadian (mean/proporsi) yang signifikan
antara kelompok data satu dengan kelompok data yang lain.
Bila nilai perhitungan uji statistik lebih kecil dibandingkan nilai yang berasal
dari tabel ( nilai perhitungan < nilai tabel), maka keputusannya : Ho gagal
ditolak.
Ho gagal ditolak, artinya: tidak ada perbedaan kejadian (mean/ proporsi) antara
kelompok data satu dengan kelompok data yang lain. Perbedaan yang ada
hanya akibat dari faktor kebetulan (by chance).
2. Pendekatan probabilistik
Setiap kita melakukan uji statistik dengan menggunakan komputer maka akan
ditampilkan/dikeluarkan nilai p (p-value). Dengan nilai p kita dapat menggunakan
untuk keputusan uji statistik dengan cara membandingkan nilai p dengan nilai .
Ketentuan :
Bila nilai p nilai maka keputusannya adalah Ho ditolak
Bila nilai p nilai maka keputusannya adalah Ho gagal ditolak
Perlu diketahui bahwa nilai p two tail adalah dua kali nilai p one tail, berarti
kalau tabel yang digunakan adalah tabel one tail sedangkan uji statistik yang
dilakukan two tail maka nilai p dari tabel harus dikalikan 2. Dengan demikian dapat
disederhanakan dengan rumus: nilai p two tail = 2 x nilai p one tail.
NILAI p (p-value)
Pengertian nilai p
Nilai p merupakan nilai yang menunjukkan besarnya peluang untuk
mendapatkan Ho yang benar Harapan kita nilai p adalah sekecil mungkin, sebab bila
nilai p nya kecil maka kita yakin bahwa adanya perbedaan pada hasil penelitian
menunjukkan pula adanya perbedaan di populasi. Dengan kata lain kalau nilai p nya
kecil maka peluang bahwa tidak ada perbedaan adalah kecil.
Nilai p dapat diartikan pula sebagai besarnya nilai peluang hasil penelitian
(misalnya adanya perbedaan mean atau proporsi) terjadi karena faktor kebetulan (by
chance). Kalau nilai p nya kecil maka perbedaan yang ada pada penelitian terjadi
karena faktor kebetulan (by chance) adalah kecil.
R Astuti 6
Perbedaan substansi/ klinis dan perbedaan statistik
Perlu disadari oleh peneliti bahwa berbeda bermakna/ signifikan secara statistik
tidak berarti (belum tentu) bahwa perbedaan tersebut juga bermakna dipandang dari
segi substansi/ klinis. Seperti diketahui bahwa semakin besar sampel yang dianalisis
akan semakin besar menghasilkan kemungkinan berbeda bermakna. Dengan sampel
besar perbedaan-perbedaan sangat kecil, yang sedikit atau bahkan tidak mempunyai
manfaat secara substansi/ klinis dapat berubah menjadi bermakna secara statistik.
Oleh karena itu arti kegunaan dari setiap penemuan jangan hanya dilihat secara
statistik saja, tapi harus juga dilihat dari kegunaan dari segi substansi/klinis.
1. Menetapkan hipotesis
Tetapkan hipotesis nol (Ho) dan hipotesis alternatif (Ha).
Dari hipotesis alternatif akan diketahui apakah uji statistik menggunakan satu arah
(one tail) atau dua arah (two tail).
R Astuti 7
4. Penghitungan uji statistik
Penghitungan uji statistik adalah menghitung data sampel kedalam uji hipotesis
yang sesuai dengan data yang akan diuji.
Pihak kiri
daerah penolakan
daerah penerimaan
(1)
Aturan pengambilan keputusan, dengan contoh menyangkut distribusi normal
R Astuti 8
Pada = 1% maka /2 = 0,05 Z 2,58
Pada = 5% maka /2 = 0,025 Z 1,96
Bila Z hitung > 1,96 atau Z hitung < - 1,96 Tolak Ho pada taraf kemaknaan
5%. Artinya ada perbedaan atau ada hubungan
Bila Z antara – 1,96 sampai dengan 1,96 Gagal tolak Ho pada taraf kemaknaan
( ) 5%. Artinya tidak ada perbedaan atau tidak ada hubungan
– 1,96 1,96
Pada = 1% Z = 2,33
Pada = 5% Z = 1,64
daerah penolakan
95%
1,64
Pada = 1% Z = 2,33
Pada = 5% Z = 1,64
daerah penolakan
95%
1,64
R Astuti 9
Soal :
1. Buat contoh hipotesis nol dan hipotesis alternatif
2. Buat contoh hipótesis satu ekor (one tail) dan hipótesis dua ekor (two tail)
3. Apa yang dimaksud kesalahan tipe 1 ()
4. Apa yang dimaksud kesalahan tipe 2 (β)
5. Apa yang dimaksud dengan kekuatan uji
6. Jelaskan urutan pengujian hipotesis
x- 2
1 -1/2
f (x) = e
2
x= Me = Mo
Kurva simetris
R Astuti 10
Mo Me x x Me Mo
Kurva normal
f (x)
1 1 < 2 < 3
1 = 2 = 3
2
3
R Astuti 11
Dengan demikian jika dan diketahui, maka akan diperoleh bentuk distribusi
normal, yang mana dapat dihitung probabilitas nilai-nilai x dengan memakai rumus
fungsi distribusi normal.
f (x)
x1 x2 sumbu x
2
1 -1/2 [ Z ]
f (Z) = e
2
Untuk mendapatkan probabilitas setiap nilai Z pada kurva normal standard telah
disusun sebuah daftar yang disebut “tabel distribusi normal standar”. Berdasarkan
tabel inilah probabilitas setiap nilai x pada distribusi normal umum dapat dihitung,
melalui suatu transformasi.
Dari hubungan distribusi normal umum dan normal standard dapat diperoleh suatu
rumus transformasi dari nilai x (distribusi normal umum) ke nilai Z (distribusi normal
standard).
Transformasinya:
x -
Z =
R Astuti 12
f (x) Rata-rata =
Simpangan baku =
f (z) =0
=1
-3 -2 -1 0 1 2 3 z
UJI KENORMALAN
Kesimpulan :
Jika p-value > 0,05 Ho diterima/gagal ditolak
Sehingga kesimpulannya data berasal dari populasi
yang berdistribusi normal
R Astuti 13
Jika p-value < 0,05 Ho ditolak
Sehingga kesimpulannya data berasal dari populasi
yang berdistribusi tidak normal
Contoh:
umur ibu
Cumulative
Frequency Percent Valid Percent Percent
Valid 22 2 10.0 10.0 10.0
25 3 15.0 15.0 25.0
27 1 5.0 5.0 30.0
31 4 20.0 20.0 50.0
32 1 5.0 5.0 55.0
33 1 5.0 5.0 60.0
34 2 10.0 10.0 70.0
36 1 5.0 5.0 75.0
39 1 5.0 5.0 80.0
40 2 10.0 10.0 90.0
43 1 5.0 5.0 95.0
47 1 5.0 5.0 100.0
Total 20 100.0 100.0
umur ibu
6
2
Frequency
umur ibu
Gambar diatas memperlihatkan histogram umur ibu dan garis / kurva normal
dari variabel umur ibu. Terlihat bahwa batang histogram mempunyai
kemiripan bentuk dengan kurva normal (berbentuk seperti lonceng). Hal ini
membuktikan bahwa distribusi tersebut sudah dapat dikatakan normal atau
mendekati normal. Namun pengujian normalitas lebih jelas pada explore data.
R Astuti 14
Descriptives
Output ini memberikan informasi ringkasan statistik deskripsi dari data umur ibu
95% CI : 29,11 – 35,66 (artinya pada tingkat kepercayaan 95% rata-rata umur
ibu pada populasi antara 29,11 – 35,66 ).
Median atau tititk tengah data jika semua data diurutkan dan dibagi dua sama
besar. Angka median umur ibu adalah 31.5 tahun menunjukkan bahwa 50%
pengetahuan gizi ibu adalah 31,5 tahun keatas dan 50% nya adalah 31,5 tahun
ke bawah.
Nilai Minimum adalah 22 tahun dan maximum adalah 47 tahun. Umur ibu
terendah adalah 22 tahun dan umur paling tua adalah 47 tahun.
Range adalah data maksimum – data minimum atau dalam kasus ini :
47 – 22 = 25
Rasio skewness adalah = nilai skewness/ standard error of skewness
= 0,328 / 0,512 = 0,640
R Astuti 15
Oleh karena kedua hasil terletak antara – 2 sampai dengan + 2, maka dapat
dikatakan distribusi data umur ibu adalah normal atau mendekati normal.
Pada uji Kolmogorov Smirnov , nilai sig atau p-value = 0,200. Karena > 0,05 maka
dapat dikatakan bahwa distribusi data umur ibu adalah normal.
Pada uji Saphiro-Wilk, nilai sig atau p-value = 0,542. Karena > 0,05 maka dapat
dikatakan bahwa distribusi data umur ibu adalah normal.
Output histogram
Histogram
6
2
Frequency
0 N = 20,00
20,0 25,0 30,0 35,0 40,0 45,0
umur ibu
2,00 2 . 22
4,00 2 . 5557
8,00 3 . 11112344
2,00 3 . 69
R Astuti 16
3,00 4 . 003
1,00 4 . 7
Stem width: 10
Each leaf: 1 case(s)
Interpretasi :
Pada baris 1 : Ada 2 data umur ibu (frequency = 2) yang mempunyai stem = 2
dan leaf = 22, yang berarti terdapat 2 orang ibu yang mempunyai umur 22 dan 22
tahun.
Pada baris 2 : Ada 4 data umur ibu (frequency = 4) yang mempunyai stem = 2
dan leaf = 5,5,5,7 yang berarti terdapat 4 orang ibu yang mempunyai umur 25, 25,
25, 27
Dan seterusnya sampai pada baris ke6 , yaitu ada 1 orang ibu yang mempunyai
umur 47 tahun.
1,5
1,0
,5
0,0
Expected Normal
-,5
-1,0
-1,5
20 30 40 50
Observed Value
Pada gambar Q-Q plot untuk variabel umur terlihat ada garis lurus dari kiri ke
kanan atas. Garis itu berasal dari nilai Z skore. Jika suatu distribusi data normal,
maka data akan tersebar di sekeliling garis. Oleh karena itu dapat dikatakan bahwa
distribusi data adalah normal.
Output untuk menguji normalitas dengan Plot (Detrended NormalQ-Q plot)
R Astuti 17
Detrended Normal Q-Q Plot of umur ibu
,5
,4
,3
,2
,1
-,0
Dev from Normal
-,1
-,2
-,3
20 30 40 50
Observed Value
Output ini untuk mendeteksi pola-pola dari titik-titik yang bukan bagian dari
kurva normal. Terlihat bahwa sebagian data terpola di sekitar garis. Hal ini
membuktikan bahwa distribusi data adalah normal.
Output boxplot
Boxplot adalah kotak pada gambar berwarna merah atau warna lain dengan
garis tebal horizontal di kotak tersebut. Kotak merah tersebut memuat 50%
data. Sedangkan garis tebal hitam median data. Jika garis hitam terletak persis
di tengah boxplot, maka distribusi data adalah normal. Jika berada di sebelah
atas, distribusi menceng ke kiri dan jika di sebelah bawah, distribusi menceng
ke kanan.
50
40
30
20
N= 20
umur ibu
Dari output diatas terlihat garis median berada ditengah. Hal ini menunjukkan
distribusi data normal.
R Astuti 18
Daftar pustaka
1. Budiarto. Biostatistika untuk kedokteran dan kesehatan masyarakat. EGC. Jakarta.
2002
2. Chandra, B. Pengantar Statistik Kesehatan. Penerbit Buku Kedokteran EGC.
Jakarta.1995.
3. Dawson B, Trapp RG. Basic and Clinical Biostatistics. Third Edition. McGraw-
Hill International Editions. Lange Medical Books, The McGraw-Hill Companies.
2001.
3. Kuzma. Basic Statistics for the Health Sciences. Mayfield Publishing Company.
1984
4. Norman and Streiner. Biostatistics : The Bare Essentials, Mosby. 1994.
5. Pagano, M dan K. Gaureau. Principles of Biostatistics. Belmont, Duxury Press.
1993.
6. Sabri dan Hastomo. Statistika kesehatan. PT Raja Grafindo Persada. Jakarta. 2006.
7. Sheskin, D.J. Handbook of Parametric and Nonparametric Statistical Prosedures.
Third Edition. Chapman & Hall/CRC. Florida.
R Astuti 19