Anda di halaman 1dari 44

ANALISIS DATA

Statistik Inferens:
Estimasi & Uji Hipotesis

Deni Purnama
Telp. (WA) 081283237575
Email : superdeni007@gmail.com

Hal-1
Gambar apakah ini?

11/20/18
Hal-2
Sebuah gambar, bila disajikan dengan cara yang
berbeda, dapat menampilkan interpretasi yang
berbeda pula.

Sebuah gambaran yg tidak utuh dapat


membuat kesimpulan yang tidak utuh

Hal yang sama dapat terjadi pada riset

Hal-3
Apakah simpulan ini benar?
Sebesar 80% penghuni penjara adalah orang
beragama Islam
1.Simpulan à Orang Islam memiliki risiko
lebih besar untuk masuk penjara

Sebesar 60% kecelakaan saat mudik lebaran


terjadi pada pengendara sepeda motor
2.Simpulan à Saat mudik lebaran, pengendara
sepeda motor memiliki risiko lebih besar
untuk kecelakaan
Apakah simpulan tsb benar?
1.Tidak, Jika orang Islam di populasi sekitar 80%
2.Tidak, Jika yg mudik dg sepeda motor sekitar 60%
11/20/18
Hal-4
STATISTIK INFERENS

UJI
ESTIMASI
HIPOTESIS

Hal-5
Ruang Lingkup Statistik Deskriptif dan Inferens

Populasi Random Sampel Statistik


Deskriptif

Rata-rata Rata-rata income


=Rp1jt
Hb Ibu hamil
Sosial Ekonomi Sosek Rendah 40%

BBLR
ASI eksklusif Kejadian BBLR 25%

Estimasi dan
(TIDAK DIKETAHUI) Uji hipotesis
Statistik
Estimasi: BBLR berkisar 20-25% Inferensial
Hipotesis: “Sosek rendah meningkatkan risiko BBLR
sebesar 2 kali lebih besar”
Hal-6
ESTIMASI

Hal-7
Estimasi (Perkiraan/Pendugaan)
• Pengertian: pendugaan karakteristik populasi (parameter)
melalui karakteristik sampel (statistik).

• Estimasi titik
• Nilai rata-rata populasi
• Nilai proporsi populasi
• Nilai OR atau RR di populasi

• Estimasi Interval
• Estimasi interval terhadap rata-rata populasi
• Estimasi interval terhadap proporsi populasi
• Estimasi interval terhadap perbedaan rata-rata/proporsi
• Estimasi interval nilai OR atau RR di populasi
Hal-8
Estimasi (Pendugaan)

• Populasi dan Sampel


Populasi Sampel

Parameter Statistik
Mean (µ) X
Proporsi (p) ps
Varians (s2) SD2

Central Limit Theorem


Pengertian Estimasi Titik dan Interval
Populasi Random Sampel Simpulan

Rata-rata Hb
Mana yang benar ?
Rata Hb Bumil di Bumil Peneliti-1 atau Peneliti-2?
Populasi tidak X =12.0 gr%
diketahui
Estimasi titik:
Rata-rata Hb Bumil
Peneliti-1 di Populasi adalah
12.0 gr%

Peneliti-2
Rata-rata Hb Estimasi Interval: Saya
Bumil percaya pada tingkat
=13.0 gr% kepercayaan …...% rata-
rata Hb Bumil di populasi
Estimasi Interval menjamin perkiraan lebih mendekati berkisar 11.0--13.0 gr%
nilai sebenarnya di populasi
Hal-10
Pengertian Estimasi Titik dan Interval
• Bupati Kabupaten X menanyakan prevalensi gizi buruk
pada Balita, Kepala Dinas Kesehatan menyatakan
berdasarkan laporan rutin gizi buruk hanya 6%.
• Bupati tidak yakin, kemudian meminta dilakukan survei,
dengan sampel 200 Balita: ditemukan gizi buruk 10%
• Kepala Dinas Kesehatan tidak puas, meminta dilakukan
survei ulang, dengan sampel yang lebih banyak 400
Balita: gizi buruk 9%

1. Apakah gizi buruk 10% lebih besar dari 6%?


2. Apakah gizi buruk 9% lebih besar dari 6%?
3. Apa simpulan anda dari situasi tersebut?
Menghitung Estimasi Interval
(Tergantung pada Interval kepercayaan dan Besar sampel)

. Estimasi
Data Numerik Data Kategorik
Interval

Rata-rata Proporsi

p(1 - p)
..%CI = P ± Z (a / 2)
Standar Deviasi Standar Deviasi n
populasi diketahui populasi tidak
diketahui

d SD
CI = c ± Za / 2 CI = c ± t(a / 2,df =n -1)
n n
Hal-12
Pengertian Estimasi Titik dan Interval
• Bupati Kabupaten X menanyakan prevalensi gizi buruk pada Balita, Kepala Dinas Kesehatan
menyatakan berdasarkan laporan rutin gizi buruk hanya 6%.
• Bupati tidak puas, kemudian meminta dilakukan survei, dengan sampel 200 Balita ditemukan gizi
buruk 10%
• Kepala Dinas Kesehatan tidak puas, meminta dilakukan survei ulang, dengan sampel yang lebih
banyak 400 Balita, gizi buruk 9% p(1 - p)
..%CI = P ± Z (a / 2)
n
p 1-p n 95% CI p
z (a/2) LL UL
0.10 0.90 200 1.96 0.058 0.142
0.09 0.91 400 1.96 0.062 0.118
1. Apakah gizi buruk 10% lebih besar dari 6%? à TIDAK
2. Apakah gizi buruk 9% lebih besar dari 6%? à YA
3. Apa simpulan anda dari situasi tersebut? à TERKADANG
STATISTIK MEMBINGUNGKAN…DAN TIDAK BISA DIPERCAYA…
…TERUTAMA JIKA SAMPLING TIDAK TEPAT…
(Semakin besar sampel semakin sempit interval kepercayaan,
àsemakin mudah menyimpulkan adanya perbedaan)
Estimasi Interval terhadap µ di populasi
bila Std.deviasi populasi diketahui
. v Rata-rata ‘urid acid’ dari 100 sampel Lansia adalah 5.9
mg/100ml. Bila standar deviasi di populasi diketahui
sebesar 1.5 mg/100 ml, Hitunglah estimasi interval terhadap
kadar ‘uric acid’ pada populasi Lansia.
§ Pada tingkat kepercayaan 90%
= 5.9 + (1.64)(1.5/Ö100)
= 5.9 + 0.246
5.654< µ <6.146 mg/100 ml

§ Pada tingkat kepercayaan 95%


= 5.9 - (1.96)(1.5/Ö100)< µ <5.9 + (1.96)(1.5/Ö100)
= 5.9 – 0,294 < µ < 5.9 + 0,294
5.606 < µ <6.194 mg/100 ml

§ Pada tingkat kepercayaan 99%


5.9 - (2.58)(1.5/Ö100)< µ <5.9 + (2.58)(1.5/Ö100)
5.51< µ <6.29 mg/100 ml

Semakin besar tingkat kepercayaan, semakin lebar estimasi interval,


à Semakin sulit untuk mendeteksi
Hal-14 adanya perbedaan
UJI HIPOTESIS

Hal-15
HIPOTESIS
v Hipotesis: “hipo” (di bawah) dan “tesis” (pernyataan yang
telah diuji) à Simpulan sementara yg ingin diuji.
“Pernyataan sementara terhadap suatu penomena yang
akan dibuktikan kebenarannya”
v Hipotesis Statistik: Pernyataan sementara mengenai
parameter populasi yang dapat diuji secara statistik
melalui sampel yang diambil dari populasi
v Pengujian Hipotesis Statistik: suatu prosedur untuk
membuat keputusan, apakah menolak atau gagal menolak
hipotesis (Ho)
v Hipotesis Statistik:
§ Hipotesis nol (H0) : pernyataan netral (sama dengan)
§ Hipotesis Alternatif (H1 atau HA): pernyataan memihak,
sudah ada dugaan

Hal-16
Ho dan Ha

Ibu Perokok Berat Bayi Lahir


v Hipotesis Nol (Ho):
“Tidak ada perbedaan berat badan bayi lahir antara
perokok dengan yang tidak merokok”
------
“Tidak ada hubungan merokok dengan berat badan
lahir bayi”
v Hipotesis Alternatif (Ha):
“Ada hubungan merokok dengan berat bayi lahir (2-tailed)”
(Belum jelas arah/bentuk hubungannya)
-----
“Rata-2 berat bayi yang lahir dari ibu perokok
lebih rendah dibandingkan dengan ibu yang tidak
perokok (1-tailed)”
Hal-17
Uji Hipotesis

v Dalam pengujian hipotesis statistik yang ingin


dibuktikan adalah H0
“Jika cukup bukti maka Ho ditolak” à Ha dianggab benar
“Jika tidak cukup bukti maka Ho gagal ditolak
à Ho dianggab benar”

v Besarnya probabilitas H0 benar adalah sebesar nilai-p


(p-value).
Bila nilai-p sangat kecil, maka kemungkinan Ho benar
sangat kecil àkita putuskan untuk menolak Ho

Batas nilai-p untuk menyatakan H0 ditolak sebesar alpha


atau < alpha (untuk kesmas alpa = 5%)

.
Hal-18
LANGKAH UJI HIPOTESIS

Hal-19
LANGKAH UJI HIPOTESIS

Hal-20
KESALAHAN PENGAMBILAN KEPUTUSAN
UJI STATISTIK

Hal-21
KESALAHAN PENGAMBILAN KEPUTUSAN
UJI STATISTIK

Hal-22
KESALAHAN PENGAMBILAN KEPUTUSAN
UJI STATISTIK

Hal-23
KESALAHAN PENGAMBILAN KEPUTUSAN
UJI STATISTIK

Hal-24
PENGGUNAAN UJI STATISTIK PARAMETRIK DAN
NON PARAMETRIK
Kelompok atau Perbandingan
Skala Komparasi (2 sampel) Komparasi > 2 sampel Hubungan
Ukur Deskriptif
(1 sampel)
(asosiasi/
Related Independen Related Independen korelasi)
Binominal Fisher Exact Test X² k sample X² k Contigency
Nominal Mc Nemar
X² 1sample X² 2 sample Cohran Q sample Coefficient C

Median test
Median Spearman Rank
Sign test Tes U Mann Friedman Extension Correlation
Whitney two way
Ordinal Run – test
Wilcoxon Kolmogorov Anova
Smirnov (repeated) Tes Kruskall
Matched
Wallis
Tau Kendall
pairs Wald Woldfowitz

Pearson Product
1way Anova
1way Anova moment
Interval t- test t–test t–test (repeated)
Partial correlation
dan Rasio (1-sampel) (paired) (independen)
2way Anova Multiple
2way Anova correlation
(repeated)
UJI STATISTIK SEDERHANA YANG SERING DIGUNAKAN

Var Independen Var Dependen


Var Dependen
Var
Independen Kategorik Numerik
1.Chi-square/ 2. t-test (jika 2 kategori)
Kategorik Regresi logistik 3. Anova (>2 kategori)
sederhana
2. t-test (jika 2 kategori) 4. Korelasi /
Numerik 2.Anova (>2 kategori) Regresi Linier
sederhana
UJI STATISTIK SEDERHANA YANG SERING DIGUNAKAN

Var Independen Var Dependen


Uji hubungan Hipotesis Alternatif Jenis uji
Rokok (Y/T) -Ada hubungan antara rokok dg BBLR
à (statemen umum)
BBLR (Y/T) -Ada perbedaan Proporsi BBLR antara ibu Chi square
perokok dg ibu bukan perokok (statemen
umum)
-Proporsi BBLR pada ibu perokok lebih tinggi
dibanding ibu bukan perokok (spesifik)i
Korelasi/regresi linier
Rokok (Y/T) à -Ada hubungan antara ibu perokok dg Berat T-test,
Berat bayi lahir bayi lahir (distribusi
(gr) -Rata-rata berat bayi pada ibu perokok normal)
berbeda dengan ibu bukan perokok
-Rata-rata berat bayi pada ibu perokok lebih Median test,
rendah daripada ibu bukan perokok (distribusi
tidak normal)
UJI STATISTIK SEDERHANA YANG SERING DIGUNAKAN

Var Independen Var Dependen

Uji Hipotesis Alternatif Jenis uji


hubungan
Pendidikan ibu Ada hubungan antara pendidikan Anova, (distribusi
(SD, SMP, SMA) ibu dg Berat bayi lahir normal)
à Berat bayi Rata-rata berat bayi berbeda antar
lahir (gr) pendidikan (<=SD, SMP, SMA+) Kruskal Wallis,
(distribusi tidak
normal)
Umur ibu (th) à Ada hubungan antara umur ibu dg Pearson Korelasi/
Berat bayi lahir Berat bayi lahir Regresi linier
(gr) Semakin tua umur ibu semakin (distribusi normal)
rendah berat bayinya
Y = a + b X (Y = berat bayi, X = Spearman korelasi,
umur ibu) (distribusi tidak
normal)
Hal-hal yang perlu
diperhatikan pada
UJI STATISTIK

Hal-29
Kemaknaan statistik vs substansi

Penelitian dilakukan dengan sampel 200 orang yang memiliki


kebiasan minum teh & 200 orang yang tidak memiliki kebiasaan
minum teh. Dengan perbedaan proporsi 2% dan p-value 0,6513
disimpulkan Kebiasan minum teh tidak berhubungan dengan PJK

Apakah simpulan ini bisa dipercaya? Ya


Hal-30
Kemaknaan statistik vs substansi

Penelitian ini memiliki proposi kejadian PJK yang sama dengan penelitian
sebelumnya, tetapi jumlah sampel 10 kali lebih besar, hasil uji statistik dengan
perbedaan 2% & p-value 0,0432 disimpulkan “Kebiasan minum teh
berhubungan dengan PJK”.

Apakah simpulan ini bisa dipercaya?


Tidak, secara substansi perbedaan 2% tidak ada maknanya.
Berhubung sampel terlalu besar, statistik jadi signifikan
Lebih tepat kita menyimpulkan perbedaan insiden 2%
(12% vs 10%) daripada melaporkan nilai-p 0,04 Hal-31
Kemaknaan statistik vs substansi
Sembuh Proporsi yang
Jenis Obat Ya Tidak Total sembuh
A 60 40 100 60.0% Obat A
B 40 60 100 40.0% Obat B
100 100 200 P-value: 0.004

Penelitian dengn sampel: 100 Obat A & 100 Obat B. Perbedaan


proporsi 20% dan p-value 0,004, disimpulkan terdapat
perbedaan signifikan,
à kesembuhan Obat A lebih tinggi dari Obat B

Apakah simpulan ini bisa dipercaya? ….Ya


Hal-32
Kemaknaan statistik vs substansi
Sembuh Proporsi yang
Jenis Obat Ya Tidak Total sembuh
A 12 8 20 60.0% Obat A
B 8 12 20 40.0% Obat B
20 20 40 P-value: 0.172
Penelitian dengn sampel: 20 Obat A & 20 Obat B.
Dengan perbedaan proporsi 20% dan p-value 0,172 disimpulkan
tidak ada perbedaan signifikan, kesembuhan Obat A sama
dengan Obat B
Apakah simpulan ini akurat?
àTidak, karena sampel terlalu kecil, tidak
bermakna secara statistik
Lebih tepat kita melaporkan angka perbedaan proporsi
60% vs 40% daripada melaporkan nilai-p 0,172 Hal-33
STATISTIK INFERENSIAL:
Hal-hal yang Perlu Diperhatikan…1
• Validitas
• Tergantung cara pengambilan sampel
• Tergantung cara pengontrolan confounder & effect modifier
• Masalah missing values & outliers

• Presisi
• Tergantung besar & distribusi sampel
• Penting untuk dilaporkan dalam nilai 95%CI
STATISTIK INFERENSIAL:
Hal-hal yang Perlu Diperhatikan…2

• Nilai p tidak pernah menggambarkan besarnya efek (efect size)


/ kuatnya hubungan

• Besarnya efek diukur dg RR, OR, beda rata-rata, beda


proporsi, korelasi, dll

• Besarnya efek lebih penting untuk hasil penelitian


dibandingkan dengan nilai p
ANALISIS DATA:
Hal-hal yang Perlu Diperhatikan…3
• Uji statistik parametrik
• Dilakukan berdasarkan asumsi distribusi parameter di populasi à umumnya distribusi
normal
• Hanya valid jika asumsi tsb benar
• Kesimpulan uji statistik berlaku untuk populasi (jika sampel dipilih secara random dan
representatif)

vUji statistik non parametrik


§ Tidak diperlukan asumsi distribusi populasi
§ Kesimpulan uji statistik hanya berlaku untuk sampel
atau populasi yg lebih kecil
§ Tiap uji statistik parametrik memiliki pasangan uji
statistik non parametrik Hal-36
STATISTIK INFERENSIAL:
Hal-hal yang Perlu Diperhatikan…5
• Analisis Multivariat
• Dilakukan untuk mengontrol confounder & effect modifier

• Jika confounder & effect modifier sudah dapat dikontrol pada tahap disain studi,
maka analisis dapat lebih sederhana (tidak sampai multivariat)

• Prinsip analisis multivariat: model parsimonius (valid, precise & simple)


PENGGUNAAN UJI STATISTIK PARAMETRIK DAN NON
PARAMETRIK
Kelompok
Skala Komparasi (2 sampel) Komparasi > 2 sampel Hubungan
Ukur Deskriptif
(asosiasi/
(1 sampel) Related Independen Related Independen korelasi)
Binominal Fisher Exact Test X² k sample X² k Contigency
Nominal Mc Nemar
X² 1sample X² 2 sample Cohran Q sample Coefficient C

Median test
Median Spearman Rank
Sign test Tes U Mann Friedman Extension Correlation
Whitney two way
Ordinal Run – test
Wilcoxon Kolmogorov Anova
Smirnov (repeated) Tes Kruskall
Matched
Wallis
Tau Kendall
pairs Wald Woldfowitz

Pearson Product
1way Anova
1way Anova moment
Interval t- test t–test t–test (repeated)
Partial correlation
dan Rasio (1-sampel) (paired) (independen)
2way Anova Multiple
2way Anova correlation
(repeated)
Hal-38
39
INTERPRETASI DATA:
Sosek dan Pemberian ASI
Sosek Pemberian ASI
Ya Tidak
Rendah 80 20
Tinggi 120 180

Mana yang lebih tinggi angka pemberian ASI,


antara ibu sosek rendah dg sosek tinggi?

Ibu sosek tinggi lebih banyak yang memberikan ASI


(120 org) dibanding ibu sosek rendah (80 org) ??
INTERPRETASI DATA:
Sosek dan Pemberian ASI
Pemberian ASI Total
Sosek Ya Tidak
n % n %
Rendah 80 80.0 20 20.0 100
Tinggi 120 40.0 180 60.0 300
OR (95%CI) 6.0 (3.5--10.3)

Mana yang lebih tinggi angka pemberian ASI,


antara ibu sosek rendah dg sosek tinggi?

Jangan membandingkan angka absolut,


perbandingan harus dalam bentuk nilai %
Interpretesi Hasil Analisis

1. Interpretasikan nilai OR 1,5 untuk kelompok Tidak


sekolah
2. Interpretasikan nilai OR 1,5 untuk kelompok Tamat
SD
3. Mengapa nilai OR yang sama (1,5) tetapi nilai-p pada
kelompok Tidak sekolah tidak bermakna (0,133) dan
kelompok Tamat SD bermakna (0,018)?
Intervensi Fe
Perbandingan hasil uji
St.Gizi Ibu BBLR
Bivariat dg Multivariat
Sosek
Normal BBLR Bivariat Multivariat
Intervensi Fe n % n % OR Sig OR Sig
Ya 23 38.0 37 62.0
Tidak 36 60.0 24 40.0 0,41 0.014 6.7 0.000
St.Gizi
Baik 40 67.0 20 33.0
Kurang 19 32.0 41 68.0 4,30 0.000 10.7 0.000
Sosek
Tinggi 40 69.0 18 31.0
Rendah 19 31.0 43 69.0 5,00 0.000 8.1 0.000

(OR pd multivariat sudah dikontrol oleh pengaruh confounding)


(Catatan: uji interaksi belum dilakukan) 42
SIMPULAN
1. Statistik hanyalah alat (tools),
penggunaannya harus hati2 sesuai substansi

2.Signifikan secara statistik sangat dipengaruhi


oleh besar sampel.
Signifikan secara substansi LEBIH PENTING
3. Akurasi hasil riset sangat bergantung
pada TIADANYA BIAS (seleksi, pengukuran,
konfounding)
4.Pengukuran yg tidak utuh pd suatu riset
cenderung kesimpulannya tidak utuh pula

Hal-43
44

Hal-44

Anda mungkin juga menyukai