Statistik Dasar
Statistik Dasar
0 1 2 3
• Judul:
• Variabel, indikator, metode (valid)
• Rancangan (observasi,
eksperimental)
Proposal dan Statistik
• Latar Belakang:
• Situation (S) besarnya masalah
• Problems (P) masalah terkait (faktor
dan akibat)
• Questions (Q) hal2 terkait yang masih
diperdebatkan sehingga perlu penelitian
lebih lanjut (variabel di tujuan dan
kerangka konsep)
• Response (R) apa yang akan
dilakukan untuk mengatas Q
(rancangan)
Proposal dan Statistik
• Tujuan:
• Sebaran variabel (univariat)
• Hubungan variabel (bivariat
dan/atau multivariat)
• Jumlah sampel
• Intervensi dan waktu
Proposal dan Statistik
• Tinjauan Pustaka:
• Kerangka teori
• Kerangka konsep (variabel dan
hubungan2nya):
• Variabel
• Indikator
• Parameter
Proposal dan Statistik
• Metode:
• Batasan operasional variabel:
• Definisi variabel di penelitian ini
• Cara ukur (validitas)
• Alat ukur (validitas)
• Hasil ukur (skala data)
Pelaksanaan Riset
dan Statistik
• Tatalaksana Data:
• Pencatatan
• Editing
• Koding
Pelaporan dan Statistik
• Tatalaksana Data:
• Data entry lembar kerja
• Data cleaning
• Data analisis:
• Manual
• Software SAS, Stata, Epi-info, SPSS
Pelaporan dan Statistik
• Analisis Data:
• Univariat skala data kategorik
atau numerik (deskriptif)
• Bivariat uji parametrik dan uji
non-parametrik (inferensial)
• Multivariat multivariabel,
multiukuran, multikategori
(statistik lanjut)
Skala Data
• Kategorik:
• Nominal
• Ordinal
• Numerik:
• Interval
• Rasio
PEMILIHAN UJI STATISTIK
Apa itu Statistik?
Statistik Statistik
deskriptif inferensial
Uji Statistik
• Contoh:
1. Ingin diketahui apakah rerata berat
badan bayi baru lahir di daerah
perkotaan lebih tinggi dari rerata
berat badan bayi yang lahir di
pedesaan
• MENJAWAB TUJUAN
PENELITIAN:
• DIKETAHUINYA SEBARAN
SUBYEK PENELITIAN
BERDASARKAN KARAKTERISTIK
DEMOGRAFI MELIPUTI:
• USIA
• JENIS KELAMIN
• TINGKAT PENDIDIKAN
ANALISIS UNIVARIAT
• USIA:
• SKALA DATA KONTINYU
• UJI NORMALITAS DATA DENGAN:
− NILAI MEAN = MEDIAN
− COEFFICIENT OF VARIANCE
(SD/MEAN*100%) <20%
− KURTOSIS/SE DAN SKEWNESS/SE = -2
SAMPAI +2
− GAMBARAN HISTOGRAM, DATA SESUAI
KURVA NORMAL
− UJI K-S ATAU S-W, NILAI KEMAKNAAN P
>0,05
ANALISIS UNIVARIAT
• USIA:
• SKALA DATA KONTINYU
• DISTRIBUSI NORMAL, DATA
DISAJIKAN SEBAGAI NILAI MEAN
(SD), DAN
• TIDAK BERDISTRIBUSI NORMAL,
DATA DISAJIKAN SEBAGAI NILAI
MEDIAN (MINIMUM-MAKSIMUM)
ANALISIS UNIVARIAT
• USIA:
• SKALA DATA KATEGORI, DATA
DISAJIKAN SEBAGAI SEBARAN
FREKUENSI n (%)
• (SKRT, 2004)
• USIA 25-34 TAHUN
• USIA 35-44 TAHUN
• USIA 45-55 TAHUN
ANALISIS UNIVARIAT
• JENIS KELAMIN:
• SKALA DATA KATEGORI, DATA
DISAJIKAN SEBAGAI SEBARAN
FREKUENSI n (%)
• LAKI-LAKI
• PEREMPUAN
ANALISIS UNIVARIAT
• PENDIDIKAN:
• SKALA DATA KATEGORI, DATA
DISAJIKAN SEBAGAI SEBARAN
FREKUENSI n (%)
• RENDAH
• SEDANG
• TINGGI
ANALISIS BIVARIAT
• MENJAWAB TUJUAN
PENELITIAN:
• DIKETAHUINYA KORELASI
ANTARA TINGGI BADAN
DENGAN BERAT BADAN
• TB: DATA KONTINYU
• BB: DATA KONTINYU
• CEK NORMALITAS SEBARAN DATA
− NORMAL: KORELASI PEARSON
− TIDAK NORMAL: KORELASI RANK-
SPEARMAN
ANALISIS BIVARIAT
• MENJAWAB TUJUAN
PENELITIAN:
• DIKETAHUINYA KORELASI
ANTARA TINGGI BADAN
DENGAN BERAT BADAN
• LAPORKAN:
− KEKUATAN KORELASI (COEFFICIENT
CORRELATION)
− KEMAKNAAN KORELASI
− PERSAMAAN KORELASI
ANALISIS BIVARIAT
• MENJAWAB TUJUAN
PENELITIAN:
• DIKETAHUINYA HUBUNGAN
ANTARA STATUS GIZI DENGAN
JENIS KELAMIN
• DATA KATEGORIK
• CHI-SQUARE:
− MEMENUHI PERSYARATAN?
− KEMAKNAAN P?
− INTERPRETASI?
ANALISIS BIVARIAT
• MENJAWAB TUJUAN
PENELITIAN:
• DIKETAHUINYA BEDA RERATA IMT
BERDASARKAN JENIS KELAMIN
• IMT: DATA KONTINYU (DISTRIBUSI?)
• JENIS KELAMIN: DATA KATEGORIK
• TES-T TIDAK BERPASANGAN ATAU
MANN-WHITNEY
− KEMAKNAAN P?
− INTERPRETASI?
ANALISIS BIVARIAT
• MENJAWAB TUJUAN
PENELITIAN:
• DIKETAHUINYA BEDA RERATA IMT
AWAL DAN IMT SAAT INI
• IMT: DATA KONTINYU (DISTRIBUSI?)
• TES-T BERPASANGAN ATAU
WILCOXON :
− KEMAKNAAN P?
− INTERPRETASI?
ANALISIS BIVARIAT
• MENJAWAB TUJUAN
PENELITIAN:
• DIKETAHUINYA BEDA RERATA IMT
DENGAN LEBIH DARI 2 TINGKATAN
KATEGORI
• IMT: DATA KONTINYU (DISTRIBUSI?)
• TEST ANOVA ATAU KRUSKAL-WALLIS :
− KEMAKNAAN P?
− INTERPRETASI?
Memilih uji statistik untuk 2
kelompok
Skala Tidak berkaitan Berkaitan Korelasi dan
pengukuran regresi
Numerik
Uji Anova Uji Anova related
• Contoh 1:
Secara acak dipilih 50 mahasiswa
dan 50 mahasiswi FKUI dan
ditimbang berat badannya.
Ternyata rerata BB mahasiswa
ialah 60 kg dan mahasiswi ialah
50 kg. Jadi ada perbedaan rerata
BB badan sebesar 10 kg. Setelah
dihitung ternyata p=0.03. Apa
artinya ini?
Arti nilai p
Jawab:
Artinya hanya ada kemungkinan
sebesar 3% bahwa perbedaan
rerata berat badan sebesar 10 kg
itu terjadi karena faktor kebetulan.
Jadi Ho ditolak (karena sudah
ditetapkan sebelumnya oleh
peneliti bahwa batas
kemaknaannya ialah < 0.05 atau
5%)
Arti nilai p
• Contoh 2:
Secara acak dipilih 50 mahasiswa
dan 50 mahasiswi FKUI dan
ditimbang berat badannya.
Ternyata rerata BB mahasiswa
ialah 60 kg dan mahasiswi ialah
59.5 kg. Jadi ada perbedaan
rerata BB badan sebesar 0.5 kg.
Setelah dihitung ternyata p=0.15.
Apa artinya ini?
Arti nilai p
Jawab:
Artinya ada kemungkinan sebesar 15% bahwa
perbedaan rerata berat badan sebesar 0.5 kg itu
terjadi karena faktor kebetulan.
Jadi Ho diterima (karena sudah ditetapkan batas
kemaknaannya ialah < 0.05 atau 5%). D.p.l. rerata
berat badan kedua kelompok itu dianggap tidak
berbeda bermakna.
Contoh:
Secara acak dipilih 50 mahasiswa dan 50 mahasiswi
FKUI dan masing2 ditimbang berat badannya. Ternyata
rerata berat badan mahasiswa ialah 60 kg dan
mahasiswi ialah 50 kg. Jadi ada perbedaan rerata berat
badan sebesar 10 kg dengan p = 0.03 dan 95% CI ialah
antara 3 -17 kg. Artinya dengan keyakinan 95% dapat di
perkirakan bahwa perbedaan rerata berat badan yang
sesungguhnya dalam populasi terletak antara 3 -17 kg.
Arti 95% Confidence Interval
(CI)(2)
• Bila 95% CI melintasi angka 0 →
berarti perbedaan tidak bermakna
Contoh:
• Bila perbedaan rerata berat badan
sebesar 10 kg tadi mempunyai 95%
CI ialah antara -2 - 14 kg artinya
dengan perbedaan rerata berat
badan yang sesungguhnya dalam
populasi masih mungkin 0 kg tidak
ada perbedaan bermakna
Kesalahan tipe 1 dan
kesalahan tipe 2 dalam
statistik (1)
Dalam menganalisis ada/tidaknya perbedaan
bermakna antara 2 kelompok, dapat dibuat 2 macam
kesalahan:
• Kesalahan tipe 1 (= type-1 error): kesalahan hasil uji
statistik yang menyatakan ada perbedaan bermakna
antara 2 kelompok tapi sebenarnya tidak ada (false
positive) yang diberi simbol . Nilai yang lazim
diambil ialah 0.05 yang berarti bahwa peneliti
bersedia menerima risiko mendapat hasil positif
semu (terjadi karena faktor kebetulan) sebesar 5%
(2-tailed)
• untuk analisis statistiknya Nilai adalah identik
dengan p
Kesalahan tipe 1 dan
kesalahan tipe 2 dalam
statistik (2)
• Kesalahan tipe 2 (= type-2 error): kesalahan hasil uji
statistik yang menyatakan bahwa tidak ada
perbedaan bermakna antara 2 kelompok tapi
sebenarnya ada (false negative) yang diberi simbol β.
Nilai β yang lazim diambil ialah 0.1 atau 0.2 yang
berarti bahwa peneliti bersedia menerima risiko
mendapat hasil negatif semu (terjadi karena faktor
kebetulan) untuk analisis statistiknya sebesar 10
atau 20% (1-tailed).
Power dari suatu uji statistik ialah 1- β dan
dinyatakan dalam %.
Kesalahan tipe 1 dan
kesalahan tipe 2 dalam
statistik (3)
Mengapa seorang peneliti harus
menetapkan nilai dan β dalam upaya
mengetahui ada/tidaknya perbedaan
rerata antara 2 kelompok?
Untuk:
1. Menetapkan suatu batas di mana
peneliti bersedia menerima
kemungkinan mendapat hasil positif
semu (terjadi secara kebetulan) untuk
analisis statistik yang akan dilakukan
(). Batas nilai ini biasanya diambil <
5%.
Kesalahan tipe 1 dan
kesalahan tipe 2 dalam
statistik (4)
2. Menetapkan suatu batas di mana ia
bersedia menerima kemungkinan
mendapat hasil negatif semu (yang
terjadi secara kebetulan) untuk
analisis statistik yang akan dilakukan
(β). Batas ini β biasanya diambil < 10
atau < 20%.
3. Butir 1 + 2 digunakan dalam
penentuan besar sampel
Batas kemaknaan
(significance level)
Definisi:
Batas Kemaknaan (= nilai p) ialah angka
yang ditetapkan oleh peneliti
(dinyatakan dalam %) yang menyatakan
besarnya risiko yang bersedia diterima
oleh peneliti untuk menerima suatu hasil
positif semu (menolak Ho padahal Ho itu
benar).
Batas kemaknaan
(significance level)
Contoh:
Dalam merencanakan penelitian untuk
mengetahui apakah ibu hamil yang
makan hematinik mempunyai rerata
kadar hemoglobin yang lebih tinggi dari
ibu hamil yang tidak makan hematinik,
maka kita merencanakan mengambil
sampel masing-masing 50 dari kedua
kelompok. Lalu kita menyatakan bahwa
perbedaan dianggap bermakna bila
p<0.05
Batas kemaknaan
(significance level)
Artinya:
Kita bersedia menerima risiko mendapat hasil positif
semu (terjadi secara kebetulan) tidak lebih dari 5%
Cara:
1. Tentukan dulu batas kemaknaan nilai p ( biasanya <
0.05)
2. Kemudian hitung nilai p dengan uji statistik yang
sesuai (misalnya dengan t test)
3. Lalu tentukan apakah nilai p yang didapat itu lebih
kecil atau lebih besar dari 0.05. Bila nilai p yang
dihitung itu <0.05 berarti perbedaan itu dianggap
bermakna secara statistik, sebaliknya dianggap
tidak
Kesalahan yang sering
dilakukan dalam
penggunaan statistik
• Melakukan untuk uji statistik yang tidak
direncanakan sebelumnya (data fishing = data
dredging)
• Tidak menetapkan besar sampel sebelum penelitian
dimulai
• Memilih uji statistik yang tidak sesuai dengan skala
pengukuran
Contoh: menggunakan uji t untuk data yang
menggunakan skala ordinal
• Melakukan uji statistik tanpa memenuhi persyaratan
Contoh: menggunakan uji t untuk data yang
distribusinya tidak normal
Rencana Perkuliahan:
Pengantar Pengantar