Anda di halaman 1dari 44

5/1/2009 1

DASAR PEMILIHAN UJI STATISTIK


Saptawati Bardosono
PENDAHULUAN
Pada setiap penelitian biasanya data dikumpulkan
untuk sejumlah besar variabel, sehingga dapat
menyulitkan pemilihan uji statistik yang sesuai
dan urutan penggunaannya
Pemilihan uji statistik perlu direncanakan sejak
5/1/2009 2
Pemilihan uji statistik perlu direncanakan sejak
awal penelitian, sehingga analisis data dapat
memaksimalkan kualitas dan interpretasi dari
temuan
Pemilihan uji statistik berdasar kepada jenis
rancangan penelitian yang ingin dianalisis
PENDAHULUAN
Manfaat dari perencanaan analisis:
1) Pedoman untuk menganalisis data
2) Membantu pada saat interpretasi dan
5/1/2009 3
2) Membantu pada saat interpretasi dan
melaporkan hasil penelitian
3) Menghasilkan analisis yang dapat
menjawab pertanyaan penelitian secara
jelas dan jujur
PERENCANAAN ANALISIS
UNTUK STUDI RCT
Sesuai dengan rincian pertanyaan penelitian
Perencanaannya meliputi:
1) Definisi operasional dari outcome primer
5/1/2009 4
1) Definisi operasional dari outcome primer
dan/atau sekunder
2) Metoda statistik yang akan digunakan
3) Pedoman untuk penyesuaian data dasar variabel
4) Bila perlu, analisis sub-kelompok
PERENCANAAN ANALISIS UNTUK
STUDI OBSERVASIONAL
Seringkali tidak memungkinkan untuk menyusun
perencanaan lengkap secara spesifik, namun
minimal berdasar pada hipotesis2 nya
Perencanaannya meliputi:
5/1/2009 5
Perencanaannya meliputi:
1) Definisi operasional dari variabel outcome dan
exposure
2) Variabel pengganggu dari hubungan antara
outcome-exposure
3) Bila perlu, analisis dari effect modifier
DATA CHECKING & EDITING
Harus dilakukan sebelum melakukan analisis data
Tahap 1 dengan memeriksa distribusi dari masing2
variabel:
Untuk data kategorik, pastikan data sesuai
5/1/2009 6
1) Untuk data kategorik, pastikan data sesuai
dengan kategori yang ada dan frekuensi dari
masing2 kategori masuk akal
2) Untuk data numerik, lakukan range check
(histogram) untuk mendapatkan data yang
ekstrim
DATA CHECKING & EDITING
Tahap 2 dengan melakukan consistency check
untuk memeriksa konsistensi kaitan antara
2 atau lebih variabel:
5/1/2009 7
1) Dengan cross-classification, contoh antara
seks dan paritas;
2) Dengan scatter plots, contoh antara BB
dengan umur atau BB dengan TB
DATA CHECKING & EDITING
Tindakan yang harus dilakukan:
1) Kesalahan harus diperbaiki dengan merujuk ke
data aslinya (kuesioner) atau diisi sebagai
missing value
5/1/2009 8
missing value
2) Bila datanya ekstrim tapi masih mungkin terjadi,
maka tidak perlu diganti
Lakukan checking untuk masing2 kelompok
perlakuan
ANALISIS AWAL
Distribusi dari masing2 variabel untuk:
Checking ulang bahwa kesalahan telah
diperbaiki
5/1/2009 9
diperbaiki
Lebih mengenal karakteristik dari populasi
yang diteliti
Lakukan analisis awal untuk masing2
kelompok perlakuan
SPESIFIKASI VARIABEL
UNTUK ANALISIS
Variabel2 dapat berperan lebih dari 1 dalam analisis
Perlu dilakukan identifikasi:
Variabel yang sudah diketahui sebagai
pengganggu hubungan antara outcome-exposure
5/1/2009 10
pengganggu hubungan antara outcome-exposure
Variabel lain yang mungkin menjadi
pengganggu nantinya
Variabel lain yang akan menjadi effect modifier
(yang dapat mengubah ukuran ataupun arah dari
hubungan outcome-exposure
REDUKSI DATA
Sebelum melakukan analisis data secara
formal, terkadang diperlukan untuk
membuat variabel baru dengan
mengelompokkan beberapa variabel asli
5/1/2009 11
mengelompokkan beberapa variabel asli
Untuk variabel exposure kategorik,
pengelompokkan diperlukan bila
kategorinya banyak, contoh: jenis
pekerjaan
REDUKSI DATA
2) Untuk variabel exposure numerik,
pengelompokkan diperlukan untuk:
Menggunakan metoda berdasarkan stratifikasi
Menggunakan metoda grafik untuk memeriksa
5/1/2009 12
Menggunakan metoda grafik untuk memeriksa
bagaimana outcome yang non-numerik berubah
pada setiap tingkatan exposure
Memeriksa adanya hubungan liniar antara
variabel exposure numerik dengan outcome non-
numerik
REDUKSI DATA
Untuk variabel exposure numerik,
pengelompokkan dapat dilakukan dengan:
Misalnya quintiles, untuk
5/1/2009 13
Misalnya quintiles, untuk
pengelompokkan menjadi 5
Cut-off points berdasarkan data dari
penelitian terdahulu atau standar normal
ANALISIS UNI-VARIABEL
Dilakukan crude association antara exposure dan outcome,
yaitu memeriksa hubungan antara outcome dengan
masing2 exposure tanpa menghiraukan variabel2 lain
dengan manfaat:
Memeriksa tabel atau grafik sederhana serta hubungan
5/1/2009 14
Memeriksa tabel atau grafik sederhana serta hubungan
yang merupakan informasi mengenai masing2 data
Dapat memberikan pemikiran awal mengenai masing2
variabel tsb yang mempunyai hubungan kuat dengan
outcome
Merupakan indikator penting pada saat dilakukan
analisis untuk mengontrol variabel pengganggu
ANALISIS VARIABEL PENGGANGGU
Untuk studi observasional mengontrol efek
variabel pengganggu merupakan fokus
utama analisis dengan:
5/1/2009 15
Metoda Mantel-Haenszel berdasarkan
stratifikasi
Modeling regresi
ANALISIS VARIABEL PENGGANGGU
Strategi memilih variabel pengganggu:
Membuat kerangka konsep untuk hubungan antara berbagai variabel
dengan variabel outcome sebagai gambaran dari teori yang ada dan arah
dari hubungan
Variabel yang sejak awal telah diketahui sebagai pengganggu harus
dikontrol dalam analisis
5/1/2009 16
dikontrol dalam analisis
Variabel pengganggu lainnya dapat ditemukan sebagai hasil analisis
eksplorasi:
a) variabel yang berhubungan dengan outcome dan exposure namun bukan
sebagai penyebab antara keduanya
b) berdasarkan data yang dianalisis dan pengetahuan yang ada serta setelah
memperhatikan arah dari hubungannya
4) Semua variabel yang berhubungan dengan outcome diikutkan dalam regresi
liniar ganda (cara stepwise), kecuali yang mempunyai hubungan sebagai
penyebab
ANALISIS UNTUK INTERAKSI
Ada tiga interaksi yang harus dibedakan:
Interaksi antara variabel pengganggu
Interaksi antara variabel pengganggu
5/1/2009 17
Interaksi antara variabel pengganggu
dengan variabel exposure yang diteliti
Interaksi antara exposure2 yang diteliti
ANALISIS YANG REPRODUKTIF
1. Masukkan file data mentah ke program
statistik, buat label untuk setiap variabel
supaya mudah diidentifikasi, check
5/1/2009 18
apakah data sesuai dengan nilainya, check
konsistensi antar variabel, buat variabel
baru dengan recoding atau penggabungan
variabel2 kemudian simpan data dalam
file baru
ANALISIS YANG REPRODUKTIF
2. Gunakan data dalam file baru untuk
memeriksa hubungan antara variabel
outcome dengan variabel2 exposure dan
5/1/2009 19
variabel pengganggu yang diteliti dengan
menggunakan tabel, grafik serta
melakukan analisis univariabel
ANALISIS YANG REPRODUKTIF
3. Gunakan uji Mantel-Haenszel dan analisis
regresi untuk mengetahui efek variabel
exposure yang dikontrol oleh variabel
5/1/2009 20
pengganggu potensial
4. Periksa interaksi antara variabel outcome,
exposure dan pengganggu
5. Buat tabel final untuk laporan penelitian
PERMASALAHAN PADA ANALISIS
DAN INTERPRETASI DATA
1. Multiple comparisons, menghubungkan semua variabel
yang ada di luar hipotesis = data dredging akan
mengakibatkan pelaporan hasil yang tidak benar/palsu
2. Subgroup analysis, kadang sangat menggoda untuk
mengembangkan hasil yang menarik bila hipotesis tak
5/1/2009 21
mengembangkan hasil yang menarik bila hipotesis tak
terbukti
3. Data-driven comparisons, sebaiknya tidak melakukan
pengelompokkan pada variabel exposure untuk
menghasilkan hubungan yang lebih bermakna dengan
variabel outcome
APA ITU STATISTIK
Statistik merupakan kegiatan untuk:
Mengumpulkan data
Meringkas/menyajikan data
5/1/2009 22
Menganalisis data dengan metoda tertentu
Menginterpretasi hasil analisis tersebut.
Ilmu statistik berguna untuk membantu dalam
pengambilan keputusan atas masalah tertentu.
MANFAAT STATISTIK
Memperkirakan rata2
Mengetahui hubungan antar variabel2
5/1/2009 23
Mengetahui hubungan antar variabel2
Mengetahui dampak suatu intervensi
Dsb
JENIS STATISTIK
Statistik deskriptif:
Berkaitan dengan
bagaimana data
dikumpulkan dan
Statistik inferensi:
Berkaitan dengan
analisis data dan
interpretasi hasil
5/1/2009 24
dikumpulkan dan
diringkas
interpretasi hasil
analisis tersebut
JENIS DATA
Data kualitatif:
Data yang dinyatakan dalam
bentuk bukan angka
Contoh: jenis pekerjaan,
Data kuantitatif:
Data yang dinyatakan dalam
bentuk angka
Contoh: usia, tinggi,
5/1/2009 25
Contoh: jenis pekerjaan,
status perkawinan, gender,
kepuasan, dll
Harus dikuantifikasikan
dengan skor atau ranking
Contoh: usia, tinggi,
penghasilan
JENIS DATA
Data berskala nominal: data yang diperoleh
dengan cara kategorisasi atau klasifikasi
Contoh: jenis pekerjaan,
5/1/2009 26
pegawai negeri, diberi tanda 1
pegawai swasta, diberi tanda 2
wiraswasta, diberi tanda 3
Cirinya: posisi setara dan tidak bisa dilakukan
operasi matematika
JENIS DATA
Data berskala ordinal: data yang diperoleh dengan
cara kategorisasi atau klasifikasi, tetapi di antara
data tsb terdapat hubungan
Contoh: kepuasan pelayanan,
sangat puas, diberi tanda 1
5/1/2009 27
puas, diberi tanda 2
cukup puas, diberi tanda 3
tidak puas, diberi tanda 4
sangat tidak puas, diberi tanda 5
Cirinya: posisi tidak setara dan tidak bisa dilakukan
operasi matematika
JENIS DATA
Data berskala interval: data yang diperoleh dengan
cara pengukuran, di mana jarak dua titik pada
skala sudah diketahui
Contoh: temperatur ruangan untuk air membeku dan
mendidih
5/1/2009 28
mendidih
Celcius pada 0 sampai 100, jarak 100
Fahrenheit pada 32 sampai 212, jarak 180
Cirinya: tidak ada kategorisasi dan bisa dilakukan
operasi matematika
JENIS DATA
Data berskala rasio: data yang diperoleh
dengan cara pengukuran, di mana jarak dua
titik pada skala sudah diketahui, dan
mempunyai titik 0 yang absolut
Contoh: jumlah buku di perpustakaan
5/1/2009 29
Contoh: jumlah buku di perpustakaan
jika 5, berarti ada 5 buku, jika 0, berarti
tidak ada buku sama sekali
Cirinya: tidak ada kategorisasi dan bisa
dilakukan operasi matematika
JENIS DATA VERSUS UJI STATISTIK
Jenis data akan mempengaruhi pemilihan
prosedur statistik yang akan digunakan:
Data kuantitatif akan menggunakan prosedur
5/1/2009 30
Data kuantitatif akan menggunakan prosedur
statistik parametrik;
Data kualitatif cenderung mengarah pada
statistik non-parametrik
Pengolahan Data Statistik
Statistik parametrik, berhubungan dengan
inferensi statistik yang membahas
parameter2 populasi, seperti rata2, proporsi,
5/1/2009 31
dll.
Cirinya: jenis data interval atau rasio, serta
distribusi data (populasi) adalah normal atau
mendekati normal
Pengolahan Data Statistik
Statistik non-parametrik, berhubungan dengan
inferensi statistik yang tidak membahas
parameter2 populasi
5/1/2009 32
Cirinya: jenis data nominal atau ordinal, serta
distribusi data (populasi) tidak diketahui
atau bisa disebut tidak normal
Pengolahan Data Statistik
Analisis univariat, di mana hanya ada satu
pengukuran (variabel) untuk n sampel
(Alat analisis: uji t, uji F< ANOVA dsb)
5/1/2009 33
(Alat analisis: uji t, uji F< ANOVA dsb)
Analisis multivariat, di mana ada dua atau
lebih pengukuran untuk n sampel
(Alat analisis: regresi, korelasi dsb)
Pemilihan uji statistik
Jumlah variabel
Analisis univariat Analisis multivariat
5/1/2009 34
Analisis univariat Analisis multivariat
Jenis data
Interval, rasio Nominal, ordinal
Statistik Parametrik Statistik Non-Parametrik
Pengolahan data kuantitatif
Data interval/rasio
Ukuran Variasi Bentuk
5/1/2009 35
Ukuran Variasi Bentuk
Mean
Median
Modus
Range
Varians
Standar deviasi
Koefisien variasi
Skweness
Kurtosis
Menguji normal tidaknya
distribusi data
Boxplot
Stem and Leaf
Kolmogorov-Smirnov
5/1/2009 36
Kolmogorov-Smirnov
Plot
Kurtosis dan skewness
Boxplot: jika MEDIAN terletak persis di
tengah boxplot, maka distribusi data adalah
normal
Nilai di atas garis adalah outlier atau nilai
ekstrem
Persentile (25) disebut HINGES
5/1/2009 37
Persentile (25) disebut HINGES
Persentile (50) atau MEDIAN
Persentile (75) disebut HINGES
Nilai di bawah garis ini adalah outlier atau
nilai ekstrem
Stem and leaf
Frequency Stem Leaf
1,00 4 0
5/1/2009 38
2,00 5 00
3,00 6 000
1,00 7 0
1,00 Extremes 10,0)
Kolmogorov-Smirnov dan Shapiro Wilk,
bila nilai signifikansi < 0,05 maka distribusi
adalah tidak normal
Kolmogorov-smirnov Shapiro-Wilk
Usia Statistik Df Sig. Statistik Df Sig
5/1/2009 39
Belum
menikah
0,176 35 0,008 0,926 35 0,033
Menikah 0,215 40 0,000 0,907 40 0,019
Plot
Normal Q-Q plot
Detrended Normal Q-Q
plot
5/1/2009 40
Data akan tersebar di
sekeliling garis
Sebagian besar data terpola
dekat garis tengah yang ada
Kurtosis dan skewness
Jika rasio kurtosis (keruncingan) dan
skewness (kemiringan) berada di antara 2
sampai dengan +2, maka distribusi data
5/1/2009 41
adalah normal
Rasio kurtosis = nilai kurtosis /SE kurtosis
Rasio skewness = nilai skewness / SE
skewness
Penyebaran Data
Distribusi data normal: mean dan standar
deviasi
Distribusi data tidak normal: median atau
mode
5/1/2009 42
mode
Persentil biasanya 10, 25, 50, 75, 90
Distribusi data: skewness (kemiringan) dan
kurtosis (keruncingan)
Deskripsi data: rata2, SD, varians, range
Analisis statistik (inferensi)
Digunakan untuk estimasi nilai suatu
parameter populasi dan uji hipotesis statistik
(Ho/Hi, signifikansi, uji satu/dua sisi,
5/1/2009 43
statistik tabel/uji)
Bagan statistik inferensi
Statistik Parametrik
Satu populasi Dua populasi
atau lebih
Jumlah sampel
5/1/2009 44
Uji Z
Uji t
Uji Z
Uji t
ANOVA/
Uji F
Bebas
Uji t berpasangan
Berhubungan
Hubungan
antar sample
atau lebih

Anda mungkin juga menyukai