Saptawati Bardosono PENDAHULUAN Pada setiap penelitian biasanya data dikumpulkan untuk sejumlah besar variabel, sehingga dapat menyulitkan pemilihan uji statistik yang sesuai dan urutan penggunaannya Pemilihan uji statistik perlu direncanakan sejak 5/1/2009 2 Pemilihan uji statistik perlu direncanakan sejak awal penelitian, sehingga analisis data dapat memaksimalkan kualitas dan interpretasi dari temuan Pemilihan uji statistik berdasar kepada jenis rancangan penelitian yang ingin dianalisis PENDAHULUAN Manfaat dari perencanaan analisis: 1) Pedoman untuk menganalisis data 2) Membantu pada saat interpretasi dan 5/1/2009 3 2) Membantu pada saat interpretasi dan melaporkan hasil penelitian 3) Menghasilkan analisis yang dapat menjawab pertanyaan penelitian secara jelas dan jujur PERENCANAAN ANALISIS UNTUK STUDI RCT Sesuai dengan rincian pertanyaan penelitian Perencanaannya meliputi: 1) Definisi operasional dari outcome primer 5/1/2009 4 1) Definisi operasional dari outcome primer dan/atau sekunder 2) Metoda statistik yang akan digunakan 3) Pedoman untuk penyesuaian data dasar variabel 4) Bila perlu, analisis sub-kelompok PERENCANAAN ANALISIS UNTUK STUDI OBSERVASIONAL Seringkali tidak memungkinkan untuk menyusun perencanaan lengkap secara spesifik, namun minimal berdasar pada hipotesis2 nya Perencanaannya meliputi: 5/1/2009 5 Perencanaannya meliputi: 1) Definisi operasional dari variabel outcome dan exposure 2) Variabel pengganggu dari hubungan antara outcome-exposure 3) Bila perlu, analisis dari effect modifier DATA CHECKING & EDITING Harus dilakukan sebelum melakukan analisis data Tahap 1 dengan memeriksa distribusi dari masing2 variabel: Untuk data kategorik, pastikan data sesuai 5/1/2009 6 1) Untuk data kategorik, pastikan data sesuai dengan kategori yang ada dan frekuensi dari masing2 kategori masuk akal 2) Untuk data numerik, lakukan range check (histogram) untuk mendapatkan data yang ekstrim DATA CHECKING & EDITING Tahap 2 dengan melakukan consistency check untuk memeriksa konsistensi kaitan antara 2 atau lebih variabel: 5/1/2009 7 1) Dengan cross-classification, contoh antara seks dan paritas; 2) Dengan scatter plots, contoh antara BB dengan umur atau BB dengan TB DATA CHECKING & EDITING Tindakan yang harus dilakukan: 1) Kesalahan harus diperbaiki dengan merujuk ke data aslinya (kuesioner) atau diisi sebagai missing value 5/1/2009 8 missing value 2) Bila datanya ekstrim tapi masih mungkin terjadi, maka tidak perlu diganti Lakukan checking untuk masing2 kelompok perlakuan ANALISIS AWAL Distribusi dari masing2 variabel untuk: Checking ulang bahwa kesalahan telah diperbaiki 5/1/2009 9 diperbaiki Lebih mengenal karakteristik dari populasi yang diteliti Lakukan analisis awal untuk masing2 kelompok perlakuan SPESIFIKASI VARIABEL UNTUK ANALISIS Variabel2 dapat berperan lebih dari 1 dalam analisis Perlu dilakukan identifikasi: Variabel yang sudah diketahui sebagai pengganggu hubungan antara outcome-exposure 5/1/2009 10 pengganggu hubungan antara outcome-exposure Variabel lain yang mungkin menjadi pengganggu nantinya Variabel lain yang akan menjadi effect modifier (yang dapat mengubah ukuran ataupun arah dari hubungan outcome-exposure REDUKSI DATA Sebelum melakukan analisis data secara formal, terkadang diperlukan untuk membuat variabel baru dengan mengelompokkan beberapa variabel asli 5/1/2009 11 mengelompokkan beberapa variabel asli Untuk variabel exposure kategorik, pengelompokkan diperlukan bila kategorinya banyak, contoh: jenis pekerjaan REDUKSI DATA 2) Untuk variabel exposure numerik, pengelompokkan diperlukan untuk: Menggunakan metoda berdasarkan stratifikasi Menggunakan metoda grafik untuk memeriksa 5/1/2009 12 Menggunakan metoda grafik untuk memeriksa bagaimana outcome yang non-numerik berubah pada setiap tingkatan exposure Memeriksa adanya hubungan liniar antara variabel exposure numerik dengan outcome non- numerik REDUKSI DATA Untuk variabel exposure numerik, pengelompokkan dapat dilakukan dengan: Misalnya quintiles, untuk 5/1/2009 13 Misalnya quintiles, untuk pengelompokkan menjadi 5 Cut-off points berdasarkan data dari penelitian terdahulu atau standar normal ANALISIS UNI-VARIABEL Dilakukan crude association antara exposure dan outcome, yaitu memeriksa hubungan antara outcome dengan masing2 exposure tanpa menghiraukan variabel2 lain dengan manfaat: Memeriksa tabel atau grafik sederhana serta hubungan 5/1/2009 14 Memeriksa tabel atau grafik sederhana serta hubungan yang merupakan informasi mengenai masing2 data Dapat memberikan pemikiran awal mengenai masing2 variabel tsb yang mempunyai hubungan kuat dengan outcome Merupakan indikator penting pada saat dilakukan analisis untuk mengontrol variabel pengganggu ANALISIS VARIABEL PENGGANGGU Untuk studi observasional mengontrol efek variabel pengganggu merupakan fokus utama analisis dengan: 5/1/2009 15 Metoda Mantel-Haenszel berdasarkan stratifikasi Modeling regresi ANALISIS VARIABEL PENGGANGGU Strategi memilih variabel pengganggu: Membuat kerangka konsep untuk hubungan antara berbagai variabel dengan variabel outcome sebagai gambaran dari teori yang ada dan arah dari hubungan Variabel yang sejak awal telah diketahui sebagai pengganggu harus dikontrol dalam analisis 5/1/2009 16 dikontrol dalam analisis Variabel pengganggu lainnya dapat ditemukan sebagai hasil analisis eksplorasi: a) variabel yang berhubungan dengan outcome dan exposure namun bukan sebagai penyebab antara keduanya b) berdasarkan data yang dianalisis dan pengetahuan yang ada serta setelah memperhatikan arah dari hubungannya 4) Semua variabel yang berhubungan dengan outcome diikutkan dalam regresi liniar ganda (cara stepwise), kecuali yang mempunyai hubungan sebagai penyebab ANALISIS UNTUK INTERAKSI Ada tiga interaksi yang harus dibedakan: Interaksi antara variabel pengganggu Interaksi antara variabel pengganggu 5/1/2009 17 Interaksi antara variabel pengganggu dengan variabel exposure yang diteliti Interaksi antara exposure2 yang diteliti ANALISIS YANG REPRODUKTIF 1. Masukkan file data mentah ke program statistik, buat label untuk setiap variabel supaya mudah diidentifikasi, check 5/1/2009 18 apakah data sesuai dengan nilainya, check konsistensi antar variabel, buat variabel baru dengan recoding atau penggabungan variabel2 kemudian simpan data dalam file baru ANALISIS YANG REPRODUKTIF 2. Gunakan data dalam file baru untuk memeriksa hubungan antara variabel outcome dengan variabel2 exposure dan 5/1/2009 19 variabel pengganggu yang diteliti dengan menggunakan tabel, grafik serta melakukan analisis univariabel ANALISIS YANG REPRODUKTIF 3. Gunakan uji Mantel-Haenszel dan analisis regresi untuk mengetahui efek variabel exposure yang dikontrol oleh variabel 5/1/2009 20 pengganggu potensial 4. Periksa interaksi antara variabel outcome, exposure dan pengganggu 5. Buat tabel final untuk laporan penelitian PERMASALAHAN PADA ANALISIS DAN INTERPRETASI DATA 1. Multiple comparisons, menghubungkan semua variabel yang ada di luar hipotesis = data dredging akan mengakibatkan pelaporan hasil yang tidak benar/palsu 2. Subgroup analysis, kadang sangat menggoda untuk mengembangkan hasil yang menarik bila hipotesis tak 5/1/2009 21 mengembangkan hasil yang menarik bila hipotesis tak terbukti 3. Data-driven comparisons, sebaiknya tidak melakukan pengelompokkan pada variabel exposure untuk menghasilkan hubungan yang lebih bermakna dengan variabel outcome APA ITU STATISTIK Statistik merupakan kegiatan untuk: Mengumpulkan data Meringkas/menyajikan data 5/1/2009 22 Menganalisis data dengan metoda tertentu Menginterpretasi hasil analisis tersebut. Ilmu statistik berguna untuk membantu dalam pengambilan keputusan atas masalah tertentu. MANFAAT STATISTIK Memperkirakan rata2 Mengetahui hubungan antar variabel2 5/1/2009 23 Mengetahui hubungan antar variabel2 Mengetahui dampak suatu intervensi Dsb JENIS STATISTIK Statistik deskriptif: Berkaitan dengan bagaimana data dikumpulkan dan Statistik inferensi: Berkaitan dengan analisis data dan interpretasi hasil 5/1/2009 24 dikumpulkan dan diringkas interpretasi hasil analisis tersebut JENIS DATA Data kualitatif: Data yang dinyatakan dalam bentuk bukan angka Contoh: jenis pekerjaan, Data kuantitatif: Data yang dinyatakan dalam bentuk angka Contoh: usia, tinggi, 5/1/2009 25 Contoh: jenis pekerjaan, status perkawinan, gender, kepuasan, dll Harus dikuantifikasikan dengan skor atau ranking Contoh: usia, tinggi, penghasilan JENIS DATA Data berskala nominal: data yang diperoleh dengan cara kategorisasi atau klasifikasi Contoh: jenis pekerjaan, 5/1/2009 26 pegawai negeri, diberi tanda 1 pegawai swasta, diberi tanda 2 wiraswasta, diberi tanda 3 Cirinya: posisi setara dan tidak bisa dilakukan operasi matematika JENIS DATA Data berskala ordinal: data yang diperoleh dengan cara kategorisasi atau klasifikasi, tetapi di antara data tsb terdapat hubungan Contoh: kepuasan pelayanan, sangat puas, diberi tanda 1 5/1/2009 27 puas, diberi tanda 2 cukup puas, diberi tanda 3 tidak puas, diberi tanda 4 sangat tidak puas, diberi tanda 5 Cirinya: posisi tidak setara dan tidak bisa dilakukan operasi matematika JENIS DATA Data berskala interval: data yang diperoleh dengan cara pengukuran, di mana jarak dua titik pada skala sudah diketahui Contoh: temperatur ruangan untuk air membeku dan mendidih 5/1/2009 28 mendidih Celcius pada 0 sampai 100, jarak 100 Fahrenheit pada 32 sampai 212, jarak 180 Cirinya: tidak ada kategorisasi dan bisa dilakukan operasi matematika JENIS DATA Data berskala rasio: data yang diperoleh dengan cara pengukuran, di mana jarak dua titik pada skala sudah diketahui, dan mempunyai titik 0 yang absolut Contoh: jumlah buku di perpustakaan 5/1/2009 29 Contoh: jumlah buku di perpustakaan jika 5, berarti ada 5 buku, jika 0, berarti tidak ada buku sama sekali Cirinya: tidak ada kategorisasi dan bisa dilakukan operasi matematika JENIS DATA VERSUS UJI STATISTIK Jenis data akan mempengaruhi pemilihan prosedur statistik yang akan digunakan: Data kuantitatif akan menggunakan prosedur 5/1/2009 30 Data kuantitatif akan menggunakan prosedur statistik parametrik; Data kualitatif cenderung mengarah pada statistik non-parametrik Pengolahan Data Statistik Statistik parametrik, berhubungan dengan inferensi statistik yang membahas parameter2 populasi, seperti rata2, proporsi, 5/1/2009 31 dll. Cirinya: jenis data interval atau rasio, serta distribusi data (populasi) adalah normal atau mendekati normal Pengolahan Data Statistik Statistik non-parametrik, berhubungan dengan inferensi statistik yang tidak membahas parameter2 populasi 5/1/2009 32 Cirinya: jenis data nominal atau ordinal, serta distribusi data (populasi) tidak diketahui atau bisa disebut tidak normal Pengolahan Data Statistik Analisis univariat, di mana hanya ada satu pengukuran (variabel) untuk n sampel (Alat analisis: uji t, uji F< ANOVA dsb) 5/1/2009 33 (Alat analisis: uji t, uji F< ANOVA dsb) Analisis multivariat, di mana ada dua atau lebih pengukuran untuk n sampel (Alat analisis: regresi, korelasi dsb) Pemilihan uji statistik Jumlah variabel Analisis univariat Analisis multivariat 5/1/2009 34 Analisis univariat Analisis multivariat Jenis data Interval, rasio Nominal, ordinal Statistik Parametrik Statistik Non-Parametrik Pengolahan data kuantitatif Data interval/rasio Ukuran Variasi Bentuk 5/1/2009 35 Ukuran Variasi Bentuk Mean Median Modus Range Varians Standar deviasi Koefisien variasi Skweness Kurtosis Menguji normal tidaknya distribusi data Boxplot Stem and Leaf Kolmogorov-Smirnov 5/1/2009 36 Kolmogorov-Smirnov Plot Kurtosis dan skewness Boxplot: jika MEDIAN terletak persis di tengah boxplot, maka distribusi data adalah normal Nilai di atas garis adalah outlier atau nilai ekstrem Persentile (25) disebut HINGES 5/1/2009 37 Persentile (25) disebut HINGES Persentile (50) atau MEDIAN Persentile (75) disebut HINGES Nilai di bawah garis ini adalah outlier atau nilai ekstrem Stem and leaf Frequency Stem Leaf 1,00 4 0 5/1/2009 38 2,00 5 00 3,00 6 000 1,00 7 0 1,00 Extremes 10,0) Kolmogorov-Smirnov dan Shapiro Wilk, bila nilai signifikansi < 0,05 maka distribusi adalah tidak normal Kolmogorov-smirnov Shapiro-Wilk Usia Statistik Df Sig. Statistik Df Sig 5/1/2009 39 Belum menikah 0,176 35 0,008 0,926 35 0,033 Menikah 0,215 40 0,000 0,907 40 0,019 Plot Normal Q-Q plot Detrended Normal Q-Q plot 5/1/2009 40 Data akan tersebar di sekeliling garis Sebagian besar data terpola dekat garis tengah yang ada Kurtosis dan skewness Jika rasio kurtosis (keruncingan) dan skewness (kemiringan) berada di antara 2 sampai dengan +2, maka distribusi data 5/1/2009 41 adalah normal Rasio kurtosis = nilai kurtosis /SE kurtosis Rasio skewness = nilai skewness / SE skewness Penyebaran Data Distribusi data normal: mean dan standar deviasi Distribusi data tidak normal: median atau mode 5/1/2009 42 mode Persentil biasanya 10, 25, 50, 75, 90 Distribusi data: skewness (kemiringan) dan kurtosis (keruncingan) Deskripsi data: rata2, SD, varians, range Analisis statistik (inferensi) Digunakan untuk estimasi nilai suatu parameter populasi dan uji hipotesis statistik (Ho/Hi, signifikansi, uji satu/dua sisi, 5/1/2009 43 statistik tabel/uji) Bagan statistik inferensi Statistik Parametrik Satu populasi Dua populasi atau lebih Jumlah sampel 5/1/2009 44 Uji Z Uji t Uji Z Uji t ANOVA/ Uji F Bebas Uji t berpasangan Berhubungan Hubungan antar sample atau lebih