Anda di halaman 1dari 10

BAB 15 MENGANALISIS DATA

Bab ini dimaksudkan untuk memberikan kenyamanan bagi para peneliti klinis
baru yang tidak ahli statistik. Sebagai bukan ahli statistik yang telah melakukan
semua penelitian, kita di posisi sebagai bagian dari tim kolaboratif yang terlatih,
berpengalaman, dan ahli statistik sangat kompeten. Bagaimanapun, kita
memainkan peran kunci dalam perencanaan analisis studi kita sendiri. Untuk
melakukannya dengan baik, kita harus memahami konsep dasar analisis.
Sebaiknya kita telah mengikuti satu atau lebih program pengantar statistik dan
telah berkonsultasi pengantar uji statistik agar tidak asing terhadap konsep-konsep
dasar.

15.1.

PERMULAAN SEDERHANA
Idealnya, kita telah mempersiapkan "rancangan tabel" ketika kita
merancang penelitian, dan sekarang kita dapat menempatkan data
penelitian dalam tabel ini untuk memberikan "gambaran" dari apa yang
telah kita temukan. Bahkan jika kita tidak mempersiapkan tabel selama
tahap usulan proyek, sekarang adalah waktu untuk melakukannya,
berdasarkan kekuatan pertanyaan penelitian kita. Untuk tabel ini kita harus
menambahkan ukuran pemusatan (yaitu, mean dan median) dan dispersi
(yaitu, range, standar deviasi, dan range antar-kuartil), dan tabulasi silang.
Tampilan data (yaitu, scatterplots dan histogram) sangat berguna dalam
membantu kita memahami data dengan baik. Semakin baik kita
memahami data dari sudut pandang deskriptif, semakin kecil kemungkinan
untuk membuat kesalahan.

15.2.

CARA MENJADI MITRA YANG BAIK BAGI

KOLEGA

AHLI

STATISTIK
Sebagai peneliti klinis, kita harus memiliki keahlian statistitik.
Beberapa berpendapat bahwa menggunakan program statistik yang
canggih dan belajar untuk menganalisis akan sangat membantu (yang

paling umum digunakan, SPSS lebih mudah untuk belajar, SAS, program
yang lebih sulit, lebih digunakan oleh para profesional).
Bagaimana kita mengoptimalkan pembelajaran statistik? Pertama,
ktia harus bekerja dengan kolega ahli statistik yang tidak hanya kompeten
tetapi juga siap membantu dalam pendidikan kita. Mereka harus guru yang
baik, ramah, dan mampu menjawab pertanyaan kita dan menjelaskan
pemikiran di balik pilihan teknik analitik mereka. Kita akan melakukan
yang terbaik dengan menjadi ingin tahu dan gigih dalam belajar sebanyak
yang kita dapatkan dari setiap tantangan analitik yang kita hadapi. Kedua,
kita dapat menambahkan "kemampuan pemahaman konseptual yang baik
dari pendekatan statistik" untuk kualitas yang kita mencari dalam
pencarian mentor penelitian klinis yang ideal.

15.3.

TIDAK ADA YANG TERBAIK


Peneliti baru mungkin menganggap bahwa ada satu pendekatan
terbaik untuk masalah analitik. Ini adalah paham yang keliru. Ada banyak
hal yang harus kita pelajari. Pertama, setelah kita mendapatkan
pemahaman tentang konsep dasar, bahkan jika kita belum pernah
melakukan analisis SAS atau SPSS, kita tidak harus malu menawarkan
pendapat kita dan terlibat dalam diskusi dengan rekan-rekan statistik.
Kedua, tidak ada satu cara yang benar atau terbaik dari melakukan analisis
(walaupun ada cara yang salah). Jika kita merasa tidak nyaman dengan apa
yang rekan statistik kita sarankan, kita perlu bertanya kembali. Ketiga,
sering mencari informasi cara untuk menjalankan analisis menggunakan
lebih dari satu strategi. Menemukan hasil yang sama akan meningkatkan
kepercayaan diri kita di setiap alternatif cara. Keempat, kita dan rekan
statistik harus siap untuk menanggapi pengamat statistik yang memiliki
ide sendiri tentang pendekatan analisis terbaiknya.

15.4.

TIDAK ADA YANG MUDAH


Bahkan pengalaman selama satu dekade atau lebih, kami terkejut
melihat seberapa sering sebuah studi baru yang berbeda di beberapa jalan

(kadang-kadang minor) dari proyek-proyek sebelumnya. Ini menjadi


tantangan yang cukup besar dalam menentukan pendekatan yang optimal
untuk analisis. Kita akhirnya akan menemukan tantangan baru dalam
memutuskan pendekatan analitik yang optimal dan kebutuhan untuk
mengembangkan pendekatan baru. Terkadang minoritas analisis cenderung
benar-benar mudah, tetapi kami mengantisipasi kebutuhan untuk
kolaborasi statistik yang tetap berkualitas tinggi.

15.5.

RAGU-RAGU
Meskipun semua kolega ahli statistik telah bekerja sangat baik,
kesalahan dan kesalahpahaman adalah hal yang tidak biasa. Kolega ahli
statistik kita mungkin berhasil dalam memperoleh pemahaman dari
masalah klinis studi yang kita tangani, tetapi pemahaman kita tetap harus
lebih dalam. Selain itu, kolega ahli statistik kita cenderung bekerja secara
simultan pada banyak proyek di beragam topik, di mana kedalaman
pemahaman akan jadi lebih sulit.
Apa pun alasannya, kadang-kadang hasil yang muncul akan
anomali. Waspada untuk temuan yang tidak cocok dan tidak sesuai dengan
apa yang kita pelajari ketika kita memeriksa data secara deskriptif, atau
tidak sesuai dengan pemahaman klinis kita terhadap kondisi yang diteliti.
Biasanya, ketika kita mengidentifikasi anomali hasil seperti itu, yang
sering terjadi adalah karena beberapa kesalahan analisis dan harus cepat
diperbaiki. Sikap dan pertanyaan yang kritis akan membantu kita
menghindari dari masalah tersebut.

15.6.

TANTANGAN SPESIFIK ANALISIS


Berikut wilayah statistik yang tepat untuk meninjau empat
pertanyaan umum dan penting yang sering timbul dalam pekerjaan
statistik. Bagian ini mungkin cocok untuk seseorang dengan pengetahuan
tentang statistik dasar, tapi tidak mempunyai pengalaman yang banyak
dalam analisis
Dapatkah Anda Lakukan Analisis Parametrik pada Data Ordinal?

Data mungkin nominal (yaitu, kategori, paling sering dua


kategori), ordinal (yaitu, kategori, namun jarak antara kategori tidak perlu
sama), interval (yaitu, kategori dengan jarak antara kategori yang sama,
tetapi tidak ada nol alami) dan rasio (yaitu, jarak dengan nol alami).
Misalnya, "Seorang pria (nominal) berjalan ke kantor saya dan
mengatakan kepada saya bahwa nyeri sendinya lebih sakit daripada bulan
lalu (ordinal). Suhu badannya adalah 101 F (interval) dan berat badannya
turun, yaitu 126 lb (rasio)."
Salah satu yang sering digunakan untuk analisis ketika ukuran hasil
memiliki sifat ordinal, misalnya, skala nyeri tujuh poin. Secara teori,
karena langkah-langkah ordinal tidak memenuhi asumsi analisis
parametrik (t-test), salah satu harus menggunakan metode nonparametrik
(chi-square) untuk menganalisis data. Namun demikian, metode
parametrik, jika valid, lebih mudah, lebih fleksibel, dan lebih familiar.
Metode parametrik umumnya "kuat," yaitu, mereka relatif tidak sensitif
terhadap pelanggaran asumsi.
Statistik bervariasi dalam menggunakan analisis parametrik dalam
kumpulan data ordinal. Kita dapat mengambil kuesioner dengan empat
pertanyaan dengan format skala tujuh poin untuk setiap pertanyaan. Jika
kita menggunakan 1 sampai 7 sebagai angka untuk skala tujuh poin, pasien
dapat total nilai 4 sampai 28 pada kuesioner ini. Hampir semua ahli
statistik akan nyaman menggunakan metode parametrik pada kumpulan
data seperti ini. Di sisi lain, satu item dengan tiga pilihan respon. Banyak
ahli statistik akan merasa tidak nyaman menggunakan pendekatan
parametrik dalam keadaan ini dan akan lebih memilih analisis
nonparametrik.
Apa Cara Terbaik untuk Analisi Data Continuous dengan Pengukuran
Berulang?
Situasi umum yang kita hadapi adalah uji coba secara acak, atau
penelitian longitudinal lainnya, di mana pasien terkena dua atau lebih
kondisi (intervensi eksperimental) dan diikuti serial dari waktu ke waktu.

Pilihan analitik untuk situasi ini meliputi metode regresi dan melihat
daerah di bawah kurva. Bagaimanapun, analisis varian untuk pengukuran
berulang (ANOVA) adalah sebagai strategi optimal.
Kerangka ini menyoroti faktor atau variabel yang dapat
mempengaruhi status pasien pada hasil pengukuran. Dalam satu desain
yang sederhana, dua faktor yang mungkin secara sistematis mempengaruhi
kondisi pasien adalah pengobatan dan waktu. Selain itu, mungkin interaksi
antara kedua faktor ini.
Gambar 15-1 sampai 15-4 menggambarkan berbagai hasil yang
mungkin dan bagaimana keduanya berpengaruh dalam pemeriksaan
berulang ANOVA. Misalnya, jika waktu mungkin tidak berpengaruh,
tetapi pengobatan mungkin memiliki dampak yang konsisten (Gambar 151). Atau, pengobatan mungkin tidak berpengaruh, tapi kondisi pasien dapat
meningkatkan dengan waktu (Gambar 15-2). Ketiga, pengobatan mungkin
memiliki efek awal yang menghilang pada tindak lanjut (Gambar 15-3).
Akhirnya, efek pengobatan dapat meningkatkan dari waktu ke waktu
(Gambar 15-4). Kedua hasil terakhir mewakili interaksi antara pengobatan
dan waktu (yaitu, efek pengobatan yang bervariasi tergantung pada titik
waktu tertentu).

Gambar 15-1. Pengaruh pada Pengobatan, Tidak Ada Pengaruh pada


Waktu

Gambar 15-2. Pengaruh pada Waktu, Tidak Ada Pengaruh pada


Pengobatan
Beberapa peneliti yang menggunakan desain ini akan memberikan
data dasar dalam desain tersebut dengan status yang sama dengan data
yang dikumpulkan setelah individu dalam kelompok perlakuan mulai
menerima intervensi. Jika dianalisis dengan cara ini, efek positif dari
pengobatan terdeteksi sebagai waktu dengan interaksi perlakuan. Artinya,
pengobatan tidak berpengaruh pada awal (yaitu, sebelum diberikan) tetapi
memiliki efek pada pengamatan berikutnya.

Gambar 15-3. Pengobatan yang Awalnya Ada Perubahan, Tetapi


Menghilang Seiring Waktu

Gambar 15-2. Pengaruh Pengobatan Meningkat Seiring Waktu


Dengan cara ini, hasil presentasi akan membingungkan banyak
dokter konsep interaksi mana yang terlihat asing. Cara yang lebih mudah
dalam menangani data dasar adalah dengan menggunakannya sebagai
kovariat dalam analisis. Ini akan menambah kekuatan untuk analisis
selama korelasi antara data baseline dan data tindak lanjut setidaknya 0,5.
Kita tidak bisa salah dengan analisis pendekatan kovarian ini, dan bahkan
jika korelasi antara data baseline dan data tindak lanjut sangat rendah, kita
tidak akan pernah kehilangan data dasar sebagai kovariat.
Model ANOVA juga dapat digunakan untuk mengatasi observasi
yang hilang. Di masa lalu, keterbatasan program statistik adalah jika ada
beberapa data yang hilang, kita harus membuat ulang. Jika beberapa data
pasien hilang untuk beberapa observasi, pilihan opsi untuk mengatasinya
yaitu dengan menghilangkan kunjungan di mana observasi hilang,
menghilangkan pasien yang observasi hilang, atau membuat semacam
estimasi untuk observasi hilang. Setelah memutuskan beberapa perkiraan,
kita bisa memilih sejumlah strategi estimasi.
Kapan Kita Harus "Menurunkan" Data Kontinu?
Keterbatasan

data

kontinu

terletak

pada

kesulitan

dalam

interpretasi klinis. Cara yang efektif untuk interpretasi data kontinu adalah

dengan memilih cut-point dan memeriksa distribusi pasien dalam


kelompok perlakuan dan kontrol yang terletak di atas dan di bawah cutpoint.
Dalam beberapa kasus, kita dapat menduga bahwa persentase
pasien yang mencapai target tertentu yang lebih bermakna dari suatu
perubahan yang berarti. Meskipun keuntungan ini di diinterpretasikan
menarik, kita harus menangani situasi ini agak rumit dengan hati-hati.
Pertama-tama, kita memanipulasi data dengan menguji berbagai cut-point
dan memilih salah satu yang terbaik untuk memisahkan kelompok
perlakuan dan kontrol.
Kedua, persiapkan untuk hasil statistik yang signifikansi dalam
analisis data kontinu (dengan interval kepercayaan relatif sempit) dan,
analisis data biner, yang gagal mencapai signifikansi (dengan interval
kepercayaan lebar). Kita tidak terlalu terganggu oleh perbedaan tersebut.
Cara kita melihat situasi ini adalah bahwa analisis terus-menerus
menunjukkan perbedaan yang nyata dan presentasi biner menyediakan
cara untuk memahami perbedaan tersebut. Ketiga, pastikan bahwa ambang
yang digunakan benar-benar mewakili kriteria wajar yang penting. Saat ini
jika jenis bukti yang kuat tidak dapat dihasilkan dalam sebuah penelitian,
maka tanggung jawab berada pada penyidik untuk menemukan penelitian
lain, yang menunjukkan hubungan langsung antara variabel.
Regresi atau korelasi, Siapa?
Membangun hubungan antara variabel dan mencoba untuk
membangun jalur kausal antara variabel tetap merupakan kegiatan utama
dalam penyelidikan epidemiologi klinis. Korelasi dan regresi itu sendiri
erat terkait. Perbedaannya adalah korelasi digunakan ketika kita hanya
tertarik pada kedekatan hubungan antara dua variabel daripada mencoba
untuk membangun sebab dan akibat. Regresi dirancang untuk mencoba
untuk membangun sebab dan akibat. Mengingat tujuan regresi ini, kita
memiliki dua jenis variabel: penyebab diduga dan efeknya, dengan acuan

penyebab sebagai variabel independen, dan efek sebagai variabel


dependen.
Regresi diklasifikasikan menjadi tiga jenis, tergantung pada sifat
dari variabel dependen. Jika variabel dependen memiliki dua kategori
(biner), kita melihat regresi sebagai "logistik" (karena aritmatika
mengandalkan logaritma). Jika variabel dependen kontinu, kita melihat
regresi sebagai "linear" (karena mengasumsikan hubungan linear antara
variabel dependen dan independen). Kedua kategori variabel dependen
adalah yang paling sering digunakan. Namun akhirnya telah ditemukan
jenis regresi ketiga, ketika variabel dependen adalah kategori. Istilah untuk
regresi dimana variabel dependen adalah kategori adalah "polytomous"
atau "polychotomous."
Regresi dapat "simple" atau univariable (hanya satu variabel
independen) atau multivariable (lebih dari satu variabel independen).
Orang kadang-kadang menggunakan istilah "multivariat" sebagai sinonim
dari multivariabel. Jika kita ingin akurat, kita harus membatasi
penggunaan istilah "multivariat" untuk situasi ketika kita melakukan
analisis dengan lebih dari satu variabel dependen di luar cakupan ini.
Keterbatasan regresi sederhana adalah kita tidak mengetahui sejauh
mana kekuatan prediktor yang jelas dari variabel independen. Semakin
besar sejauh mana variabel independen terkait satu lain (Istilah "ko-linear"
adalah istilah yang digunakan untuk menggambarkan situasi ketika
variabel independen berkorelasi dengan satu lain), maka semakin besar
regresi sederhana dapat menyesatkan.
Masalah pada analisis regresi adalah ada banyak variabel
independen yang menarik dan peserta dalam penelitian yang relatif sedikit.
Sesuai aturan, dalam regresi logistik, harus ada sepuluh peristiwa (bukan
sepuluh pasien, tapi sepuluh peristiwa) untuk setiap variabel independen.
Jika kita mencoba untuk melakukan analisis yang melanggar panduan ini,
kita mungkin akan menghasilkan model yang tidak dapat diandalkan dan
berpotensi menyesatkan.

Kemudian

pada

regresi

multivariabel,

proses

ini

disebut

"pemodelan." Ada beberapa strategi. Salah satu yang sangat umum


digunakan, adalah regresi "bertahap" maju. Di sini, prediktor yang paling
kuat memasuki model pertama. Prediktor yang menyumbang porsi
terbesar dari varian memasuki kedua. Prosedur terus sampai semua
variabel yang tersedia telah memasuki model. Biasanya ditetapkan cut-off
untuk signifikansi (biasanya 0,05) dan semua variabel yang menjelaskan
proporsi tambahan yang signifikan dilaporkan secara statistik. Sebuah
pendekatan alternatif, adalah regresi "bertahap" mundur. Di sini, kita mulai
memasukkan semua variabel ke dalam model. Kemudian menghilangkan
variabel yang menjelaskan varian yang paling sedikit, dan menjalankan
kembali model.