Anda di halaman 1dari 36

ANALISIS MULTIVARIAT

Apriani Susmita Sari


Pengertian Analisis Multivariat

Analisis multivariat merupakan analisis yang digunakan untuk


mengetahui hubungan antara banyak variabel bebas dengan suatu
variabel terikat.
Tahap analisis data pada umumnya dapat dibagi menjadi tiga tahap
yaitu deskriptif, analisis bivariate dan analisis multivariat.
Deskriptif berbicara tentang gambaran suatu variabel, analisis bivariat
berbicara tentang hubungan dua variabel sementara multivariat
berbicara tentang hubungan antara banyak variabel bebas dengan satu
variabel terikat.
Jenis Analisis Multivariat

 Terdapat dua jenis analisis multivariat yang sering digunakan dalam penelitian
kedokteran dan kesehatan, yaitu analisis regresi logistik dan analisis regresi linier.
 Pemilihan kedua analisis tersebut ditentukan oleh skala pengukuran variabel
terikatnya.
 Bila variabel terikatnya berupa variabel kategorik, maka regresi yang digunakan
adalah regresu logistik.
 Bila variabel terikatnya berupa variabel numerik, maka regresi yang digunakan
adalah regresi linier.
Metode-Metode dalam Analisis
Multivariat
1. ENTER
Memasukkan semua variabel independen dengan serentak satu langkah tanpa melewati kriteria
kemaknaan statistik tertentu;
2. FORWARD
Memasukkan satu persatu variabel dari hasil pengkorelasian variabel dan memenuhi kriteria
kemaknaan statistik untuk masuk kedalam model, sampai semua variabel yang memenuhi
criteria tersebut masuk kedalam model. Variabel yang masuk pertama kali adalah variabel yang
mempunyai korelasi parsial terbesar dengan variabel dependen. Versi SPSS mensyaratkan
kriteria variabel dapat masuk model bila variabel mempunyai nilai p < 0,05;
3. BACKWARD
Memasukkan semua variabel kedalam model tetapi kemudian satu persatu variabel independen
dikeluarkan dari model berdasarkan kriteria kemaknaan statistik tertentu. Variabel yang pertama
dikeluarkan adalah variabel yang memiliki korelasi parsial terkecil dengan variabel dependen.
Kriteria pengeluaran adalah variabel yang mempunyai nilai p >=0,10 dikeluarkan dari model.
4. STEPWISE
Merupakan kombinasi antara metode Forward dan Backward. Dimulai dengan
pemasukan satu persatu variabel independen hasil pengkorelasian dimasukkan ke
dalam model dan dikeluarkan dari model dengan kriteria tertentu. Variabel yang
pertama masuk adalah variabel yang memiliki korelasi parsial terbesar (lihat metode
forward). Selanjutnya setelah masuk, variabel pertama ini diperiksa lagi apakah harus
dikeluarkan dari model menurut kriteria pengeluaran seperti metode backward.
5. REMOVE
Mengeluarkan semua variabel independen dengan serentak satu langkah, tanpa
melewati kriteria kemaknaan statistik tertentu.
Langkah-Langkah Melakukan
Analisis Multivariat
1. Menyelesaikan variabel yang akan dimasukkan dalam analisis multivariat.
Variabel yang dimasukkan ke dlaam analisis multivariat adalah variabel yang pada analisis
bivariate mempunyai nilai p<0,25.
2. Melakukan analisis multivariat
3. Melakukan intervensi hasil.
Beberapa hal yang dapat diperoleh dari analisis multivariat adalah sebagai berikut:
a. Variabel yang berpengaruh terhadap variabel terikat diketahui dari nila p masing-
masing variabel.
b. Urutan kekuatan hubungan dari variabel-variabel yang berpengarub terhadap variabel
terikat. Pada regresi logistik, urutan kekuatan hubungan diketahui dari besarnya nilai
OR. Sedangkan untuk regresi linear, urutan kekuatan hubungannya diketahui dari
besarnya nilai r (koefisien korelasi).
c. Model atau rumus untuk memprediksikan variabel terikat.
Cont..
 Pada regresi logistik, rumus umum yang diperoleh adalah :
p = 1/(1 + e-xp(-y))

di mana : p = probabilitas untuk terjadinya suatu kejadian (misalnya penyakit)


exp = eksponensial
y = konstanta + alx1 + a2x2 +. .+ aixi
a = nilai koefisien tiap variabel
x = nilai variabel bebas
 Pada regresi linear, rumus umum yang diperoleh adalah:

y = konstanta + a1x1 + a2x2 +.. .+ aixi


di mana : y = nilai dari variabel terikat
a = nilai koefisien tiap variabel
x = nilai variabel bebas
4. Menilai kualitas analisis multivariat. Cont.
Pada analisis regresi logistik, kualitas dinilai dengan melihat kemampuan diskriminasi dan kalibrasi.
Diskriminasi dinilai dengan melihat nilai Area Under Curve (AUC) dengan metode Receiver Operating Curve
(ROC) sementara kalibrasi dengan metode Hosmer and Lameshow. Diskriminasi baik jika nilai AUC
semakin mendekati angka 1. Kalibrasi baik jika mempunyai nilai p > 0,05 pada uji Hosmer and Lameshow.
Kualitas regresi linear dinilai dengan melihat determinasi (nilai R2) dan kalibrasi (uji ANOVA). Determinasi
baik jika nilai R2 semakin mendekati angka 1. Kalibrasi baik apabila nilai p pada uji ANOVA < 0,05
5. Menilai syarat atau asumsi.
Pada regresi logistik terdapat asumsi multikolineritas.
Sementara itu, pada regresi linear terdapat asumsi normalitas, independensi, multikolineariti, linearitas,
dan heteroskedisitas.
a.Normalitas artinya distribusi residu harus normal dan reratanya nol.
b.Independensi artinya tidak ada hubungan antara residu dengan variabel bebas.
c.Multikolinearitas artinya ada hubungan yang kuat antara sesama variabel bebas. Nama lainnya adalah
autokorelasi. Hal ini tidak boleh terjadi.
d.Linearitas artinya hubungan antara variabel bebas dengan variabel terikat bersifat linear.
e.Heteroskesiditas artinya residu tidak ada hubungannya dengan variabel terikat.
Analisis Regresi Logistik
Kasus
Tujuan penelitian adalah untuk mengetahui faktor-faktor
yang dapat dijadikan sebagal prediktor terjadinya syok
pada pasien anak demam berdarah. Variabe yang diteliti
adalah jenis kelamin, status gizi, trombositopenia,
hemokonsentrasi dan hepatomegali pada saat pasien
masuk perawatan. Desain penelitian yang digunakan
adalah kohort. Data disimpan dalam file dengan nama
regresi_logistik
Tabel variabel
Pertanyaan:
1. Uji hipotesis apa yang akan digunakan pada analisis bivariat tersebut?
2. Parameter kekuatan hubungan apa yang digunakan?
3. Lakukanlah analisis bivariat dengan menggunakan SPSSI
4. Analisis multivariat apa yang akan digunakan?
5. Variabel apa saja yang akan dimasukkan ke dalam analisis multivariat?
6. Lakukanlah analisis multivariat dengan menggunakan SPSS!
7. Setelah dilakukan analisis multivariat:
a. variabel apa saja yang berpengaruh terhadap syok? Bagaimana
kekuatan hubungannya?
b. Parameter kekuatan hubungan apa yang digunakan?
c. bagaimana aplikasi dari persamaan yang diperoleh untuk memprediksi
probabilitas syok pada pasien?
8. Bagaimanakah kualitas persamaan yang diperoleh baik dari segi
diskriminasi maupun dari segi kalibrasi?
Jawaban
1. Uji hipotesis apa yang akan digunakan pada analisis bivariat?
Uji hipotesis untuk analisis bivariat adalah uji Chi square atau uji Fisher
karena semua analisis bivariat yang dilakukan termasuk ke dalam analisis
komparatif kategorik tidak berpasangan.
2. Parameter kekuatan hubungan apa yang digunakan?
Pada kohort, parameter kekuatan hubungan yang digunakan adalah nilai odds
rasio (OR) dan risiko relatif (RR). Parameter kekuatan hubungan yang dapat
langsung dihasilkan oleh perangkat lunak adalah OR.
3. Lakukanlah analisis bivariat dengan menggunakan SPSS!
Lakukanlah analisis Chi square dan carilah nilai OR-nya untuk variabel.
Tabel Analisis Bivariat
4. Analisis multivariat apa yang akan digunakan?
Analisis multivariat yang akan digunakan adalah regresi logistik
karena variabel yang digunakannya adalah variabel kategorik
dikotom.
5. Variabel apa saja yang akan dimasukkan ke dalam analisis
multivariat?
Variabel yang akan dimasukkan ke dalam analisis regresi
logistik adalan variabel yang pada analisis bivariat memiliki nilai p
<0,25.
Variabel tersebut adalah jenis kelamin, status gizi,
hepatomegali, hemokonsentras. dan trombositopenia.
6. Lakukanlah analisis regresi logistik dengan menggunakan
SPSS!
Langkah-langkah analisis regresi logistik
1. Klik Analiyze, Regression, Binary logistic.
2. Masukan variabel syok (untuk analisis multivariat: syok_reg) ke
dalam Dependent Variable.
3. Masukan semua variabel independen ke dalam Covariate. Pilih
metode Backward LR pada pilihan metode.
4. Aktifkan kotak options
5. Pilih CI for exp (B)
6. Pilih Hosmer-Lameshow goodness-of-fit
7. Klik continue
8. Aktifkan kotak save. Pilih Probabilities
9. Klik continue
10. Aktifkan kotak Categorical
11. Pada saat pemasukan data, kode 2 dirancang menjadi
pembanding/reference. Akibatnya, yang menjadi pembanding
pada penelitian ini adalah last. Dengan demiklan tidak perlu
merubah apapun pada Reference Category.
12. Klik continue
13. Perhatikan pada masing-masing variabel saat ini telah ada
tulisan (cat) setelah nama variabel.
14. Proses sudah selesai. Klik Ok.
Interpretasi hasil
Output
Interpretasi hasil
1. Variabel yang berpengaruh terhadap syok adalah jenis
kelamin, status gizi, trombositopenia, hepatomegali, dan
hemokonsentrasi. Kekuatan hubungan dapat dilihat dari nilai
OR (EXP'). Kekuatan hubungan terbesar dan terkecil adalah
hemokonsentrasi (OR = 9,87) dan hepatomegali (OR = 3,90).

2. Persamaan didapatkan adalah:


y = konstanta + a1x1 + a2x2 +. ..+ aixi
y =-5,859 + 1,567(sex) + 1,363(gizi) + 1,848(trombositopenia) +
1,360 (hepatomegali) + 2,289 (hemokonsentrasi).
Analisis Regresi Linier
Kasus
Seorang peneliti ingin mengetahui hubungan antara umur,
indeks masa tubuh (IMT) tebal trisep, persen lemak tubuh,
asupan lemak, asupan karbohidat dengan kadar leptin dan
memprediksikan kadar leptin dengan menggunakan
variabel-variabel tersebut.
Rencana Analisis
1. Analisis deskriptif dan uji normalitas
2. Analisis bivariate dengan uji pearson atau
spearmen
3. Analisis multivariat
4. Resume analisis
5. Melaporkan analisis
Rancana Analisis
1. Hasil uji normalitas data
2. Analisis bivariate dengan Uji Pearson
Karena hasil uji normalitas dengan menggunakan Kolmogorov Smirnov
didapatkan semua variabel berdistribusi normal, uji korelasi yang dipilih
adalah pearson.
3. Analisis Multivariat Regresi Linier
Korelasi pada uji bivariate didapatkan semua variabel bebas dengan leptin
mempunyai nilai p<0,25. dengan demikian, semua variabel memenuhi
syarat untuk dimasukkan ke dalam analisis
Langkah-langkah melakukan uji regresi linier:
a.Klik Analiyze, Regression, Linear.
b.Masukan variabel leptin ke dalam Dependent.
c.Masukan semua variabel independen ke dalam Independent.
d. Pilih metode Backward pada pilihan Method.
e. Klik continue. Pilih kotak Plots. Pilih histogram dan Normal Probability Plot.
Histogram dan Normal Probability Plot dipilih untuk mengecek asumsi
normalitas dengan metode gambar.

f. Pada Plots, terdapat variabel DEPENDENT, "ZPRED, ZRESID, "DRESID.


"ADJPRED, SRESID, dan SDRESID. Dari variabel-variavel tersebut, kita akan
menggunakan variabel DEPENDENT, ZPRED, dan ZRESID.

g. DEPENDENT adalah variabel terikat, yaitu variabel leptin. "ZPRED adalah


variabel terikat fitted yang distandardisasi atau kita sebut juga variabel bebas
yang distandardisasi. ZRESID adalah residu yang distandardisasi.

h. Diagram tebar antara DEPENDENT dan "ZPRED kita gunakan untuk


mengecek asumsi linearitas, sementara diagram tebar "ZPRED dan "ZRESID
kita gunakan untuk mengecek asumsi konstan.

i. Untuk mengecek asumsi linearitas, lakukan prosedur berikut: pindahkan


DEPENDENT ke sumbu y dan "ZPRED ke sumbu x.
j. Untuk mengecek asumsi konstan, lakukan prosedur berikut:
Klik Next, pindahkan "ZPRED ke sumbu y dan "ZRESID ke sumbu
x
k. Klik continue
l. Proses selesai. Klik Ok
Pada output , periksalah Coefficients.
Interpretasi hasil
 Tabel Variable Entered/Removed memberikan informasi jumlah
model yang dibuat, variabel yang masuk model, dan variabel yang
dikeluarkan dari model. Dengan metode backward, pada model
pertama dimasukkan empat variabel, yaitu karbohidrat, BMI, umur,
dan lemak. Variabel lemak tidak dikutsertakan dalam model dua
karena varlabel tersebut adalah variabel yang paling layak
dikeluarkan. Selanjutnya, variabel karbohidrat tidak terlihat lagi
pada model tiga karena variabel tersebut layak untuk dikcluarkan.
Proses berhenti pada model tiga karena model tiga dianggap
sebagai model yang paling baik. Model tiga terdiri dari variabel
umur dan BMI.
 Pada metode backward, varlabel yang tidak bermakna dikeluarkan
secara bertahap. Variabel yang dikeluarkan adalah variabel yang
tidak bermakna yang mempunyai nilai pP yang paling besar.
Interpretasi Hasil

Pada Model Summary, kita memperoleh informasi seberapa besar variabel- variabel
bebas dapat menjelaskan variabel terikat. Model satu mempunyai koefisien determinasi
sebesar 66,5%, model dua 66,9%, dan model tiga 67,2%. Tampak bahwa model akhir,
yaitu model 3, adalah model yang mempunyai koefisien determinasi terbaik. Persamaan
yang terdiri dari variabel umur dan BMI dapat menjelaskan leptin sebesar 67,2%.
Interpretasi hasil

Uji anova memberikan informasi apakah salah satu dari slope variabel bebas
bermakna atau tidak. Pada semua model, nilai p uji anova lebih kecil dari 0,05.
Dengan demikian, pada setiap model kita mengetahui bahwa paling tidak ada slope
dari variabel yang terdapat dalam model yang bermakna.
Interpretasi hasil
 Dengan metode backward, pada model pertama dimasukkan
empat variabel, yaitu ember, BMI, berumur, dan lemak. Variabel
lemak tidak termasuk dalam model dua karena variabel ini adalah
variabel yang paling pantas dikeluarkan karena model satu,
variabel lemak memiliki nilai p yang paling besar. Selanjutnya,
variabel karbohidrat tidak terlihat lagi pada model tiga karena
variabel ini memiliki nilai p yang paling besar. Proses berhenti
pada model tiga karena model tiga dianggap sebagai model yang
paling baik. Model tiga terdiri dari variabel umur, dan BMI.
 Persamaan regresi linear yang kita peroleh dengan demikian
adalah leptin= 1,526+0,005*umur+0,086*BMI. Koefisien korelasi
BMI adalah 0,799 sementara umur 0,128
Terima Kasih

Anda mungkin juga menyukai