Statistik Multivariat
1. How would you differentiate among multiple discriminant analysis, regression analysis,
logistic regression analysis, and analysis of variance?
Jawab:
Analisis diskriminan ganda: variabel dependen adalah variabel kategori (nominal atau
nonmetrik) dan variabel independen adalah variabel metrik.
Analisis regresi: beberapa variabel independen dan variabel dependen tunggal adalah
metrik.
Analisis regresi logistik: untuk klasifikasi dan analitik prediktif. Analisis ini
memperkirakan kemungkinan suatu peristiwa yang terjadi, seperti keberhasilan atau
kegagalan, berdasarkan data variabel independen yang diberikan. Karena hasilnya adalah
probabilitas, variabel dependen dibatasi antara 0 dan 1.
Analysis of Variance (ANOVA): variabel independen tunggal adalah nonmetrik dan
beberapa variabel dependen adalah metrik. Analis menggunakan uji ANOVA untuk
menentukan pengaruh variabel independen terhadap variabel dependen dalam studi
regresi.
2. When would you employ logistic regression rather than discriminant analysis? What are
the advantages and disadvantages of this decision?
Jawab:
Regresi logistik dan analisis diskriminan adalah teknik yang digunakan untuk
memprediksi klasifikasi variabel dependen kategoris. Namun, ada beberapa situasi di
mana regresi logistik mungkin lebih disukai daripada analisis diskriminan.
Regresi logistik adalah teknik yang digunakan untuk memodelkan hubungan antara
variabel dependen dan satu atau lebih variabel independen ketika variabel dependen
bersifat kategoris. Regresi logistik adalah metode yang lebih fleksibel daripada analisis
diskriminan, karena dapat menangani berbagai situasi di mana hubungan antara variabel
dependen dan independen mungkin kompleks atau nonlinier.
Di sisi lain, analisis diskriminan adalah teknik yang menemukan kombinasi linier dari
variabel independen yang paling baik memisahkan kelompok pengamatan berdasarkan
keanggotaan kelas mereka. Analisis diskriminan mengasumsikan bahwa variabel
independen biasanya didistribusikan dalam setiap kelompok dan memiliki matriks
kovarians yang sama di seluruh kelompok.
Berikut adalah beberapa keuntungan dan kerugian menggunakan regresi logistik daripada
analisis diskriminan:
3. How does logistic regression handle the relationship of the dependent and independent
variables?
Jawab:
Regresi logistik adalah teknik statistik yang digunakan untuk memodelkan hubungan
antara variabel dependen kategoris (sering disebut sebagai "variabel respons") dan satu
atau lebih variabel independen (sering disebut sebagai "variabel prediktor" atau
"kovariat").
Tujuan regresi logistik adalah untuk memperkirakan probabilitas terjadinya hasil atau
peristiwa tertentu berdasarkan nilai variabel prediktor. Tidak seperti regresi linier, yang
memodelkan hubungan antara variabel dependen kontinu dan satu atau lebih variabel
independen, regresi logistik memodelkan hubungan antara variabel dependen biner atau
kategoris dan satu atau lebih variabel independen.
Regresi logistik memodelkan hubungan antara variabel prediktor dan peluang log dari
hasil yang terjadi. Log-odds (juga dikenal sebagai "logit") adalah transformasi probabilitas
hasil yang terjadi, sehingga logit mengambil nilai antara tak terhingga negatif dan tak
terhingga positif.
Model regresi logistik mengasumsikan bahwa hubungan antara log-odds dari hasil yang
terjadi dan variabel prediktor adalah linier. Dengan kata lain, untuk setiap variabel
prediktor, perubahan log-odds dari hasil yang terjadi sebanding dengan perubahan nilai
variabel prediktor, memegang semua variabel lain konstan.
Koefisien dalam regresi logistik dinyatakan dalam hal peluang log. Dalam regresi linier,
koefisien dinyatakan dalam hal unit variabel dependen. Dalam regresi logistik, koefisien
mewakili perubahan peluang log dari variabel dependen untuk peningkatan satu unit
dalam variabel prediktor.
Koefisien dalam regresi logistik tidak secara langsung sebanding satu sama lain. Dalam
regresi linier, koefisien secara langsung sebanding, dan ukuran koefisien sesuai dengan
ukuran efek variabel prediktor pada variabel dependen. Dalam regresi logistik, ukuran
koefisien tidak sesuai dengan ukuran pengaruh variabel prediktor pada variabel dependen,
dan koefisien tidak secara langsung sebanding satu sama lain.
5. Explain the concept of odds and why it is used in predicting probability in a logistic
regression procedure.
Jawab:
Dalam regresi logistik, konsep peluang digunakan untuk memprediksi probabilitas
variabel dependen biner atau kategoris yang terjadi. Peluang mewakili kemungkinan suatu
peristiwa terjadi relatif terhadap kemungkinan peristiwa tersebut tidak terjadi. Peluang
suatu peristiwa didefinisikan sebagai probabilitas peristiwa yang terjadi dibagi dengan
probabilitas peristiwa yang tidak terjadi.
Misalnya, jika probabilitas seseorang mengalami serangan jantung adalah 0,3, maka
kemungkinan orang tersebut mengalami serangan jantung adalah 0,3/(1-0,3) = 0,43. Ini
berarti bahwa orang tersebut 0,43 kali lebih mungkin mengalami serangan jantung
daripada tidak mengalami serangan jantung.
Dalam regresi logistik, hubungan antara variabel prediktor dan variabel dependen
dimodelkan menggunakan fungsi logit, yang merupakan logaritma alami dari peluang.
Fungsi logit digunakan karena memungkinkan hubungan linier antara variabel prediktor
dan peluang log dari variabel dependen. Persamaan untuk fungsi logit adalah:
logit(p) = ln(p/(1-p))
p = 1/(1 + e^(-logit(p)))
Model regresi logistik menggunakan odds dan fungsi logit untuk memodelkan hubungan
antara variabel prediktor dan variabel dependen. Hal ini memungkinkan untuk prediksi
probabilitas variabel dependen yang terjadi, yang dapat berguna dalam berbagai aplikasi,
seperti memprediksi kemungkinan pasien mengembangkan penyakit, atau memprediksi
kemungkinan pelanggan membeli suatu produk.