Modul5 006 026 061
Modul5 006 026 061
ANALISIS MULTVARIAT
Modul V
Oleh :
Arin Berliana Angrenani 06211640000006
Euodia Putri Prastika 06211640000026
Niam Zuhdi Yuliarto 06211640000061
Asisten Dosen :
Sri Hidayati 06211750010027
Dosen :
Dr. Bambang Widjanarko O. S.Si., M.Si.
Penyakit diabetes ditandai dengan tingginya kadar gula (glukosa) dalam tubuh. Penyakit
ini adalah termasuk penyakit kronis yang mematikan. Jika diabetes tidak dikontrol dengan
baik, dapat timbul berbagai komplikasi yang membahayakan nyawa penderita.
Berdasarkan penelitian Diabetes Atlas tahun 2015, Indonesia menempati posisi ke tujuh
sebagai negara yang memiliki jumlah penderita diabetes terbanyak, yaitu sebesar 11,4 juta
orang. Penderita diabetes mengalami gangguan keseimbangan tranportasi gula kedalam
sel antara gula yang disimpan di hati dan gula yang dikeluarkan dari hati, sehingga kadar
gula dalam darah meningkat. Analisis diskriminan merupakan salah satu dari analisis
multivariat dengan metode dependensi yang bertujuan untuk mengklasifikasikan suatu
individu atau observasi ke dalam kelompok yang saling bebas (mutually exclusive/disjoint)
dan menyeluruh (exhaustive) berdasarkan sejumlah variabel penjelas. Analisis
diskriminan dapat digunakan untuk mengelompokan penderita diabetes yang positif dan
negatif. Data jumlah penderita diabetes positif dan negative beserta faktor-faktor yang
mempengaruhi disebut data imbliced. Berdasarkan hasil analisis didapatkan bahwa uji
asumsi normal mutivariat tidak terpenuhi, namun diasumsikan memenuhi dan uji asumsi
homogenitas terpenuhi. Selanjutnya, hasil analisis diskriminan adalah terdapat perbedaan
nilai rata-rata yang disebabkan oleh variabel konsentrasi glukosa plasma dan antar
variabel tidak terindikasi multikolinieritas. Model yang terbentuk sudah dapat
menjelaskan keragaman sebesar 100%, namun variabel penjelas belum mampu
membedakan grup secara signifikan. Hubungan terbesar dimiliki oleh variabel ketebalan
lipatan kulit. Variabel konsentrasi glukosa plasma memiliki kontribusi terbesar terhadap
fungsi diskriminan. Jika hasil nilai observasi y kurang dari 0,1285 maka observasi tersebut
akan masuk kelompok diabetes negatif, sedangkan jika nilai observasi y lebih besar dari
0,1285 maka observasi tersebut akan masuk ke dalam kelompok diabetes positif. Ketepatan
pengklasifikasian dengan menggunakan metode analisis diskriminan akan menghasilkan
tingkat akurasi sebesar 70% dari data yang ada.
Kata kunci : Analisis Diskriminan, Diabetes, Klasifikasi, Uji Homogenitas, Uji Normal
Multivariat.
ii
DAFTAR ISI
Halaman
HALAMAN JUDUL .............................................................................................. i
ABSTRAK ............................................................................................................. ii
DAFTAR ISI......................................................................................................... iii
DAFTAR TABEL ................................................................................................. v
DAFTAR GAMBAR ............................................................................................ vi
BAB I PENDAHULUAN ..................................................................................... 1
1.1 Latar Belakang ............................................................................................ 1
1.2 Rumusan Masalah ....................................................................................... 2
1.3 Tujuan ......................................................................................................... 2
1.4 Manfaat ....................................................................................................... 2
1.5 Batasan Masalah ......................................................................................... 3
BAB II TINJAUAN PUSTAKA .......................................................................... 4
2.1 Statistika Deskriptif .................................................................................... 4
2.2 Uji Normal Multivariat ............................................................................... 5
2.3 Uji Homogenitas ......................................................................................... 5
2.4 Analisis Diskriminan .................................................................................. 6
2.5 Diabetes....................................................................................................... 7
BAB III METODOLOGI PENELITIAN ........................................................... 8
3.1 Sumber Data ................................................................................................ 8
3.2 Variabel Penelitian ...................................................................................... 8
3.3 Struktur Data ............................................................................................... 8
3.4 Langkah Analisis ........................................................................................ 8
3.5 Diagram Alir ............................................................................................... 9
BAB IV ANALISIS DAN PEMBAHASAN ...................................................... 11
4.1 Analisis Karakteristik Data ....................................................................... 11
4.2 Uji Normal Multivariat ............................................................................. 11
4.3 Uji Homogenitas ....................................................................................... 12
4.4 Analisis Diskriminan ................................................................................ 13
BAB V KESIMPULAN DAN SARAN .............................................................. 19
5.1 Kesimpulan ............................................................................................... 19
iii
5.2 Saran ......................................................................................................... 20
DAFTAR PUSTAKA .......................................................................................... 21
LAMPIRAN
iv
DAFTAR TABEL
v
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
Lampiran 1. Data Praktikum ............................................................................... 22
Lampiran 2. Output SPSS Untuk Menghitung Korelasi ..................................... 22
Lampiran 3. Output SPSS Untuk Menghitung Korelasi ..................................... 23
Lampiran 4. Output SPSS Untuk Uji Kebaikan Model ...................................... 23
Lampiran 5. Output SPSS Untuk Uji Signifikansi Model .................................. 23
Lampiran 6. Output SPSS Untuk Analisis Hubungan Variabel Pediktor dengan
Fungsi Diskriminan ............................................................................................... 24
Lampiran 7. Output SPSS Struktur Matrik ......................................................... 24
Lampiran 8. Output SPSS Canonical Discriminant Function Coefficients ........ 25
Lampiran 9. Output SPSS Function at Group Centroids.................................... 25
Lampiran 10. Output SPSS Classification Function Coefficients ...................... 25
vii
BAB I
PENDAHULUAN
1
dalam kelompok yang saling bebas (mutually exclusive/disjoint) dan menyeluruh
(exhaustive) berdasarkan sejumlah variabel penjelas. Analisis diskriminan
digunakan ketika variabel dependen merupakan data kategorik atau kualitatif
(ordinal atau rasio), sedangkan variabel independen berupa data kuantitatif (interval
atau rasio). Dalam analisis diskriminan variabel dependen hanya satu, sedangkan
variabel independen banyak (Johnson, 2007).
Variabel yang digunakan dalam analisis diskriminan adalah analisis terhadap
faktor – faktor yang mempengaruhi penyakit diabetes tahun 2012 di Indonesia.
Sebelum melakukan analisis diskriminan, dilakukan analisis karakteristik data, uji
asumsi multivariat normal, dan homogenitasnya secara multivariat.
1.3 Tujuan
Berdasarkan rumusan masalah di atas, tujuan yang ingin dicapai adalah
sebagai berikut:
1. Mengetahui karakteristik data Imblaced
2. Mengetahui uji asumsi normal multivariat data data Imblaced
3. Mengetahui uji asumsi homogenitas data data Imblaced
4. Mengetahui analisis diskriminan data Imblaced dengan tahapan uji beda
mean antar kelas, kebaikan model, uji signifikan model, analisis hubungan
variabel prediktor dengan fungsi diskriminan, dan analisis ketepatan
klasifikasi?
1.4 Manfaat
Adapun manfaat yang diperoleh dari penelitian kali ini adalah mengetahui
klasifikasi baru yang terbentuk dari data Imblaced dengan metode analisis
2
diskriminan. Selain itu, dapat memahami asumsi-asumsi dari analisis diskriman,
sehingga ketika dihadapkan dengan masalah diskriminan yang nyata, dapat
menyelesaikannya dengan baik.
3
BAB II
TINJAUAN PUSTAKA
Keterangan :
𝑥𝑖 = data ke-i
𝑛 = banyaknya data
𝑋= nilai rata-rata
Sementara, nilai maksimum adalah nilai tertinggi dari suatu gugus data dan
nilai minimum adalah nilai terendah dari suatu gugus data. Namun, statistika
deskriptif tidak dapat digunakan untuk mengambil suatu kesimpulan yang berkaitan
dengan populasi.
4
2.2 Uji Normal Multivariat
Seringkali sebelum melakukan pemodelan statistik, penting untuk
mengetahui apakah data yang sedang diamati memenuhi asumsi di bawah distribusi
tertentu. Uji normal multivariat merupakan uji yang digunakan untuk mengetahui
apakah data berdistribusi normal secara multivariat atau tidak. Variabel
𝑥1 , 𝑥2 , . . . , 𝑥𝑝 dikatakan berditribusi normal multivariat dengan parameter 𝜇 dan Σ
(Johnson dan Wichern, 2007).
Hipotesis
H0 : data berdistribusi normal multivariat
H1 : data tidak berdistribusi normal multivariat
Taraf siginifikan : 𝛼
Statistik uji :
𝑑𝑗 2 < 𝜒𝛼2 (2.3)
dimana j = banyaknya variabel,
𝑑𝑗 2 = (𝑥 − 𝑥̄ )𝑆 −1 (𝑥 − 𝑥̄ ) (2.4)
1 2
𝑆𝑗𝑗 = 𝑛−1 ∑𝑛𝑗=1(𝑥𝑗 − 𝑥̄ ) (2.5)
dengan,
∑𝑘
𝑖=1 𝑣𝑖 𝑆𝑖
𝑆𝑝𝑜𝑜𝑙𝑒𝑑 = ∑𝑘
(2.7)
𝑖=1 𝑣𝑖
1 1 2𝑝2 +3𝑝−1
𝑐1 = [∑𝑘𝑖=1 𝑣 − ∑𝑘 ] [6(𝑝+1)(𝑘−1)] (2.8)
𝑖 𝑖=1 𝑣𝑖
5
2
Data akan dikatakan homogen ketika nilai 𝜒 2 ≤ 𝜒(𝑘−1)𝑝(𝑝+1) . Bisa juga
menggunakan nilai p-value yaitu gagal tolak H0 jika p-value > α.
6
Tabel 2.1 Confusion Matrix
Kelompok 𝝅𝟏 𝝅𝟐
𝝅𝟏 n1c n1m
𝝅𝟐 n2m n2c
𝑛1 𝑚+ 𝑛2 𝑚
APER= × 100% (2.12)
𝑛1 +𝑛2
2.5 Diabetes
Diabetes adalah penyakit yang berlangsung lama atau kronis serta ditandai
dengan kadar gula (glukosa) darah yang tinggi atau di atas nilai normal. Glukosa
yang menumpuk di dalam darah akibat tidak diserap sel tubuh dengan baik dapat
menimbulkan berbagai gangguan organ tubuh. Jika diabetes tidak dikontrol dengan
baik, dapat timbul berbagai komplikasi yang membahayakan nyawa penderita.
Glukosa merupakan sumber energi utama bagi sel tubuh manusia. Kadar gula dalam
darah dikendalikan oleh hormon insulin yang diproduksi oleh pankreas, yaitu organ
yang terletak di belakang lambung. Pada penderita diabetes, pankreas tidak mampu
memproduksi insulin sesuai kebutuhan tubuh. Tanpa insulin, sel-sel tubuh tidak
dapat menyerap dan mengolah glukosa menjadi energi (Harmanto dan Prapti,
2013).
Secara umum, diabetes dibedakan menjadi dua jenis, yaitu diabetes tipe 1 dan
tipe 2. Diabetes tipe 1 terjadi karena sistem kekebalan tubuh penderita menyerang
dan menghancurkan sel-sel pankreas yang memproduksi insulin. Diabetes tipe 2
merupakan jenis diabetes yang lebih sering terjadi. Diabetes jenis ini disebabkan
oleh sel-sel tubuh yang menjadi kurang sensitif terhadap insulin, sehingga insulin
yang dihasilkan tidak dapat dipergunakan dengan baik. Selain kadar glukosa dan
insulin dalam tubuh, diabetes juga dapat dipengaruhi oleh jumlah kelahiran,
tekanan darah, ketebalan lipatan kulit, indeks massa tubuh, dan usia seseorang
(Soegondo, 2007).
7
BAB III
METODOLOGI PENELITIAN
8
4. Melakukan pengujian asumsi distribusi normal multivariat serta uji
homogenitas.
5. Menganalisis data dengan metode analisis diskriminan dengan pengujian
beda mean antar grup/kelas data.
6. Menganalisis kebaikan model berdasarkan nilai R2.
7. Melakukan pengujian signifikansi model berdasarkan P-value dari wilks
lambda.
8. Melihat hubungan variabel prediktor dengan fungsi diskriminan dan
menentukan variabel yang paling berpengaruh dalam penentuan kelas data
suatu objek dalam analisis diskriminan
9. Menghitung besarnya ketepatan klasifikasi dari fungsi diskriminan yang
terbentuk.
10. Menarik kesimpulan dan saran.
Mulai
Mengumpulkan
Data
Tolak
Uji Normal
Multivariat Diasumsikan
Gagal Tolak
Tolak
Diasumsikan Uji Homogenitas
Gagal Tolak
9
A
Analisis Diskriminan
Kesimpulan
Selesai
10
BAB IV
ANALISIS DAN PEMBAHASAN
11
20
15
dj2
10
0
0 5 10 15 20
qc
12
penelitian homogen atau memiliki varians yang sama. Sehingga data Imblaced telah
memenuhi asumsi homogen dan dapat dilanjutkan untuk penelitian.
13
Tabel 4.5 Korelasi Antar Variabel
Variabel X1 X2 X3 X4 X5 X6 X7 X8
X1 1.000 0.210 0.135 -0.510 -0.445 -0.256 -0.113 0.390
X2 0.210 1.000 0.250 -0.134 0.393 0.028 0.066 0.555
X3 0.135 0.250 1.000 -0.007 -0.021 -0.154 -0.145 0.317
X4 -0.510 -0.134 -0.007 1.000 0.456 0.304 0.062 -0.096
X5 -0.445 0.393 -0.021 0.456 1.000 0.072 0.000 0.316
X6 -0.256 0.028 -0.154 0.304 0.072 1.000 0.161 -0.269
X7 -0.113 0.066 -0.145 0.062 0.000 0.161 1.000 0.094
X8 0.390 0.555 0.317 -0.096 0.316 -0.269 0.094 1.000
Tabel 4.5 menunjukkan bahwa korelasi antara variabel jumlah kelahiran dan
konsentrasi glukosa plasma sebesar 0,21 dan bertanda positif yang artinya
berhubungan lurus antara variabel tersebut. Sedangkan untuk korelasi antara jumlah
kelahiran dan ketebalan lipatan kulit sebesar 0,51 dan bertanda negatif, sehingga
dapat diartikan bahwa antara variabel tersebut memiliki hubungan yang terbalik.
Begitu juga dengan variabel-variabel yang lainnya. Sehingga dapat disimpulkan
bahwa antar variabel tidak terindikasi multikolinieritas karena nilai korelasi yang
relatif di bawah angka 0,95.
B. Analisis Kebaikan Model
Tahap selanjutnya adalah menganalisis kebaikan model berdasarkan R2 pada
output SPSS yang diperoleh.
Tabel 4.6 Eigenvalues
% of Cumulative Canonical
Function Eigenvalue
Variance % Correlation
1 0.424 100 100 0,545
Pada Tabel 4.6, satu fungsi (model) yang terbentuk memiliki arti mampu
menjelaskan keragaman dari variabel respon, dalam hal ini adalah diagnosa
penyakit diabetes, sebesar 0,545 atau 54,5%. Selain itu, dengan satu fungsi yang
terbentuk diperoleh eigenvalue sebesar 0,424 yang sudah dapat menjelaskan
keragaman sebesar 100%.
C. Uji Signifikansi Model
Hasil pengujian kesamaan rata-rata kelompok berdasarkan seluruh variabel
penjelas ditunjukkan oleh Tabel 4.7.
14
Tabel 4.7 Hasil Uji Wilks’ Lambda
Test of Wilks’
Chi-square df Sig.
Function(s) Lambda
1 0,702 8.475 8 0,388
Berdasarkan Tabel 4.7, dapat diketahui bahwa statistik uji Wilks’ Lambda
yang dihasilkan sebesar 0,702. Nilai tersebut menunjukkan bahwa 70,2%
keragaman yang tidak dapat dijelaskan. Selain itu, didapatkan juga nilai P-value
sebesar 0,388 sehingga pada tingkat kepercayaan 5% dapat diputuskan untuk gagal
tolak H0 yang artinya bahwa ketiga variabel prediktor atau variabel penjelas belum
mampu membedakan grup secara signifikan.
D. Analisis Hubungan Variabel Prediktor dengan Fungsi Diskriminan
Hasil analisis hubungan variabel prediktor dengan fungsi diskriminan
disajikan pada tabel berikut ini.
Tabel 4.8 Standardized Canonical Discriminant Function Coefficients
Function 1
Jumlah Kelahiran 0.066
Konsentrasi Glukosa Plasma 1.205
Tekanan Darah Diastolik -0.312
Ketebalan Lipatan Kulit 0.724
Serum Insulin -0.381
Indeks Massa Tubuh -0.257
Diabetes Predigree Function -0.097
Usia Pasien -0.137
Tabel 4.8 menunjukkan bahwa pada variabel jumlah kelahiran, konsentrasi
glukosa plasma, dan ketebalan lipatan kulit memiliki hubungan yang positif atau
berbanding lurus dengan fungsi diskriminan. Sedangkan untuk variabel tekanan
darah diastolik, serum insulin, indeks massa tubuh, diabetes predigree function, dan
usia pasien memiliki hubungan negatif atau terbalik dengan fungsi diskriminan.
Hubungan terbesar dimiliki oleh variabel ketebalan lipatan kulit dengan nilai
hubungan sebesar 0,724. Selanjutnya didapatkan struktur matriks sebagai berikut.
Tabel 4.9 Structure Matrix
Function 1
Konsentrasi Glukosa Plasma 0.805
Serum Insulin 0.338
Usia Pasien 0.328
Ketebalan Lipatan Kulit 0.286
Jumlah Kelahiran 0.101
Indeks Massa Tubuh 0.023
Tekanan Darah Diastolik 0.011
Diabetes Predigree Function 0.011
15
Dari Tabel 4.9, yaitu tabel struktur matriks dapat disimpulkan bahwa
konsentrasi glukosa plasma memiliki kontribusi terbesar senilai 80,5% atau
variabel konsentrasi glukosa plasma lebih berpengaruh terhadap fungsi
diskriminan. Sedangkan untuk serum insulin dan usia pasien berkontribusi sebesar
33,8% dan 32,8%. Sedangkan variabel lainnya memiliki kontribusi dibawah 30%.
Berikut didapatkan pula canonical discriminant function coefficients yang disajikan
pada Tabel 4.10.
Tabel 4.10 Canonical Discriminant Function Coefficients
Function 1
Jumlah Kelahiran 0.017
Konsentrasi Glukosa Plasma 0.041
Tekanan Darah Diastolik -0.013
Ketebalan Lipatan Kulit 0.043
Serum Insulin -0.002
Indeks Massa Tubuh -0.029
Diabetes Predigree Function 0.000
Usia Pasien -0.012
(Constant) -3.638
Berdasarkan Tabel 4.10 dapat dibentuk model (persamaan) diskiminan
sebagai berikut.
𝑦 = -3,638 + 0,017 Jumlah Kelahiran + 0,041 Konsentrasi Glukosa Plasma - 0,013
Tekanan Darah Diastolik + 0,043 Ketebalan Lipatan Kulit - 0,002 Serum
Insulin - 0,029 Indeks Massa Tubuh + 0,000 Diabetes Predigree Function -
0,012 Usia Pasien
Apabila nilai diskriminan semakin besar maka akan mengakibatkan observasi
masuk ke kelompok negatif diabetes sedangkan apabila nilai skor diskriminan
semakin kecil maka akan diklasifikasikan ke dalam kelompok positif diabetes.
Selanjutnya, didapatkan function at group centroids yang digunakan untuk
mengetahui dari persamaan 𝑦 diatas observasi akan masuk ke kelompok mana.
Tabel 4.11 Function at Group Centroids
Function
Diagnosa m centroid
1
Diabetes Negatif -0,770
0.1285
Diabetes Positif 0,513
Tabel 4.11 menunjukkan hasil perhitungan group centroids sehingga
diketahui observasi akan masuk pada kelompok diabetes negatif atau kelompok
diabetes positif. Jika hasil nilai observasi 𝑦 kurang dari 0,1285 maka observasi
tersebut masuk kedalam kelompok diabetes negatif. Sedangkan apabila nilai
16
observasi 𝑦 lebih besar dari 0,1285 maka observasi tersebut akan masuk ke dalam
kelompok diabetes positif. Kemudian didapatkan pula classification function
coefficients dari fisher yang digunakan untuk mengetahui observasi masuk ke
dalam kelompok mobil regular atau mobil sports dengan membandingkan kedua
persamaan fisher’s.
Tabel 4.12 Classification Function Coefficients
Diagnosa Diabetes
Negatif Positif
Jumlah Kelahiran -0.148 -0.126
Konsentrasi Glukosa Plasma 0.095 0.147
Tekanan Darah Diastolik 0.061 0.045
Ketebalan Lipatan Kulit 0.082 0.136
Serum Insulin -0.018 -0.020
Indeks Massa Tubuh 0.516 0.479
Diabetes Predigree Function -0.002 -0.002
Usia Pasien 0.336 0.320
(Constant) -21.715 -26.219
Berdasarkan Tabel 4.12 didapatkan persamaan fisher’s sebagai berikut.
𝑦1 = – 21,715 + 0,061 Tekanan Darah Diastolik – 0,018 Serum Insulin + 0,516
Indeks Massa Tubuh – 0,002 Diabetes Predigree Function + 0,336 Usia Pasien
𝑦2 = – 26,219 – 0,126 Jumlah Kelahiran + 0,147 Konsentrasi Glukosa Plasma +
0,136 Ketebalan Lipatan Kulit
E. Analisis Ketepatan Klasifikasi
Setelah dilakukan pengelompokkan selanjutnya dapat dihitung nilai akurasi
terhadap hasil klasifikasi yang terbentuk dengan melihat tabel berikut.
Tabel 4.13 Classification Results
Predicted Group
Diagnosa Membership Total
Diabetes Negatif Positif
Negatif 9 3 12
Count
Positif 6 12 18
Original
Negatif 75 25 100,0
%
Positif 33.3 66.7 100,0
Pada Tabel 4.13 dapat diketahui bahwa 3 dari 12 observasi atau sebesar 25%
pada kelompok diagnosa negatif tidak tepat pengklasifikasiannya atau tidak sesuai
dengan kenyataan, sedangkan pada kelompok diagnosa positif terdapat 6 dari 18
observasi atau sebesar 33,3% pengklasifikasian yang tidak sesuai. Kesalahan
pengklasifikasian tersebut dapat dihitung menggunakan nilai APER sebagai
berikut.
17
6+3 9
𝐴𝑃𝐸𝑅 = = = 0,3
12 + 18 30
Jadi, persentase kesalahan klasifikasi adalah sebesar 30%, sedangkan untuk
mengetahui akurasi atau ketepatan klasifikasi dapat dihitung menggunakan
persamaan berikut.
Persentase Ketepatan Klasifikasi = (1 − 0, ,3)𝑥 100%
= 0,7 𝑥 100%
= 70%
Berdasarkan hasil akurasi diatas dapat disimpulkan bahwa ketepatan
pengklasifikasian dengan menggunakan metode analisis diskriminan akan
menghasilkan tingkat akurasi sebesar 70% dari data yang ada. Dimana nilai akurasi
tersebut juga menunjukkan bahwa total banyaknya kesalahan pengklasifikasian
(missclassify) sebanyak 9 data.
18
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Kesimpulan dalam praktikum ini berdasarkan hasil analisis adalah sebagai
berikut:
1. Berdasarkan analisis karakteristik data diketahui bahwa rata-rata usia pasien
yang diambil sebagai responden adalah 39 tahun dengan tingkat keragaman
sebesar 128,69 dan rata-rata konsentrasi glukosa plasma dari 30 responden
adalah 130,07 mg/dl dengan keragaman konsentrasi sebesar 1075,03.
2. Uji asumsi normal multivariat menghasilkan kesimpulan bahwa variabel
prediktor data Imblaced tidak berdistribusi normal multivariat. Namun, pada
praktikum kali ini data diasumsikan normal multivariat.
3. Uji asumsi homogenitas menghasilkan kesimpulan bahwa data Imblaced telah
memenuhi asumsi homogen dan dapat dilanjutkan untuk penelitian.
4. Berikut merupakan kesimpulan analisis diskriminan pada masing-masing
tahap.
A. Tahap uji beda mean antar kelas adalah terdapat perbedaan nilai rata-rata
(mean) pada salah satu variabel yang digunakan, yaitu konsentrasi
glukosa plasma (X2) untuk diagnosa negatif diabetes dan positif diabetes,
yang berarti variabel konsentrasi glukosa plasma baik untuk dijadikan
sebagai penentu klasifikasi dan antar variabel tidak terindikasi
multikolinieritas.
B. Tahap analisis kebaikan model, didapatkan hasil bahwa model yang
terbentuk sudah dapat menjelaskan keragaman sebesar 100%.
C. Tahap uji signifikan model mendapatkan hasil bahwa ketiga variabel
prediktor atau variabel penjelas belum mampu membedakan grup secara
signifikan.
D. Tahap analisis hubungan variabel prediktor dengan fungsi diskriminan
dihasilkan hubungan terbesar dimiliki oleh variabel ketebalan lipatan
kulit. Variabel konsentrasi glukosa plasma memiliki kontribusi terbesar
terhadap fungsi diskriminan, dimana fungsi diskriminan yang terbentuk
adalah sebagai berikut.
19
𝑦 = -3,638 + 0,017 Jumlah Kelahiran + 0,041 Konsentrasi Glukosa Plasma
- 0,013 Tekanan Darah Diastolik + 0,043 Ketebalan Lipatan Kulit - 0,002
Serum Insulin - 0,029 Indeks Massa Tubuh + 0,000 Diabetes Predigree
Function - 0,012 Usia Pasien
Jika hasil nilai observasi 𝑦 kurang dari 0,1285 maka observasi tersebut
masuk kedalam kelompok diabetes negatif, sedangkan apabila nilai
observasi 𝑦 lebih besar dari 0,1285 maka observasi tersebut akan masuk
ke dalam kelompok diabetes positif. Selanjutnya adalah classification
function coefficients dari fisher didapatkan perbandingan model sebagai
berikut.
𝑦1 = – 21,715 + 0,061 Tekanan Darah Diastolik – 0,018 Serum Insulin +
0,516 Indeks Massa Tubuh – 0,002 Diabetes Predigree Function + 0,336
Usia Pasien
𝑦2 = – 26,219 – 0,126 Jumlah Kelahiran + 0,147 Konsentrasi Glukosa
Plasma + 0,136 Ketebalan Lipatan Kulit
E. Persentase kesalahan klasifikasi adalah sebesar 30%. Ketepatan
pengklasifikasian dengan menggunakan metode analisis diskriminan akan
menghasilkan tingkat akurasi sebesar 70% dari data yang ada.
5.2 Saran
Kegiatan praktikum tentang analisis diskriminan ini harus dilakukan dengan
teliti dan cermat, ketika proses penginputan data dan penginterpretasian setiap
output harus benar dan tepat sehingga diharapkan dapat menunjukkan hasil yang
lebih akurat dan sesuai.
20
DAFTAR PUSTAKA
21
LAMPIRAN
Lampiran 1. Data Praktikum
Y X1 X2 X3 X4 X5 X6 X7 X8
1 6 148 72 35 0 33,6 0,627 50
0 1 85 66 29 0 26,6 0,351 31
1 8 183 64 0 0 23,3 0,672 32
0 1 89 66 23 94 28,1 0,167 21
1 0 137 40 35 168 43,1 2,288 33
0 5 116 74 0 0 25,6 0,201 30
1 3 78 50 32 88 31 0,248 26
0 10 115 0 0 0 35,3 0,134 29
1 2 197 70 45 543 30,5 0,158 53
1 8 125 96 0 0 0 0,232 54
0 4 110 92 0 0 37,6 0,191 30
1 10 168 74 0 0 38 0,537 34
0 10 139 80 0 0 27,1 1,441 57
1 1 189 60 23 846 30,1 0,398 59
1 5 166 72 19 175 25,8 0,587 51
1 7 100 0 0 0 30 0,484 32
1 0 118 84 47 230 45,8 0,551 31
1 7 107 74 0 0 29,6 0,254 31
0 1 103 30 38 83 43,3 0,183 33
1 1 115 70 30 96 34,6 0,529 32
0 3 126 88 41 235 39,3 0,704 27
0 8 99 84 0 0 35,4 0,388 50
1 7 196 90 0 0 39,8 0,451 41
1 9 119 80 35 0 29 0,263 29
1 11 143 94 33 146 36,6 0,254 51
1 10 125 70 26 115 31,1 0,205 41
1 7 147 76 0 0 39,4 0,257 43
0 1 97 66 15 140 23,2 0,487 22
0 13 145 82 19 110 22,2 0,245 57
0 5 117 92 0 0 34,1 0,337 38
22
Lampiran 3. Output SPSS Untuk Menghitung Korelasi
23
Lampiran 6. Output SPSS Untuk Analisis Hubungan Variabel Pediktor dengan Fungsi
Diskriminan
24
Lampiran 8. Output SPSS Canonical Discriminant Function Coefficients
25