MULTIVARIAT
MODUL IV
Oleh:
Diaz Hafshah R (1313030027)
Ihya Putty Ulinnuha (1313030088)
AsistenDosen:
Hani Khaulasari
Dosen:
Santi Wulan Purnami, M.Si, Ph.D
1
ABSTRAK
Usaha pertanian hortikultura, khususnya buah dan sayur, dapat menjadi solusi alternatif
pendapatan bagi siapapun yang ingin mengusahakannya. Selain mendukung program
pemerintah dalam gerakan mengkonsumsi buah dan sayur di masyarakat, ternyata peluang
usaha ini masih sangat besar baik di dalam maupun luar negeri. Kementrian Pertanian
Republik Indonesia menyebutkan, bahwa konsumsi buah dan sayur dalam negeri masih
rendah dan permintaan buah tropis dan sayur di luar negeri terus meningkat per tahun.
Namun pemegang masalah utama dalam memproduksi tanaman dalam hal ini sayuran
adalah iklim dan cuaca yang tidak beraturan. Kondisi ini mengakibatkan mutu hasil
pertanian yang diperoleh kurang memuaskan bahkan gagal dikarenakan tidak adanya
pemahaman yang baik dalam mempelajari karakteristik iklim dan perubahan cuaca. Untuk
itu perlu dilakukan pendekatan yang efektif dengan cara menyesuaikan sistem usaha tani
dengan kondisi iklim setempat. Namun, dari banyak variabel ini, tidak semuanya
berpengaruh signifikan untuk mempengaruhi probabilitas produktivitas sayuran di kota
Makasar. Analisis diskriminasi digunakan untuk digunakan untuk mengklasifikasikan
individu ke dalam salah satu dari dua kelompok atau lebih pada probabilitas produktivitas
sayuran di kota Makasar. Data yang digunakan diambil dari data Skripsi mahasiswa Fisika
Universitas Hasnuddin Makassar yang berjudul “Analisis diskriminan dalam prediksi
probabilitas produktivitas sayuran di kota Makasar berbasis iklim”.
2
DAFTAR ISI
ABSTRAK ........................................................................................................... i
DAFTAR ISI ........................................................................................................ ii
DAFTAR TABEL ............................................................................................... iv
DAFTAR GAMBAR ........................................................................................... v
BAB I PENDAHULUAN
1.1 Latar Belakang ........................................................................................ 1
1.2 Rumusan Masalah ................................................................................... 2
1.3 Tujuan ..................................................................................................... 2
1.4 Manfaat ................................................................................................... 2
1.5 Batasan Masalah ..................................................................................... 2
BAB II TINJAUAN PUSTAKA
2.1. Uji Asumsi Analisis Diskriminan ........................................................... 4
2.2 Analisis Diskriminan ............................................................................... 6
2.3 Cuaca dan Iklim ....................................................................................... 7
2.4 Iklim dan Tanaman .................................................................................. 8
BAB III METODOLOGI PENELITIAN
3.1 Sumber Data ........................................................................................... 9
3.2 Variabel Penelitian ................................................................................. 9
3.3 Langkah Analisis .................................................................................... 9
3.4 Diagram Alir .......................................................................................... 11
BAB IV ANALISIS DAN PEMBAHASAN
4.1 Pemeriksaan Asumsi ................................................................................ 12
4.2 Analisis Diskriminan ............................................................................... 14
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan .............................................................................................. 19
5.2 Sumber Data ............................................................................................. 19
DAFTAR PUSTAKA
LAMPIRAN
3
DAFTAR TABEL
4
DAFTAR GAMBAR
5
BAB I
PENDAHULUAN
6
1.2 Rumusan Masalah
Berdasarkan latar belakang diatas, maka rumusan masalah yang digunakan
pada pratikum ini adalah sebagai berikut.
1. Bagaimana uji asumsi-asumsi analisis diskriminan pada data probabilitas
produktivitas sayuran di kota Makasar?
2. Bagaimana analisis diskriminan pada data probabilitas produktivitas
sayuran di kota Makasar?
1.3 Tujuan
Berdasarkan rumusan masalah diatas, maka tujuan dari pratikum ini adalah
sebagai berikut.
1. Mengetahui asumsi-asumsi analisis diskriminan pada data probabilitas
produktivitas sayuran di kota Makasar.
2. Mengetahui analisis diskriminan pada data probabilitas produktivitas sayuran di
kota Makasar.
1.4 Manfaat
Manfaat yang dapat diambil dari praktikum ini adalah dapat meningkatkan
kemampuan dalam menganalisis data menggunakan analisis diskriminan, dapat
mengetahui apa manfaat analisis tersebut sehingga dapat menerapkannya dalam
masalah-masalah dalam kehidupan sehari-hari. Manfaat lain yang didapatkan dari
praktikum ini adalah dapat mengetahui ketepatan klasifikasi mempengaruhi
probabilitas produktivitas satyuran di kota Makasar.
7
Universitas Hasanudin Makasar yang berjudul “Analisis diskriminan dalam
prediksi probabilitas produktivitas sayuran di kota Makasar berbasis iklim”.
8
BAB II
TINJAUAN PUSTAKA
Statistik Uji : D S x F0 x
SUP
x
Keterangan:
S x : nilai kumulatif distribusi empiris
9
Menghitung jarak kaudarat d j dengan rumus d 2j x j x S 1 x j x ,
2
'
dimana :
j : 1, 2, …, n
xj : obyek pengamatan ke-j
x x p x j x p
n
j 1 j
Diketahui elemen matrik : S , dimana:
n 1
j : 1, 2, …,n
p : banyaknya karakteristik variabel kualitas
n : banyaknya pengamatan
2
Mengurutkan nilai d j dari yang terkecil sampai yang terbesar. Mencari nilai
2
2 j 0.5 q j dari tabel chi-square dana membuat scatter plot antara pasangan ( d j
p,
n
qj).
2.1.3 Uji Homogenitas
Pengujian homogenitas berfungsi untuk mengetahui varians data bersifat
homogen atau heterogen berdasarkan faktor tertentu. Sama seperti pada
kenormalan, bahwa asumsi homogenitas juga diperlukan pada beberapa analisis
statistik parametrik.
a. Uji Bartlett
Uji Bartlett merupakan metode pengujian homogenitas varian. Pada
pengujian ini terdapat syarat data harus berdistrbusi normal. Pengujiannya adalah
sebagai berikut.
H0 : 𝜎1 2 = 𝜎2 2 = ⋯ = 𝜎𝑘 2 (data homogen)
H1 : paling sedikit ada satu 𝜎𝑖 2 yang tidak sama
Statistik uji :
s2
1 s
n1 1
2
2 n 2 1
... sk 2
n ki 1 1 / N k
b 2
(2.1)
sp
10
k
n 1s
i 1
i i
2
Dimana s p 2
N k
Kesimpulan : H0 ditolak jika b bk ( ; n) (Walpole, 1995).
2.1.4 Multikolinieritas
Multikolinieritas adalah suatu kondisi dimana terjadi korelasi yang kuat
diantara variabel-variabel bebas (X) yang diikutsertakan dalam pembentukan
model regresi linier (Deny, 2008). Dapat juga berarti suatu keadaan di mana
hubungan linier yang sempurna antara variabel-variabel penjelas atau variabel
bebas. Uji multikolinieritas adalah untuk melihat ada atau tidaknya korelasi yang
tinggi antara variabel-variabel bebas dalam suatu model analisis diskriminan.
Masalah multikolinieritas terjadi pada analisis diskriminan jika peubah-peubah X
saling berkorelasi atau adanya hubungan linier yang kuat antara peubah-peubah
bebas X. Hal yang akan mempengaruhi ragam dari dugaan koefisien diskriminan
adalah peubah X yang dianggap penting kemungkinan akan tidak nyata walaupun
nilai R2 tinggi serta pendugaan dari koefisien diskriminan menjadi tidak benar,
misalnya koefisien memiliki tanda negatif yang mana didalam hubungan X dan Y
sebenarnya adalah positif (Salamah, 2014).
a. VIF
VIF merupakan singkatan dari Variance Inflation Factor. Jika nilai VIF
lebih dari 10, maka terdapat masalah multikolinieritas pada sebuah permodelan.
(Hartini, 2013)
1 (2.2)
VIF
1 Ri2
Dimana R2 = koefisien determinasi berganda dari peubah penjelas Xi dengan
seluruh peubah penjelas lainnya.
2.1.5 Ketepatan Klasifikasi
Evaluasi prosedur klasifikasi merupakan suatu evaluasi yang melihat
peluang kesalahan klasifikasi yang dilakukan oleh suatu fungsi klasifikasi. Tabel di
bawah ini menunjukan tabel ketepatan klasifikasi (Johnson, et al., 2002).
11
Tabel 2.1 Ketepatan Klasifikasi
Prediksi
Total
Observasi ˆ 1 ̂ 2 ̂ 3 ̂ 4
12
2.2 Analisis Diskriminan
Analisis diskriminan merupakan salah satu metode statistika yang bertujuan
untuk mengkategorikan suatu objek ke dalam dua atau lebih kelompok berdasarkan
pada sejumlah variabel bebas. Pengelompokannya bersifat “mutually executive”
dalam artian jika objek A sudah berada dalam kelompok I, maka tidak mungkin
menjadi kelompok 2 dan selanjutnya. Oleh karena ada sejumlah variable
independen, maka akan terdapat satu variable dependen (Wilks, 1995).
Model analisis diskriminan adalah sebuah persamaan yang menunjukkan
suatu kombinasi linier dari berbagai variabel independen yaitu.
D b0 b1 X 1 b2 X 2 b3 X 3 ... bk X k (2.3)
Dimana:
D = Skor diskriminan
b = Koefisien diskriminasi atau bobot
X = Prediktor atau variabel independent
Dalam bentuk catatan matriks dapat dinyatakan sebagai berikut.
X 2 X 1n 2 X 2 jn 2 j 1 (2.8)
S 2 X 1n 2 1( X 2 jn 2 j 1 X 2 )( X 2 j X 2 )' (2.9)
13
2.3 Cuaca dengan Iklim
Cuaca dan iklim merupakan dua kondisi yang hampir sama tetapi berbeda
pengertian khususnya terhadap kurun waktu. Cuaca merupakan bentuk awal yang
dihubungkan dengan penafsiran dan pengertian akan kondisi fisik udara sesaat pada
suatu lokasi dan suatu waktu, sedangkan iklim merupakan kondisi lanjutan dan
merupakan kumpulan dari kondisi cuaca yang kemudian disusun dan dihitung
dalam bentuk rata-rata kondisi cuaca dalam kurun waktu tertentu (Winarso, 2003).
Unsur-unsur iklim terdiri dari radiasi surya, suhu udara, kelembaban udara, awan,
presipitasi, evaporasi, tekanan udara dan angin. Unsur-unsur ini berbeda dari waktu
ke waktu dan dari tempat ke tempat yang disebabkan oleh adanya pengendali-
pengendali iklim. Pengendali iklim atau faktor yang dominan menentukan
perbedaan iklim antara wilayah yang satu dengan wilayah yang lain adalah
(Lakitan, 2002).
1. Ketinggian tempat.
2. Latitude atau garis lintang.
3. Daerah-daerah tekanan.
4. Arus-arus laut, dan
5. Permukaan tanah.
14
BAB III
METODE PENELITIAN
15
2. Melakukan uji homogenitas varians dari data Probabilitas Produktivitas
Sayuran di Kota Makasar.
3. Melakukan analisis diskriminan.
4. Melakukan uji ketepatan klasifikasi secara manual pada data Probabilitas
Produktivitas Sayuran di Kota Makasar.
5. Menginterpretasikan dan kesimpulan
16
3.4 Diagram Alir
Berikut adalah diagram alir dari langkah analisis yang telah dijelaskan.
Mulai
Data
Tidak
Uji Outlier
Tidak
Ya
Tidak
Uji Normalitas
Multikolinierita
s
Ya
Uji
Homogenitas
Ya
Uji
Multikolinieritas
Kesimpulan
Selesai
17
BAB IV
ANALISIS DAN PEMBAHASAN
Scatterplot of q vs dd
20
15
q
10
2 4 6 8 10 12 14 16
dd
18
Gambar 4.1 Scatterplot Multivariat Normal
Gambar 4.1 menunjukkan bahwa plot-plot yang terbentuk sudah mendekati
garis normal, sehingga dapat disimpulkan bahwa data faktor-faktor yang
mempengaruhi produktivitas sayur bayam di Kota Makassar sudah mengikuti
distribusi multivariat normal.
4.1.2 Uji Multikolinieritas
Masalah multikolineritas terjadi pada regresi berganda jika adanya hubungan
linier yang kuat antara peubah variabel predictor. Berikut adalah hasil dari
pengujian multikolineritas.
Tabel 4.2 Uji Multikolineritas
Prediktor VIF
X3 = Curah Hujan 1.140
X8 = Kecepatan Angin Rata-Rata 1.140
Tabel 4.2 didapatkan masing-masing nilai varian inflasi faktor (VIF) dari
curah hujan kecepatan angin rata-rata adalah kurang dari 10 maka tidak ada
hubungan antara curah hujan dan kecepatan angin rata-rata sehingga pengujian
tersebut telah memenuhi persamaan model.
4.1.3 Uji Homogenitas Varians
Uji Homogenitas varians digunakan untuk mengetahui apakah data curah
hujan dan kecepatan angin rata-rata terhadap produksi sayur bayam di Kota
Makassar sudah memenuhi asumsi homogenitas varians. Hasil pengujian box’s M
adalah sebagai berikut.
Hipotesis:
H0 : Data pengaruh curah hujan dan kecepatan angin rata-rata terhadap produksi
sayur bayam telah memenuhi asumsi homogenitas varians.
H1 : Data pengaruh curah hujan dan kecepatan angin rata-rata terhadap produksi
sayur bayam belum memenuhi asumsi homogenitas varians.
Tabel 4.3 Log Determinan
Y Rank Log Determinan
Sedang 2 3.322
Tinggi 2 8.690
Pooled Within Group 2 8.431
19
Tabel 4.3 menunjukkan bahwa selisih log determinan antara jumlah
produktivitas sayur bayam yang sedang dan jumlah produktivitas sayur bayam yang
tinggi adalah cukup besar sehingga dapat diketahui matriks varians dan kovarians
grup adalah identik.
Tabel 4.4 Hasil Uji Box’ M
Box’s M F Df1 Df2 P-value
11.697 2.895 3 392.267 0.065
Tabel 4.4 menunjukkan bahwa nilai P-value yang dihasilkan adalah 0.065,
sehingga dapat diambil keputusan yaitu pada taraf signifikan 5% gagal menolak H0
karena P-value > artinya data pengaruh curah hujan dan kecepatan angin rata-
rata terhadap produksi sayur bayam di Kota Makassar memenuhi asumsi
homogenitas varians.
X8 0.192 0.259
T-value 2.12 2.95
P-value 0.049 0.009
X3 0.00216
20
T-Value 2.18
P-Value 0.045
S 0.383 0.347
R2 20.83 38.90
R2 adj 16.18 31.27
Cp mallow 0.1 -1.4
Tabel 4.5 menunjukkan model regresi terbaik dengan menggunakan metode
forward. Dengan R2 sebesar 38.90, R2adj sebesar 31.27, dengan Cp mallow -1.4,
dan nilai S sebesar 0.347 hasil yang didapatkan adalah hanya X8, dan X3 yang
masuk ke dalam model. Sehingga model regresinya Y = 1 + 0.259 X8 + 0.00216
X3, yaitu variabel curah hujan, dan kecepatan angin rata-rata.
4.2.2 Persamaan Rata-Rata
Setelah dilakukan perhitungan menggunakan software didapatkan hasil
sebagai berikut.
Tabel 4.8 Wilks’ Lambda
Function Wilks’ Lambda Chi-square df p-value
1 0.037 13.849 5 0.000
Tabel 4.8 menunjukkan bahwa dengan nilai α sebesar 5% didapatkan hasil p-
value yang kurang dari α (0.000<0.05) yang artinya kelompok yang diteliti mampu
membedakan variabel-variabel yang masuk secara signifikan, selain itu dapat
diketahui pula nilai wilks’ lambda 0.037 atau 3.7% artinya keragaman yang tidak
dapat dijelaskan oleh kelompok hanya sebesar 3.7%.
4.2.3 Uji Kekuatan Hubungan Fungsi Diskriminan
Setelah dilakukan perhitungan menggunakan software didapatkan hasil
sebagai berikut.
Tabel 4.7 Nilai Eigen
Function Eigen value % varians % kumulatif Korelasi kanonik
1 0.637 100 100 0.624
Tabel 4.7 menunjukkan bahwa nilai korelasi kanoniknya adalah 0.624 atau
62.4% yang artinya model yang terbentuk mampu menjelaskan 62.4%2 atau 38.9%
21
keragaman dari variabel respon, sedangkan sisanya dijelaskan oleh variabel lain
yang tidak masuk ke dalam model.
4.2.4 Fungsi Diskriminan
Setelah diketahui bahwa ada dua variabel yang akan masuk ke dalam
kelompok, yaitu curah hujan dan kecepatan angin rata-rata. Maka didapatkan hasil
sebagai berikut.
Tabel 4.9 Koefisien Kanonik
Function
1
X3 = Curah Hujan 0.01
X8 = Kecepatan Angin Rata-Rata 1.234
Konstan -5.740
Tabel 4.9 menunjukkan bahwa setelah dilakukan analisis, didapatkan fungsi
diskriminan dari variabel data pengaruh curah hujan dan kecepatan angin rata-rata
terhadap jumlah produksi padi adalah Y = -5.740 + 0.010 X3 + 1.234 X8.
4.2.5 Pengklasifikasian Koefisien Fungsi
Setelah dilakukan perhitungan menggunakan software didapatkan hasil
sebagai berikut.
Tabel 4.10 Klasifikasi Fungsi
Y
Sedang Tinggi
X3 0.035 0.054
X8 5.707 7.992
Konstan -10.419 -20.055
Tabel 4.10 didapatkan fungsi diskriminan yang dibedakan berdasarkan
kelompok. Pada kelompok jumlah produksi sayur bayam yang sedang didapatkan
fungsi Y (Sedang) = -10.419 + 0.035 X3 + 5.707 X8. Sedangkan pada kelompok
jumlah produksi sayur bayam yang tinggi didapatkan fungsi Y (Tinggi) = -20.055
+ 0.054 X3 + 7.992 X8.
Tabel 4.11 Fungsi Kelompok Sentroid
Y Function
Sedang -1.462
22
Tinggi 0.390
Tabel 4.11 menunjukkan nilai fungsi masing-masing kelompok, dan jika di
rata-rata didapatkan nilai sebesar -0.536. Jika fungsi kelompok dengan jumlah
produksi yang sedang dibandingkan dengan nilai rata-rata (-0.536) mempunyai
nilai yang lebih kecil sehingga Y masuk ke populasi dengan jumlah produksi yang
tinggi. Sedangkan fungsi kelompok dengan jumlah produksi yang tinggi
mempunyai nilai yang lebih tinggi dari nilai rata-rata (-0.536) sehingga Y masuk
ke populasi dengan jumlah produksi sedang.
4.2.6 Ketepatan Klasifikasi
Setelah dilakukan perhitungan menggunakan software didapatkan hasil
sebagai berikut.
Tabel 4.12 Hasil Klasifikasi
Prediksi
Y Total
Sedang Tinggi
Sedang 3 1 4
Original Count
Tinggi 4 11 15
Sedang 75.0 25.0 100
%
Tinggi 26.7 73.3 100
Tabel 4.12 menunjukkan bahwa variabel pada data awal yang masuk ke
dalam kelompok jumlah produksi sedang dan tetap pada kelompok produksi sedang
ada 3 data, dan yang masuk ke dalam kelompok produksi sayur bayam tinggi ada 1
data, sedangkan variabel pada data awal yang masuk ke dalam kelompok jumlah
produksi tinggi dan tetap pada kelompok produksi tinggi ada 11 data, dan yang
masuk ke dalam kelompok produksi sayur bayam rendah ada 1 data. Selain itu dapat
diketahui pula nilai ketepatan sebesar 73.7% artinya karena nilai ketepatan lebih
dari 50% maka fungsi diskriminan sudah dapat digunakan untuk
mengklasifikasikan sebuah kasus pada tipe jumlah produksi sayur bayam di Kota
Makassar.
23
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil analisis data faktor-faktor yang mempengaruhi kondisi
klinis yaitu tekanan darah sistolik dan diastolik pasien telah diperoleh kesimpulan
sebagai berikut.
1. Hasil uji asumsi menunjukkan bahwa faktor-faktor yang mempengaruhi
jumlah produksi bayam di Kota Makassar sudah berdistribusi multivariat
normal, tidak ada multikolinieritas dan memenuhi uji asumsi homogenitas
varians.
2. Hasil analisis diskriminan didapatkan hasil ada 2 faktor yang masuk ke dalam
fungsi yaitu variabel curah hujan dan kecepatan angin rata-rata. Sehingga
fungsi diskriminannya adalah Y = -5.740 + 0.010 X3 + 1.234 X8 dan fungsi
ini mempunyai nilai ketepatan sebesar 73.7%.
5.2 Saran
Saran untuk praktikum selanjutnya adalah lebih memahami materi yang
dibahas, agar tidak terdapat kesalahan dalam pengolahan data ataupun dalam
menginterpretasikannya. Panduan yang jelas dalam melakukan penelitian ini sangat
penting serta dalam menganalisis datahasil pengamatan diperlukan kecermatan dan
ketelitian.
24
DAFTAR PUSTAKA
25
LAMPIRAN
26
Lampiran 2. Output Uji Asumsi
MTB > %D:/MULTINORMAL.txt c12-c20
Executing from file: D:/MULTINORMAL.txt
Answer = 5,1698
Answer = 6,8657
Answer = 2,0461
Answer = 7,7374
Answer = 9,8231
Answer = 6,8633
Answer = 9,9107
Answer = 11,6578
Answer = 8,9682
Answer = 12,6940
Answer = 9,4485
Answer = 5,9453
Answer = 9,5552
Answer = 5,9204
Answer = 3,5215
Answer = 9,2424
Answer = 6,0232
Answer = 14,9961
Answer = 15,6112
Scatterplot of q vs dd
Data Display
t 0,473684
27
Lampiran 4. Output Stepwise
Stepwise Regression: C21 versus C12; C13; ...
Step 1 2
Constant 1,0000 0,5833
C14 0,00216
T-Value 2,18
P-Value 0,045
S 0,383 0,347
R-Sq 20,83 38,90
R-Sq(adj) 16,18 31,27
Mallows Cp -2,6 -3,4
Valid 19 100,0
Excluded Missing or out-of-range group codes 0 ,0
At least one missing discriminating
0 ,0
variable
Total 0 ,0
Total 19 100,0
Group Statistics
y Mean Std. Deviation Valid N (listwise)
Unweighted Weighted
28
Tests of Equality of Group Means
Wilks' Lambda F df1 df2 Sig.
x8 -,531 1,000
Covariance Matricesa
y x3 x8
x8 -30,623 ,988
freedom.
Log Determinants
y Rank Log Determinant
sedang 2 3,322
tinggi 2 8,690
Pooled within-groups 2 8,431
Test Results
Box's M 11,697
F Approx. 2,895
df1 3
df2 392,267
Sig. ,035
Eigenvalues
Function Eigenvalue % of Variance Cumulative % Canonical
Correlation
29
Wilks' Lambda
Test of Function(s) Wilks' Lambda Chi-square df Sig.
Coefficients x3 ,307 1
Function
Pooled within-groups x3 ,010
1 correlations between x8 1,234
x3 ,904 discriminating variables (Constant) -5,740
x8 1,123 and standardized Unstandardized coefficients
canonical discriminant
functions
Variables ordered by
absolute size of
correlation within
function.
1 sedang tinggi
Used in Output 19
30
Prior Probabilities for Groups
y Prior Specified Prior Effective Prior Cases Used in Analysis
Unweighted Weighted
Classification Resultsa,c
y Predicted Group Membership Total
sedang tinggi
tinggi 4 11 15
b. Cross validation is done only for those cases in the analysis. In cross validation, each case is
classified by the functions derived from all cases other than that case.
31