Jawab:
'
Misal a =[ a1 … a p ] adalah vector skalar yang digunakan dalam mentransformasi dua sampel
multivariat y 1 dan y 2 dengan kombinasi linier yaitu:
n1 n
z1 i z 2
n1 n2
dimana: ý 1=∑ y 1 i /n1 dan ý 2=∑ y 2 i /n2 .
i=1 i=2
Nilai jarak terstandarisasi yang memisahkan antara kedua sampel tersebut, yaitu ( ź 1− ź 2)/ s z
Namun karena hasilnya bisa negative, akan digunakan hasil kuadratnya yaitu pada persamaan 8.7:
2 2
( ź 1−ź 2)
2
( a' ý 1−a' ý 2) ( a' ( ý 1− ý 2 ) )
= =
s 2z a' S pl a a' S pl a
2
Selanjutnya akan dibuktikan bahwa a' ( ý 1− ý2 ) =a' ( ý 1− ý 2 ) ( ý 1− ý 2 ) ' a. Pembuktian dilakukan
[ ]
dari ruas kanan,
ý 11− ý 21 a1
' '
a ( ý 1− ý 2 ) ( ý 1− ý 2 ) a= [ a1 … a p ]
[ ] ⋮
ý 1 p− ý 2 p
[ ý 11 − ý 21 … ý1 p −ý 2 p ]
[]
⋮
ap
a 1 ( ý 11 − ý 21 ) a1 ( ý 11− ý 21)
¿
[ ⋮
][ ⋮
a p ( ý 1 p − ý 2 p ) a p ( ý 1 p− ý 2 p ) ]
¿ [ a ' ( ý 1− ý 2 ) ][ a' ( ý1 − ý 2 ) ]
2
¿ [ a ' ( ý 1− ý 2 ) ] (Terbukti)
(d) Compare the results of (b) and (c) as to the contribution of each variable to separation
of the groups.
(e) Find the partial F for each variable, as in (8.26). Do the partial F's rank the variables
in the same order of importance as the standardized coefficients?
Jawab:
Berikut merupakan data tabel 5.5 yang berisi empat pengukuran dari dua spesies kutu kumbang
yaitu Haltiaca oleracea dan Haltica carduorum.
y1 y2 y3 y4 Jenis Kumbang
189 245 137 163 Oleracea
192 260 132 217 Oleracea
217 276 141 192 Oleracea
221 299 142 213 Oleracea
171 239 128 158 Oleracea
192 262 147 173 Oleracea
213 278 136 201 Oleracea
192 255 128 185 Oleracea
170 244 128 192 Oleracea
201 276 146 186 Oleracea
195 242 128 192 Oleracea
205 263 147 192 Oleracea
180 252 121 167 Oleracea
192 283 138 183 Oleracea
200 294 138 188 Oleracea
192 277 150 177 Oleracea
200 287 136 173 Oleracea
181 255 146 183 Oleracea
192 287 141 198 Oleracea
181 305 184 209 Carduorum
158 237 133 188 Carduorum
184 300 166 231 Carduorum
171 273 162 213 Carduorum
181 297 163 224 Carduorum
181 308 160 223 Carduorum
177 301 166 221 Carduorum
198 308 141 197 Carduorum
180 286 146 214 Carduorum
177 299 171 192 Carduorum
176 317 166 213 Carduorum
192 312 166 209 Carduorum
176 285 141 200 Carduorum
169 287 162 214 Carduorum
164 265 147 192 Carduorum
181 308 157 204 Carduorum
192 276 154 209 Carduorum
181 278 149 235 Carduorum
175 271 140 192 Carduorum
197 303 170 205 Carduorum
Keterangan:
y 1=Jarak melintang dari batas posterior prothorax ( μm)
y 2=Panjang elytra (dalam 0.01 mm)
y 3=Panjang sendi antenal kedua(μm)
y 4 =Panjang sendi anternal ketiga( μm)
A) Mencari vektor koefisien fungsi diskriminan jika dilakukan secara manual dapat
menggunnakan rumus:
a=Spl −1( ý 1− ý 2)
Mencari vektor koefisien fungsi diskriminan dikerjakan dengan menggunakan software
R:
#input data
> data2<-as.matrix.data.frame(data_8_8_1_)
> n1<-nrow(data2)
> w1<-(n1-1)*var(data2)
>
> data3<-as.matrix.data.frame(data_8_8_2_)
> n2<-nrow(data3)
> w2<-(n2-1)*var(data3)
> matrixk=matrix1-matrix2
> a<-b%*%matrixk
> a
[,1]
y1 0.3459815
y2 -0.1312460
y3 -0.1058841
y4 -0.1432168
Kesimpulan:
Berdasarkan hasil diatas, diperoleh vektor koefisien dari fungsi diskriminan adalah:
0.3459815
a'=
(
−0.1312460
−0.1058841
−0.1432168
)
B) Mencari koefosien standarisasi jika dilakukan secara manual dapat menggunnakan
rumus:
a ¿=(diag S pl )1/ 2 a
Mencari koefisien standarisasi akan dikerjakan dengan menggunnakan software R:
> standarisasi<-diag(sp1)^(1/2)*a
> standarisasi
[,1]
y1 4.136640
y2 -2.500550
y3 -1.157705
y4 -2.067833
Kesimpulan:
4.145417
¿
a=
(
−2.514145
−1.151725
−2.065864
)
C) Uji t untuk masing-masing variabel akan dikerjakan dengan menggunakan
software R
Hipotesis :
H0 : μi−μ j=0 , i , j=1,2,3,4 , i≠ j (Tidak ada perbedaan yi pada kedua jenis kumbang)
data: x1 and y1
t = 3.8577, df = 33.031, p-value = 0.0005024
alternative hypothesis: true difference in means is not equal to
0
95 percent confidence interval:
7.053392 22.793977
sample estimates:
mean of x mean of y
194.4737 179.5500
data: x2 and y2
t = -3.8713, df = 36.998, p-value = 0.0004251
alternative hypothesis: true difference in means is not equal to
0
95 percent confidence interval:
-36.17651 -11.31823
sample estimates:
mean of x mean of y
267.0526 290.8000
data: x3 and y3
t = -5.7563, df = 32.232, p-value = 2.146e-06
alternative hypothesis: true difference in means is not equal to
0
95 percent confidence interval:
-26.84721 -12.81594
sample estimates:
mean of x mean of y
137.3684 157.2000
data: x4 and y4
t = -5.0229, df = 35.569, p-value = 1.441e-05
alternative hypothesis: true difference in means is not equal to
0
95 percent confidence interval:
-32.71542 -13.88985
sample estimates:
mean of x mean of y
185.9474 209.2500
NEW FILE.
DISCRIMINANT
/GROUPS=Species(1 2)
/VARIABLES=y1 y2 y3 y4
/ANALYSIS ALL
/METHOD=WILKS
/FIN=3.84
/FOUT=2.71
/PRIORS EQUAL
1 y3 1.000 32.389
F ( y 1| y 2 , y 3 , y 4 ) =35.934
F ( y 2| y 1 , y 3 , y 4 ) =5.799
F ( y 3| y 1 , y 2 , y 4 ) =1.775
F ( y 4| y 1 , y 2 , y3 ) =8.259
Berdasarkan hasil diatas kita dapat mengurutkan kepentingan dari setiap variabel dengan
cara mengurutkan hasil F-Partial dari yang terbesar sampai yang terkecil didapatkan
urutan sbb: y 1 , y 4 , y 2 , y 3
Seperti yang diperoleh pada bagian (b) urutan kepentingan dengan menggunakan
standardized coefficients adalah: y 1 , y 3 , y 4 , y 2
8.14 Carry out a stepwise selection of variables on the engineer data of table 5.6.
Jawab:
Berikut merupakan data tabel 5.6 yang berisi enam ujian yang diberikan kepada 20 engineer
apprentices dan 20 pilot.
Keterangan:
y 1=Intelligence
y 2=Form relation
y 3=Dynamometer
y 4 =Dotting
y 5=Sensory motor coordination
y 6=Perseveration
Akan digunakan metode stepwise dalam analisis diskriminan untuk menyeleksi variabel –
variabel mana saja (dari variabel y1 sampai dengan y6) yang paling mampu untuk
mendiskriminasi (membedakan) antar kelompok, dalam hal ini kelompok pekerjaan Engineer
Apprentices dan Pilots.
Akan digunakan bantuan software SPSS untuk melakukan metode stepwise. Adapun prosedur
dalam melakukan metode stepwise dengan bantuan software SPSS adalah sebagai berikut:
Tests of Equality of Group Means digunakan untuk melihat secara univariat, variabel –
variabel mana yang paling mampu mediskriminasi (membedakan) jenis pekerjaan. Hal ini dapat
dilihat dari nilai Wilks’ Lambda yang memiliki signifikansi dibawah 0.05. Jika nilai Wilks’
Lambda mendekati angka 0 maka cenderung ada perbedaan dalam kelompok. Dari output di atas,
variabel yang mampu mendiskriminasi adalah Form Relations ( y 2), Dynamometer ( y 3),
Dotting ( y 4 ), dan Perseveration ( y 6). Sedangkan variabel Intelligence ( y 1) dan Sensory Motor
Coordination ( y 5) tidak mampu membedakan jenis pekerjaan.
Log Determinants
Semakin besar nilai log determinant pada tabel di atas, maka semakin tinggi perbedaan grup
kovarian matrik. Kolom "Rank" menunjukkan jumlah variabel independen. Dalam hal ini
terdapat 4 variabel independen. Oleh karena analisis diskriminan berasumsi bahwa terdapat
homoginitas matrik kovarian antar grup, maka dapat dilihat uji asumsi pada Box's M berikut ini.
Test Results
Box's M 8.916
F Approx. .789
df1 10
df2 6903.586
Sig. .639
Hasil uji Box's M menunjukkan bahwa nilai Sig. sebesar 0.639, maka dapat disimpulkan bahwa
matrik kovariat antar grup memang berbeda dan hal ini menyalahi asumsi diskriminan. Namun
demikian analisis fungsi diskriminan tetap dapat diterima, walaupun asumsi homogeniety of
variance tidak terpenuhi dengan syarat data tidak memiliki outlier.
Variables Entered/Removeda,b,c,d
1 Engineer
Dotting 2.145 Apprentices and 21.451 1 38.000 4.168E-5
Pilots
2 Engineer
Dynamometer 3.198 Apprentices and 15.570 2 37.000 1.241E-5
Pilots
3 Engineer
Perseveration 4.471 Apprentices and 14.119 3 36.000 3.053E-6
Pilots
4 Engineer
Form Relations 5.553 Apprentices and 12.787 4 35.000 1.626E-6
Pilots
At each step, the variable that maximizes the Mahalanobis distance between the two closest groups is
entered.
a. Maximum number of steps is 12.
b. Maximum significance of F to enter is .05.
c. Minimum significance of F to remove is .10.
d. F level, tolerance, or VIN insufficient for further computation.
Dari tabel diatas, setelah dilakukan metode stepwise variabel yang mampu mendiskriminasi jenis
pekerjaan adalah Dotting ( y 4 ), Dynamometer ( y 3), Form Relations ( y 2), dan Perseveration (
y 6). Adapun step – stepnya diperlihatkan pada gambar dibawah ini.
Form Relations 1.000 1.000 .013 .683 Engineer Apprentices and Pilots
Sensory Motor
1.000 1.000 .067 .356 Engineer Apprentices and Pilots
Coordination
Sensory Motor
.831 .804 .055 6.642 Engineer Apprentices and Pilots
Coordination
Kedua tabel di atas menunjukan variabel yang terdapat di dalam model dalam setiap tahap. Pada
tabel Variable Not in the Analysis, lihatlah nilai signifikansi terkecil dan di bawah 0.05.
Pada tahap pertama, variabel Dotting ( y 4 ) memiliki nilai signifikansi terkecil yaitu 0.000
dimana sig.=0.000<0.05sehingga variabel Dotting ( y 4 ) akan dimasukan ke dalam
model.
Pada tahap kedua, variabel Dynamometer ( y 3) memiliki nilai signifikansi terkecil yaitu
0.015 dimana sig.=0.015<0.05sehingga variabel Dynamometer ( y 3) akan dimasukan ke
dalam model.
Pada tahap ketiga, variabel Perseveration ( y 6) memiliki nilai signifikansi terkecil yaitu
0.015 dimana sig.=0.015<0.05sehingga variabel Perseveration ( y 6) akan dimasukan ke
dalam model.
Pada tahap keempat, variabel Form Relation ( y 2) memiliki nilai signifikansi terkecil
yaitu 0.039 dimana sig.=0.039<0.05 sehingga variabel Form Relation ( y 2 ¿ akan
dimasukan ke dalam model.
Pada tahap kelima, tidak ada lagi variabel yang memiliki nilai signifikansi di bawah 0.05
sehingga variabel Intelligence ( y 1) dan Sensory Motor Coordination ( y 5) tidak
dimasukan ke dalam model.
Wilks' Lambda
Number of Exact F
Step Variables Lambda df1 df2 df3 Statistic df1 df2 Sig.
Tabel di atas menunjukan nilai Wilks’s Lamda dan nilai uji F dari setiap tahap. Terlihat bahwa
dari tahap pertama sampai tahap keempat menghasilkan nilai sig.=0.000 dimana
sig.=0.000<α =0.05. Hal ini bearti dari tahap pertama sampai tahap keempat, variabel Dotting (
y 4 ), Dynamometer ( y 3), Form Relations ( y 2), dan Perseveration ( y 6) masuk ke dalam model.
Selanjutnya, dari output summary of canonical discriminant function akan dilihat apakah
fungsi diskriminan signifikan dan akan dilihat juga berapa persen dari variasi jenis pekerjaan
dapat dijelaskan dari empat variabel terpilih yaitu Dotting ( y 4 ), Dynamometer ( y 3), Form
Relations ( y 2), dan Perseveration ( y 6).
Wilks' Lambda
Dari tampilan output diatas, nilai Sig. = 0.000 < α = 0.05, sehingga dapat dikatakan bahwa fungsi
diskriminan sangat signifikan.
Eigenvalues
Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
Pada tabel diatas, kolom canonical correlation adalah 0.771. Apabila dikuadratkan, nilainya
menjadi (0.771)2 = 0.594441. Artinya, sekitar 59.45% variasi jenis pekerjaan dapat dijelaskan
oleh empat variabel diskriminan terpilih.
Canonical Discriminant
Function Coefficients
Function
Unstandardized coefficients
library(olsrr)
model<-lm(grup~.,data = Data_8_14)
stepwise<-ols_step_forward_p(model,pent=0.05,details = TRUE)
Menggunakan forward stepwise berdasarkan nilai p-value dengan kriteria yaitu nilai ambang
batas p-value yang digunakan untuk memasukan variabel ke dalam model adalah 0.05
(pent=0.05). Didapat output sebagai berikut:
Tahap 1
Tahap 2
Tahap 3
Tahap 4