Anda di halaman 1dari 10

Jurnal ILMU DASAR Vol. 4 No.

2, 2003 : 77-82
77

Analisis Diskriminan untuk Melihat Misklasifikasi Mahasiswa FMIPA Angkatan


1998/1999 Universitas Jember

R.Kusumawati 1), I M Tirta 2) dan Y S Dewi 2)


1) Mahasiswa Jurusan Matematika FMIPA Universitas Jember
2) Staf Pengajar Jurusan Matematika FMIPA Universitas Jember

ABSTRACT
This paper describes discriminant analysis to find the factors that distinguish the populations (groups)
and to see misclassification of student groups from FMIPA University of Jember based on 1998/1999
students. The results show that among ten tested variables, five of them are distinguished factors.
Moreover, we find that the percentage of initial misclassification for every department are relatively
high (more than 30%).

Keywords :discriminant analysis, misclassification, distinguished factors

PENDAHULUAN
Analisis diskriminan merupakan suatu analisis dengan tujuan membentuk sejumlah fungsi melalui
kombinasi linear peubah-peubah asal, yang dapat digunakan sebagai cara terbaik untuk memisahkan
kelompok-kelompok individu. Fungsi yang terbentuk melalui analisis ini selanjutnya disebut sebagai
fungsi diskriminan. Menurut Cooper & Morry (1999:151) analisis diskriminan menghubungkan satu
kriteria atau variabel dependen berskala nominal dengan satu atau beberapa variabel independen yang
berskala interval atau rasio.
Dalam prosesnya fungsi diskriminan akan memberikan nilai-nilai yang sedekat mungkin dalam
kelompok dan sejauh mungkin antar kelompok. Manfaat lain dari fungsi diskriminan ini disamping dapat
digunakan untuk menerangkan perbedaan antar kelompok juga dapat digunakan dalam masalah
klasifikasi.
Menurut Tatsuoka (1971) dalam buku Siswandi dan Budi Suharjo (1999:11) masalah yang dihadapi
dalam analisis statistika peubah ganda secara umum adalah bagaimana mempelajari faktor penentu yang
membedakan populasi (kelompok) atau mendapatkan kombinasi linear dari peubah-peubah
(atribut-atribut) yang diukur untuk menunjukkan ukuran perbedaan dalam nilai tengah populasi tersebut.

Huberty(1994) mengatakan bahwa salah satu permasalahan khusus yang berhubungan dengan
analisis diskriminan adalah masalah salah pengelompokan (misklasifikasi) awal pengelompokan.
Selama ini penjurusan mahasiswa di banyak fakultas perguruan tinggi hanya berdasarkan minat
mahasiswa pada saat masuk perguruan tinggi, belum mempertimbangkan prestasi akademik mahasiswa,
misalnya nilai NEM (Nilai Ebtanas Murni) dan IPK (Indeks Prestasi Kumulatif) mahasiswa saat awal
belajar di perguruan tinggi pada jurusan tertentu. Dengan demikian, belum diketahui apakah mahasiswa
tersebut benar-benar sesuai untuk masuk jurusan tersebut atau lebih sesuai jika masuk jurusan lainnya.
Apa faktor yang dapat dijadikan kriteria bahwa mahasiswa tertentu tidak sesuai dengan jurusan yang
dipilihnya.. Berdasarkan hal-hal tersebut di atas, dalam penelitian ini akan dibahas faktor-faktor
penentu yang membedakan populasi (kelompok) dalam hal ini kelompoknya adalah jurusan-jurusan di
FMIPA serta melihat misklasifikasi mahasiswa FMIPA Universitas Jember berdasarkan data
mahasiswa angkatan 1998/1999.

TINJAUAN PUSTAKA
Analisis Diskriminan Untuk Beberapa Pengelompokan
Kita asumsikan bahwa k populasi mempunyai matrik peragam (kovarian) yang sama å, dengan vektor

77
Jurnal ILMU DASAR Vol. 4 No. 2, 2003 : 77-82
78

nilai tengah (mean) m1 sampai mk. Misalnya dinotasikan sampel dari populasi pertama
y11,y22,...,y1n1, populasi kedua y21,y22,...,y2n2, sampai populasi ke-k adalah. yk1,yk2,...,yknk.
Masing-masing vektor yij terdiri dari p variabel. Misalnya
Fungsi diskriminan merupakan kombinasi linier dari p variabel dengan jarak vektor nilai tengah
maksimum untuk k pengelompokan. Kombinasi linier , dengan melambangkan transpos
matriks , mentransformasi masing-masing pengamatan dari bentuk vektor menjadi skalar.
= = a1y1j1 + a2y1j2 + ... + apy1jp , j = 1, 2, ..., n1

.
.
.
= = a1ykj1 + a2ykj2 + ... + apykjp , j = 1, 2, ..., nk.

Jika n1 + n2 +…+ nk merupakan vektor observasi dalam k sampel,


y11 y 21 … y k1
y 12 y 22 … y k2
. . .
. . .
. . .
y1n1 y2n2 yknk

ditransfer ke bentuk skalar :

11 …
12 21 … k1
.
. 22 k2
. . .
. .

1n1 . .

2n2 kn2
Atau , i = 1, 2, ... , k ; j = 1, 2, ... , ni dan nilai tengah . Dalam analisis

diskriminan ingin dicari vektor a yang memisahkan secara maksimal dengan menggunakan :

= =

untuk kasus 2 pengelompokan.


Untuk kasus k pengelompokan, kita menggunakan matrik H dari MANOVA (analisis varians untuk
multivariat) untuk dan matrik E untuk Spl sehingga diperoleh

78
Jurnal ILMU DASAR Vol. 4 No. 2, 2003 : 77-82
79

dengan
H adalah matrik peragam antar kelompok.
E adalah matrik peragam dalam kelompok
Ini dapat ditulis dalam bentuk
atau atau (E –1 H - lI)a = 0 ………………………(1)
l = akar ciri yang memenuhi persamaan ciri (1)
a = vektor ciri padanan bagi akar ciri l
Bila fungsi diskriminan yang memaksimumkan nisbah antara matrik peragam antar kelompok
dengan matrik peragam dalam kelompok maka yang ingin kita cari ialah a1 sehingga
maksimum, demikian juga untuk fungsi diskriminan Z2, ingin dicari a2 sehingga

maksimum setelah l2, dan seterusnya.


Uji L Wilks digunakan untuk menguji vektor nilai tengah yang berbeda secara signifikan. Uji L Wilks

dinyatakan dengan ,

yang berdistribusi Lp , k – 1, N – k dengan


N = åi ni untuk model tidak seimbang atau N = kn
2
untuk kasus seimbang. Kita dapat menggunakan c sebagai aproksimasi untuk Lm dengan v adalah

statistik V-Barlett. Selanjutnya, uji masing –masing li sampai menolak H0. , dengan

berdistribusi sebagai Lp – m + 1 , k – m , N - k – m +1, sehingga


vm = - [ N – 1 – ½ ( p + k ) ] ln L m

=[N–1–½(p+k)] dengan distribusi approksimasi c2 (p – m + 1)(k – m).

Kita dapat juga menggunakan aproksimasi uji F untuk masing–masing Li. Untuk

dengan vE = N – k dan vH = k – 1,maka , dengan

, w = N – 1 – ½ (p + k)

df1 = p (k – 1) df2 = wt – ½ [ p (k – 1) – 2 ].

Untuk , m =2, 3, ... , s maka ,

dengan p – m – 1 dan k – m di tempatkan pada p dan k – 1 .

79
Jurnal ILMU DASAR Vol. 4 No. 2, 2003 : 77-82
80

w = N – 1 – ½ (p + k)
df1 = (p – m + 1)(k – m)
df2 = wt – ½ [ (p – m + 1)(k – m) – 2 ]
(Alvin C Rencher ; 1996 : 303 - 313).
Apabila variabel-vareiabel yang digunakan dalam analisis di atas mempunyai skala yang berbeda, maka
analisis dilakukan terhadap variabel yang dibakukan.

Rata-rata Misklasifikasi
Untuk menghitung proses pengklasifikasian dalam memprediksikan anggota pengelompokan , biasanya
dengan menggunakan probabilitas misklasifikasi yang disebut sebagai rata-rata kesalahan (error rate).
Sedangkan komplemen dari rata-rata kesalahan adalah rata-rata pengklasifikasian yang benar (correct
classification rate).
Untuk kasus dua pengelompokan hal tersebut di atas dapat dicari sebagai berikut

dengan :
= rata-rata kesalahan
n1 = pengamatan dalam kelompok 1
n11 = hasil yang diklasifikasikan benar dalam kelompok 1
n12 = hasil yang misklasifikasi dalam kelompok 1
n1 = n11 + n12
n2 = pengamatan dalam kelompok 2
n22 = hasil yang diklasifikasikan benar dalam kelompok 2
n21 = hasil yang misklasifikasi dalam kelompok 2
n2 = n21 + n22
Dengan cara yang sama, kita dapat mendefinisikan sebagai berikut:
maka rata-rata kesalahan = 1 – rata-rata

pengklasifikasian yang benar


Kita dapat menggunakan (2) dan (3) untuk kasus beberapa pengelompokan.

METODOLOGI
Subjek penelitian yang digunakan dalam penelitian ini adalah mahasiswa Fakultas MIPA Universitas
Jember. Pada penelitian ini populasi penelitian di batasi pada mahasiswa Fakultas MIPA Universitas
Jember angkatan 1998/1999. Sampel penelitian di ambil sebanyak mahasiswa yang ada pada angkatan
tersebut.
Variabel independen yang digunakan dalam penelitian ini :
y1/nmath : nilai NEM matematika untuk semua jurusan;
y2/nrmath : nilai rata-rata mata kuliah matematika untuk semua jurusan pada semester I dan II;
y3/nfis : nilai NEM fisika untuk semua jurusan;
y4/nrfis : nilai rata-rata mata kuliah fisika untuk semua jurusan pada semester I dan II;
y5/nkim : nilai NEM kimia untuk semua ju- rusan;

80
Jurnal ILMU DASAR Vol. 4 No. 2, 2003 : 77-82
81

y6/nrkim: nilai rata-rata mata kuliah kimia untuk semua jurusan pada semester I dan II;
y7/nbio : nilai NEM biologi untuk semua jurusan;
y8/nrbio : nilai rata-rata mata kuliah biologi untuk semua jurusan pada semester I dan II;
y9/nlain : nilai NEM lainnya untuk semua jurusan yaitu PPKN, Bahasa Indonesia dan Bahasa Inggris;
y10/nrlain : nilai rata-rata mata kuliah lainnya yang tidak berhubungan dengan matematika, fisika, kimia
dan biologi;
Tahapan-tahapan penelitian yang dilakukan sebagai berikut :
1. mengelompokkan mahasiswa per jurusan dengan pemberian kode, matematika(kode 1), fisika (kode
2), kimia (kode 3) dan biologi (kode 4);
2. menggunakan analisis diskriminan untuk mengetahui misklasifikasi awal pengelompokan.
Pengolahan data dilakukan dengan menggunakan paket program SPSS versi 7.5.
3. menganalisa misklasifikasi awal pengelompokan mahasiswa FMIPA angkatan 1998/1999 Universitas
Jember dan menentukan langkah yang terbaik bagi pihak Fakultas MIPA Universitas Jember.

HASIL DAN PEMBAHASAN


Karena terdapat 4 kelompok , maka akan terbentuk tiga fungsi diskriminan. Berdasarkan hasil analisis,
kita dapat menguji tiga fungsi diskriminan yang diperoleh, dengan statistik V-Barlett yang menyebar
mengikuti sebaran Khi-Kuadrat (Tabel 1). Karena angka statistik V-Barlett lebih besar dari Khi-Kuadrat
dengan tingkat signifikansi 0.01, maka pengujian menunjukkan hasil yang nyata, sehingga dapat
diartikan bahwa antara ketiga fungsi diskriminan yang ada terdapat paling sedikit sepasang peubah yang
memiliki nilai tengah berbeda, sehingga dalam hal ini analisis diskriminan layak untuk digunakan. Hasil
yang sama akan diperoleh dengan menggunakan pendekatan uji F.

Tabel 1. Statistik V-Barlett Dengan Sebaran Khi


Kuadrat

Fgs S t a t is t ik F Nilai Sig


V-Barlett Khi-Kuad
rat
1 72,778 2,648 43,8 0,00
2 42,906 2,578 28,9 0,00
3 17,662 2,359 15,5 0,00
Keterangan : Fgs = fungsi
Keragaman relatif antar kelompok terhadap keragaman dalam kelompok yang dituntunjukkan oleh
besarnya akar ciri, persentase keragaman relatif dan korelasi kanonik antara fungsi diskriminan dengan
ketiga variabel dummy yang mebatasi anggota-anggota dari 4 jurusan dapat dilihat pada tabel 2 berikut
ini.

Tabel 2. Akar Ciri

% Korelasi
A k a r %
Fgs raga kanonik
ciri kumulatif
m
1 0,379a 41,9 41,9 0,533
2 0,330a 34,9 76,8 0,498
3 0,219a 23,2 100,0 0,424

81
Jurnal ILMU DASAR Vol. 4 No. 2, 2003 : 77-82
82

Dari tabel tersebut dapat diketahui bahwa persentase relatif tertinggi yang ditunjukkan oleh fungsi
diskriminan-1 adalah sebesar 41.9% dengan korelasi kanonik sebesar 0.533. Keeragaman relatif dan
korelasi kanonik terbesar ke-2 ditunjukkan oleh fungsi diskriminan-2, dan seterusnya.
Untuk mencari variabel-variabel asal yang dianggap dominan untuk digunakan dalam membedakan
antar kelompok, dilakukan prosedur stepwise. Dari prosedur stepwise yang dilakukan, dengan hasil
Tabel 3, terdapat lima variabel yang dianggap dominan untuk digunakan dalam membedakan antar
kelompok yang selanjutnya digunakan untuk membentuk fungsi diskriminan, yakni variabel nilai
rata-rata kimia (y6), nilai rata-rata biologi (y8), nilai rata-rata matematika (y2), nilai NEM kimia (y5)
dan nilai rata-rata fisika (y1). Koefisien baku dari fungsi diskriminan yang diperoleh adalah seperti tabel
4.

Tabel 3. Variabel Yang Dimasukkan/Dikeluarkan

Variabel Wilks Lambda


Lang
yang di
kah
Masukkan
Exact F Aproximate F
Statis db db2 db3 Statis db1 db2 Sig Statis d db2 sig
tik tik tik b
1
1
1 y6/nrkim 0,818 1 3 93 6,877 3 93 0,00
2 y8/nrbio 0,679 2 3 93 6,546 6 184 0,00
3 y2/nrmath 0,596 3 3 93 5,839 9 221,621 0,00
y5/nkim 1
4 0,513 4 3 93 5,710 238,409 0,00
2
y4/nrfis 1
5 0,441 5 3 93 5,656 246,091 0,00
5

Tabel 4. Koefisien Baku Fungsi Diskriminan


Kanonik

Fungsi
1 2 3
y2/nrmath -0,863 -0,080 -0,307
y4/nrfis 0,471 -0,656 0,284
y5/nkim 0,522 0,330 0,679
y6/nrkim 0,464 0,391 -1,045
y8/nrbio -0,426 0,704 0,479

Dari Tabel 4 di atas, maka fungsi diskriminan yang terbentuk :


= -0,863*y2 + 0,471* y4 + 0,522* y5 + 0,464* y6 -0,426 * y8

= -0,080*y2 - 0,656* y4 + 0,330* y5 + 0,391* y6 + 0,704* y8

82
Jurnal ILMU DASAR Vol. 4 No. 2, 2003 : 77-82
83

= -0,307*y2 + 0,284* y4 + 0,679* y5 - 1,045* y6 + 0,479* y8

Terkait dengan penjelasan mengenai fungsi diskriminan, maka hubungan ketiga fungsi bisa diperlihatkan
seperti pada Gambar 1.
Dari peta di atas dapat dilihat terdapat 4 kelompok (jurusan) dengan anggota-anggota di dalamnya
(mahasiswa). Daerah yang dibatasi oleh kode 1 menunjukkan wilayah matematika, kode-2 fisika, kode
3 kimia dan kode 4 biologi.
Untuk kasus individu dengan Nim: 98-1017, dengan data:

y2/nrmath = 2,83 ; y4/nrfis = 1,5 ;


y5/nkim = 7,84 ; y6/nrkim = 3 ; y8/nrbio = 2 ;
= -0,863*(2,83) + 0,471*(1,5) + 0,522* (7,84) + 0,464*(3) -0,426 *(2)
= 2,89669
= -0,080*(2,83) - 0,656* (1,5) + 0,330*(7,84) + 0,391*(3) + 0,704*(2)

= 3,9578
= -0,307*(2,83) + 0,284*(1,5) + 0,679*(7,84) - 1,045*(3) + 0,479*(2)
= 2,70355,
maka mahasiswa tersebut masuk ke kelompok kimia.
Pengklasifikasian individu ke dalam kelompok, berdasarkan fungsi diskriminan yang diperoleh, dapat
dilihat pada tabel 5.
Dari tabel 5 dapat dilihat bahwa mahasiswa matematika yang diprediksikan ke dalam kelompok
matematika sebanyak 15 orang, yang diprediksikan ke dalam kelompok fisika sebanyak 4 orang, kimia
2 orang dan biologi 5 orang. Demikian juga untuk kelompok fisika, kimia dan biologi.

83
Jurnal ILMU DASAR Vol. 4 No. 2, 2003 : 77-82
84

Fungsi 2
-3.0 -2.0 -1.0 .0 1.0 2.0 3.0
+---------+---------+---------+---------+---------+---------+
3.0 + 13 +
I 13 I
I 13 I
I 13 I
I s 13 I
I 13 I
2.0 + + + + 13 + + +
I 13 I
I 13 I
I 13 I
I 13 I
I 13 I
1.0 + + + + 13 + + +
I 13 I
I * 13 I
I 13 I
I 13 * I
I111111111111 13 I
.0 +4444444444441111111111111111111333 + + +
I 4444444444444444442222333 I
I 42 222333 I
I 42 * 222333 I
I * 42 222333 I
I 42 222333 I
-1.0 + + + +42 + 2223333 +
I 42 2222333 I
I 42 222333 I
I 42 22233I
I 42 22I
I 42 I
-2.0 + + + + 42 + + +
I 42 I
I 42 I
I 42 I
I 42 I
I 42 I
-3.0 + 42 +
+---------+---------+---------+---------+---------+---------+
-3.0 -2.0 -1.0 .0 1.0 2.0 3.0
Fungsi 1

Simbol yang digunakan pada peta wilayah


simbol kelompok
------ ----- --------------------
1 Math
2 Fis
3 Kim
4 Bio
* menunjukkan pusat kelompok

Gambar 1 . Peta Wilayah untuk 4 jurusan

Tabel 5. Hasil Pengklasifikasian

Kelo mp ok Anggota Kelompok Yang Diprediksikan


Asli
Matematika Fisika Kimia Biologi
Matematika 15 4 2 5
Fisika 3 11 6 4
Kimia 4 3 16 2
Biologi 4 3 4 11

84
Jurnal ILMU DASAR Vol. 4 No. 2, 2003 : 77-82
85

Jadi dari hasil pengklasifikasian tersebut, data yang telah terklasifikasikan dengan benar sebesar 54,6%.
Hal ini berarti 54,6% dari 97 data yang diolah telah dimasukkan pada kelompok yang sesuai dengan
data semula. Dengan demikian, terjadi misklasifikasi mahasiswa FMIPA angkatan 1998/1999
Universitas Jember sebesar 45,4%. Hal ini mungkin disebabkan pengelompokan mahasiswa pada waktu
UMPTN diumumkan didasarkan minat atau pilihan kedua. Setelah mahasiswa tersebut menjalani selama
dua semester ternyata nilai yang diperoleh untuk mata kuliah yang sesuai dengan jurusan tidak sesuai
dengan harapannya, tetapi untuk nilai mata kuliah lainnya memperoleh nilai lebih baik. Meskipun begitu,
berdasarkan aturan administrasi yang masih berlaku, mahasiswa tersebut tetap tinggal pada jurusannya
masing-masing, karena pemilihan jurusan yang dilakukan pada awal penerimaan mahasiswa sementara
dianggap final. Dari tabel di atas, relokasi individu-individu yang salah alokasi paling besar terjadi pada
pengelompokan fisika sebesar 54,2% dan paling sedikit terjadi pada pengelompokan kimia sebesar 36%.
Sedangkan untuk pengelompokan biologi dan matematika yaitu 50% dan 42,3%. Makna angka sebesar
54,2% adalah jumlah persentase total dari mahasiswa yang salah alokasi terhadap kelompok fisika, dan
seterusnya untuk persentase kelompok yang lain

KESIMPULAN DAN SARAN


Kesimpulan
Dari pembahasan pada bab sebelumnya dapat diambil kesimpulan sebagai berikut.
1. Variabel yang membedakan misklasifikasi awal pengelompokan adalah nilai rata-rata matematika
(y2), nilai rata-rata fisika (y4), nilai NEM kimia (y5) , nilai rata-rata kimia (y6)dan nilai rata-rata
biologi (y8).
2. Ada tiga fungsi diskriminan yang terbentuk, terkait dengan pengelompokan mahasiswa pada
jurusannya, yakni:
= -0,863*y2 + 0,471* y4 + 0,522* y5 + 0,464* y6 -0,426 * y8

= -0,080*y2 - 0,656* y4 + 0,330* y5 + 0,391* y6 + 0,704* y8

= -0,307*y2 + 0,284* y4 + 0,679* y5 - 1,045* y6 + 0,479* y8

3. Hasil penelitian menunjukkan terjadinya misklasifikasi mahasiswa FMIPA angkatan 1998/1999


Universitas Jember sebesar 45,4%. Angka yang relatif tinggi mungkin disebabkan karena belum
memperhatikan profil kemampuan akademik dari mata kuliah yang terkait (baik NEM, mata kuliah
dari kemipaan).
4. Ada perbedaan yang signifikan (kurang dari 1%) untuk ketiga fungsi diskriminan yang menerangkan
perbedaan antara kelompok matematika, fisika, kimia dan biologi, sehingga analisis diskriminan
layak untuk digunakan.

Saran
Dari pembahasan pada bab sebelumnya dapat diambil saran sebagai berikut.
1. Melihat adanya misklasifikasi yang relatif tinggi, sebaiknya pihak FMIPA Universitas Jember
memberikan informasi dan wawasan yang luas mengenai prospek dan prasyarat dari masing-masing
jurusan di masa yang akan datang untuk pelajar SMU yang akan mengikuti UMPTN serta
memberikan motivasi cara belajar yang efektif untuk menghasilkan lulusan yang berkualitas.
2. Sistem penjurusan mahasiswa FMIPA Universitas Jember ada baiknya mempertimbangkan prestasi
akademik awal setelah di Perguruan Tinggi selain minat dan profil NEM.

85
Jurnal ILMU DASAR Vol. 4 No. 2, 2003 : 77-82
86

3. Penelitian dapat di kembangkan dengan menggunakan sampel yang lebih luas (berbagai angkatan)
dan variabel lain (nilai STTB dan hasil skor UMPTN).

DAFTAR PUSTAKA
Cooper, D.R. & W. E. Morry. 1999. Metode Penelitian Bisnis. Jilid II, Erlangga. Jakarta.
Huberty, J. C. 1994. Applied Discriminant Analysis. Inc. 605 Third Avene. New York.
Johnson, R.A. & D.W. Wichern. 1992. Applied Multivariate Statistical Analysis. University of
Winconsin Practice Hall, Inc. New York.
Rencher, A. C. 1996. Methods of Multivariate Analysis. Inc. New York.
Siswadi & Budi S. 1999. Analisis Eksplorasi Data Peubah Ganda & SPSS versi 7.5. Jurusan
Matematika FMIPA-IPB.

86