Anda di halaman 1dari 8

PENGGUNAAN MULTIDIMENSI ITEM RESPON TEORI DALAM MENGANALISIS

HASIL UN MATA PELAJARAN BAHASA INDONESIA DI YOGYAKARTA TAHUN 2015

Darmanto Minggele1

Abstrak
Artikel ini merupakan studi yang bertujuan untuk melakukan estimasi parameter dan juga untuk
mengetahui model fit dari hasil UN mata pelajaran Bahasa Indonesia di Yogyakarta. Data dalam
penelitian ini adalah data hasil Ujian Nasional yang merupakan pola respon siswa dari soal tes
paket 1 untuk mata pelajaran Bahasa Indonesia pada wilayah Yogyakarta tahun 2015 dimana tes
tersebut terdiri dari 50 butir dengan jumlah peserta tes sebanyak 430 siswa. Berdasarkan tabel tes
KMO dan Bartlett diperoleh nilai 0.8 yang bermakna kecukupan data telah terpenuhi dan
berikutnya dilakukan proses analisis faktor sehingga terbentuk 6 komponen dimana setelah
dilakukan rotasi dengan metode varimax dapat disimpulkan bahwa data tidak unidimensi sehingga
dilakukan analisis multidimensi. Dari hasil analisis multidimensi 2-PL diperoleh hasil untuk
parameter diskriminasi butir menyebar pada semua kategori tetapi yang terbanyak ada pada
kategori very high sejumlah 21 butir, dan 10 butir pada kategori high. Selanjutya mengenai
parameter kesulitan butir, nampak bahwa yang tertinggi ada pada kategori very easy dan easy
dengan jumlah butirnya berturut-turut sebanyak 38 dan 10. Kemudian berdasarkan analisis MIRT
ini juga dapat dinyatakan bahwa ada butir-butir dalam tes ini yang tidak fit sehingga seharusnya
tidak digunakan diantaranya butir 3, 5, 8, 18, 22, 25, 27, 31, 36, 41, dan 44. Adapun tindak lanjut
yang dapat diambil dari penelitian ini adalah merekomendasikan penggunaan model MIRT
dikarenakan model ini sangat baik untuk memperoleh hasil analisis yang lebih akurat dalam
mengevaluasi tes dan kompetensi peserta ujian, serta bagi peneliti dapat melakukan analisis-
analisis lebih lanjut terhadap data-data hasil UN guna peningkatan kualitas pendidikan khususnya
di Indonesia.
Keywords
MIRT, UN, Bahasa Indonesia..
A. PENDAHULUAN
Untuk mengetahui kemampuan seseorang di bidang tertentu, tes merupakan salah satu
instrumen yang sering digunakan. Tes dapat digunakan setelah melalui proses pengembangan
dengan terlebih dahulu melakukan perancangan, perakitan dan analisis butir tes berdasarkan
berbagai pendekatan, baik menggunakan teori tes klasik maupun teori respon butir. Pengembangan
tes dengan pendekatan teori respon butir memiliki keunggulan, diantaranya dapat menghasilkan
parameter butir yang independen dari peserta tes dan parameter peserta tes yang bersifat
independen dari sekumpulan butir yang diujikan (Xitao Fan, 1998). Sifat invarian dari model teori
repon butir membuat teori respon butir secara teoritis bisa digunakan untuk menyelesaikan
permasalahan yang tidak dapat diselesaikan oleh teori tes klasik. Pada teori respon butir, ada

1
Guru MAN 1 Flores Timur dan Mahasiswa Program Pascasarjana Penelitian dan Evalausi Pendidikan di Universitas
Negeri Yogyakarta. e-mail: darmantominggele.2018@student.uny.ac.id
asumsi yang harus dipenuhi, yakni independensi lokal dan unidimensi (Hambleton, Swaminathan,
dan Rogers, 1985).
Independensi lokal terjadi jika kemampuan yang mempengaruhi kinerja suatu tes adalah
konstan, artinya respon peserta tes dalam menjawab suatu butir tes independen secara statistik
terhadap respon peserta tes tersebut dalam menjawab butir lainnya. Dengan kata lain, asumsi
independensi lokal menyatakan bahwa tidak ada korelasi antara respon peserta tes pada butir soal
yang berbeda. Ini berarti bahwa kemampuan yang dinyatakan dalam model merupakan satu-
satunya faktor yang mempengaruhi respon peserta tes terhadap butir soal. Unidimensi, artinya tes
hanya mengukur satu kemampuan tertentu. Asumsi unidimensi dapat ditunjukkan jika tes
mengandung hanya satu komponen dominan yang mengukur prestasi suatu subjek. Pada
praktiknya, asumsi unidimensi tidak dapat dipenuhi secara ketat karena adanya faktor-faktor
kognitif, kepribadian, dan administratif dalam tes, seperti kecemasan, motivasi, dan tendensi untuk
menebak. Pada kenyataannya di lapangan, asumsi unidimensi sulit terpenuhi. Hal ini sesuai dengan
pendapat bahwa kebanyakan tes pendidikan dan psikologi pada beberapa tingkat bersifat
multidimensi (Bolt dan Lall, 2003).
Pada data yang realitasnya berbentuk multidimensi, kemudian di analisis dengan model
unidimensi maka akan menyesatkan. Terkait dengan hal ini, pada data yang bersifat multidimensi,
diperlukan analisis dengan pendekatan multidimensi untuk mengestimasi parameter peserta dan
parameter butir. Pada tulisan ini dibahas tentang parameter peserta, parameter butir tes, dan
estimasinya dengan pendekatan teori respon butir multidimensi.
B. METODE
Tes yang digunakan pada analisis ini merupakan tes UN dikarenakan butir tes UN itu sendiri
telah melalui tahapan pengembangan yang baik oleh BSNP. Pada penyelenggaraan tes berskala
besar seperti UN ini, oleh BSNP telah disiapkan tujuh paket tes dengan rincian lima paket untuk
UN utama dan dua paket tes untuk UN susulan pada setiap mata pelajaran baik pada sekolah
tingkat menegah pertama maupun tingkat atas. Pada teori respon butir, tes yang berbentuk multiple
choice atau pilihan majemuk tergolong dalam kategori data dikotomus, sedangkan tes atau
kuisioner yang berbentuk uraian tergolong dalam kategori data politomus. Pada butir dikotomus,
model yang sering digunakan adalah model logistik satu parameter, dua parameter, dan tiga
parameter yang berturut-turut disingkat dengan 1-PL, 2-PL, dan 3-PL. Model logistik satu
parameter sering disebut juga model Rasch. Parameter-parameter model ini meliputi parameter
daya pembeda, tingkat kesulitan dan tebakan semu. Berdasarkan keterangan di atas maka
pemilihan data hasil Ujian Nasional yang diambil yaitu paket 1 untuk mata pelajaran Bahasa
Indonesia pada wilayah Yogyakarta tahun 2015 dimana tes tersebut terdiri dari 50 butir dengan
jumlah peserta tes sebanyak 430 siswa. Berikutnya analisis data dikotomus menggunakan program
R dengan package-package yang telah disiapkan sehingga bisa di lihat model FIT pada analisis
data tersebut.
C. HASIL DAN PEMBAHASAN
Analisis data dikotomus dengan menggunakan teori respon butir, langkah pertama yang
dilakukan adalah menguji dimensi dari data empiris yang telah diperoleh. Proses pengujian
dilakukan dengan analisis faktor eksploratori dengan metode principal component analysis (PCA).
Asumsi awal yang harus dipenuhi dalam analisis faktor eksploratori adalah tes KMO dan Bartlett
sebagai berikut.
Tabel 1. KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .800
Approx. Chi-Square 4802.807
Bartlett's Test of Sphericity Df 1225
Sig. .000

Dalam penelitian ini, dapat dikatakan telah memiliki kecukupan data yang diindikasikan
dengan KMO = 0.8 > 0.5. Selain itu signifikansi Bartlett’s test menunjukkan bahwa Hipotesis Nol
matriks korelasi merupakan matriks identitas ditolak sehingga data membentuk matriks korelasi
dengan ada hubungan kedekatan antar variabel. Kemudian berdasarkan analisis pada semua data
anti-images correlation maka measures of adequate sampling (MSA) telah memiliki nilai diatas
0,5 sehingga semua data telah layak masuk dalam analisis faktor. Dalam analisis faktor dihasilkan
data pengelompokan sebagai berikut.
Tabel 2. Total Variance Explained

Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings

Component % of Cumulative % of Cumulative % of Cumulative


Total Total Total
Variance % Variance % Variance %

1 7.758 15.517 15.517 7.758 15.517 15.517 5.542 11.083 11.083

2 2.052 4.104 19.621 2.052 4.104 19.621 2.502 5.003 16.087


3 1.752 3.504 23.125 1.752 3.504 23.125 2.254 4.508 20.595
4 1.663 3.325 26.450 1.663 3.325 26.450 2.056 4.113 24.708

5 1.539 3.079 29.529 1.539 3.079 29.529 2.032 4.064 28.771


6 1.502 3.003 32.532 1.502 3.003 32.532 1.880 3.761 32.532
. . . .
. . . .
. . . .
48 .308 .617 98.973
49 .284 .567 99.540
50 .230 .460 100.000

Extraction Method: Principal Component Analysis.

Metode principal component analysis (PCA) mereduksi atau mengurangi jumlah variabel
yang diamati menjadi sejumlah kecil komponen utama yang membentuk sebagian besar varian
dari variabel yang diamati. Jumlah faktor dapat ditentukan dengan memilih faktor-faktor yang
memiliki nilai eigen lebih besar dari 1. Nilai ini berarti bahwa faktor-faktor ini lebih dari rata-rata
total varians dalam item, yang dikenal sebagai aturan (Guttman, 1954; Kaiser 1960). Dengan
demikian data empiris menunjukkan bahwa item soal UN untuk mata pelajaran Bahasa Indonesia
terbagi menjadi 6 faktor. Dengan menggunakan rotasi varimax maka 50 butir soal mengelompok
dalam 6 faktor sebagai berikut.

Tabel 3. Komponen rotasi matrix dengan metode varimax


Rotated Component Matrixa Rotated Component Matrixa
Component Component
Butir Butir
1 2 3 4 5 6 1 2 3 4 5 6
B1 .324 .469 B26 .502
B2 .413 .353 B27
B3 B28 .522 .325
B4 .429 B29 .358 .382
B5 B30 .341 .335
B6 .529 .496 B31 .348
B7 .308 .401 B32 -.392
B8 B33 .604
B9 .509 B34 .530
B10 -.312 B35 .609
B11 .391 -.493 B36 .400
B12 .436 B37 .331 .616
B13 .552 .304 B38 .315 .602
B14 .479 B39 .368
B15 .317 B40 .479 .403 .328
B16 .559 B41
B17 .537 B42 .359 .319 .400
B18 .351 B43 .454
B19 .572 B44
B20 .332 .312 -.516 B45 .539
B21 .563 B46 .538
B22 B47 .389 .422
B23 -.308 B48 .486 .319
B24 .339 B49 .406
B25 B50 .415
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 18 iterations.
Berdasarkan pada analisis faktor maka dapat disimpulkan bahwa data tidak unidimensi
sehingga tidak dapat dilakukan analisis teori respon butir unidimensi. Oleh karena itu data
kemudian akan dianalisis dengan menggunakan teori respon butir multidimensi, dalam kasus ini
memuat 2 dan 3 dimensi. Berikut adalah rangkuman dimensi (faktor) dan anggota himpunannya
(butir).
F1 = 9, 11, 13, 17-20, 24, 26, 28-29, 31, 33-35, 37, 40, 42-43, 46-48
F2 = 4, 7, 28, 32, 36, 38-39, 45, 48-49
F3 = 1, 6, 10, 12, 29, 37, 40, 47
F4 = 1, 6-7, 13-14, 21
F5 = 2, 16, 20, 23, 30, 38, 40, 42
F6 = 2, 11, 15, 20, 30, 42, 50
Sedangkan untuk butir dengan 2 dan 3 dimensi mengikuti formula COV = F1 * F2 hal ini bisa
dilihat dari adanya butir yang memiliki nilai koefisien yang lebih dari 0.3 yakni pada butir 28
dimana terletak pada F1 dengan nilai koefisien sebesar 0.522 serta pada F2 dengan nilai 0.325.
Formula ini juga berlaku untuk faktor-faktor yang lain yang memiliki dimensi yang lebih dari satu.
Berikut ini disajikan tabel yang merupakan hasil keluaran dari program R menggunakan
package MIRT yang menunjukkan hasil estimasi parameter tes dengan menggunakan
multidimensi teori respon butir.
Tabel 4. Estimasi parameter tes dengan MIRT
Butir a1 a2 a3 a4 a5 a6 d Butir a1 a2 a3 a4 a5 a6 d
2.64 0.00 0.00 0.00 0.00 0.00 6.88
B1 0.000 0.000 1.332 1.427 0.000 0.000 4.102 B26
4 0 0 0 0 0 0
-
0.00 0.00 0.00 0.00 0.00 0.00
B2 0.000 0.000 0.000 0.000 2.989 1.813 9.350 B27 1.06
0 0 0 0 0 0
5
1.57 0.56 0.00 0.00 0.00 0.00 4.03
B3 0.000 0.000 0.000 0.000 0.000 0.000 2.826 B28
4 6 0 0 0 0 9
1.53 0.00 0.85 0.00 0.00 0.00 4.86
B4 0.000 1.794 0.000 0.000 0.000 0.000 1.408 B29
1 0 7 0 0 0 9
0.00 0.00 0.00 0.00 0.97 0.92 2.61
B5 0.000 0.000 0.000 0.000 0.000 0.000 0.042 B30
0 0 0 0 1 7 3
25.42 0.56 0.00 0.00 0.00 0.00 0.00 1.74
B6 0.000 0.000 7.868 3.424 0.000 0.000 B31
9 7 0 0 0 0 0 9
- -
0.00 0.00 0.00 0.00 0.00
B7 0.000 2.107 0.000 1.015 0.000 0.000 4.321 B32 0.76 0.86
0 0 0 0 0
7 3
2.83 0.00 0.00 0.00 0.00 0.00 8.43
B8 0.000 0.000 0.000 0.000 0.000 0.000 2.421 B33
4 0 0 0 0 0 5
1.69 0.00 0.00 0.00 0.00 0.00 4.41
B9 2.193 0.000 0.000 0.000 0.000 0.000 5.306 B34
7 0 0 0 0 0 0
1.89 0.00 0.00 0.00 0.00 0.00 3.92
B10 0.000 0.000 -0.222 0.000 0.000 0.000 -0.609 B35
8 0 0 0 0 0 0
- 18.55 0.00 0.49 0.00 0.00 0.00 0.00 1.05
B11 4.987 0.000 0.000 0.000 0.000 B36
6.369 1 0 9 0 0 0 0 2
2.16 0.00 2.11 0.00 0.00 0.00 8.22
B12 0.000 0.000 1.626 0.000 0.000 0.000 4.720 B37
7 0 9 0 0 0 6
0.00 2.05 0.00 0.00 1.21 0.00 3.90
B13 1.598 0.000 0.000 1.044 0.000 0.000 4.719 B38
0 7 0 0 2 0 6
0.00 1.50 0.00 0.00 0.00 0.00 1.45
B14 0.000 0.000 0.000 2.847 0.000 0.000 5.111 B39
0 3 0 0 0 0 3
2.86 0.00 2.18 0.00 1.64 0.00 8.46
B15 0.000 0.000 0.000 0.000 0.000 0.994 2.742 B40
2 0 5 0 4 0 6
0.00 0.00 0.00 0.00 0.00 0.00 1.16
B16 0.000 0.000 0.000 0.000 1.384 0.000 3.734 B41
0 0 0 0 0 0 5
0.80 0.00 0.00 0.00 0.92 0.95 3.20
B17 1.688 0.000 0.000 0.000 0.000 0.000 2.708 B42
3 0 0 0 2 9 5
1.48 0.00 0.00 0.00 0.00 0.00 2.98
B18 0.575 0.000 0.000 0.000 0.000 0.000 1.400 B43
8 0 0 0 0 0 1
0.00 0.00 0.00 0.00 0.00 0.00 0.33
B19 1.231 0.000 0.000 0.000 0.000 0.000 3.039 B44
0 0 0 0 0 0 4
- 0.00 1.81 0.00 0.00 0.00 0.00 1.74
B20 2.256 0.000 0.000 0.000 0.718 8.199 B45
0.928 0 9 0 0 0 0 6
1.86 0.00 0.00 0.00 0.00 0.00 4.74
B21 0.000 0.000 0.000 1.306 0.000 0.000 2.814 B46
7 0 0 0 0 0 6
1.68 0.00 0.92 0.00 0.00 0.00 5.42
B22 0.000 0.000 0.000 0.000 0.000 0.000 0.550 B47
8 0 4 0 0 0 4
- 1.57 0.15 0.00 0.00 0.00 0.00 3.36
B23 0.000 0.000 0.000 0.000 0.000 1.052 B48
0.457 2 9 0 0 0 0 2
0.00 1.17 0.00 0.00 0.00 0.00 1.26
B24 1.387 0.000 0.000 0.000 0.000 0.000 3.221 B49
0 1 0 0 0 0 9
0.00 0.00 0.00 0.00 0.00 2.60 4.31
B25 0.000 0.000 0.000 0.000 0.000 0.000 0.540 B50
0 0 0 0 0 8 5
Tabel 5. Kriteria kombinasi diskriminasi dan tingkat kesulitan butir
Kriteria Kriteria
Butir MDISC Kriteria MDISC MDIFF Kriteria MDIFF Butir MDISC MDIFF
MDISC MDIFF
-
B1 1.95181153 Very High -2.1014766 Very Easy B26 2.6441071 Very High Very Easy
2.6020204
B2 3.4960274 Very High -2.6746009 Very Easy B27 0 Very Low -4 Very Easy
-
B3 0 Very Low -4 Very Easy B28 1.6722034 High Very Easy
2.4155095
-
B4 1.7944176 Very High -0.7846689 Easy B29 1.7543242 Very High Very Easy
2.7752905
B5 0 Very Low -4 Very Easy B30 1.3426896 Moderator -1.946366 Easy
-
B6 8.5804947 Very High -2.9635506 Very Easy B31 0.5665513 Low Very Easy
3.0871858
B7 2.3388978 Very High -1.8473268 Easy B32 0.7674723 Moderator 1.1248685 Hard
-
B8 0 Very Low -4 Very Easy B33 2.8341515 Very High Very Easy
2.9761809
-
B9 2.1927568 Very High -2.4196654 Very Easy B34 1.6973645 High Very Easy
2.5979036
-
B10 0.2222172 Very Low 2.7389034 Very Hard B35 1.8979751 Very High Very Easy
2.0652418
-
B11 8.0893881 Very High -2.2932931 Very Easy B36 0.4992233 Low Very Easy
2.1078725
-
B12 1.6258418 High -2.9032001 Very Easy B37 3.0305308 Very High Very Easy
2.7142591
-
B13 1.9087059 Very High -2.4721466 Very Easy B38 2.3877806 Very High Easy
1.6360095
-
B14 2.8468606 Very High -1.7953061 Easy B39 1.502631 High Easy
0.9667707
-
B15 0.9936055 Moderator -2.7598671 Very Easy B40 3.9576246 Very High Very Easy
2.1391488
B16 1.3837475 High -2.6983836 Very Easy B41 0 Very Low -4 Very Easy
-
B17 1.6883178 High -1.6037389 Easy B42 1.5538694 High Very Easy
2.0623339
B18 0.5749864 Low -2.4353351 Very Easy B43 1.4878479 High -2.003688 Very Easy

B19 1.2311975 Moderator -2.4682164 Very Easy B44 0 Very Low -4 Very Easy
-
B20 2.5425401 Very High -3.2247468 Very Easy B45 1.8191719 Very High Easy
0.9597908
-
B21 1.3063846 Moderator -2.1539114 Very Easy B46 1.8667918 Very High Very Easy
2.5423986
-
B22 0 Very Low -4 Very Easy B47 1.9242463 Very High Very Easy
2.8187304
-
B23 0.4574012 Low -2.3010343 Very Easy B48 1.5802041 High Very Easy
2.1276154
-
B24 1.3870217 High -2.3223363 Very Easy B49 1.1712108 Moderator Easy
1.0836069
-
B25 0 Very Low -4 Very Easy B50 2.6076906 Very High Easy
1.6545842

Diskriminan atau sering juga disebut slope ditandai oleh suatu kemiringannya. Kemiringan
positif menunjukkan bahwa kemungkinan respons yang benar dari siswa yang baik lebih tinggi
daripada siswa yang buruk, sedangkan kemiringan negatif menggambarkan respon yang
berlawanan. Untuk analisis lebih lanjut, kombinasi diskriminatif dan kesulitan soal dihitung
dengan menggunakan formula berikut.

2 −
= ∑ =1 & = .

MDISC adalah singkatan dari kombinasi diskriminatif, dan MDIFF menunjukkan kesulitan
item. Menurut Baker (2001) dan Hasmy (2014), kombinasi dari diskriminasi dan kesulitan item
dapat diklasifikasikan masing-masing sebagai berikut.
Tabel 6. Klasifikasi indeks kombinasi diskriminan & kesulitan butir
Kriteria Keterangan Kriteria Keterangan
MDISC ≥ 1.7 Very High MDIFF ≥ 2 Very Hard
1.35 ≤ MDISC < 1.7 High 0.5 ≤ MDISC < 2 Hard
0.65 ≤ MDISC < 1.35 Moderate -0.5 ≤ MDISC < 0.5 Moderate
0.35 ≤ MDISC < 0.65 Low -2 ≤ MDISC < -0.5 Easy
MDISC < 0.35 Very Low MDISC < -2 Very Easy

MDISC TABLE MDIFF TABLE


25 40
20 30
15
20
10
5 10
0 0

Diskriminasi butir menyebar pada semua kategori tetapi yang terbanyak ada pada kategori
very high sejumlah 21 butir, dan 10 butir pada kategori high. Selanjutya mengenai kesulitan butir,
nampak bahwa yang tertinggi ada pada kategori very easy dan easy dengan jumlah butirnya
berturut-turut sebanyak 38 dan 10. Bar chart berikut memberikan gambaran tentang diskriminasi
dan kesulitan sebanyak 50 butir dari tes UN yang diberikan.
D. SIMPULAN DAN SARAN
Simpulan dari penelitian ini yaitu: (1) untuk soal mata pelajaran Bahasa Indonesia paket 1
pada wilayah Yogyakarta tahun 2015 berada pada kategori very high dan high untuk parameter
kombinasi diskriminasinya, (2) untuk parameter kombinasi kesulitan butirnya berada pada
kategori very easy dan easy, (3) ada butir-butir dalam tes ini yang tidak fit sehingga seharusnya
tidak digunakan diantaranya butir 3, 5, 8, 18, 22, 25, 27, 31, 36, 41, dan 44.

Rekomendasi sebagai tindak lanjut dari penelitian ini adalah (1) sebaiknya menggunakan
model MIRT untuk data yang berbentuk multidimensi dikarenakan model ini sangat baik untuk
memperoleh hasil analisis yang lebih akurat dalam mengevaluasi tes dan kompetensi peserta ujian,
(2) bagi peneliti untuk ke depannya dapat melakukan analisis-analisis lebih lanjut terhadap data-
data hasil UN guna peningkatan kualitas pendidikan khususnya di Indonesia.
Referensi
Baker, F. (2001). The basic of item response theory. USA: ERIC Clearinghouse on Assessment and
Evaluation.
Bolt, D.M. & Lall, V.M. (2003). Estimation of compensatory and noncompensatory
multidimensional item response models using Marcov chain Monte-Carlo. Applied
Psychological Measurement, 27, 395-414.
Hambleton, R. K., &Swaminathan, H. (1985). Item Response Theory: Principles and Applications.
USA: Kluwer-Nijhoff Publishing.
Hasmy, A. (2014). Compare unidimensional & multidimensional Rasch model for test with
multidimensional construct and items local dependence. Journal of Education and Learning,
8(3), 187-194.
Xitao Fan. (1998). Item response theory and classical test theory : an empirical comparison of their
item/person statistic. Educational and Psychological Measurement, 58, 357-381.

Anda mungkin juga menyukai