Anda di halaman 1dari 11

1

PENGEMBANGAN TES PRESTASI BELAJAR MATA PELAJARAN FISIKA DENGAN


MEMANFAATKAN SPESIFIKASI BUTIR SOAL

DEVELOPING AN ACHIEVEMENT TEST IN LEARNING OF PHYSICS BY UTILIZING ITEM


SPECIFICATIONS

Dhien Astrini, Kumaidi


Prodi PEP PPsUNY, Universitas Muhammadiyah Surakarta
dhienastrini@gmail.com, kuma_426@yahoo.com

Abstrak
Penelitian ini bertujuan untuk mengetahui (1) keunggulan tes prestasi belajar mata pelajaran
fisika yang dikembangkan dengan memanfaatkan spesifikasi butir soal dan (2) distribusi kemampuan
siswa kelas X SMA di kota Yogyakarta. Penelitian ini merupakan penelitian pengembangan dengan
mengacu pada model Oriondo & Dallo-Antonio. Subjek coba adalah siswa kelas X. Uji coba terbatas
melibatkan 354 siswa dari sekolah dengan kategori tinggi, sedang, dan rendah. Uji penelitian pada
skala luas melibatkan 644 siswa pada paket soal A dan paket soal B. Analisis butir soal dilakukan
melalui analisis kualitatif dan analisis kuantitatif. Hasil penelitian menyimpulkan bahwa (1) tes yang
dikembangkan pada mata pelajaran fisika dengan memanfaatkan spesifikasi butir soal memiliki
keunggulan dalam menghasilkan tes yang lebih setara dibandingkan dengan tes yang dirakit tanpa
memanfaatkan spesifikasi butir soal, (2) distribusi kemampuan siswa kelas X SMA di kota Yogyakarta
sebagian besar berada pada kategori kemampuan rata-rata.
Kata Kunci: pengembangan, tes prestasi belajar, spesifikasi butir, fisika

Abstrack
The aims of the study are to know (1) the advantage of achievement test in learning physics
developed by utilizing item specifications and (2) the ability distribution of tenth grade students at
senior high school in Yogyakarta. This research is developmental research used the model suggested
by Oriondo & Dallo-Antonio. The subjects were tenth grade students. The limited test was tried out to
354 students in school with categories of high, medium and low. The wide scale test was tried out to
644 students on package A and package B. Item analysis was conducted by using qualitative and
quantitative analysis. This research shows (1) developed test in physics by utilizing item specifications
had the advantage in producing more equate test (2) the ability distributions of tenth grade students at
senior high school in Yogyakarta were mostly at the average category.
Keywords: developing, achievement test, item specifications, physics
2

Pendahuluan dalam suatu jangka waktu dalam pengetahuan,


Peningkatan kualitas pendidikan terus dan keterampilan; (3) menunjukkan bukti
dilakukan secara berkesinambungan untuk pemahaman akan satu materi pelajaran,
dapat menghasilkan lulusan yang kompeten. pengetahuan atau ide tertentu; (4) meramalkan
Kegiatan pembelajaran dan sistem penilaian kinerja peserta didik. Kemampuan peserta
merupakan bagian dari upaya peningkatan didik menguasai materi pembelajaran tertentu
kualitas pendidikan. Kegiatan pembelajaran pada suatu jenjang pendidikan secara
berkaitan dengan tujuan pembelajaran, proses menyeluruh diharapkan sesuai dengan Standar
belajar mengajar dan evaluasi pembelajaran. Kompetensi Lulusan (SKL) pada Kurikulum
Tujuan pembelajaran mengarahkan pada Tingkat Satuan Pendidikan (KTSP) yang telah
penilaian yang dilakukan oleh guru. Proses ditetapkan. Hasil pencapaian kompetensi
belajar mengajar dalam pelaksanaan mengacu diharapkan dapat menjelaskan kemampuan
pada tujuan pada pembelajaran dan evaluasi peserta didik yang sebenarnya.
pembelajaran. Hal ini dilakukan untuk menilai Fisika merupakan ilmu sains terkait
sejauhmana proses belajar mengajar sesuai dengan dunia fisik yang paling fundamental,
dengan tujuan pada pembelajaran yang telah mempelajari prinsip-prinsip dasar dari alam
ditetapkan. semesta. Tujuan utama fisika adalah mencari
Guru dapat melakukan evaluasi hasil sejumlah dasar yang mengatur berbagai
pembelajaran dengan cara mempersiapkan tes fenomena alam dan menggunakan hukum-
dalam proses belajar mengajar. Tes merupakan hukum tersebut untuk mengembangkan teori-
salah satu bentuk instrumen yang digunakan teori yang dapat memprediksi percobaan
untuk melakukan pengukuran terdiri atas selanjutnya oleh Serway (2009, pp. 1-3).
sejumlah pertanyaan yang memiliki jawaban Pendapat lain diungkapkan oleh Murdaka &
benar atau salah, atau semua benar atau Kuntoro (2013, pp. 3-8) fisika memiliki ciri
sebagian benar. Tujuan melakukan tes adalah khas mengenai ilmu alam yang bersifat
untuk mengetahui pencapaian belajar atau mendasar dan universal. Hukum fisika dapat
kompetensi yang telah dicapai peserta didik ditampilkan dalam beberapa penampilan yaitu
untuk bidang tertentu oleh Mardapi (2012, berupa kalimat, persamaan matematika, grafik,
p.108). Hasil tes merupakan informasi tentang dan data hasil percobaan. Mata pelajaran fisika
karakteristik seseorang atau sekelompok memerlukan pemahaman konsep bagi peserta
orang. Karakteristik bisa berupa kemampuan didik khususnya kelas X Sekolah Menengah
kognitif atau keterampilan. Tes dikatakan baik Atas (SMA).
jika mampu mengukur apa yang seharusnya Berdasarkan hasil wawancara yang
diukur dan dapat memberikan hasil yang dapat dilakukan oleh beberapa guru mata pelajaran
dipercaya. fisika SMA Negeri di kota Yogyakarta
Salah satu cara untuk mengetahui hasil diperoleh bahwa butir soal yang dihasilkan
pembelajaran peserta didik melalui penilaian. terlebih dahulu diawali dengan membuat butir-
Penilaian melibatkan upaya formal untuk butir soal selanjutnya, menulis kisi-kisi soal
menentukan status peserta didik sehubungan serta dalam perakitan tes belum memanfaatkan
dengan pendidikan. Di sekolah yang paling spesifikasi butir soal. Hal ini belum sesuai
sering adalah prestasi siswa dibidang-bidang dengan kaidah penulisan soal dan belum
seperti membaca, menulis, matematika, ilmu secara jelas diketahui karakteristik pada
pengetahuan, dan ilmu sosial. Akuntabilitas masing-masing butir soal. Selain itu, diperoleh
sering mengarah ke pengujian menjadi sarana beberapa butir soal yang belum sepenuhnya
penilaian yang mencakup banyak prosedur buatan guru sebagian besar hanya mengambil
pengukuran selain pengujian untuk menilai dari buku yang tersedia di sekolah sehingga,
hasil belajar melalui tes tertulis. Belajar sering dikhawatirkan belum terkalibrasi dengan baik.
dinilai berdasarkan tanggapan tertulis peserta Permasalahan lain yang diperoleh
didik pada tes oleh Schunk (2012, pp. 14-15). pada SMA Negeri di kota Yogyakarta dengan
Sumintono & Widhiarso (2015, p.7) melihat butir-butir soal Ujian Tengah Semester
menyatakan bahwa hasil tes dapat digunakan (UTS) dan Ujian Akhir Semester (UAS). Butir
oleh guru untuk menentukan (1) kemampuan soal yang dilengkapi gambar namun,
peserta didik relatif terhadap peserta didik lain penyajiannya belum secara jelas sesuai dengan
dalam tes yang sama; (2) menunjukkan permasalahan fisika yang dijelaskan pada butir
perkembangan kemampuan peserta didik soal. Hal ini tentu akan berdampak pada
3

kualitas tes, jika butir yang digunakan kurang tepat. Skor yang paling umum digunakan
baik maka dapat menyebabkan kesalahan adalah peringkat persentil. Peringkat persentil
pengukuran (SEM) menjadi besar. Hendaknya berkisar dari 1 sampai 99 dan menunjukkan
dilakukan telaah butir soal baik secara persentase kelompok acuan siswa. Stanine
kualitatif maupun kuantitatif agar dapat adalah jenis kedua dari skor tes standar.
diketahui karakteristik butir soal yang baik dan Stanine merupakan skala sembilan poin,
yang tidak baik serta yang harus diperbaiki dengan stanine dari 1 mewakili kinerja
atau diganti. Dengan demikian, diharapkan terendah dan stanine dari 9 tertinggi oleh
dapat mempengaruhi keterampilan guru untuk Russell & Airasian (2012, pp. 311-312).
menghasilkan butir soal yang berkualitas. Pengembangan tes prestasi belajar
Hasil penelitian Megawati (2012, mata pelajaran fisika dengan memanfaatkan
p.53) mengemukakan bahwa terdapat dua spesifikasi butir soal tentu sangat diperlukan.
kelemahan pendidik dalam melakukan Adapun beberapa manfaat dalam penelitian ini
pengukuran menggunakan tes. Pertama, yaitu (1) spesifikasi butir soal yang dihasilkan
perangkat tes yang dibuat setiap kali akan khususnya pada mata pelajaran fisika dapat
melakukan penilaian tidak teruji secara digunakan untuk mempersiapkan butir tes
statistik karena tidak melalui uji coba untuk yang selanjutnya akan dibuat, (2) memberikan
menguji validitas dan reliabilitas, termasuk pedoman bagi para guru dalam menulis butir
pengujian daya beda dan efektivitas pengecoh soal yang berkualitas, (3) tersedianya butir
(distractor) pada tipe soal pilihan ganda. soal yang berkualitas dapat membantu para
Selain itu, validitas konstruk masih perlu guru dalam menyusun bentuk tes paralel yang
dipertanyakan sebab penyusunannya seadanya bermutu, (4) menghasilkan tes prestasi belajar
dan kurang terencana. Kedua, jika hendak yang dapat digunakan pada ujian tingkat
diperoleh tes yang benar-benar berkualitas, sekolah.
tentu memerlukan waktu yang tidak sedikit Spesifikasi butir soal memuat Standar
setiap kali akan melakukan penilaian. Kompetensi, cakupan materi pembelajaran,
Model Item Response Theory (IRT) indikator soal, bentuk soal, dan contoh butir
adalah model statistik dari hubungan antara soal. Hal ini didukung oleh penelitian Hayati
nilai seseorang pada konstruk yang diukur dan (2010, p.168) bahwa item specification yang
probabilitas peserta tes memilih setiap respon dikembangkan dapat digunakan oleh guru dan
pada setiap butir mengukur konstruk tersebut. pengembang tes khususnya untuk merancang
IRT dapat digunakan untuk mengevaluasi item specification pada topik atau mata
bagaimana informasi butir pada berbagai skor pelajaran lain. Dengan demikian, guru dan
spesifik dan memperkirakan nilai IRT pengembang tes memiliki pedoman untuk
seseorang oleh Jakob, Chih-Hung, David mengembangkan butir tes yang valid dalam
& Bryce (2007, p.96). Model Item Response konten maupun secara empirik.
Theory (IRT) memberikan informasi pada Berdasarkan beberapa yang telah
sebagian besar butir pilihan ganda yang dikemukakan di atas dapat disimpulkan bahwa
mengandung salah satu jawaban benar, disebut spesifikasi butir soal merupakan pedoman
"pilihan" untuk peserta ujian dari tingkat khusus yang digunakan oleh guru dalam
kemampuan yang berbeda (Kim, 2006, p.193). menulis butir soal yang terdiri dari SKL,
Penggunaan fungsi logistik dalam IRT tidak indikator, ruang lingkup materi, bentuk soal
hanya memungkinkan estimasi parameter butir dan contoh butir soal untuk menghasilkan
dan parameter kemampuan tetapi juga dapat butir tes yang sesuai dengan indikator.
memungkinkan pada pertimbangan ketepatan Informasi kemampuan peserta didik perlu
setiap parameter diperkirakan (Umar, 1999, diketahui secara jelas melalui prestasi belajar
p.23). yang diperoleh. Jika informasi yang diperoleh
Reynolds, Livingston, & Willson semakin besar maka kesalahan pengukuran
(2009, p.76) menyatakan bahwa standar semakin kecil sehingga butir soal yang
sembilan (stanine) membagi distribusi ke digunakan dapat benar-benar mengukur
dalam sembilan kategori. Stanine memiliki kemampuan siswa pada tingkat tertentu.
rata-rata 5 dan standar deviasi 2 karena nilai Tujuan penelitian ini adalah untuk mengetahui
stanine hanya menggunakan sembilan standar keunggulan tes prestasi belajar mata pelajaran
untuk mewakili berbagai nilai, sehingga skala fisika yang telah dikembangkan dengan
ini tidak memiliki format skor yang sangat memanfaatkan spesifikasi butir soal dan
4

memperoleh informasi distribusi kemampuan Nasional (UN) SMA yang memiliki nilai rata-
siswa kelas X SMA di kota Yogyakarta. rata UN termasuk pada kategori tinggi, sedang
dan rendah. Peringkat rerata hasil UN dilihat
Metode berdasarkan data dari Dinas Pendidikan di
Model Pengembangan kota Yogyakarta pada tahun ajaran 2014/2015.
Penelitian ini merupakan penelitian Selanjutnya pengambilan sampel penelitian
pengembangan tes dengan mengacu pada dilakukan dengan teknik stratified random
model Oriondo& Dallo-Antonio. Pertama, sampling. Uji coba dikenakan pada 354 siswa
perancangan tes yang meliputi: perumusan dan uji skala luas dikenakan pada 644 siswa.
materi fisika kelas X, penyusunan kisi-kisi,
penyusunan spesifikasi butir soal, penelaahan Data, Intrumen, dan Teknik Pengumpulan
butir soal, penulisan butir soal dalam bentuk Data
paket paralel; Kedua, uji coba penelitian; Data penelitian diperoleh melalui
Ketiga, uji penelitian. lembar jawaban yang dikerjakan peserta tes
dalam paket tes paralel yaitu paket A dan paket
Prosedur Pengembangan B. Instrumen pengumpulan data berupa
Prosedur pengembangan tes prestasi beberapa instrumen yang digunakan pada
belajar mata pelajaran fisika menggunakan penelitian yaitu kisi-kisi tes prestasi belajar
langkah pengembangan tes oleh Oriondo & fisika, tes prestasi belajar berbentuk pilihan
Dallo-Antonio (1998, p.34). Adapun tahap ganda dengan lima alternatif jawaban
dalam mengembangkan tes berdasarkan pada sebanyak 40 butir soal untuk paket A dan
prosedur yang sistematis yaitu (a) menentukan paket B, lembar penilaian instrumen tes,
tujuan; tujuan dari pengukuran yang dilakukan lembar telaah tes dan lembar jawaban tes.
untuk menghasilkan tes; (b) mempersiapkan Teknik pengumpulan data dalam penelitian ini
tabel spesifikasi; tabel spesifikasi berdasarkan melalui tes dan dokumentasi pada saat
perumusan materi yang ditentukan selanjutnya pengujian pada uji coba terbatas dan uji
menentukan presentase jumlah butir yang penelitian skala luas di SMA kota Yogyakarta.
dihasilkan; (c) memilih format butir yang
sesuai; format butir yang digunakan dalam Teknik Analisis Data
penelitian ini berbentuk pilihan ganda Teknik analisis data dalam penelitian
(multiple choice); (d) menulis butir tes; ini menggunakan analisis secara kualitatif dan
penulisan butir tes dilakukan berdasarkan pada secara kuantitatif. Analisis secara kualitatif
kisi-kisi soal; (e) mengedit butir tes; sebelum dilakukan melalui lembar telaah tes prestasi
pengujian, maka dilakukan pengeditan butir belajar dilakukan sebelum tes diujikan. Butir-
agar tidak terjadi kesalahan dalam konsep butir tes yang telah ditelaah selanjutnya
soal; (f) melakukan uji coba tes; butir tes yang dilakukan perbaikan berdasarkan masukan dan
telah melalui tahap penyuntingan selanjutnya saran perbaikan yang diberikan oleh validator.
dilakukan uji coba; (g) mempersiapkan tes; Analisis kuantitatif dilakukan melalui
bentuk akhir tes meliputi butir yang memenuhi 2 (dua) tahap yaitu Pertama, telaah kesesuaian
kriteria karakteristik butir baik; (h) butir soal berdasarkan isi melalui penilaian
menentukan uji validitas; penentuan validitas sebanyak sepuluh validator untuk mengetahui
tes dilakukan berdasarkan isi (materi); (i) sejauhmana butir mewakili konstrak yang
menentukan uji reliabilitas; pengembangan tes diukur. Menurut Azwar (2014, pp. 112-113)
diperlukan keajegan sebuah tes yang akan butir dikatakan mewakili konstruk yang diukur
digunakan sehingga koefisien reliabilitas berarti butir yang bersangkutan relevan dengan
tinggi sangat diperlukan; (j) menafsirkan tes; indikator. Hal ini karena indikator merupakan
penafsiran tes merupakan tahap akhir dalam penerjemahan operasional dari atribut yang
penelitian yang dilakukan. diukur. Penilaian dilakukan dengan cara
memberikan angka antara 1 sampai dengan 4.
Subjek Coba Analisis yang dapat digunakan untuk
Subjek coba dalam penelitian ini menentukan indeks validitas isi instrumen tes
adalah siswa kelas X SMA di kota Yogyakarta yaitu formula Aiken’s sebagai berikut: (Aiken,
yang menggunakan Kurikulum Tingkat Satuan 1980, p.956).
Pendidikan (KTSP). Subjek coba penelitian
diperoleh berdasarkan peringkat hasil Ujian
5

dengan tujuan pengembangan instrumen,


kesesuaian antara indikator dengan cakupan
materi atau kesesuaian teori, melihat
Berdasarkan hasil dari analisis dapat kesesuaian antara instrumen dengan indikator
ditentukan butir yang memenuhi validitas isi. butir, melihat kebenaran konsep butir soal,
Butir dinyatakan valid jika memenuhi kriteria melihat kebenaran isi, kebenaran kunci pada
V > 0,73 untuk 10 penilai dengan kategori tes, bahasa dan budaya oleh Retnawati (2016,
penilaian sebanyak 4 skala oleh Aiken (1985, p.5). Hasil analisis dapat diperoleh bahwa
p.134). Kedua, analisis empiris menggunakan terdapat 33 butir soal yang dinyatakan valid
pendekatan teori respons butir (IRT) melalui yaitu V>0,73 diinterpretasikan sebagai
program BILOG-MG. Analisis secara empiris koefisien yang cukup tinggi untuk butir
dilakukan setelah soal diujikan. Analisis tersebut. Artinya butir tersebut memiliki
kuantitatif dilakukan sebanyak dua kali yaitu validitas isi yang baik dan mendukung
uji coba kelompok terbatas dan uji penelitian validitas isi tes secara keseluruhan oleh Azwar
skala luas. (2015, p.113). Adapun 7 butir soal yang
dinyatakan belum memenuhi validitas isi
Hasil dan Pembahasan disajikan pada Tabel 1.
Pengembangan tes prestasi belajar
mata pelajaran fisika yang dikembangkan Tabel 1. Hasil Perhitungan
berdasarkan pada spesifikasi butir soal disusun formula index aiken’s
mengacu pada dua Standar Kompetensi (SK),
Kompetensi Dasar (KD) dan indikator No butir V
selanjutnya dikembangkan menjadi 40 5 0,6
indikator soal yang terdapat dalam kisi-kisi tes 6 0,67
prestasi belajar fisika kelas X. Kisi-kisi dan 7 0,6
spesifikasi butir soal ditelaah secara kualitatif 8 0,6
selanjutnya dijadikan pedoman penulis soal 33 0,7
untuk menghasilkan produk berupa dua paket 35 0,7
tes paralel. Tes paralel terdiri dari paket A dan 40 0,7
paket B. Produk yang dihasilkan kemudian
diujikan kepada siswa kelas X SMA di kota Hasil output pada fase 3 BILOG-MG
Yogyakarta. Butir soal pada masing-masing 3.0 model 2 Parameter Logistik (PL)
paket tes sebanyak 40 butir soal pilihan ganda. menunjukkan paket A memiliki koefisien
Paket A dan paket B dikerjakan oleh peserta reliabilitas sebesar 0,860 dan paket B memiliki
tes yang ditetapkan sebagai subjek dalam koefisien reliabilitas sebesar 0,826. Hal ini
penelitian. didukung oleh pendapat Diederich dalam
Hasil telaah butir soal menunjukkan (Gronlund, 1977, p.142) mengungkapkan
bahwa tes telah memenuhi kriteria aspek bahwa koefisien reliabilitas untuk tes dikelas
telaah butir soal yaitu 75% sampai dengan berkisar antara 0,60 sampai 0,80. Hasil analisis
100%. Dengan demikian, sebagian besar butir uji coba diperoleh model yang menghasilkan
soal telah memenuhi kriteria aspek yang butir baik paling banyak adalah model 2-PL
ditelaah secara teoritis. Kisi-kisi tes dan pada paket A dan paket B. Kriteria butir yang
spesifikasi butir soal yang dihasilkan terlebih baik menurut model 2-PL berdasarkan pada
dahulu dilakukan telaah secara kuantitatif. daya pembeda dan tingkat kesukaran butir.
Telaah secara kuantitatif dilakukan oleh ahli Daya pembeda butir dikatakan sangat tinggi
pengukuran, ahli pendidikan fisika dan jika berkisar antara 0-2. Butir dikatakan baik
delapan guru mata pelajaran fisika di SMA jika memiliki tingkat kesukaran berkisar antara
kota Yogyakarta. Validator memberikan -2 dan +2 (Hambleton & Swaminathan, 1985,
penilaian pada lembar instrumen tes prestasi p.107).
belajar mata pelajaran fisika. Lembar penilaian Hasil output analisis menggunakan
instrumen merupakan salah satu bagian dari BILOG-MG menunjukkan bahwa paket A
validitas isi untuk merakit tes. memiliki karakteristik butir baik menurut
Penilaian tes dapat dilakukan dengan model 2 parameter logistik sebanyak 35 butir
melihat kesesuaian antara indikator soal dan paket B sebanyak 39 butir selanjutnya
6

butir yang belum memenuhi kriteria dilakukan faktor kesepuluh diperoleh sebesar 32,4% dari
revisi produk. Revisi produk tidak dilakukan total varians lebih besar dari 20%. Dengan
dengan membuang butir soal yang buruk demikian, dapat dikatakan bahwa berdasarkan
melainkan dengan memperbaiki tata bahasa komponen hasil varians hasil analisis faktor
dalam kalimat soal. Revisi produk pada paket telah memenuhi asumsi unidimensi. Selain itu,
A terdapat 4 butir soal dan paket B terdapat 1 dapat dilihat scree plot yang disajikan pada
butir. Adapun 3 asumsi yang mendasari teori Gambar 2 menunjukkan nilai eigen yang mulai
respons butir (IRT), yaitu unidimensi, landai pada faktor ketiga. Hal ini menunjukkan
independensi lokal, dan invariansi parameter. bahwa terdapat 1 faktor yang dominan pada
tes prestasi belajar fisika dan faktor lain
Unidimensi memberikan sumbangan yang cukup besar
Unidimensi menyatakan bahwa setiap terhadap varians yang dapat dijelaskan. Hasil
butir tes hanya mengukur satu kemampuan. analisis unidimensi sesuai dengan pendapat
Prakteknya asumsi ini sangat sulit dipenuhi Retnawati (2016, pp.48) mengemukakan
karena banyak faktor yang mempengaruhi tes. bahwa perangkat tes mengukur paling tidak 2
Salah satu cara untuk menguji asumsi ini faktor dengan faktor yang pertama merupakan
dengan melakukan faktor analisis yang faktor dominan.
menghasilkan KMO, nilai eigen, varians yang
dapat dijelaskan dan komponen faktor.
Hasil analisis juga memuat faktor
dominan yang terukur pada paket tes A dan
grafik yang memuat garis berbentuk curam
maupun landai. Paket A memiliki total varians
berdasarkan hasil bagi antara faktor utama
dengan faktor kesepuluh diperoleh persentase
sebesar 48% dari total varians. Selain itu,
dapat dilihat pada scree plot yang disajikan
pada Gambar 1 menunjukkan grafik hanya
menunjukkan dua curaman sedangkan grafik
yang lain berbentuk landai. Hal ini berarti
bahwa terdapat dua faktor dominan yang Gambar 2. Scree Plot Hasil Analisis Faktor
terukur dalam tes. Berdasarkan analisis Eksploratori Paket B
eksploratori disimpulkan bahwa instrumen
yang berupa perangkat tes prestasi belajar Independensi Lokal
dapat dikatakan valid untuk mengukur Independensi lokal terpenuhi jika
kemampuan fisika dan terbukti secara empiris. kovarians pada masing-masing kelompok
mendekati nol. Berdasarkan hasil analisis
menggunakan microsoft excel menunjukkan
bahwa paket A dan paket B terbukti memenuhi
asumsi independensi lokal dengan nilai
kovarians pada masing-masing kelompok
mendekati nol. Dengan demikian berarti tidak
terjadi korelasi pada masing-masing butir
dalam kelompok.

Invariansi Parameter
Invariansi Parameter Butir
Invariansi parameter menyatakan
bahwa karakteristik butir soal tidak tergantung
pada distribusi parameter kemampuan peserta
Gambar 1. Scree Plot Hasil Analisis tes dan parameter yang menjadi peserta tes
Faktor Eksploratori Paket A tidak bergantung dari ciri butir soal. Invariansi
parameter butir baik tingkat kesukaran dan
Paket B memiliki total varians daya pembeda dapat dibuktikan dengan
berdasarkan hasil bagi faktor utama dengan melakukan pemisahan kelompok siswa ganjil
7

dan kelompok siswa genap. Jika titik-titik invariansi parameter daya pembeda butir yang
mendekati garis kemiringan berarti tidak dapat dilakukan melalui pemisahan dua
terjadi variasi parameter hasil estimasi pada kelompok peserta tes yaitu genap dan ganjil
kelompok ganjil dan genap. yaitu menggunakan bantuan Microsoft Excel
Berdasarkan hasil analisis estimasi sehingga diperoleh korelasi yang disajikan
parameter butir menunjukkan bahwa pemetaan pada Diagram 3 sebagai berikut.
membentuk sebuah garis lurus. Hal ini berarti
paket A telah terbukti memenuhi invariansi
parameter daya pembeda butir. Invariansi
parameter daya pembeda pada kelompok siswa
ganjil dan genap berkorelasi tinggi sebesar
0,827 ditandai dengan titik-titik pada diagram
pencar mendekati garis yang melewati titik
asal.

Diagram 3. Invariansi Parameter


Daya Pembeda Butir Paket B

Berdasarkan Diagram 3 dan 4 menunjukkan


bahwa hasil pemetaan membentuk sebuah
garis lurus. Hal ini berarti paket B memenuhi
invariansi parameter butir dengan korelasi
antara skor peserta terhadap estimasi
Diagram 1. Invariansi Parameter parameter daya pembeda butir sebesar 0,815
Daya Pembeda Butir Paket A dan korelasi antara skor peserta terhadap
estimasi parameter tingkat kesukaran butir
Diagram pencar untuk parameter sebesar 0,928.
tingkat kesukaran butir menunjukkan korelasi
yang cukup sebesar 0,779. Berdasarkan
Diagram 2 menunjukkan bahwa titik-titik
berada relatif dekat dengan garis kemiringan.
Hal ini berarti tidak terjadi variasi parameter
hasil estimasi pada kelompok siswa ganjil dan
siswa genap sehingga terbukti invariansi
parameter butir pada paket A terpenuhi.

Diagram 4. Invariansi Parameter Tingkat


Kesukaran Butir Paket B

Invariansi Parameter Kemampuan


Invariansi parameter kemampuan
dibuktikan dengan mengelompokkan butir
genap dan butir ganjil yang dikerjakan oleh
seluruh peserta tes. Selanjutnya dibuat
Diagram 2. Invariansi Parameter Tingkat diagram pencar, kemudian dibandingkan
Kesukaran Butir Paket A kedekatannya dengan garis kemiringan 1 oleh
Retnawati (2014, p.9). Analisis estimasi
Adapun hasil analisis parameter butir parameter kemampuan diperoleh berdasarkan
pada paket B diperlukan pengujian asumsi hasil BILOG-MG pada fase 3 yang memuat
8

kemampuan (θ) selanjutnya dihitung dengan Paket A dan B terbukti memenuhi


bantuan Microsoft Excel. Secara keseluruhan ketiga asumsi pada teori respons butir. Hasil
estimasi parameter kemampuan peserta tes analisis model 2 parameter logistik diperoleh
yang mengerjakan paket A seperti pada butir tes yang memenuhi kriteria daya
diagram 5 berbentuk diagram pencar sebagai pembeda butir, tingkat kesukaran butir dan
berikut. kecocokan butir terhadap model Paket A
sebanyak 35 butir dan Paket B sebanyak 36
butir. Hal ini sesuai dengan pendapat Mislevy
& Bock (1990: pp. 6-9) yang mengungkapkan
bahwa butir tes dikategorikan fit untuk model
jika proporsi yang benar atau salah melebihi
0,05.
Hasil analisis menunjukkan rerata
tingkat kesukaran butir soal tes prestasi belajar
mata pelajaran fisika SMA di kota Yogyakarta
pada paket A sebesar -0,712 dan paket B
sebesar -0,514. Tingkat kesukaran antara paket
A dan paket B menunjukkan indeks tingkat
kesukaran yang hampir setara tanpa melalui
Diagram 5. Invariansi Parameter Kemampuan proses penyetaraan dan rerata daya pembeda
Paket A butir soal pada tes prestasi belajar mata
pelajaran fisika SMA di kota Yogyakarta pada
Berdasarkan hasil analisis diperoleh paket A sebesar 0,956 dan paket B sebesar
bahwa paket A telah terbukti memenuhi 0,938.
invariansi parameter kemampuan dapat dilihat
pada Diagram 5 yang menunjukkan titik-titik Fungsi Informasi
pada diagram pencar mendekati garis lurus. Paket A telah dilakukan perhitungan
Hal ini juga ditandai oleh nilai korelasi sebesar fungsi informasi tes. Berdasarkan hasil analisis
0,758 yang menunjukkan bahwa korelasi karakeristik butir menggunakan program
cukup untuk estimasi kemampuan peserta tes BILOG-MG pada fase 2 untuk model 2
kelompok ganjil dan peserta tes kelompok Parameter Logistik diperoleh daya beda (a i)
genap. dan tingkat kesukaran butir (bi) yang
selanjutnya dimasukkan ke dalam Microsoft
excel untuk dihitung nilai fungsi informasi
masing-masing butir. Adapun fungsi informasi
pada paket A disajikan sebagai berikut.

Diagram 6. Invariansi Parameter


Kemampuan Paket B

Berdasarkan hasil analisis diperoleh Gambar 3. Kurva Fungsi Informasi Tes


bahwa paket B telah terbukti memenuhi Paket A
invariansi parameter kemampuan dapat dilihat
pada Diagram 6 yang menunjukkan titik-titik Fungsi informasi tes tertinggi pada
pada diagram pencar mendekati garis lurus. paket A terletak pada kemampuan (θ) = -1
Hal ini juga ditandai oleh nilai R=0,632 yang dengan nilai fungsi informasi tes tertinggi
menunjukkan bahwa korelasi cukup untuk sebesar 22,4 (SEM = 0,211). Hal ini berarti tes
estimasi kemampuan peserta tes kelompok prestasi belajar fisika pada paket A cocok
ganjil dan peserta tes kelompok genap.
9

untuk peserta tes yang berkemampuan sedang Kemampuan (θ) peserta tes berada pada
dan rendah. kisaran -0,70 sampai -0,23. Dengan demikian,
Berdasarkan hasil analisis diperoleh distribusi kemampuan peserta didik yang
fungsi informasi tes tertinggi terletak pada mengerjakan paket A sebagian besar
kemampuan (θ) = -0,75 dengan nilai fungsi dikerjakan oleh siswa yang termasuk dalam
informasi tes tertinggi sebesar 15,6 (SEM = kemampuan rata-rata.
0,252). Tes prestasi belajar fisika pada Paket B
cocok untuk peserta tes yang berkemampuan
sedang dan rendah. Disimpulkan kedua paket
tes memberikan informasi kemampuan yang
hampir mendekati.

Gambar 5. Distribusi Kemampuan Siswa


Paket A
Berdasarkan hasil perhitungan pada
tabel 4 kategori kemampuan peserta tes dapat
diperlihatkan pada grafik gambar 5 yang
menunjukkan bahwa presentase peserta tes
Gambar 4. Kurva Fungsi Informasi Tes
yang mengerjakan paket A hampir membentuk
Paket B
kurva normal. Kemampuan dengan presentase
Standar sembilan (stanine) merupakan
tertinggi berada pada rangking 6, 5, dan 4
nilai standar berskala sembilan dimana
termasuk ke dalam kategori kemampuan rata-
rentangan nilainya mulai dari 1 sampai dengan
rata.
9 (tidak ada nilai 0 dan tidak ada nilai 10).
Kategori kemampuan peserta didik
Berdasarkan hasil output BILOG-MG pada
yang mengerjakan paket B menunjukkan
fase 3 diperoleh kemampuan masing-masing
bahwa sebanyak 34,1% responden berada
peserta tes sebanyak 372 responden untuk
dalam kategori rata-rata. Kemampuan (θ)
paket A dan paket B.Kemampuan peserta tes
berdasarkan perhitungan skala 9 (sembilan) peserta tes berada pada kisaran -0,70 sampai
disajikan pada tabel 2 sebagai berikut. -0,24. Dengan demikian, distribusi
kemampuan peserta didik yang mengerjakan
paket B sebagian besar dikerjakan siswa yang
Tabel 2. Perhitungan Kategori Kemampuan
termasuk dalam kemampuan rata-rata.
Paket A
Persentil Rank Stanine Persentase Keterangan
(θ) Peserta Tabel 3. Perhitungan Kategori Kemampuan
1,617 ke atas 9 3,4 Tinggi Paket B
1,154 — 1,616 8 10,2 Di atas rata- Persentil Rank Persentase
Stanine Keterangan
rata (θ) Peserta
0,691 — 1,153 7 9,6 Di atas rata- 1,63 ke atas 9 9,9 Tinggi
rata Di atas rata-
0,228 — 0,690 6 15,3 Rata-rata 1,163 — 1,629 8 6,1
rata
-0,24 — 0,227 5 15,8 Rata-rata Di atas rata-
-0,70 — -0,23 4 26,8 Rata-rata 0,697 — 1,162 7 2,1
rata
-1,16 — -0,69 3 4,8 Di bawah 0,229 — 0,696 6 16,3 Rata-rata
rata-rata -0,237 — 0,228 5 12,6 Rata-rata
-1,62 — -1,15 2 10,2 Di bawah -0,70 — -0,24 4 34,1 Rata-rata
rata-rata Di bawah
-1,61 ke bawah 1 3,4 Rendah -1,171 — -0,69 3 9,6
rata-rata
Di bawah
-1,64 — -1,16 2 7,5
Hasil perhitungan menunjukkan rata-rata
-1,63 ke bawah 1 1,3 Rendah
bahwa kategori kemampuan peserta didik yang
mengerjakan paket A sebanyak 26,8%
responden berada dalam kategori rata-rata. Berdasarkan hasil perhitungan pada
tabel 3 kategori kemampuan peserta tes dapat
10

diperlihatkan pada grafik gambar 6 yang siswa kelas X SMA di kota Yogyakarta yang
menunjukkan bahwa persentase peserta tes mengerjakan tes sebagian besar berada pada
yang mengerjakan paket B hampir membentuk kategori kemampuan rata-rata.
kurva normal. Kemampuan dengan presentase Berdasarkan hasil penelitian ini
tertinggi berada pada rangking 6, 4, dan 5 diharapkan sekolah terbiasa untuk membuat
termasuk ke dalam kategori rata-rata. Dengan spesifikasi butir soal sehingga ketika membuat
demikian, secara keseluruhan paket A dan indikator yang sama menghasilkan butir yang
paket B diujikan kepada peserta didik SMA relatif sama. Dengan demikian, kesamaan butir
kelas X di kota Yogyakarta yang memiliki lebih terjamin sehingga jika tidak ada
kemampuan rata-rata. spesifikasi butir soal maka dikhawatirkan akan
menghasilkan butir tes yang cenderung bebas
antara butir satu dengan butir lainnya
meskipun berasal dari indikator yang sama dan
menguji hal yang sama.
Bagi peneliti lain yang tertarik untuk
melakukan penelitian lebih lanjut terkait
pengembangan tes dengan memanfaatkan
spesifikasi butir soal untuk mata pelajaran
lainnya diperlukan kecermatan dan ketelitian
dalam menyusun indikator, ruang lingkup
Gambar 6. Distribusi Kemampuan Siswa materi dan rumusan butir soal. Instrumen tes
Paket B yang dikembangkan dapat dimanfaatkan lebih
lanjut dengan melakukan penyimpanan
Hasil penelitian ini menunjukkan berbasis file word dengan dilengkapi software
bahwa telah berhasil dikembangkan tes spesifikasi butir soal akan memudahkan guru
prestasi belajar fisika dengan memanfaatkan dalam memperbaruhi dan memperkaya
spesifikasi butir soal SMA di kota Yogyakarta. spesifikasi butir soal pada materi fisika
Tes yang terdiri dari materi optik, suhu dan lainnya.
kalor telah menghasilkan bentuk tes paralel
yang teruji kualitas maupun kesetaraannya Daftar Pustaka
baik secara teoritis dan empiris. Dengan Aiken, L.R. (1980). Content validity and
demikian, paket tes paralel yang dihasilkan reliability of single items or
melalui spesifikasi butir soal dapat digunakan questionnaires. Educational and
untuk mengukur kompetensi yang sama pada Psycological Measurement, 40, 955-
masing-masing indikator. 959.

Simpulan dan Saran Aiken, L.R. (1985). Three coefficients for


Tes yang dikembangkan pada mata analyzing the reliability and validity of
pelajaran fisika dengan memanfaatkan ratings. Educational and Psycological
spesifikasi butir soal memiliki keunggulan Measurement, 45, 131-142.
untuk menghasilkan tes yang lebih setara
dibandingkan dengan tes yang dirakit tanpa Azwar, S. (2014). Reliabilitas dan validitas
memanfaatkan spesifikasi butir soal. Hal ini edisi 4. Yogyakarta: Pustaka Pelajar.
dikarenakan untuk minimal dua tes yang
memanfaatkan spesifikasi butir soal akan Gronlund, N.E. (1977). Constructing
memiliki tingkat kesukaran butir yang lebih achievement tests. United States of
setara. Hasil analisis menunjukkan rerata America: Prentice-Hall, Inc.,
tingkat kesukaran butir soal tes prestasi belajar Englewood Cliffs.
mata pelajaran fisika SMA di kota Yogyakarta
pada paket A sebesar -0,712 dan paket B Hayati, K.S. (2010). Pengembangan tes
sebesar -0,514. Tingkat kesukaran antara paket prestasi belajar mata pelajaran
A dan paket B menunjukkan indeks tingkat ekonomi SMA/MA dengan spesifikasi
kesukaran yang hampir setara tanpa melalui butir (item specification). Disertasi
proses penyetaraan. Distribusi kemampuan doktor, tidak diterbitkan, Universitas
Negeri Yogyakarta, Yogyakarta.
11

applications (7th ed.). New York:


Jakob B.B., Chih-Hung, C., David, T., Bryce, McGraw-Hill Companies, Inc.
R.B. (2007). Developing tailored
instruments: item banking and Schunk, D.H. (2012). Learning theories an
computerized adaptive assessment. educational perspective (6th ed.). The
Qual Life Research, 16, 95–108. University of North Carolina at
Greensboro: Pearson Education, Inc.
Kim, J.S. (2006). Using the distractor
categories of multiple-choice items to Serway, J. (2010). Fisika untuk sains dan
improve IRT linking. Diakses 9 Maret teknik edisi 6. Jakarta: Salemba
2016 dari Teknika.
https://www.jstor.org/stable/20461824
Sumintono, B. & Widhiarso, W. (2015).
Mardapi, D. (2012). Pengukuran penilaian Aplikasi pemodelan RASCH pada
dan evaluasi pendidikan. Yogyakarta: asessment pendidikan. Cimahi: Trim
Nuha Litera. Komunikata.

Megawati, E. (2012). Pengembangan Umar, J. (1999). Item banking. Dalam


perangkat tes kimia dalam rangka Masters, G.N.,& Keeves, J.P (Ed),
pembentukan bank soal di kabupaten Advances in measurement in
paser kalimantan timur. Tesis educational research and assessment.
magister, tidak diterbitkan, Universitas New York: Pergamon.
Negeri Yogyakarta, Yogyakarta.
Profil Singkat
Mislevy. R.J.,& Bock, R.D. (1990). BILOG 3 Dhien Astrini, lahir pada 18 september 1992 di
item analysis and test scoring with kota Tarakan, Kalimantan Utara. Sarjana (S-1)
binary logistic models (2nd ed.). USA: Pendidikan Fisika ditempuh sejak tahun 2010
Scientific Software, Inc. hingga tahun 2014 di Universitas
Sarjanawiyata Tamansiswa (UST) Yogyakarta,
Murdaka, B.E.J. & Kuntoro, T.P. (2013). kemudian melanjutkan Program Pascasarjana
Fisika dasar edisi 2. Yogyakarta: CV (S-2) di Universitas Negeri Yogyakarta (UNY)
Andi offset. Jurusan Penelitian dan Evaluasi Pendidikan
(PEP) ditempuh sejak tahun 2014 hingga
Oriondo, L.L.,& Dallo-Antonio, E.M. (1998). tahun 2016.
Evaluation educational outcomes.
Manila: Rex Printing Compagny, inc. Kumaidi lahir pada 24 Maret 1952. Beliau
adalah dosen di Universitas Negeri Yogyakarta
Retnawati, H. (2014). Teori respon butir dan (UNY) dan universitas lain, termasuk
penerapannya untuk peneliti, praktisi Universitas Muhammadiyah Surakarta (UMS).
pengukuran dan pengujian, mahasiswa Latar belakang pendidikan beliau
pascasarjana. Yogyakarta: Nuha menyelesaikan gelar sarjana di Universitas
Medika. Negeri Yogyakarta Jurusan Pendidikan Teknik
Mesin pada tahun 1976, kemudian beliau
Retnawati, H. (2016). Validitas, reliabilitas & memperoleh gelar master Pengukuran &
karakteristik butir panduan untuk Statistik, di Iowa University, Amerika Serikat
peneliti, mahasiswa, dan psikometrian. pada tahun 1987.
Yogyakarta: Nuha Medika.

Reynolds, C.R., Livingston, R.B.,& Willson,


V. (2009). Measurement and
nd
assessment in education (2 ed.).
USA: Pearson.

Russell, M.K.,& Airasian, P.W (2012).


Classroom assessment concepts and

Anda mungkin juga menyukai