Abstrak
Penelitian ini bertujuan untuk mengetahui (1) keunggulan tes prestasi belajar mata pelajaran
fisika yang dikembangkan dengan memanfaatkan spesifikasi butir soal dan (2) distribusi kemampuan
siswa kelas X SMA di kota Yogyakarta. Penelitian ini merupakan penelitian pengembangan dengan
mengacu pada model Oriondo & Dallo-Antonio. Subjek coba adalah siswa kelas X. Uji coba terbatas
melibatkan 354 siswa dari sekolah dengan kategori tinggi, sedang, dan rendah. Uji penelitian pada
skala luas melibatkan 644 siswa pada paket soal A dan paket soal B. Analisis butir soal dilakukan
melalui analisis kualitatif dan analisis kuantitatif. Hasil penelitian menyimpulkan bahwa (1) tes yang
dikembangkan pada mata pelajaran fisika dengan memanfaatkan spesifikasi butir soal memiliki
keunggulan dalam menghasilkan tes yang lebih setara dibandingkan dengan tes yang dirakit tanpa
memanfaatkan spesifikasi butir soal, (2) distribusi kemampuan siswa kelas X SMA di kota Yogyakarta
sebagian besar berada pada kategori kemampuan rata-rata.
Kata Kunci: pengembangan, tes prestasi belajar, spesifikasi butir, fisika
Abstrack
The aims of the study are to know (1) the advantage of achievement test in learning physics
developed by utilizing item specifications and (2) the ability distribution of tenth grade students at
senior high school in Yogyakarta. This research is developmental research used the model suggested
by Oriondo & Dallo-Antonio. The subjects were tenth grade students. The limited test was tried out to
354 students in school with categories of high, medium and low. The wide scale test was tried out to
644 students on package A and package B. Item analysis was conducted by using qualitative and
quantitative analysis. This research shows (1) developed test in physics by utilizing item specifications
had the advantage in producing more equate test (2) the ability distributions of tenth grade students at
senior high school in Yogyakarta were mostly at the average category.
Keywords: developing, achievement test, item specifications, physics
2
kualitas tes, jika butir yang digunakan kurang tepat. Skor yang paling umum digunakan
baik maka dapat menyebabkan kesalahan adalah peringkat persentil. Peringkat persentil
pengukuran (SEM) menjadi besar. Hendaknya berkisar dari 1 sampai 99 dan menunjukkan
dilakukan telaah butir soal baik secara persentase kelompok acuan siswa. Stanine
kualitatif maupun kuantitatif agar dapat adalah jenis kedua dari skor tes standar.
diketahui karakteristik butir soal yang baik dan Stanine merupakan skala sembilan poin,
yang tidak baik serta yang harus diperbaiki dengan stanine dari 1 mewakili kinerja
atau diganti. Dengan demikian, diharapkan terendah dan stanine dari 9 tertinggi oleh
dapat mempengaruhi keterampilan guru untuk Russell & Airasian (2012, pp. 311-312).
menghasilkan butir soal yang berkualitas. Pengembangan tes prestasi belajar
Hasil penelitian Megawati (2012, mata pelajaran fisika dengan memanfaatkan
p.53) mengemukakan bahwa terdapat dua spesifikasi butir soal tentu sangat diperlukan.
kelemahan pendidik dalam melakukan Adapun beberapa manfaat dalam penelitian ini
pengukuran menggunakan tes. Pertama, yaitu (1) spesifikasi butir soal yang dihasilkan
perangkat tes yang dibuat setiap kali akan khususnya pada mata pelajaran fisika dapat
melakukan penilaian tidak teruji secara digunakan untuk mempersiapkan butir tes
statistik karena tidak melalui uji coba untuk yang selanjutnya akan dibuat, (2) memberikan
menguji validitas dan reliabilitas, termasuk pedoman bagi para guru dalam menulis butir
pengujian daya beda dan efektivitas pengecoh soal yang berkualitas, (3) tersedianya butir
(distractor) pada tipe soal pilihan ganda. soal yang berkualitas dapat membantu para
Selain itu, validitas konstruk masih perlu guru dalam menyusun bentuk tes paralel yang
dipertanyakan sebab penyusunannya seadanya bermutu, (4) menghasilkan tes prestasi belajar
dan kurang terencana. Kedua, jika hendak yang dapat digunakan pada ujian tingkat
diperoleh tes yang benar-benar berkualitas, sekolah.
tentu memerlukan waktu yang tidak sedikit Spesifikasi butir soal memuat Standar
setiap kali akan melakukan penilaian. Kompetensi, cakupan materi pembelajaran,
Model Item Response Theory (IRT) indikator soal, bentuk soal, dan contoh butir
adalah model statistik dari hubungan antara soal. Hal ini didukung oleh penelitian Hayati
nilai seseorang pada konstruk yang diukur dan (2010, p.168) bahwa item specification yang
probabilitas peserta tes memilih setiap respon dikembangkan dapat digunakan oleh guru dan
pada setiap butir mengukur konstruk tersebut. pengembang tes khususnya untuk merancang
IRT dapat digunakan untuk mengevaluasi item specification pada topik atau mata
bagaimana informasi butir pada berbagai skor pelajaran lain. Dengan demikian, guru dan
spesifik dan memperkirakan nilai IRT pengembang tes memiliki pedoman untuk
seseorang oleh Jakob, Chih-Hung, David mengembangkan butir tes yang valid dalam
& Bryce (2007, p.96). Model Item Response konten maupun secara empirik.
Theory (IRT) memberikan informasi pada Berdasarkan beberapa yang telah
sebagian besar butir pilihan ganda yang dikemukakan di atas dapat disimpulkan bahwa
mengandung salah satu jawaban benar, disebut spesifikasi butir soal merupakan pedoman
"pilihan" untuk peserta ujian dari tingkat khusus yang digunakan oleh guru dalam
kemampuan yang berbeda (Kim, 2006, p.193). menulis butir soal yang terdiri dari SKL,
Penggunaan fungsi logistik dalam IRT tidak indikator, ruang lingkup materi, bentuk soal
hanya memungkinkan estimasi parameter butir dan contoh butir soal untuk menghasilkan
dan parameter kemampuan tetapi juga dapat butir tes yang sesuai dengan indikator.
memungkinkan pada pertimbangan ketepatan Informasi kemampuan peserta didik perlu
setiap parameter diperkirakan (Umar, 1999, diketahui secara jelas melalui prestasi belajar
p.23). yang diperoleh. Jika informasi yang diperoleh
Reynolds, Livingston, & Willson semakin besar maka kesalahan pengukuran
(2009, p.76) menyatakan bahwa standar semakin kecil sehingga butir soal yang
sembilan (stanine) membagi distribusi ke digunakan dapat benar-benar mengukur
dalam sembilan kategori. Stanine memiliki kemampuan siswa pada tingkat tertentu.
rata-rata 5 dan standar deviasi 2 karena nilai Tujuan penelitian ini adalah untuk mengetahui
stanine hanya menggunakan sembilan standar keunggulan tes prestasi belajar mata pelajaran
untuk mewakili berbagai nilai, sehingga skala fisika yang telah dikembangkan dengan
ini tidak memiliki format skor yang sangat memanfaatkan spesifikasi butir soal dan
4
memperoleh informasi distribusi kemampuan Nasional (UN) SMA yang memiliki nilai rata-
siswa kelas X SMA di kota Yogyakarta. rata UN termasuk pada kategori tinggi, sedang
dan rendah. Peringkat rerata hasil UN dilihat
Metode berdasarkan data dari Dinas Pendidikan di
Model Pengembangan kota Yogyakarta pada tahun ajaran 2014/2015.
Penelitian ini merupakan penelitian Selanjutnya pengambilan sampel penelitian
pengembangan tes dengan mengacu pada dilakukan dengan teknik stratified random
model Oriondo& Dallo-Antonio. Pertama, sampling. Uji coba dikenakan pada 354 siswa
perancangan tes yang meliputi: perumusan dan uji skala luas dikenakan pada 644 siswa.
materi fisika kelas X, penyusunan kisi-kisi,
penyusunan spesifikasi butir soal, penelaahan Data, Intrumen, dan Teknik Pengumpulan
butir soal, penulisan butir soal dalam bentuk Data
paket paralel; Kedua, uji coba penelitian; Data penelitian diperoleh melalui
Ketiga, uji penelitian. lembar jawaban yang dikerjakan peserta tes
dalam paket tes paralel yaitu paket A dan paket
Prosedur Pengembangan B. Instrumen pengumpulan data berupa
Prosedur pengembangan tes prestasi beberapa instrumen yang digunakan pada
belajar mata pelajaran fisika menggunakan penelitian yaitu kisi-kisi tes prestasi belajar
langkah pengembangan tes oleh Oriondo & fisika, tes prestasi belajar berbentuk pilihan
Dallo-Antonio (1998, p.34). Adapun tahap ganda dengan lima alternatif jawaban
dalam mengembangkan tes berdasarkan pada sebanyak 40 butir soal untuk paket A dan
prosedur yang sistematis yaitu (a) menentukan paket B, lembar penilaian instrumen tes,
tujuan; tujuan dari pengukuran yang dilakukan lembar telaah tes dan lembar jawaban tes.
untuk menghasilkan tes; (b) mempersiapkan Teknik pengumpulan data dalam penelitian ini
tabel spesifikasi; tabel spesifikasi berdasarkan melalui tes dan dokumentasi pada saat
perumusan materi yang ditentukan selanjutnya pengujian pada uji coba terbatas dan uji
menentukan presentase jumlah butir yang penelitian skala luas di SMA kota Yogyakarta.
dihasilkan; (c) memilih format butir yang
sesuai; format butir yang digunakan dalam Teknik Analisis Data
penelitian ini berbentuk pilihan ganda Teknik analisis data dalam penelitian
(multiple choice); (d) menulis butir tes; ini menggunakan analisis secara kualitatif dan
penulisan butir tes dilakukan berdasarkan pada secara kuantitatif. Analisis secara kualitatif
kisi-kisi soal; (e) mengedit butir tes; sebelum dilakukan melalui lembar telaah tes prestasi
pengujian, maka dilakukan pengeditan butir belajar dilakukan sebelum tes diujikan. Butir-
agar tidak terjadi kesalahan dalam konsep butir tes yang telah ditelaah selanjutnya
soal; (f) melakukan uji coba tes; butir tes yang dilakukan perbaikan berdasarkan masukan dan
telah melalui tahap penyuntingan selanjutnya saran perbaikan yang diberikan oleh validator.
dilakukan uji coba; (g) mempersiapkan tes; Analisis kuantitatif dilakukan melalui
bentuk akhir tes meliputi butir yang memenuhi 2 (dua) tahap yaitu Pertama, telaah kesesuaian
kriteria karakteristik butir baik; (h) butir soal berdasarkan isi melalui penilaian
menentukan uji validitas; penentuan validitas sebanyak sepuluh validator untuk mengetahui
tes dilakukan berdasarkan isi (materi); (i) sejauhmana butir mewakili konstrak yang
menentukan uji reliabilitas; pengembangan tes diukur. Menurut Azwar (2014, pp. 112-113)
diperlukan keajegan sebuah tes yang akan butir dikatakan mewakili konstruk yang diukur
digunakan sehingga koefisien reliabilitas berarti butir yang bersangkutan relevan dengan
tinggi sangat diperlukan; (j) menafsirkan tes; indikator. Hal ini karena indikator merupakan
penafsiran tes merupakan tahap akhir dalam penerjemahan operasional dari atribut yang
penelitian yang dilakukan. diukur. Penilaian dilakukan dengan cara
memberikan angka antara 1 sampai dengan 4.
Subjek Coba Analisis yang dapat digunakan untuk
Subjek coba dalam penelitian ini menentukan indeks validitas isi instrumen tes
adalah siswa kelas X SMA di kota Yogyakarta yaitu formula Aiken’s sebagai berikut: (Aiken,
yang menggunakan Kurikulum Tingkat Satuan 1980, p.956).
Pendidikan (KTSP). Subjek coba penelitian
diperoleh berdasarkan peringkat hasil Ujian
5
butir yang belum memenuhi kriteria dilakukan faktor kesepuluh diperoleh sebesar 32,4% dari
revisi produk. Revisi produk tidak dilakukan total varians lebih besar dari 20%. Dengan
dengan membuang butir soal yang buruk demikian, dapat dikatakan bahwa berdasarkan
melainkan dengan memperbaiki tata bahasa komponen hasil varians hasil analisis faktor
dalam kalimat soal. Revisi produk pada paket telah memenuhi asumsi unidimensi. Selain itu,
A terdapat 4 butir soal dan paket B terdapat 1 dapat dilihat scree plot yang disajikan pada
butir. Adapun 3 asumsi yang mendasari teori Gambar 2 menunjukkan nilai eigen yang mulai
respons butir (IRT), yaitu unidimensi, landai pada faktor ketiga. Hal ini menunjukkan
independensi lokal, dan invariansi parameter. bahwa terdapat 1 faktor yang dominan pada
tes prestasi belajar fisika dan faktor lain
Unidimensi memberikan sumbangan yang cukup besar
Unidimensi menyatakan bahwa setiap terhadap varians yang dapat dijelaskan. Hasil
butir tes hanya mengukur satu kemampuan. analisis unidimensi sesuai dengan pendapat
Prakteknya asumsi ini sangat sulit dipenuhi Retnawati (2016, pp.48) mengemukakan
karena banyak faktor yang mempengaruhi tes. bahwa perangkat tes mengukur paling tidak 2
Salah satu cara untuk menguji asumsi ini faktor dengan faktor yang pertama merupakan
dengan melakukan faktor analisis yang faktor dominan.
menghasilkan KMO, nilai eigen, varians yang
dapat dijelaskan dan komponen faktor.
Hasil analisis juga memuat faktor
dominan yang terukur pada paket tes A dan
grafik yang memuat garis berbentuk curam
maupun landai. Paket A memiliki total varians
berdasarkan hasil bagi antara faktor utama
dengan faktor kesepuluh diperoleh persentase
sebesar 48% dari total varians. Selain itu,
dapat dilihat pada scree plot yang disajikan
pada Gambar 1 menunjukkan grafik hanya
menunjukkan dua curaman sedangkan grafik
yang lain berbentuk landai. Hal ini berarti
bahwa terdapat dua faktor dominan yang Gambar 2. Scree Plot Hasil Analisis Faktor
terukur dalam tes. Berdasarkan analisis Eksploratori Paket B
eksploratori disimpulkan bahwa instrumen
yang berupa perangkat tes prestasi belajar Independensi Lokal
dapat dikatakan valid untuk mengukur Independensi lokal terpenuhi jika
kemampuan fisika dan terbukti secara empiris. kovarians pada masing-masing kelompok
mendekati nol. Berdasarkan hasil analisis
menggunakan microsoft excel menunjukkan
bahwa paket A dan paket B terbukti memenuhi
asumsi independensi lokal dengan nilai
kovarians pada masing-masing kelompok
mendekati nol. Dengan demikian berarti tidak
terjadi korelasi pada masing-masing butir
dalam kelompok.
Invariansi Parameter
Invariansi Parameter Butir
Invariansi parameter menyatakan
bahwa karakteristik butir soal tidak tergantung
pada distribusi parameter kemampuan peserta
Gambar 1. Scree Plot Hasil Analisis tes dan parameter yang menjadi peserta tes
Faktor Eksploratori Paket A tidak bergantung dari ciri butir soal. Invariansi
parameter butir baik tingkat kesukaran dan
Paket B memiliki total varians daya pembeda dapat dibuktikan dengan
berdasarkan hasil bagi faktor utama dengan melakukan pemisahan kelompok siswa ganjil
7
dan kelompok siswa genap. Jika titik-titik invariansi parameter daya pembeda butir yang
mendekati garis kemiringan berarti tidak dapat dilakukan melalui pemisahan dua
terjadi variasi parameter hasil estimasi pada kelompok peserta tes yaitu genap dan ganjil
kelompok ganjil dan genap. yaitu menggunakan bantuan Microsoft Excel
Berdasarkan hasil analisis estimasi sehingga diperoleh korelasi yang disajikan
parameter butir menunjukkan bahwa pemetaan pada Diagram 3 sebagai berikut.
membentuk sebuah garis lurus. Hal ini berarti
paket A telah terbukti memenuhi invariansi
parameter daya pembeda butir. Invariansi
parameter daya pembeda pada kelompok siswa
ganjil dan genap berkorelasi tinggi sebesar
0,827 ditandai dengan titik-titik pada diagram
pencar mendekati garis yang melewati titik
asal.
untuk peserta tes yang berkemampuan sedang Kemampuan (θ) peserta tes berada pada
dan rendah. kisaran -0,70 sampai -0,23. Dengan demikian,
Berdasarkan hasil analisis diperoleh distribusi kemampuan peserta didik yang
fungsi informasi tes tertinggi terletak pada mengerjakan paket A sebagian besar
kemampuan (θ) = -0,75 dengan nilai fungsi dikerjakan oleh siswa yang termasuk dalam
informasi tes tertinggi sebesar 15,6 (SEM = kemampuan rata-rata.
0,252). Tes prestasi belajar fisika pada Paket B
cocok untuk peserta tes yang berkemampuan
sedang dan rendah. Disimpulkan kedua paket
tes memberikan informasi kemampuan yang
hampir mendekati.
diperlihatkan pada grafik gambar 6 yang siswa kelas X SMA di kota Yogyakarta yang
menunjukkan bahwa persentase peserta tes mengerjakan tes sebagian besar berada pada
yang mengerjakan paket B hampir membentuk kategori kemampuan rata-rata.
kurva normal. Kemampuan dengan presentase Berdasarkan hasil penelitian ini
tertinggi berada pada rangking 6, 4, dan 5 diharapkan sekolah terbiasa untuk membuat
termasuk ke dalam kategori rata-rata. Dengan spesifikasi butir soal sehingga ketika membuat
demikian, secara keseluruhan paket A dan indikator yang sama menghasilkan butir yang
paket B diujikan kepada peserta didik SMA relatif sama. Dengan demikian, kesamaan butir
kelas X di kota Yogyakarta yang memiliki lebih terjamin sehingga jika tidak ada
kemampuan rata-rata. spesifikasi butir soal maka dikhawatirkan akan
menghasilkan butir tes yang cenderung bebas
antara butir satu dengan butir lainnya
meskipun berasal dari indikator yang sama dan
menguji hal yang sama.
Bagi peneliti lain yang tertarik untuk
melakukan penelitian lebih lanjut terkait
pengembangan tes dengan memanfaatkan
spesifikasi butir soal untuk mata pelajaran
lainnya diperlukan kecermatan dan ketelitian
dalam menyusun indikator, ruang lingkup
Gambar 6. Distribusi Kemampuan Siswa materi dan rumusan butir soal. Instrumen tes
Paket B yang dikembangkan dapat dimanfaatkan lebih
lanjut dengan melakukan penyimpanan
Hasil penelitian ini menunjukkan berbasis file word dengan dilengkapi software
bahwa telah berhasil dikembangkan tes spesifikasi butir soal akan memudahkan guru
prestasi belajar fisika dengan memanfaatkan dalam memperbaruhi dan memperkaya
spesifikasi butir soal SMA di kota Yogyakarta. spesifikasi butir soal pada materi fisika
Tes yang terdiri dari materi optik, suhu dan lainnya.
kalor telah menghasilkan bentuk tes paralel
yang teruji kualitas maupun kesetaraannya Daftar Pustaka
baik secara teoritis dan empiris. Dengan Aiken, L.R. (1980). Content validity and
demikian, paket tes paralel yang dihasilkan reliability of single items or
melalui spesifikasi butir soal dapat digunakan questionnaires. Educational and
untuk mengukur kompetensi yang sama pada Psycological Measurement, 40, 955-
masing-masing indikator. 959.