Peng Instrumen Penilaian Untuk Mengukur Keerampilan SAINS PDF
Peng Instrumen Penilaian Untuk Mengukur Keerampilan SAINS PDF
Abstrak
Penelitian pengembangan ini bertujuan untuk mengetahui: (1) kelayakan instrumen penilaian untuk
mengukur keterampilan proses sains siswa SMA ditinjau dari karakteristik standar tes dan (2) seberapa
besar tingkat penguasaan instrumen penilaian untuk mengukur keterampilan proses sains siswa SMA.
Prosedur pengembangan dalam penelitian ini dengan model 4-D yang dikemukakan oleh Thiagarajan yaitu
define (pendefinisian), design (perancangan), develop (pengembangan), dan disseminate (penyebarluasan).
Instrumen pengumpulan data yang digunakan berupa angket, wawancara, dan soal pilihan ganda beralasan.
Teknik analisis data menggunakan analisis kualitatif dengan menggunakan statistik Aiken’s V dan analisis
kuantitatif dengan menggunakan program QUEST. Hasil penelitian adalah sebagai berikut. (1) Instrumen
penilaian untuk mengukur keterampilan proses sains siswa SMA dikatakan layak ditinjau dari karakteristik
standar tes yaitu kecocokkan butir soal dengan INFIT MNSQ 0,86 sampai 1,29, Reliabilitas sebesar 0,80,
dan tingkat kesukaran dengan jangkauan -1,47 sampai 1,59 terdiri dari 3 katergori: 11 butir soal mudah, 7
butir soal sedang, dan 5 butir soal Sukar. (2) Persentase tingkat penguasaan keterampilan proses sains siswa
pada sekolah dengan kategori tinggi 76,64%, kategori sedang 73,71% dan rendah 70,12%.
Abstract
This development research aimed to determine: (1) the feasibility of assessment instrument to measure the
science process skills of high school students in terms of test standard characteristics and (2) how the level
of assessment instrument mastery to measure the science process skills of high school students. The
development procedure used in this study was by using 4-D model that was found by Thiagarajan; define,
design, develop, and disseminate. The instruments used in collecting the data were questionnaires,
interview, and multiple choice questions reasoned. The technique for analyzing the data used in this study
was qualitative analysis by using Aiken's V statistics and quantitative analysis by using QUEST program.
The results of this study were (1) assessment instrument to measure the process skills of high school students
where could be categorized as effective from test standard characteristic namely the matching of question
items with INFIT MNSQ was 0.86 until 1.29. The reliability was 0.80 and the difficulty level was -1.47 until
1.59 consisted of 3 categories: 11 items of easy question, 7 items of medium questions, and 5 questions of
difficult question. (2) The percentage of assessment instrument mastery level science process skills of high
school students in high level was 76.64%, medium category was 73.71%, and poor level was 70.12%.
alpha Cronbach untuk data politimus. SMA kelas X pada materi ekosistem. Uraian
Menurut Wright & Master (Subali & Suyata, dari hasil pengembangan instrumen penilaian
2012), indeks sparasi item (item separation sebagai berikut.
index) disebut dengan istilah reliabilitas 1. Define
sampel, sedangkan indeks sparasi person Produk instrumen penilaian yang
disebut reliabilitas tes.” dikembangkan berupa kisi-kisi soal,
naskah soal pilihan ganda beralasan, serta
Tingkat Kesukaran rubrik penilaian. Instrumen penilaian
Karakteristik yang kedua adalah dalam penelitian ini merupakan alat yang
tingkat kesukaran atau indeks kesukaran. digunakan untuk menilai capaian
Indeks kesukaran atau tingkat kesukaran pembelajaran siswa, baik aspek
diperoleh dengan menggunakan program pengetahuan yaitu kognitif maupun
QUEST. Subali & Suyata (2012) menyatakan keterampilan proses sains. Penilaian
skala politomus memiliki skor x sebesar 0, 1, dilakukan dengan menggunakan tes dalam
2, 3, …. mi. Butir dikatakan baik jika indeks bentuk tertulis. Tes yang dikembangkan
kesukaran lebih dari –2,00 atau kurang dari berupa pilihan ganda beralasan dengan
2,00. Difficulty merupakan mean (rerata) jumlah item soal sebanyak 35 butir.
indeks kesukaran pada skor 0, skor 1, skor 2, 2. Design
dan skor 3 pada setiap butir. Tahap ini merupakan tahap merancang
instrumen penilaian. Pada tahap ini
Hasil dan Pembahasan dihasilkan kisi-kisi penyusunan soal,
Hasil Pengembangan naskah soal awal, dan rubrik penilaian.
Hasil pengembangan merupakan Kisi-kisi penyusunan soal dirancang
pencapaian yang telah didapatkan setelah dengan adanya identitas, KI, KD,
menyelesaikan prosedur penelitian. Produk indikator pembelajaran, indikator
yang dikembangkan berupa instrumen keterampilan proses sains, nomor soal dan
penilaian biologi yang bertujuan untuk ranah kognitif. Hal ini dapat dilihat pada
mengukur keterampilan proses sains siswa Tabel 4.
Nomor Ranah
No. Indikator Pembelajaran Indikator KPS
Soal Kognitif
10 Merumuskan hipotesis hasil penelitian Merumuskan hipotesis 9 C2
berdasarkan grafik atau tabel 23 C2
11 Merencakan percobaan terkait dengan Merencanakan 10 C1
ekosistem percobaan
Merencanakan 11 C2
percobaan
Merencanakan 12 C1
percobaan
Merencanakan 13 C2
percobaan
Naskah soal awal terdiri dari petunjuk guru sebagai pelaksana pembelajaran.
soal, contoh soal, dan soal sebanyak 35 Instrumen penilaian biologi ini berbentuk
item soal, sedangkan rubrik penilaian soal pilihan ganda beralasan. Soal ini terdiri
terdiri dari identitas, nomor, nomor soal, dari 35 soal. Validasi instrumen penilaian
ide pokok, skor, dan kriteria. Pada skor biologi ini dilakukan oleh dosen ahli evaluasi
diberikan skor 0, 1, 2, dan 3. Pada skor 0 dan dosen ahli materi.
apabila tidak menjawab, skor 1 apabila Hasil validasi dibagi menjadi tiga
jawaban pilihan ganda salah dan alasan yaitu valid tanpa revisi, valid dengan revisi,
salah, skor 2 apabila jawaban pilihan dan tidak valid. Saran ketika terjadi revisi
ganda benar dan alasan salah atau apabila dibagi menjadi 21 macam, 6 untuk ahli materi
jawaban pilihan ganda salah dan alasan dan 15 untuk ahli evaluasi. Selain pada
benar dengan memunculkan semua ide lembar validasi, masukan dan saran juga
pokok, dan skor 3 apabila jawaban pilihan didapatkan dari validator secara operasional
ganda benar dan alasan benar dengan melalui lembar soal. Soal terdiri dari 35 butir
memunculkan semua ide pokok. yang mewakili keterampilan proses sains.
3. Develop Hasil dari validasi instrumen penilaian
Tahap pengembangan merupakan tahap dari dosen ahli menunjukkan bahwa terdapat
pengembangan produk instrumen beberapa komponen yang memerlukan
penilaian yang telah direncanakan perbaikan lebih lanjut. Setelah itu dianalisis
sebelumnya disusun untuk menjadi menggunakan statistik Aiken’s V dengan
produk yang siap untuk diujicobakan. bantuan program Microsoft Excel. Dari
Langkah-langkah yang dilakukan dalam analisis Aiken’s V diperoleh nilai rata-rata
tahap pengembangan instrumen penilaian 0,86 yang berarti valid.
biologi ini antara lain validasi oleh dosen Pada rubrik penilaian ada beberapa
ahli dan guru biologi sebagai pelaksana aspek yang dinilai yaitu substansi,
pembelajaran. konstruksi, dan bahasa. Berdasarkan lembar
validasi yang telah dinilai oleh dosen ahli
Validasi Dosen Ahli menunjukan hasil validasi rubrik penilaian
Berdasarkan penelitian yang dilakukan untuk pengembangan keterampilan proses
oleh Akani (2015), draf instrumen yang sains siswa pada materi ekosistem dinyatakan
digunakannya divalidasi oleh lima orang ahli, valid.
satu dari ahli pengukuran dan evaluasi, satu
dari ahli biologi, satu dari ahli kimia, satu dari Validasi Guru
ahli fisika, dan satu lagi dari ahli ipa Validasi selanjutnya dilakukan oleh
terintegrasi. guru sebagai pelaksana pembelajaran.
Produk instrumen penilaian biologi Validasi dilakukan oleh guru A dari SMAN 1
dikembangkan berdasarkan kisi-kisi yang Prambanan, guru B dari SMAN 1 Godean,
mengacu pada KI, KD dan indikator yang guru C dari SMAN 1 Seyegan, dan guru D
ada, divalidasi oleh dosen ahli untuk dari SMAN 2 Ngaglik sebagai guru kelas X
mengetahui kelayakan produk instrumen di SMAN Kabupaten Sleman. Berdasarkan
penilaian biologi sebelum divalidasi oleh lembar validasi, hasil validasi dibagi menjadi
tiga yaitu valid tanpa revisi, valid dengan atau mengamati nilai rata-rata INFIT t (Mean
revisi, dan tidak valid. Soal terdiri dari 35 INFIT t) beserta simpangan bakunya. Jika
butir yang mewakili keterampilan proses rerata INFIT MNSQ sekitar 1,00 dan
sains. Hasil dari validasi instrumen penilaian simpangan bakunya 0,00 atau rerata INFIT t
dari guru menunjukkan bahwa terdapat mendekati 0,00 dan simpangan bakunya 1,00,
beberapa komponen yang memerlukan maka keseluruhan tes fit dengan model PCM
perbaikan lebih lanjut. Hal yang harus 1 PL. Berdasarkan perhitungan, nilai rerata
diperhatikan yaitu pada kategori layak INFIT MNSQ 1,00 (sekitar 1,00) dan
dengan revisi. simpangan baku 0,12 (sekitar 0,00), maka
Berdasarkan validasi soal dari guru keseluruhan tes fit dengan PCM 1 PL.
diperoleh saran berupa pengurangan butir Pengujian penetapan fit setiap butir
soal dari yang semula 35 butir soal menjadi terhadap model mengikuti kaidah Adam &
23 butir soal. Masukan dan saran dari guru Khoo (Subali & Suyata, 2012), yakni suatu
tersebut digunakan untuk merevisi produk butir fit terhadap model jika nilai INFIT
awal instrumen penilaian, sehingga diperoleh MNSQ antara 0,77 sampai dengan 1,30.
instrumen penilaian yang siap diujicobakan. Dengan batas penerimaan butir
Selanjutnya validasi instrumen penilaian menggunakan INFIT MNSQ atau fit menurut
menggunakan statistik Aiken’s V dengan model (antara 0,77 sampai dengan 1,30) dan
bantuan program Microsoft Excel. Dari menggunakan INFIT t dengan batas -2,00
analisis Aiken’s V diperoleh nilai rata-rata sampai 2,00, maka diperoleh butir-butir yang
0,94 yang berarti valid. cocok memenuhi goodness of fit. Nilai INFIT
Dari hasil analisis validasi instrumen MNSQ memiliki jangkauan dari 0,86 sampai
penilaian oleh guru dapat diketahui bahwa dengan 1,29.
sebanyak 17 item soal dengan kategori sangat Berdasarkan batas penerimaan butir
tinggi, 5 item soal dengan kategori tinggi, dan menggunakan INFIT MNSQ atau fit menurut
1 soal dengan kategori cukup. model, maka semua butir sebanyak 23 butir
fit semua.
Uji Coba Terbatas
Tindak lanjut hasil revisi produk oleh Reliabilitas Tes pada Uji Coba
dosen ahli dan guru adalah uji coba terbatas. Selain untuk menguji kecocokan,
Uji coba terbatas dilaksanakan di SMAN 2 output program QUEST juga menampilkan
Ngaglik dengan sampel penelitian 121 orang estimasi reliabilitas perangkat instrumen tes.
siswa. Uji coba terbatas ini dilakukan untuk Berdasarkan hasil analisis dengan program
mengetahui kecocokan butir instrumen QUEST, reliabilitas tes berdasarkan item
(Goodness of fit), reliabilitas, dan tingkat (indeks aparasi item sebesar 0,76 yang
kesukaran dari instrumen penilaian yang tergolong kategori cukup tinggi, sedangkan
dikembangkan. reliabilitas tes berdasarkan testi (indeks
Informasi tentang karakteristik soal sparasi person) sebesar 0,80 yang tergolong
diperoleh dari analisis menggunakan kategori sangat tinggi (Sumintono &
program komputer QUEST. Uji coba yang Widhiarso, 2014).
dilakukan memanfaatkan waktu pelajaran
biologi yaitu 2 jam pelajaran biologi dengan Tingkat Kesukaran (Difficulties Index)
total waktu yang diperlukan yaitu 90 menit. Penelitian yang dilakukan oleh
Penskoran dilakukan dengan diskor Sukarno, Permanasari, dan Hamidah (2013)
politomus. dengan menggunakan soal tes keterampilan
sains dasar yang dikembangkan oleh The
Goodness of fit pada Uji Coba International Energy Management Courses
Pengujian fit tes secara keseluruhan (IEC) dan The University of Queensland.
maupun tiap butir dengan menggunakan Item yang dikembangkan meliputi
program QUEST. Pengujian fit tes keterampilan menyimpulkan,
keseluruhan dikembangkan oleh Adam & mengobservasi, memprediksi, mengukur, dan
Khoo (Subali & Suyata, 2012) berdasarkan mengklasifikasikan. Data yang telah
nilai rerata INFIT Mean of Square (Mean dikumpulkan kemudian dilakukan
INFIT MNSQ) beserta simpangan bakunya
kategorisasi skor menjadi tiga yaitu mudah, nilai persentase jawaban benar pada masing-
sedang, dan tinggi. masing jenis keterampilan proses sains yang
Berdasarkan hasil analisis dengan muncul. Hasil analisis ketercapaian
QUEST, tingkat kesukaran (difficulty) butir- keterampilan proses sains pada uji coba luas
butir terletak dalam jangkauan dari -1,47 tersaji pada Tabel 5. Tabel 5 menunjukkan
sampai dengan 1,59 dengan rata-rata 0,00 dan tingkat penguasaan keterampilan proses sains
simpangan baku 0,87. Butir dikatakan baik pada uji coba luas. Hasil tersebut diperoleh
jika nilai difficulty lebih dari -2,00 atau dari siswa di tiga sekolah di SMA Negeri
kurang dari 2,00. Nilai difficulty rata-rata Sleman yang dijadikan subjek uji coba.
perangkat tes keterampilan proses sains yang Tabel 5. Penguasaan Keterampilan Proses Sains
dipakai pada tahap uji coba sebesar 0,00 + pada Uji Coba Luas
0,87 dengan kategori sedang. Jadi, Rata-rata
berdasarkan nilai difficulty dari 23 butir soal, No. Subjek Penelitian Penguasaan
terdapat 11 soal dengan kriteria mudah, 7 soal (%)
1 SMAN 1 Godean 76,64
dengan kriteria sedang dan 5 soal dengan
2 SMAN 1 Prambanan 73,71
kriteria sukar. Distribusi tingkat kesukaran 3 SMAN 1 Seyegan 70,12
butir soal dapat dilihat pada Tabel 4.
Tabel 4. Distribusi Tingkat Kesukaran Butir
Dari Tabel 5 dapat diketahui untuk
Soal
No. Kriteria Jumlah
penguasaan keterampilan proses sains paling
1 Mudah 11 tinggi dari semua indikator adalah siswa
2 Sedang 7 SMAN 1 Godean dengan indikator
3 Sulit 5 mengelompokkan, menafsirkan, meramalkan
Jumlah Soal 23 merumuskan hipotesis, dan merencanakan
percobaan lebih tinggi persentase
Berdasarkan data pada Tabel 4, maka penguasaannya dibandingkan dengan
dapat diperoleh produk instrumen penilaian sekolah lainnya.
yang diterima dari uji coba terbatas sebanyak
23 butir soal, artinya semua butir soal Revisi Produk
diterima. Soal yang diterima digunakan 1. Revisi Berdasarkan Hasil Validasi
sebagai produk akhir pada instrumen Produk instrumen penilaian yang
penilaian sebelum digunakan pada uji coba dikembangkan melalui revisi 3 validator
luas. yaitu satu orang dosen ahli evaluasi, satu
orang dosen ahli materi, dan empat orang
Uji Coba Luas guru sebagai pelaksana pembelajaran kelas
Setelah produk instrumen penilaian X. Hasil validasi instrumen penilaian
keterampilan proses sains yang telah diuji menunjukkan instrumen penilaian valid.
coba secara terbatas direvisi dan diperoleh Menurut Azwar (2014) estimasi validitas
soal pilihan ganda beralasan pada uji terbatas tidak dapat dituntut suatu koefisien sangat
sebanyak 23 butir soal, berarti tidak ada butir tinggi sebagaimana halnya dalam penilaian
soal yang ditolak atau gugur melainkan butir terhadap koefisien reliabilitas. Selanjutnya
soal bisa diuji lapangan seluruhnya. Azwar menungkapkan apabila koefisien
Uji coba luas melibatkan 3 SMA validitas itu lebih dari 0,33 dianggap valid
Negeri dengan kategori sekolah berbeda di dan jika kurang dari 0,33 biasanya dianggap
Kabupaten Sleman yaitu SMA Negeri 1 tidak memadai atau tidak valid. Jadi
Godean (ketegori sekolah tinggi), SMA keseluruhan penilaian dari validator tersebut
Negeri 1 Prambanan (kategori sekolah dapat disimpulkan valid atau dengan kata lain
sedang), dan SMA Negeri 1 Seyegan layak.
(kategori sekalah rendah). Kategori ini Validator ahli evaluasi memutuskan 23
berdasarkan peringkat Ujian Nasional (UN) butir soal valid tanpa revisi dan 12 soal valid
tahun ajaran 2013/2014. dengan revisi, sedangkan validator ahli
Berdasarkan hasil uji coba luas di materi 30 soal valid tanpa revisi dan 5 soal
lapangan, analisis penguasaan keterampilan valid dengan revisi. Validator guru
proses sains dilakukan dengan mencari rerata memutuskan 33 butir soal valid tanpa revisi