1. Kegiatan Belajar 1 : Validitas dan Reliabilitas Hasil Pengukuran
A. Apakah Validitas itu? Alat ukur yang baik adalah alat ukur yang dapat dengan tepat mengukur apa yang ingin Anda ukur. Ketepatan hasil pengukuran inilah yang dinamakan validitas. Pengertian validitas mengacu pada ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi (Gronlund dan Linn, 1990). Secara umum validitas ada tiga jenis: 1. Validitas isi (content validity) 2. Validitas konstrak (construct validity) 3. Validitas yang dikaitkan dengan kriteria tertentu (criterion related validity) Validitas isi diperlukan untuk menjawab pertanyaan “sejauh mana item-item yang ada dalam tes dapat mengukur keseluruhan materi yang telah diajarkan”. Tinggi rendahnya validitas isi dapat ditetapkan berdasarkan analisis rasional atau pertimbangan ahli terhadap isi tes tersebut. Hal ini merupakan tuntutan yang harus dipenuhi oleh tes hasil belajar.tinggi rendahnya validitas isi suatu tes dapat Anda lihat pada perencanaan atau kisi-kisi tes. Semakin representative materi yang dapat ditanyakan dalam tes tersebut menunjukkan semakin tinggi validitas isinya. Validitas konstrak mengacu pada sejauh mana alat ukur tersebut dapat mengungkap keseluruhan yang digunakan sebagai dasar dalam penyusunan tersebut.yang dimaksud dengan konstrak di sini adalah konsep hipotesis yang digunakan sebagai dasar dalam penyusunan alat ukur. Validitas konstrak ini banyak digunakan terutama dalam pengukuran-pengukuran psikologi seperti pengukuran sikap, minat,tingkah laku dan sebagainya. Validitas yang dikaitkan dengan kriteria lain mengacu pada sejauh mana alat ukur tersebut dapat dengan tepat memprediksi kesesuaian antara pengetahuan yang dimiliki sekarang dengan keberhasilannya pada masa yang akan datang atau kesesuaian antara penguasaan suatu pengetahuan dengan keterampilan penggunaan pengetahuan tersebut. B. Apakah Reabilitas itu? Reliabilitas, atau keandalan, adalah konsistensi dari serangkaian pengukuran atau serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes dengan tes ulang) akan memberikan hasil yang sama, atau untuk pengukuran yang lebih subjektif, apakah dua orang penilai memberikan skor yang mirip (reliabilitas antar penilai). Reliabilitas tidak sama dengan validitas. Artinya pengukuran yang dapat diandalkan akan mengukur secara konsisten, tapi belum tentu mengukur apa yang seharusnya diukur. Dalam penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi yang sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran yang berulang itu memberikan hasil yang berbeda-beda. Hasil-hasil pengukuran yang berhubungan dengan aspek-aspek fisik seperti mengukur panjang meja, tinggi almari, berat badan, dan tinggi badan biasanya menghasilkan reliabilitas yang sangat tinggi. Artinya walaupun pengukuran dilakukan lebih dari sekali tetapi tetap memberikan lebih dari sekali tetapi tetap memberikan hasil yang tidak jauh berbeda. C. Bagaimana Hubungan antara Validitas dan Realibilitas Ketetapan hasil pengukuran (reliabilitas) sangat diperlukan untuk memperoleh alat ukur yang dapat memberikan hasil pengukuran yang tepat (valid). Walaupun demikian alat ukur yang mempunyai reliabilitas yang tinggi belum tentu secara otomatis mempunyai validitas yang tinggi. Karena tingginya reliabilitas yang dihasilkan oleh suatu alat ukur jika tidak dibarengi dengan tingginya validitas dapat memberikan informasi yang salah tentang apa yang ingin Anda ukur. D. Bagaimana Meningkatkan Realibiltas Tes? Reliabilitas suatu tes dapat ditingkatkan dengan menambah jumlah butir ke dalam tes tersebut. Yang mungkin menjadi pertanyaan bagi Anda kemudian adalah apakah setiap penambahan butir soal akan selalu dapat menaikkan reliabilitas tes? Jawabannya adalah belum tentu.penambahan butir soal pada tes akan meningkatkan reliabilitas jika butir soal yang ditambahkan adalah butir-butir soal yang homogeny dengan butir soal yang ada. Yang dimaksud dengan butir soal yang homogen dengan butir soal-soal yang mengukur hal yang sama dengan butir soal yang sudah ada. Penambahan butir soal tidak akan menaikkan reliabilitas tes jika butir soal yang ditambahkan tidak homogeny dengan butir soal yang telah ada.
2. Kegiatan Belajar 2 : Analisis dan Perbaikan Instrumen
A. Mengapa Analisis Butir Soal Penting? Menurut Nitko (1983) analisis butir soal menggambarkan suatu proses pengambilan data, dan penggunaan informasi tentang tiap-tiap butir soal terutama informasi tentang respon siswa terhadap setiap butir soal. Lebih lanjut dikatakan bahwa arti penting penggunaan analisis butir soal adalah sebagai berikut : 1. Untuk mengetahui apakah butir soal-butir soal yang disusun sudah berfungsi sesuai dengan apa yang dikehendaki oleh penyusun soal. Untuk menentukan soal- soal yang Anda susun telah berfungsi sebagaimana seharusnya maka Anda harus memperhatikan antara lain hal-hal sebagai berikut : a. Apakah soal-soal yang Anda susun sudah sesuai untuk mengukur perubahan tingkah laku seperti telah dirumuskan dalam tujuan instruksional khusus? b. Apakah tingkat kesukaran sudah Anda perhitungkan? c. Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang kurang pandai? d. Apakah kunci soal yang Anda buat sudah benar sesuai dengan maksud soal? e. Jika Anda menggunakan tes pilihan berganda, apakah pengecoh yang Anda pilih sudah berfungsi dengan baik? f. Apakah soal tersebut masih dapat ditafsirkan ganda atau tidak? 2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu materi. 3. Sebagai umpan balik bagi Anda sendiri sebagai guru untuk mengetahui kesulitan- kesulitan yang dialami siswa dalam memahami suatu materi. 4. Sebagai acuan untuk merevisi soal 5. Untuk memperbaiki kemampuan Anda dalam menulis soal. B. Kapan Analisis Butir Soal Dilakukan? Dalam menganalisis butir soal paling tidak ada dua karakteristik butir soal yang perlu Anda perhatikan yaitu tingkat kesukaran dan daya beda butirr-butir soal. 1. Tingkat kesukaran butir soal Tingkat kesukaran merupakan salah satu karakteristik yang dapat menunjukkan kualitas butir soal tersebut apakah termasuk mudah, sedang, atau sukar. 2. Daya Beda (D) Daya beda butir soal memiliki pengertian seberapa jauh butir soal tesebut dapat membedakan kemampuan individu peserta tes. Butir soal didukung potensi daya beda yang baik, akan mampu membedakan peserta didik yang memiliki kemampuan tinggi (pandai) dengan peserta didik yang memiliki kemampuan rendah (kurang pandai) C. Bagaimana Cara Melakukan Analisis Secara Sederhana? Untuk melakukan analisis butir soal secara sederhana, berikut ini disajikan langkah- langkah dalam menganalisis butir soal: 1. Hitunglah jumlah jawaban yang benar untuk seluruh siswa 2. Berdasarkan jumlah jawaban yang benar dari seluruh siswa tersebut susunlah skor siswa mulai skor tertinggi ke skor terendah 3. Berdasarkan urutan skor tersebut tentukan siswa yang termasuk dalam kelompok atsa dan siswa yang terrmasuk dalam kelompok bawah. Untuk menentukan berapa persen siswa yang termasuk kelompok atas dan berapa persen yang masuk kelompok bawah gunakan rambu-rambu sebagai berikut (Nitko, 1983 dan Hanna, 1993): a. Jika jumlah nilai siswa <21-40 maka jumlah kelompok atas dan kelompok bawah masing-masing 50% b. Jika jumlah siswa 21-40 maka jumlah kelompok atas dan kelompok bawah masing-masing 33,3% c. Jika jumlah siswa > 41 maka jumlah kelompok atas dan kelompok bawah msing-masing 27% 4. Hitunglah jumlah siswa dalam kelompok atas yang memilih tiap-tiap alternative jawaban yang disediakan 5. Dengan cara yang sama hitung jumlah siswa dalam kelompok bawah yang memilih tiap-tiap alternative jawaban yang disediakan 6. Hitung jumlah seluruh peserta tes (kelompok atas, tengah, dan bawah) 7. Hitung tingkat kesukaran butir soal dan daya beda dengan menggunakan rumus yang telah disediakan D. Bagaimana menganalisis tes uraian? Cara menganalisis tes uraian diberikan oleh Whitney dan Sabers (Mehrens dan Lehman, 1984) sebagai berikut : 1. Tentukan jumlah siswa yang termasuk dalam kelompok atas (25%) dan kelompok bawah (25%) 2. Hitung jumlah skor kelompok atas dan jumlah skor kelompok bawah 3. Hitung tingkat kesukaran dan daya beda setiap butir soal dengan rumus berikut :
Beberapa hal yang perlu Anda perhatikan dalam memperbaiki butir soal adalah sebagai berikut: 1. Perhatikan tingkat kesukaran butir soal,. Butir soal dianggap baik jika mempunyai tingkat kesukaran (p) antara 0,25 sampai dengan 0,75 atau yang mendekati angka tersebut. 2. Perhatikan daya beda butir soal. Butir soal dianggap baik jika kunci atau jawaban yang dianggap benar mempunyai daya beda positif tinggi dan pengecohnya mempunyai daya beda negatif. F. Bagaimana memperbaiki Non-Tes? Prosedur memperbaiki instrument non-tes sama dengan prosedur memperbaiki tes. Perbaikan yang dapat Anda lakukan pada tahp ini adalah dengan meminta pakar untuk meriview atau menelaah instrument tersebut. Setelah instrument Anda ditelaah dan diperbaiki oleh pakar, langkah berikutnya adalah uji coba ke lapangan. Kemudian analisislah hasil uji coba tersebut dengan menggunakan program analisis instrument yang relevan. Penyebab butir soal kurang baik antara lain : 1. Penggunaan Bahasa kurang komunikatif 2. Kalimat bersifat ambiguous (dapat ditafsirkan ganda) 3. Pertanyaan atau pernyataanyang dibuat menyimpang dari indicator; 4. Pertanyaan atau pernyataan tidak mengukur trait (sifat) yang akan diukur
Pengambilan keputusan dalam 4 langkah: Strategi dan langkah operasional untuk pengambilan keputusan dan pilihan yang efektif dalam konteks yang tidak pasti