Anda di halaman 1dari 14

EVALUASI PEMBELAJARAN

MODUL 5
KUALITAS ALAT UKUR (INSTRUMEN)
KELOMPOK:
FATMAWATI
ST NUR FATIMAH
NINIK KHOIRONIK
KB. 1
Validitas dan Reliabilitas Hasil Pengukuran

Timbangan Duduk Timbangan Neraca


A. Apakah Validitas itu?

Validitas adalah ketepatan hasil pengukuran.

Validitas ada 3:
a. Validitas isi (content validity)
b. Validitas konstrak (construct validity)
c. Validitas yang dikaitkan dengan kriteria tertentu (criterion
related validity)
B. Apakah Reliabilitas itu?

Reliabilitas adalah ketetapan hasil pengukuran.


Suatu perangkat tes dinyatakan cukup reliabel jika mempunyai
koefisien reliabilitas lebih besar 0.5 (Fernandes, 1984).
Cara menghitungnya menggunakan formula korelasi product-
momen sebagai berikut:

Modul 5.11 – 5. 12
C. Hubungan antara Validitas dan Reliabilitas

Hasil bidikan Anto Hasil bidikan Simon Hasil bidikan Martin

• • •
• ••••
• •• ••••
• • • • •••
• •

=> Reliabilitas yang tinggi belum tentu mempunyai validitas yang


tinggi.
D. Meningkatkan Reliabilitas Tes

Reliabilitas suatu tes dapat ditingkatkan dengan menambah


jumlah butir soal ke dalam tes tersebut.
Penambahan butir soal pada tes akan meningkatkan realibilitas
jika butir soal yang ditambahkan adalah butir soal yang homogen
dengan butir soal yang ada.
KB. 2
Analisis dan Perbaikan Instrumen

A. Analis Butir Soal

Menurut Nitko (1983), analisis butir soal menggambarkan suatu


proses pengambilan data dan penggunaan informasi tentang tiap -
tiap butir soal terutama tentang respon siswa terhadap setiap butir
soal.
Arti penting penggunaan analisis butir soal adalah sebagai berikut :

1. Untuk mengetahui apakah butir soal – butir soal yang disusun sudah berfungsi sesuai

dengan apa yang dikehendaki oleh penyusun soal.

2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam

menguasai suatu materi.

3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan – kesulitan yang dialami

siswa dalam memahami suatu materi.

4. Sebagai acuan untuk merevisi soal.

5. Untuk memperbaiki kemampuan kita dalam menulis soal.

 
B. Kapan Analisis Butir Soal Dilakukan ?

1) Tingkat kesukaran butir soal


Besarnya tingkat kesukaran butir soal, dapat dihitung dengan
memperhatikan proporsi peserta tes yang menjawab benar
terhadap setiap butir soal. 
2) Daya beda
Daya beda butir soal memiliki pengertian seberapa jauh butir soal
tersebut dapat membedakan kemampuan individu peserta tes.
C. Cara Melakukan Analsis Secara Sederhana
a. Hitunglah jumlah jawaban benar
b. Susunlah urutan skor tertinggi – terendah
c. Urutkan siswa yang termasuk kelompok atas – bawah
d. Hitung jumlah siswa kelompok atas yang memilih alternatif
jawaban yang disedikan
e. Hitung jumlah siswa kelompok bawah yang memilih
alternatif jawaban yang disedikan
f. Hitung jumlah seluruh peserta tes
g. Hitung tingkat kesukaran butir soal dan daya beda
D. Bagaimana Menganalisis Tes Uraian?

Cara menganalisis tes uraian menurut Whitney dan Sabers


(Mehrens dan Lehmann, 1984) adalah :
(1) tentukan jumlah siswa yang termasuk kelompok atas (25%)
dan kelompok bawah (25%),
(2) hitung jumlah skor kelompok atas dan jumlah skor kelompok
bawah, dan
(3) hitung tingkat kesukaran dan daya beda setiap butir soal
dengan rumus berikut : ( Hal 5.27)
E. Bagaimana Memperbaiki Butir Soal?

Beberapa hal yang perlu diperhatikan dalam memperbaiki butir


soal antara lain :
a) perhatikan tingkat kesukaran soal. Butir soal dianggap baik
jika mempunyai tingkat kesukaran (P) antara 0,25 sampai
dengan 0,75 atau mendekati angka tersebut,
b) perhatikan daya beda butir soal. Butir soal dianggap baik jika
kunci atau jawabannya dianggap benar mempunyai beda
positif tinggi dan pengecohnya mempunyai daya beda negatif.
F. Memperbaiki Non - Tes

Prosedur memperbaiki instrument non-tes sama dengan prosedur


memperbaiki tes. Penyempurnaan butir yang lemah dapat dilaksanakan
dengan memperbaiki butir yang kurang baik atau mengganti butir yang
lama dengan butir yang baru. Penyebab butir soal kurang baik, antara
lain:
a) penggunaan bahasa kurang komunikatif,
b) kalimat dapat ditafsirkan ambiguous (dapat ditafsirkan ganda),
c) pertanyaan / pernyataan yang dibuat menyimpang dari indikator, dan
d) pertanyaan / pernyataan tidak mengukur tarif (sifat) yang akan
diukur.

Anda mungkin juga menyukai