EVALUASI PEMBELAJARAN DI SD
Disusun Oleh
Kelompok 5
NAMA NIM
Untuk mengukur sesuatu Anda harus dapat memilih alat ukur yang sesuai agar Anda
dapat memperoleh hasil pengukuran yang tepat. Ketetapan hasil pengukuran inilah yang disebut
validitas. Validitas dapat dibedakan menjadi tiga macam yaitu:
1. Validitas isi (conten validity)
2. Validitas konstrak (construct validity)
3. Validitas yang dikaitkan dengan kriteria lain ( criteria related,validity).
Pengertian validitas mengacu pada ketetapan interpretasi yang dibuat dari hasil
pengukuran atau evaluasi. Validitas isi diperlukan untuk menjawab pertanyaan “sejauh mana
item-item yang ada dalam tes dapat mengukur keseluruhan materi yang telah di ajarkan.” Tinggi
rendahnya validitas isi dapat ditetapkan berdasarkan analisis rasional atau pertimbangan ahli
terhadap isi tes. Validitas konstrak mengacu pada sejauh mana alat ukur dapat mengungkap
keseluruhan konstrak yang digunakan sebagai dasar dalam penyusunanan tes. Yang dimaksud
dengan konstrak di sini adalah konsep hipotesis (hipotetical concept) yang digunakan sebagai
dasar dalam penyusunan alat ukur. Validitas konstrak banyak digunakan dalam pengukuran –
pengukuran psikologi seperti pengukuran sikap,minat dan tingkah laku. Validitas criteria
digunakan untuk memprediksi keberhasilan seseorang di masa yang akan datang atau
dimaksudkan untuk mengetahui kesesuaian antara pengetahuan dengan keterampilan yang
dimiliki.
Pengertian reliabilitas mengacu kepada ketetapan hasil yang diperoleh dari suatu pengukuran
. salah satu untuk mengetahui ketetapan atau reliabilitas suatu hasil pengukuran , dapat diperoleh
dengan cara melakukan pengukuran dua kali. Hasil pengukuran dikatakan mempunyai
reliabilitas tinggi jika hasil pengukuran pertama hampir sama dengan hasil pengukuran kedua.
Ketetapan hasil pengukuran ( reliabilitas) sangat diperlukan untuk memperoleh alat ukur yang
dapat memberikan hasil pengukuran yang tepat( valid). Alat ukur yang mempunyai reabilitas
yang tinggi belum tentu secara otomatis mempunyai validitas tinggi. Karena tinnginya
reliabilitas yang dihasilkan oleh suatu alat ukur jika tidak dibarengi dengan tinnginya validitas
dapat memberikan informasi yang salah tentang apa yang ingin anda ukur.
Reliabilitas suatu tes dapat ditingkatkan dengan menambah jumlah butir ke dalam tes tersebut.
Setiap penambahan butir soal belum tentu menaikan reabilitas tes. Penambahan butir soal pada
tes akan meningkatkan reliabilitas jika butir soal yang ditambahkan adalah butir- butir soal yang
homogen dengan butir soal yang ada. Yang dimaksud dengan butir soal yang homogen adalah
butir soal-soal yang mengukur hal yang sama dengan butir soal yang sudah ada. Penambahan
butir soal tidak tidak akan menaikan reliabilitas tes jika butir soal yang ditambahkan tidak
homogen dengan butir soal yang telah ada. Hubungan antara banyaknya butir soal baru yang
ditambahkan dengan peningkatan reliabilitas tes tidak menunjukan hubungan yang linier artinya
setiap penambahan butir soal tidak selalu terus diikuti dengan kenaikan reliabilitas.
Analisis butir soal sangat penting karena dapat memperoleh informasi yang bermanfaat
baik bagi guru atau siswa, dan proses pembelajaran yang telah dilakukan oleh guru. Menurut
Nitko (1983) analisis butir soal menggambarkan suatu proses pengambilan data, dan penggunaan
informasi tentang tiap-tiap butir soal terutama informasi tentang respon siswa terhadap setiap
butir soal. Arti penting penggunaan analisis butir soal sebagai berikut:
1. Untuk mengetahui apakah butir soal yang disusun sudah berfungsi sesuai dengan apa yang
dikehendaki oleh penyusun soal.
2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai
suatu materi.
3. Sebagai umpan balik bagi Anda sendiri sebagai guru untuk mengetahui kesulitan- kesulitan
yang dialami siswa dalam memahami suatu materi.
4. Sebagai acuan untuk merevisi soal.
5. Untuk memperbaiki kemampuan Anda dalam menulis soal.
Dalam menganalisis butir soal ada dua karakteristik butir soal yang perlu diperhatikan
yaitu tingkat kesukaran dan daya beda butir-butir soal.
2. Daya Beda
Daya beda butir soal memilki pengertian seberapa jauh butir soal tersebut dapat
membedakan kemampuan individu peserta tes. Butir soal didukung potensi daya beda yang baik,
akan mampu membedakan peserta didik yang memiliki kemapuan tinggi (pandai) dengan
pseserta didik yang memiliki kemampuan rendah ( kurang pandai).
Butir butir soal yang kunci jawabannya mempunyai indeks daya beda negatif adalah butir
soal yang kurang baik karena butir soal tersebut tidak dapat membedakan siswa yang pandai
dengan siswa yang kurang pandai, di mana siswa yang kurang pandai justru lebih banyak
menjawab benar daripada siswa yang pandai.
Butir soal mempunyai daya beda yang baik jika dianalisis kuncinya mempunyai daya
beda positif dan pengecohnya mempunyai daya beda negatif. Menurut Frenandes (1984) kaegori
indeks daya beda butir soal adalah sebagai berikut:
1. Tentukan jumlah siswa yang termasuk dalam kelompok atas (25%) dan kelompok bawah
( 25%).
2. Hitung jumlah skor kelompok atas dan jumlah skor kelompok bawah.
3. Hitung tingkat kesukaran dan daya beda setiap butir soal dengan rumus berikut:
E. Bagaimana Memperbaiki Butir Soal?
Dalam memperbaiki butir soal hal yang perlu diperhatikan sebagai berikut:
1. Perhatikan tingkat kesukaran butir soal. Butir soal dianggap baik jika mempunyai tingkat
kesukaran (p) antara 0,25 sampai dengan 0,75 atau yang mendekati angka tersebut.
2. Perhatikan daya beda butir soal. Butir soal dianggap baik jika kunci atau jawaban yang
dianggap benar mempunyai daya beda positif tinggi dan pengecohnya mempunyai daya beda
negatif.
Prosedur memperbaiki instrument non tes sama dengan prosedur memperbaiki tes.
Perbaikan yang pertama dengan menulis instrument. Perbaikannya dengan meminta pakar untuk
mereview atau menelaah instrument tersebut. Setelah instrument di telaah langkah berikutnya uji
coba kelapangan. Penyempurnaan butir yang lemah dapat dilaksanakan dengan mengganti butir
yang lama dengan butir yang baru atau dengan memperbaiki butir yang kurang baik.
4. Pertanyaan atau pernyataan tidak mengukur trait (sifat) yang akan diukur.
Diskusi Modul 5
Suatu ukuran yang menunjukkan tingkat kevalidan atau kesahihan suatu instrumen , prinsif
validitas adalah pengukuran atau pengamatan yang bearrti prinsif keandalan instrumen dalam
pengumpulan data
a. Validitas isi yaitu untuk menjawab pertanyaan sejauh mana item-item yang ada dalam tes
dapatmengukur keseluruhan materi yang telah diajarkan
b. Validitas kontrak mengacu sejauh mana alat ukur tersebut dapat mengungkap
keseluruhan konstrak yang digunakan sebagai dasar dalam penyususnan tes tersebut
Apa yang dimaksud dengan konsep realibilitas dalam arti stabilitas tes,dalam arti equivalent tes
dan dalam arti konsistensi internal?
PENJAWAB : AI LINA
b. Konsep realibilitas dalam arti equivalent test dimaksudkan untuk mengetahui apakah dua
tes yang anda gunakan paralel atau tidak, sedangkan
Idealnya semua materi yang telah anda ajarkan harus anda ujikan, tetapi karena terbatasnya
waktu ujian maka tidak mungkin anda menanyakan seluruh bahan tersebut cara terbaik adalah
memilih konsep-konsep terpenting yang dapat mewakili seluruh materi yang telah diajarkan.
apakah tes yang mempunyai reliabilitas tinggi selalu mempunyai validitas yang tinggi?
Tingginya reabilitas sangat diperlukan untuk memperoleh hasil pengukuran yangvalid tetapi jika
tingginya realibilitas tanpa disertai dengan tingginya validitas dapat memberikan informasi yang
salah
jika tes yang terdiri atas 90 butir soal dengan realibilitas0,75 jumlah soalnya dikurangi menjadi
60 butir, berapakah reliabilitas set tes yang baru tersebut?
PENANYA : AI LINA
Diskusi Modul 5
PENANYA : AI LINA
Analisis item merupakan suatu proses pengambilan dan penggunaan informasi tentang tiap-tiap
butir terutamainformasi tentang respon siswaterhadap setiap butir soal
PENANYA : LILIS LISNAWATI
a. Untuk mengetahui apakah butir-butir soal yang disusun sudah berfungsi sesuai dengan
apa yang dikehendaki oleh penyususn soal
b. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai
suatu materi
c. Sebagai umpan balik bagi anda sendiri sebagaiguru untukmengetahui kesulitan- kesulitan
yang dialami siswa dalam memahami suatu materi
b. Berdasarkan jumlah jawaban yang benar dari siswa tersebut susunlah skor siswa mulai
dari skor tertinggi ke skor terendah
c. Berdasarkan urutan skor tersebut tentukan siswa yang termasuk dalam kelompok atas dan
siswa yang termasuk dalam kelompok bawah
d. Hitunglah jumlah siswa dalam kelompok atas yang memilih tiap-tiap alternatif jawaban
yang disediakan
e. Dengan cara yang sama hitung jumlah siswa dalam kelompok bawah yang memilih tiap-
tiap alternatif jawaban yang disediakan
g. Hitunh tingkat kesukaran butir soal dan daya beda dengan menggunakanrumus yang telah
disediakan.
b. daya beda(D)
a. Apakah soal-soal yang anda ssusun sudah sesuai untuk mengukur perubahan tingkah laku
seperti telah dirumuskan dalam tujuan interaksional khusus?
c. Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa
yang kurang pandai?
d. Apakah kunci soal yang anda buat sudah benar sesuai dengan maksud soal?
e. Jika anda menggunakan tes pilihan berganda , apakah pengecoh yang anda pilih sudah
berfungsi dengan baik?
Seberapa jauh butir soal tersebut dapat membedakan kemampuan individu peserta tes.butir soal
di dukung potensi daya beda yang baik,akan mampu membedakan peserta didik yang memiliki
kemampuan tinggi dengan peserta didik yang memiliki kemampuan rendah
PENJAWAB : AI LINA
Karakteristik yang dapat menunjukan kualitas butir soal tersebut apakah termasuk mudah sedang
atau sukar.
Suatu butir soal dikatakan mudah jika sebagian besar siswa dapat menjawab dengan benar dan
dikatakan sukar jika sebagian besar siswa tidak dapat menjawab dengan benar