Anda di halaman 1dari 13

MAKALAH

EVALUASI PEMBELAJARAN DI SD
( MODUL 5 )
KUALITAS ALAT UKUR (INSTRUMEN)
Dosen Pengampu: Wening Pawestri, SS., M.HUM

Oleh:

ANA MUZIZAH 858700256


M. AZIZ AVIVUDIN 858700249
RO’AH 855881585
SUMARNING 855881618

Program Studi Pendidikan Guru Sekolah Dasar


Fakultas Keguruan dan Ilmu Pendidikan
Universitas Terbuka

2021
1
BAB I
PENDAHULUAN

A. Latar Belakang

Setelah memeriksa hasil tes sumatif semester pertama, Bu Sita merasa terkejut
karena nilai yang diperoleh siswa-siswanya pada tes tersebwa jauh di bawah yang
diharapkan. Untuk mengetahui di mana letak kesalahannya, Bu Sita mencoba melihat
kembali kumpulan Satuan Pelajaran yang telah dibuatnya selama satu semester. Dari
kumpulan satuan pelajaran tersebut Bu Sita mencoba menganalisis kembali tujuan
pembelajaran yang harus dicapai.
Hasil analisis menunjukkan bahwa tujuan pembelajaran yang harus dicapai
tidak terlalu tinggi dan sesuai dengan tingkat perkembangan anak. Karena tidak
menemukan kesalahan pada tujuan pembelajaran, Ba Sita mencoba mengingat-ingat
kembali tentang proses pembelajaran yang selarna im dilakukannya. Menurutnya, ia
sudah mencoba sekuat tenaga wuak mengajar dengan baik yaitu dengan memilih
metode dan media yang pat agar para siswa dapat menangkap dengan mudah dan jelas
tentang konsep-konsep yang ia ajarkan.
Para mahasiswa, pernahkah Anda mengalami kasus seperti yang dialama Bu
Sita? Jika pernah, bagaimana tindakan Anda? Pernahkah Anda menganalisis penyebab
rendahnya nilai siswa Anda seperti vang dilakukan Bu Sita? Dapatkah Anda
menentukan penyebab rendahnya nilai siswa Amia tersebut?
Secara teoretis terdapat hubungan timbal balik antara pembelajaran, proses
pembelajaran, dan penilaian hasil belajar. Maka dari itu makalah ini akan membahas
tentang kualitas alat ukur evaluasi pembelajaran di sekolah dasar.

2
B. Rumusan Masalah
1. Apakah validitas itu ?
2. Apakah reliabilitas itu ?
3. Bagaimana hubungan antara validitas dan reliabilitas ?
4. Bagaimana meningkatkan reliabilitas tes ?
5. Mengapa analisis butir soal penting ?
6. Kapan analisis butir soal dilakukan ?
7. Bagaimana cara melakukan analisis secara sederhana ?
8. Bagaimana menganalisis tes uraian ?
9. Bagaimana memperbaiki butir soal ?
10. Bagaimana memperbaiki non-tes ?

C. Tujuan
1. Untuk mengetahui pengertian validitas
2. Untuk mengetahui pengertian reliabilitas
3. Untuk mengetahui hubungan antara validitas dan reliabilitas
4. Untuk mengetahui cara meningkatkan reliabilitas tes
5. Untuk mengetahui analisis butir soal
6. Untuk mengetahui kapan menganalisis butir soal
7. Untuk mengetahui cara melakukan analisis secara sederhana
8. Untuk mengetahui cara menganalisis tes uraian
9. Untuk mengetahui cara memperbaiki butir soal
10. Untuk mengetahui cara memperbaiki non-tes

3
BAB II
PEMBAHASAN

A. Pengertian Validitas
Pengertian validitas mengacu pada ketepatan interpretasi yang dibuat dari hasil
pengukuran atau evaluasi (Gronlund dan Linn, 1990). Secara umum validitas ada tiga
jenis.
1. Validitas isi (content validity).
2. Validitas konstrak (construct validity).
3. Validitas yang dikaitkan dengan kriteria tertentu (criterion related validity).
Validitas isi diperlukan untuk menjawab pertanyaan “sejauh mana item-item
yang ada dalam tes dapat mengukur keseluruhan materi yang telah diajarkan”. Tinggi
rendahnya validitas isi dapat ditetapkan berdasarkan analisis rasional atau
pertimbangan ahli terhadap isi tes tersebut Hal ini merupakan tuntutan yang harus
dipenuhi oleh tes hasil belajar. Tinggi rendahnya validitas isi suatu tes dapat Anda lihat
pada perencanaan atau kisikisi tes. Semakin representatif materi yang dapat ditanyakan
dalam tes tersebut menunjukkan semakin tinggi validitas isinya.
Validitas konstrak mengacu pada sejauh mana alat ukur tersebut dapa!
mengungkap keseluruhan konstrak yang digunakan sebagai dasar dalam penyusunan
tes tersebut. Yang dimaksud dengan konstrak di sini adalah konsep hipotetis
(hipotetical concept) yang digunakan sebagai dasar dalam penyusunan alat ukur.
Validitas konstrak ini banyak digunakan terutama dalam pengukuran-pengukuran
psikologi seperti pengukuran sikap, minat, tingkah laku dan sebagainya. Campbell dan
Fiske (Djemari Mardapi, 2004) mengembangkan satu pendekatan untuk menentukan
validitas konstrak dengan menggunakan teknik multi trait-multi method. Validasi
dengan multi trait-multi method dilakukan dengan menggunakan lebih dari satu metode
untuk mengukur lebih dari satu macam trait (sifat). Dengan menggunakan matrik
korelasi sehingga interkorelasi antara trait dan metode dapat dilihat dengan jelas.

4
B. Pengertian Reliabilitas
Pendahuluan telah dijelaskan bahwa untuk menyusun set tes yang baik ada dua
hal yang perlu diperhatikan yaitu validitas dan reliabilitas. Kalau tadi Anda telah
memahami apa yang dimaksud dengan validitas maka berikut ini Anda akan diajak
untuk membahas konsep reliabilitas. Untuk memperoleh pemahaman tentang
pengertian reliabilitas, lakukanlah kegiatan berikut ini! Ukurlah panjang sepuluh benda
yang berada di sekitar anda sebanyak dua kali pada waktu yang berbeda dengan
menggunakan alat ukur yang tepat kemudian tuangkanlah hasilnya pada tabel berikut
ini !

Alat ukur yang Hasil Pengukuran


No. Nama benda 1 2
digunakan
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

Apakah hasil yang Anda peroleh dalam dua kali pengukuran, memberikan hasil
yang berbeda? Jika cara pengukuran yang Anda lakukan benar maka hasil pengukuran
yang Anda peroleh mestinya sama. Jika hasil pengukuran yang Anda peroleh sama,
dapat dikatakan bahwa alat ukur yang Anda gunakan memberikan hasil pengukuran
yang reliabel (tetap, konsisten, stabil). Hasil-hasil pengukuran yang berhubungan
dengan aspek-aspek fisik seperti mengukur panjang meja, tinggi almari, berat badan,
dan tinggi badan biasanya menghasilkan reliabilitas yang sangat tinggi. Artinya
walaupun pengukuran dilakukan lebih dari sekali tetapi tetap memberikan hasil yang
tidak jauh berbeda.
Hasil pengukuran yang berbeda akan sering Anda temukan jika Anda
5
melakukan pengukuran terhadap hal-hal yang berhubungan dengan aspek-aspek
psikologi dan sosial seperti dalam pengukuran mewakili intelegensi, sikap, dan konsep
diri. Aspek-aspek sosial psikologis seperti itu tidak dapat diukur dengan ketepatan dan
konsistensi yang tinggi. Hal ini disebabkan karena hasil pengukuran yang diperoleh
tidak dapat lepas dari pengaruh hal-hal di luar maksud pengukuran tersebut misalnya
alat ukur itu sendiri mungkin bukan merupakan alat ukur yang tepat untuk mengukur
aspek yang diinginkan.
Di samping itu karena subjek pengukurannya adalah manusia maka cara-cara
penyajian tes, emosi, motivasi, kondisi fisik, dan keadaan ruangan tes akan
mempengaruhi hasil pengukuran walaupun sebenarnya aspek-aspek yang ingin kita
ukur tersebut tidak berubah. Dengan demikian hasil pengukuran yang diperoleh
menjadi kurang reliabel.

C. Hubungan antara Validitas dan Reliabilitas


Ketetapan hasil pengukuran (reliabilitas) sangat diperlukan untuk memperoleh
alat ukur yang dapat memberikan hasil pengukuran yang tepat (valid). Walaupun
demikian alat ukur yang mempunyai reliabilitas yang tinggi belum tentu secara
otomatis mempunyai validitas yang tinggi. Karena tngginya reliabilitas yang dihasilkan
oleh suatu alat ukur jika tidak dibarengi dengan tingginya validitas dapat memberikan
informasi yang salah lentang apa yang ingin Anda ukur. Sebagai ilustrasi berikut ini
disajikan hasil perlombaan memanah yang diikuti Anto, Andi, dan Anang sesuai yang
terlampir pada modul 5.13.
Hasil bidikan siapakah yang tidak valid dan tidak reliabel? Hasil bidikan
siapakah yang tidak valid tetapi reliabel? Dan hasil bidikan siapakah yang valid dan
reliabel?
Dengan menggunakan pengertian validitas dan reliabilitas yang telah dijelaskan
di depan maka Anda akan dapat menjawab ketiga pertanyaan tersebut. Hasil bidikan
Anto adalah hasil bidikan yang tidak valid dan ndak reliabel. Mengapa? Hal ini
disebabkan karena dari 10 anak panah yang dilepaskan Anto selalu mengenai sasaran
yang berbeda. Bagaimana hasil bidikan Andi? Kalau Anda perhatikan hasil bidikan
Andi ternyata dari 10 anak panah yang dilepaskan tidak satu pun anak panah yang tepat
mengenai sasaran.
Walaupun kesepuluh anak panah yang dilepaskan tidak tepat pada sasaran yang
ditentukan tetapi hasil bidikan Andi selalu mengenai sasaran yang relatif sama. Kalau 6
kita menggunakan konsep validitas dan reliabilitas yang telah dijelaskan di depan maka
dapat dikatakan bahwa hasil bidikan Andi adalah tidak valid tetapi reliabel. Hasil
bidikan Ananglah yang dikatakan valid dan reliabel. mengapa? Hal ini disebabkan
karena kesepuluh hasil bidikan Anang tepat dan tetap mengenai sasaran yang
ditentukan.

D. Cara Meningkatkan Reliabilitas Tes


Reliabilitas suatu tes dapat ditingkatkan dengan menambah jumlah butir ke
dalam tes tersebut. Yang mungkin menjadi pertanyaan bagi Anda kemudian adalah
apakah setiap penambahan butir soal akan selalu dapat menaikkan reliabilitas tes?
Jawabannya adalah belum tentu. Penambahan butir soal pada tes akan meningkatkan
reliabilitas jika butir soal yang ditambahkan adalah butir-butir soal yang homogen
dengan butir soal yang ada. Yang dimaksud dengan butir soal yang homogen adalah
butir soal-soal yang mengukur hal yang sama dengan butir soal yang sudah ada.
Penambahan butir soal tidak akan menaikkan reliabilitas tes jika butir soal yang
ditambahkan tidak homogen dengan butir soal yang telah ada. Reliabilitas tes yang baru
sebagai akibat adanya penambahan butir soal secara sederhana dapat dihitung dengan
menggunakan rumus Spearman Brown sesuai pada modul evaluasi pembelajaran di SD
halaman 5.14.

E. Pentingnya Mengalisis Butir Soal


Menurut Nitko (1983) analisis butir soal menggambarkan suatu proses
pengambilan data, dan penggunaan informasi tentang tiap-tiap butir soal terutama
informasi tentang respon siswa terhadap setiap butir soal. Lebih lanjut dikatakan bahwa
arti penting penggunaan analisis butir soal adalah sebagai berkut:
1. Untuk mengetahui apakah butir soal-butir soal yang disusun sudah berfungsi sesuai
dengan apa yang dikehendaki oleh penyusun soal. Untuk menentukan apakah soal-
soal yang Anda susun telah berfungsi sebagaimana seharusnya maka Anda harus
memperhatikan antara lain hal-hal sebagai berikut:
a. Apakah soal-soal yang Anda susun sudah sesuai untuk mengukur perubahan
tingkah laku seperti telah dirumuskan dalam tujuan instruksional khusus?
b. Apakah tingkat kesukaran sudah Anda perhitungkan?
c. Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai
dengan siswa yang kurang pandai? 7

d. Apakah kunci soal yang Anda buat sudah benar sesuai dengan maksud soal?
e. Jika Anda menggunakan tes pilihan berganda, apakah pengecoh yang Anda
pilih sudah berfungsi dengan baik?
f. Apakah soal tersebut masih dapat ditafsirkan ganda atau tidak?

2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam
menguasai suatu materi.
3. Sebagai umpan balik bagi Anda sendiri sebagai guru untuk mengetahui kesulitan-
kesulitan yang dialami siswa dalam memahami suatu materi.
4. Sebagai acuan untuk merevisi soal.
5. Untuk memperbaiki kemampuan Anda dalam menulis soal.

F. Kapan Menganalisis Butir Soal Dilakukan


Pada saat anda mengujikan suatu set soal untuk mengambil keputusan penting
tentang hasil belajar sisa maka idealnya anda harus yakin bahwa set soal tersebut adalah
valid dan reliabel. Validitas set soal dapat diketahui dari kisi-kisi soal sedangkan
reliabilitas soal baru dapat diketahui setelah uji coba. Nah, dalam rangka memperoleh
reliabilitas set soal inilah analisis butir soal dilakukan. Dalam menganalisis butir soal
paling tidak ada dua karakteristik butir soal yang perlu Anda perhatikan yaitu tingkat
kesukaran dan daya beda butir-butir soal.
1. Tingkat Kesukaran Butir Soal
Tingkat kesukaran merupakan salah satu karakteristik yang dapat menunjukkan
kualitas butir soal tersebut apakah termasuk mudah, sedang atau sukar. Suatu butir
soal dikatakan mudah jika sebagian besar siswa dapat menjawab dengan benar dan
dikatakan sukar jika sebagian besar siswa tidak dapat menjawab dengan benar.
Besarnya tingkat kesukaran butir soal, dapat dihitung dengan memperhatikan
proporsi peserta tes yang menjawab benar terhadap setiap butir soal. Secara
matematis tingkat kesukaran butir soal dapat dihitung dengan rumus:
B
PN
Keterangan :
P : adalah indeks tingkat kesukaran butir soal
B adalah Jumlah peserta tes yang menjawab benar
N adalah jumlah seluruh peserta tes 8
2. Daya Beda (D)
Daya beda butir soal memiliki pengertian seberapa jauh butir soal tersebut dapat
membedakan kemampuan individu peserta tes. Butir soal didukung potensi daya
beda yang baik, akan mampu membedakan peserta didik yang memiliki
kemampuan tinggi (pandai) dengan peserta didik yang memiliki kemampuan
rendah (kurang pandai). Daya beda butir soal dapat dihitung dengan menggunakan
rumus:
D = PA - PB
Keterangan :
D = indeks daya beda butir soal
PA = proporsi kelompok atas yang menjawab benar
PB = proporsi kelompok bawah yang menjawab benar

G. Cara Melakukan Analisis Secara Sederhana


Setelah Anda memahami butir soal maka Anda sudah mulai dapat berlatih
menganalisis butir soal yang telah Anda miliki. Analisis butir soal ini tidak sukar untuk
Anda lakukan, ada cara sederhana yang dapat Anda gunakan.
Untuk melakukan analisis butir soal secara sederhana, berikut disajikan
langkah-langkah dalam menganalisis butir soal:
1. Hitunglah jumlah jawaban yang benar untuk seluruh siswa
2. Berdasarkan jumlah jawaban yang benar dari seluruh siswa tersebut susunlah skor
siswa mulai dari skor tertinggi ke skor terendah
3. Berdasarkan urutan skor tersebut tentukan siswa yang termasuk dalam kelompok
atas dan siswa yang termasuk dalam kelompok bawah. Untuk menentukan berapa
persen siswa yang termasuk kelompok atas dan berapa persen yang masuk
kelompok bawah gunakan rambu-rambu sebagai berikut (Nitko, 1983 dan Hanna,
1993):
a. Jika jumlah siswa ≤ 20 maka jumlah kelompok atas dan kelompok bawah
masing-masing 50%.
b. Jika jumlah siswa 21 - 40 maka jumlah kelompok atas dan kelompok bawah
masing-masing 33,3 %. Jika jumlah siswa 21 - 40 maka jumlah kelompok atas
dan kelompok bawah masing-masing 27%.
4. Hitunglah jumlah siswa dalam kelompok atas yang memilih tiap-tiap alternatif 9
jawaban yang disediakan.
5. Dengan cara yang sama hitung jumlah siswa dalam kelompok bawah yang memilih
tiap-tiap alternatif jawaban yang disediakan.
6. Hitung jumlah seluruh peserta tes (kelompok atas, tengah, dan bawah) yang
menjawab benar.
7. Hitung tingkat kesukaran butir soal dan daya beda dengan menggunakan rumus
yang telah disediakan.

H. Cara Menganalisis Tes Uraian


Cara menganalisis tes uraian diberikan oleh Whitney dan Sabers (Mehrens dan
Lehmann, 1984) sebagai berikut :
1. Tentukan jumlah siswa yang termasuk dalam kelompok atas (25%) dan kelompok
bawah (25%)
2. Hitung jumlah skor kelompok atas dan jumlah skor kelompok bawah
3. Hitung tingkat kesukaran dan daya beda setiap butir soal dengan rumus sesuai
modul 5.27.

I. Cara memperbaiki Butir Soal


Beberapa hal yang perlu Anda perhankan dan memperbaiki butir soal adalah
sebagai berikut:
1. Perhatikan tingkat kesukaran butir soal. Butir soal dianggap baik jika mempunyai
tingkat kesukaran (p) antara 0,25 sampai dengan 0,75 atau yang mendekati angka
tersebut.
2. Perhatikan daya beda butir soal. Butir soal dianggap baik jika kunci atau jawaban
yang dianggap benar mempunyai daya beda positif tinggi dan pengecohnya
mempunyai daya beda negatif. Jika Anda menemukan butir soal di mana kuncinya
mempunyai daya beda negatif sedangkan ada salah satu pengecohnya mempunyai
beda positif maka butir soal tersebut perlu Anda telaah kembali sebab ada
kemungkinan terjadi salah kunci. Kemungkinan juga Anda akan menemukan butir
soal yang mempunyai daya beda positif pada kunci dan pada satu atau dua
pengecohnya. Jika Anda menemukan kasus tersebut maka perbaikannya lebih
ditekankan pada pengecoh yang mempunyai daya beda positif tersebut. Sebab
pengecoh yang mempunyai daya beda posiuf menunjukkan bahwa proporsi 10
kelompok atas yang menjawab benar lebih besar daripada proporsi kelompok
bawah yang menjawab benar. Ini beraru pengecoh tersebut kurang berfungsi
dengan baik. Di samping memperbaiki pengecoh Anda perlu juga melihat stem atau
pakuk soalnya sebab stem yang membingungkan atau mendua akan
membingungkan peserta ujian untuk menentukan pilihannya.

J. Cara Memperbaiki Non-Tes


Prosedur memperbaiki instrument non-tes sama dengan prosedur memperbaiki
tes. Perbaikan yang pertama dapat Anda lakukan setelah Anda menulis instrument.
Perbaikan yang dapat Anda lakukan pada tahap ini adalah dengan meminta pakar untuk
mereviu atau menelaah instrument tersebut. Setelah instrument Anda ditelaah dan
diperbaiki oleh pakar, langkah berikutnya adalah uji coba ke lapangan. Kemudian
analisislah hasil uji coba tersebut dengan menggunakan program analisis instrument
yang relevan. Pada saat ini banyak sekali tersedia program-program analsis data yang
tersedia di pasaran. Dengan kemajuan teknologi computer sekarang ini, analisis data
dapat Anda lakukan dengan cepat dan akurat.
Dari hasil analisis, Anda dengan mudah akan memperoleh informasi yang jelas
mengenai kualitas instrument Anda, seperti validitas dan reliabilitas perangkat tes serta
kualitas butir-per butir dari instrument tersebut. Sudah barang tentu perbaikan
instrument harus Anda lakukan terhadap butir-butir yang berdasar hasil analisis
menunjukkan butir yang lemah sedangkan butir yang baik dapat disimpan.
Penyempurnaan butir yang lemah dapat dilaksanakan dengan mengganti butir yang
lama dengan butir yang baru atau dengan memperbaiki butir yang kurang baik tersebut.
Penyebab butir soal kurang baik antara lain:
1. Penggunaan bahasa kurang komunikatif
2. Kalimat bersifat ambiguous (dapat ditafsirkan ganda).
3. Pertanyaan atau pernyataan yang dibuat menyimpang dari indikator
4. Pertanyaan atau pernyataan tidak mengukur trait (sifat) yang akan diukur.

11
DAFTAR PUSTAKA

Azwar, S. (1986), Reliabilitas dan Validitas, Liberty, Yogyakarta.


Ebel, R.L., & Frisbie, D.A, (1986). Essentials of Educational Measurement, Prentice Hall,
New York.
Fernades, H.J.X. (1984), Testing and Measurement, National Educational Planning, Evaluation
and Curriculum Development, Jakarta.
Hanna, G.S. (1993). Better teaching Trough Better Measurement, Harcout Brace Jovanovich
College Pub., New York.
Mardapi, D. (2004). Penyusunan Tes Hasil Belajar. Yogyakarta: PPS-UNY.
Mehrens, W.A & lehmamn, I.J. (1973). Measurement and Evaluation in Education and
Psychology, Holt Renehart and Winton, New York.
Nasoetion, N & Suryanto, A. (2002). Tes, Pengukuran dan Penilaian. Jakarta: Pusat Penerbitan
Universitas Terbuka.
Nitko, A.J. (1983). Educational Test and Measurement an Introduction, Harcourt Brace
Jovanovich, Inc., New York.
Sax,G. (1980). Principles of Educational and Psychological Measurement and Evaluation,
Wadsworth, California.

12
13

Anda mungkin juga menyukai