Anda di halaman 1dari 8

MAKALAH EVALUASI PEMBELAJARAN

DI SD MODUL 5 KUALITAS ALAT UKUR


(INSTRUMEN)
Ditulis oleh ilmiahku.com  Sabtu, 26 Oktober 2019 

TUGAS KELOMPOK EVALUASI PEMBELAJARAN DI SD 


MODUL 5 KUALITAS ALAT UKUR (INSTRUMEN)
Disusun Oleh: DINI LADY PUSPITHA ; HERMIN NURANIFAH ; SEPTIYAN DIAN
TRISTIANA ; WIDIANTO HARI WIDODO       

MODUL 5
KEGIATAN BELAJAR  I
KUALITAS ALAT UKUR (INSTRUMEN)
PENDAHULUAN

Baca Juga

 Makalah Pengertian, Tujuan, dan Permasalahan Pendididkan di Indonesia


 Makalah Implementasi Pendidikan Karakter Bagi Anak Usia Dini
 Makalah Timbulnya Permasalahan Pendidikan

Untuk mengetahui perkembangan dan kemajuan belajar siswa, perlu dilakukan


suatu penilaian dengan menggunakan berbagai teknik yang tepat. Penilaian dalam
pembelajaran dilakukan tidak hanya untuk menilai hasil belajar siswa melainkan juga
menilai proses belajar siswa. Dalam melakukan penilaian pembelajaran, ada
beberapa hal yang harus diperhatikan guru, terutama yang berhubungan dengan
jenis kompetensi yang akan dinilai, tujuan penilaian yang dilakukan, teknik – teknik
penilaian yang digunakan, dan jenis penilaian yang akan digunakan. Dengan
demikian kegiatan penilaian yang dilakukan menjadi tepet sasaran, terarah, dan
terencana.
Secara teoritis terdapat hubungan timbal balik antara tujuan pembelajaran,
proses pembelajaran, dan penilaian hasil belajar. Jika tujuan pembembelajaran yang
dirumuskan sudah tepat dan proses pembelajaran yang dilakukan sudah maksimal
maka salah satu hal yang perlu kita cermati adalah alat penilaian hasil belajar.
pengukuran memiliki dua karakteristik utama yaitu pertama penggunaan angka atau
skala tertentu, dan kedua menurut suatu aturan atau formula tertentu. Contoh
kegiatan pengukuran adalah ketika kita mengukur tinggi atau berat badan
seseorang. Kita akan mengetahui berapa tingginya atau beratnya. Atribut atau
karakteristik yang kita cari dari contoh pengukuran tersebut yaitu tinggi atau berat,
kemudian hasil pengukuran tersebut kita akan memperoleh angka, misalkan tinggi
1,75 meter atau beratnya 70 kilogram.
-benar mampu mengukur kemampuan siswa.
apakah alat ukur yang anda gunakan ( dalam hal ini tes yang anda susun atau
instrumen lain yang anda gunakan ) mempunyai kualitas yang baik sehingga dapat
digunakan untuk mengukur tujuan pembelajaran yang telah anda tetapkan ?.
Untuk menjawab permasalahan tersebut, kita akan diajak untuk mempelajari
lebih rinci berbagai cara yang dapat ditempuh untuk meningkatkan kualitas alat ukur
atau instrumen yang anda gunakan agar benar – benar dapat mengukur apa yang
ingin anda ukur. Dalam pembahasan ini akan dibahas mengenai pengujian kualitas
alat ukur atau instrumen yang akan membahas tentang validitas dan reliabilitas hasil
pengukuran dan tentang bagaimana cara menganalisis butir soal dan bagaimana
cara meningkatkan kualitas butir soal berdasarkan hasil analisis serta bagaimana
meningkatkan kualitas alat ukur non-tes.

Validitas dan Reliabilitas Hasil Pengukuran


   

Untuk mengukur sesuatu kita harus dapat memilih alat ukur yang sesuai agar kita
dapat memperoleh hasil pengukuran yang tepat. Sebagai contoh, seorang pemanah
akan dinyatakan sebagai pemenang jika hasil bidikannya dapat dengan tepat
mengenai sasaran yaitu daerah lingkaran yang paling dalam atau yang paling
mendekati lingkaran yang paling dalam. Jika hasil bidikan peserta didik dapat
mengenai daerah di lingkaran paling dalam maka ia akan memperoleh skor tertinggi
dan perolehan skor tersebut semakin berkurang jika hasil bidikannya jauh dari
sasaran. Karena anak panah yang harus dilepaskan tidak hanya satu maka
pemanah dituntut untuk tetap dapat melepaskan anak panahnya tepat mengenai
sasaran.
Hasil bidikan dari peserta bisa tepat mengenai sasaran atau juga melesat dari
sasaran. Hasil yang sama dapat terjadi pada saat anda mengukur hasil belajar
siswa. Jika alat ukur yang anda gunakan tidak anda persiapkan dengan cermat
maka skor yang anda peroleh tidak dapat menggambarkan dengan tepat tingkat
kemampuan siswa.Dari penjelasan tersebut terdapat dua masalah pokok yang harus
diperhatikan dalam menyusun alat ukur hasil belajar yang baik yaitu masalah yang
berhubungan dengan ketepatan hasil pengukuran dan ketetapanhasil
pengukuran.Masalah yang berhubungan dengan ketepatan hasil pengukuran inilah
yang dikenal dengan istilah validitas sedangkan maslah – masalah yang
berhubungan dengan ketetapan hasil pengukuran dikenal dengan istilah reliabilitas.

A.      Validitas
Alat ukur yang baik adalah alat ukur yang dapat dengan tepat mengukur apa
yang ingin diukur. Jika kita ingin mengukur panjang sebuah meja maka kita harus
dapat memilih alat ukur yang tepat untuk mengukur panjang meja tersebut.Untuk
menghitung waktu tempuh pelari cepat dalam perlombaan lari cepat 100 meter maka
kita juga harus dapat memilih alat ukur yang tepat untuk digunakan. Demikian juga
jika kita ingin mengukur hasil belajar siswa maka kita juga dituntut untuk
menggunakan alat ukur ( dalam hal ini tes ) yang dapat dengan tepat mengukur hasil
belajar yang kita harapkan.
Pengertian validitas mengacu pada ketepatan interpretasi yang dibuat dari
hasil pengukuran atau evaluasi ( Gronlund dan Linn, 1990). Secra umum validitas
ada tiga jenis :
a.       Validitas isi ( concent validity ).
b.      Validitas konstrak ( construct validity ).
c.       Validitas yang dikaitkan dengan kriteria tertentu ( criterion related validity ).
Validitas isi diperlukan untuk menjawab pertanyaan “ sejauh mana item – item
yang ada dalam tes dapat mengukur keseluruhan materi yang telah diajarkan “.
Tinggi rendahnya validitas isi dapat ditetapkan berdasarkan analisis rasional atau
pertimbangan ahli terhadap isi tes tersebut.Hal ini merupakan tuntutan yang harus
dipenuhi oleh tes hasil belajar. Tinggi rendahnya validitas isi suatu tes dapat dilihat
pada perencanaan atau kisi – kisi tes. Semakin representatif materi yang dapat
ditanyakan dalam tes tersebut menunjukkan semakin tinggi validitas isinya.
Validitas konstrak mengacu pada sejauh mana alat ukur tersebut dapat
mengungkap keseluruhan konstrak yang digunakan sebagai dasar dalam
penyusunan tes tersebut.Yang dimaksud dengan konstrak disini adalah konsep
hipotesis (hipotetical concept) yang digunakan sebagai dasar dalam penyusunan
alat ukur.Validitas konstrak ini banyak digunakan terutama dalam pengukuran –
pengukuran psikologi seperti pengukuran sikap, minat, tingkah laku dan
sebagainya.Campbell dan Fiske (Demari Mardapi, 2004) mengembangkan satu
pendekatan untuk menentukan validitas konstrak dengan menggunakan teknik multi
trait-multi method.Validasi dengan multi trait – multi method dilakukan dengan
menggunakan lebih dari satu metode untuk mengukur lebih dari satu
acam trait ( sifat ). Dengan menggunakan matrik korelasi sehingga interkorelasi
antara trait dan metode dapat dilihat dengan jelas.
Jika suatu tes dimaksudkan untuk memprediksi keberhasilan seseorang di
masa yang akan datang atau dimaksudkan untuk mengetahui kesesuaian anatar
pengetahuan dengan keterampilan yang dimiliki maka alat ukur yang digunakan
harus mempunyai criterion related validity yang tinggi.
B..      Reliabilitas
Hasil – hasil pengukuran yang berhubungan dengan aspek – aspek fisik
seperti mengukur panjang meja, tinggi almari, berat badan dan tinggi badan
biasanya menghasilkan reliabilitas yang sangat tinggi.Artinya walaupun pengukuran
dilakukan lebih dari sekali tetapi tetap memberikan hasil yang ridak jauh berbeda.
Hasil pengukuran yenag berbeda akan sering kita temukan jika kita melakukan
pengukuran terhadap hal – hal yang berhubungan dengan aspek – aspek psikologi
dan sosial seperti dalam pengukuran mewakili intelegensi, sikap, dan konsep diri.
Aspek – aspek sosial-psikologi seperti itu tidak dapat diukur dengan ketepatan dan
konsistensi yang tinggi.Hal ini disebabkan karena hasil pengukuran yang diperoleh
tidak dapat lepas dari pengaruh hal - hal diluar maksud pengukuran tersebut
misalnya alat ukur itu sendiri bukan merupakan alat ukur yang tepat untuk mengukur
aspek yang diinginkan. Disamping itu karena subjek pengukurannya adalah manusia
maka cara – cara penyajian tes, emosi, motivasi. Kondisi fisik dan keadaan ruangan
tes akan mempengaruhi hasil pengukuran walaupun sebenarnya aspek – aspek
yang ingin kita ukur tersebut tidak berubah. Dengan demikian hasil pengukuran yang
diperoleh menjadi kurang reliabel.
Pengertian reliabilitas mengacu pada ketetapan hasil yang diperoleh dari
suatu Pengukuran ( Grondlund dan Linn, 1990 ). Salah satu cara untuk mengetahui
ketetapan atau reliabilitas suatu pengukuran, dapat diperoleh dengan cara
melakukan pengukuran dua kali. Hasil pengukuran dikatakan mempunyai reliabilitas
yang tinggi jika hasil pengukuran pertama hampir sama dengan hasil pengukuran
kedua. Dan sebaliknya hasil pengukuran dikatakan mempunyai reliabilitas yang
rendah jika hasil pengukuran pertama jauh berbeda dengan hasil pengukuran
kedua. Hubungan antar skor yang diperoleh pada pengukuran pertama dengan
kedua akan menghasilkan angka korelasi bergerak antara -1 sampai dengan +1.
Semakin tinggi angka koefisien reliabilitas (mendekati 1) maka semakin tinggi
reliabilitas tersebut. Suatu perangkat tes dinyatakan cukup reliabel jika mempunyai
reliabilitas lebih besar 0,5 (Fernandes, 1984).
Konsep reliabilitas dalam arti equivalent tes dimaksudkan untuk mengetahui
apakah dua set tes yang digunakan paralel atau tidak. Keparalelan dua set tes ini
diperoleh dengan cara mengembangkan dua set tes yang paralel dari kisi - kisi tes
yang sama kemudian masing - masing tes tersebut diujikan pada dua kelas yang
mempunyai tingkat kemampuan yang sama. Hasil kedua tes tersebut dikorelasikan,
jika hasil korelasinya tinggi, hal ini menunjukan kedua tes paralel.koefisien
korelasinya dapat dihitung dengan menggunakan formula product-moment.
konsep reliabilitas dalam arti konsistensi internal dimaksudkan untuk
mengetahui apakah kumpulan butir soal yang ada dalam satu set tes tersebut
mengukur dimensi hasil belajar yang sama atau tidak. Konsep reliabilitas dalam asrti
konsistensi dapat dihitung menggunakan formula Kuder-Richardson (KR-20 atau
KR-21). Jika hasil korelasinya tinggi, hal ni menunjukan bahwa antara butir soal
dalam satu set tes tersebut adalah konsisten dengan yang lain.

C.      Hubungan antara validitas dan reliabilitas


Ketepatan hasil pengukuran ( validitas ) sangat diperlukan untuk memperoleh
alat ukur yang dapat memberikan hasil pengukuran yang tepat ( valid ). Walaupun
demikian alat ukur yang mempunyai reliabilitas tinggi belum tentu secara otomatis
mempunyai validitas yang tinggi. Karena tingginya reliabilitas  yang dihasilkan oleh
suatu alat ukur jika tidak dibarengi dengan tingginya validitas dapat memberikan
informasi yang salah tentang apa yang ingin kita ukur.

D. Meningkatkan Reliabilitas Tes


Reliabilitas suatu tes dapat ditingkatkan dengan menambah jumlah butir
kedalam tes tersebut. Penambahan butir soal pada tes akan meningkatkan
reliabilitas jika butir soal yang ditambahkan adalah butir soal yang homogen dengan
butir soal – soal yang ada.

KEGIATAN BELAJAR 2
ANALISIS DAN PERBAIKAN INSTRUMEN

A.ANALISIS BUTIR SOAL


Menurut Nitko (1983), analisis butir soal menggambarkan suatu proses
pengambilan data dan penggunaan informasi tentang tiap - tiap butir soal terutama
tentang respon siswa terhadap setiap butir soal. Lebih Lnjut dikatakan bahwa arti
penting penggunaan analisis butir soal adalah sebagai berikut :
1.      Untuk mengetahui apakah butir soal – butir soal yang disusun sudah berfungsi
sesuai dengan apa yang dikehendaki oleh penyusun soal. Untuk menentukan
apakah soal – soal yang kita susun telah berfungsi sebagaimana seharusnya maka
kita harus memperhatikan hal – hal sebagai berikut :
a.       Apakah soal – soal yang disusun sudah sesuai untuk mengukur perubahan
tingkah laku seperti telah dirumuskan dalam tujuan instruksional khusus ?
b.      Apakah tingkat kesukaran sudah kita perhatikan ?
c.       Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai
dengan siswa yang kurang pandai ?
d.      Apakah kunci soal yang kita buat sudah benar sesuai dengan maksud soa ?
e.       Jika menggunakan tes pilihan berganda, apakah pengecoh yang kita pilih sudah
berfungsi dengan baik ?
f.       Apakah soal tersebut dapat ditafsirkan ganda atau tidak ?
2.      Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam
menguasai suatu materi.
3.      Sebagai umpan balik bagi guru untuk mengetahui kesulitan – kesulitan yang
dialami siswa dalam memahami suatu materi.
4.      Sebagai acuan untuk merevisi soal.
5.      Untuk memperbaiki kemapuan kita dalam menulis soal.
Pada saat kita engujikan suatu set soal untuk mengambil keputusan penting tentang
hasil belajar siswa maka idealnya kita harus yakin bahwa set soal tersebut adalah
valid dan reliabel. Validitas set soal dapat diketahui dari kisi – kisi soal sedangkan
reliabelitas soala baru dapat diketahui setelah uji coba. Dalam rangka memperoleh
reliabilitas set soal inilah analisis butir soal dilakukan. Dalam menganalisis butir soal
paling tidak ada dua karakteristik butir soal yang perlu diperhatikan yaitu tingkat
kesukaran dan daya beda butir – butir soal.

B. KAPAN ANALISIS BUTIR SOAL DILAKUKAN ?


1)      Tingkat kesukaran butir soal
Besarnya tingkat kesukaran butir soal, dapat dihitung dengan memperhatikan
proporsi peserta tes yang menjawab benar terhadap setiap butir soal. Secara
matematis tingkat kesukaran butir soal dapat dihitung dengan rumus :
P = 
Keterangan :
P adalah indeks kesukaran butir soal
B adalah jumlah peserta tes yang menjawab benar
N adalah jumlah peserta tes
Menurut Fernandes (1984), kategori kesukaran butir soal adalah sebagai
berikut :
P > 0,75 : mudah
0,25 ≤ P ≤ 0,75 : sedang
P < 0,24 : sukar
Butir soal yang baik adalah butir soal yang memiliki tingkat kesukaran dalam
kategori sedang.

2)     Daya beda
Daya beda butir soal memiliki pengertian seberapa jauh butir soal tersebut dapat
membedakan kemampuan individu peserta tes. Daya beda butir soal dapat dihitung
dengan menggunakan rumus :
D=PA – PB
dimana,
D = indeks daya beda butir soal
PA = proporsi kelompok atas yang menjawab benar
PB = proporsi kelompok bawah yang menjawab salah

Secara teoritis indeks beda soal (D) = 1 akan tercapai apabila semua siswa
dalam kelompok atas menjawab benar dan semua siswa dalam kelompok bawah
menjawab salah. Indeks daya beda soal (D) = -1 jika semua sisa dalam kelompok
atas menjawab salah dan semua siswa dalam kelopok bawah justru menjawab
benar. Sedangkan indeks daya beda soal (D) = 0 apabila proporsi siswa yang
menjawab benar dalam kelompok atas dan kelompok bawah adalah sama. Menurut
Fernandes (1984) kategori indeks daya beda butir soal adalah :
D ≥ 0,40 = sangat baik
0,30 ≤ D ≤ 0,40 = baik
0,20 ≤ D < 0,30 = sedang
D < 0,20 = tidak baik
Butir soal yang perlu diperbaiki adalah butir soal yang terlalu sukar atau terlalu
mudah dan butir soal yang pengecohnya mempunyai daya beda positif atau
kuncinya mempunyai daya beda negatif. Perbaikan butir soal dapat dilakukan pada
pokok soal atau pada alternatif jawaban.

C. Menganalisis Tes Uraian


Cara menganalisis tes uraian menurut Whitney dan Sabers (Mehrens dan
Lehmann, 1984) adalah : (1) tentukan jumlah siswa yang termasuk kelompok atas
(25%) dan kelompok bawah (25%), (2) hitung jumlah skor kelompok atas dan jumlah
skor kelompok bawah, dan (3) hitung tingkat kesukaran dan daya beda setiap butir
soal dengan rumus berikut :  
Dimana
SA          :  jumlah skor kelompok atas
SB          :  jumlah skor kelompok bawah
N            :  25% peserta didik
Skor maks :  skor maksimal tiap buti tes
Skor min   :   skor minimal tiap butir tes
D. Memperbaiki Butir Soal
Beberapa hal yang perlu diperhatikan dalam memperbaiki butir soal antara lain : a)
perhatikan tingkat kesukaran soal. Butir soal dianggap baik jika mempunyai tingkat
kesukaran (P) antara 0,25 sampai dengan 0,75 atau mendekati angka tersebut, b)
perhatikan daya beda butir soal. Butir soal dianggap baik jika kunci atau jawabannya
dianggap benar mempunyai beda positif tinggi dan pengecohnya mempunyai daya
beda negatif.

E. Memperbaiki Non-Tes
Prosedur memperbaiki instrument non-tes sama dengan prosedur memperbaiki tes.
Penyempurnaan butir yang lemah dapat dilaksanakan dengan memperbaiki butir
yang kurang baik atau mengganti butir yang lama dengan butir yang baru. Penyebab
butir soal kurang baik, antara lain: a) penggunaan bahasa kurang komunikatif, b)
kalimat dapat ditafsirkan ambiguous (dapat ditafsirkan ganda), c) pertanyaan /
pernyataan yang dibuat menyimpang dari indikator, dan d) pertanyaan / pernyataan
tidak mengukur tarif (sifat) yang akan diukur.

Anda mungkin juga menyukai