Anda di halaman 1dari 23

Evaluasi Pembelajaran di SD

Modul 5 Kualitas Alat Ukur

Universitas Terbuka Pokjar Lewiliang


Asalamualaikum
Power Poin Presentation Kelompok 6
Rita Alfiansyah Nirahmi
Desi Purnamasari
Siti Syahadah Al Idris
Hanifah Arbiatun Nisa
Atria Tovad Wagenta
 
 
Kegiatan
Belajar 1
Kualitas Alat Ukur (instrumen)
Untuk mengetahui perkembangan dan kemajuan
belajar siswa, perlu dilakukan suatu penilaian dengan
menggunakan berbagai teknik yang tepat. Penilaian
dalam pembelajaran dilakukan tidak hanya untuk menilai
hasil belajar siswa melainkan juga menilai proses belajar
siswa. Dalam melakukan penilaian pembelajaran, ada
beberapa hal yang harus diperhatikan guru, terutama
yang berhubungan dengan jenis kompetensi yang akan
dinilai, tujuan penilaian yang dilakukan, teknik – teknik
penilaian yang digunakan, dan jenis penilaian yang akan
digunakan. Dengan demikian kegiatan penilaian yang
dilakukan menjadi tepet sasaran, terarah, dan terencana.
Kegiatan Belajar 1 Secara teoritis terdapat hubungan timbal balik antara tujuan
pembelajaran, proses pembelajaran, dan penilaian hasil belajar. Jika
tujuan pembembelajaran yang dirumuskan sudah tepat dan proses
pembelajaran yang dilakukan sudah maksimal maka salah satu hal
yang perlu kita cermati adalah alat penilaian hasil belajar.
pengukuran memiliki dua karakteristik utama yaitu pertama
penggunaan angka atau skala tertentu, dan kedua menurut suatu
aturan atau formula tertentu. Contoh kegiatan pengukuran adalah
ketika kita mengukur tinggi atau berat badan seseorang. Kita akan
mengetahui berapa tingginya atau beratnya. Atribut atau
karakteristik yang kita cari dari contoh pengukuran tersebut yaitu
tinggi atau berat, kemudian hasil pengukuran tersebut kita akan
memperoleh angka, misalkan tinggi 1,75 meter atau beratnya 70
kilogram.
-benar mampu mengukur kemampuan siswa.
apakah alat ukur yang anda gunakan ( dalam hal ini tes yang
anda susun atau instrumen lain yang anda gunakan ) mempunyai
kualitas yang baik sehingga dapat digunakan untuk mengukur tujuan
pembelajaran yang telah anda tetapkan ?.
Untuk menjawab permasalahan tersebut, kita akan diajak untuk
mempelajari lebih rinci berbagai cara yang dapat ditempuh untuk
meningkatkan kualitas alat ukur atau instrumen yang anda gunakan
agar benar – benar dapat mengukur apa yang ingin anda ukur.
Dalam pembahasan ini akan dibahas mengenai pengujian kualitas
alat ukur atau instrumen yang akan membahas tentang validitas dan
reliabilitas hasil pengukuran dan tentang bagaimana cara
menganalisis butir soal dan bagaimana cara meningkatkan kualitas
butir soal berdasarkan hasil analisis serta bagaimana meningkatkan
kualitas alat ukur non-tes.
Validitas dan Reliabilitas
Dan hasil Pengukuran

Untuk mengukur sesuatu kita harus dapat memilih alat ukur yang sesuai
agar kita dapat memperoleh hasil pengukuran yang tepat. Sebagai contoh,
seorang pemanah akan dinyatakan sebagai pemenang jika hasil bidikannya
dapat dengan tepat mengenai sasaran yaitu daerah lingkaran yang paling
dalam atau yang paling mendekati lingkaran yang paling dalam. Jika hasil
bidikan peserta didik dapat mengenai daerah di lingkaran paling dalam maka
ia akan memperoleh skor tertinggi dan perolehan skor tersebut semakin
berkurang jika hasil bidikannya jauh dari sasaran. Karena anak panah yang
harus dilepaskan tidak hanya satu maka pemanah dituntut untuk tetap
dapat melepaskan anak panahnya tepat mengenai sasaran.
Hasil bidikan dari peserta bisa tepat mengenai sasaran atau juga melesat
dari sasaran. Hasil yang sama dapat terjadi pada saat anda mengukur hasil
belajar siswa. Jika alat ukur yang anda gunakan tidak anda persiapkan
dengan cermat maka skor yang anda peroleh tidak dapat menggambarkan

Kualitas
dengan tepat tingkat kemampuan siswa.Dari penjelasan tersebut terdapat
dua masalah pokok yang harus diperhatikan dalam menyusun alat ukur hasil
belajar yang baik yaitu masalah yang berhubungan dengan ketepatan hasil
pengukuran dan ketetapan hasil pengukuran.Masalah yang berhubungan

Alat Ukur
Kegiatan Belajar 1
dengan ketepatan hasil pengukuran inilah yang dikenal dengan istilah
validitas sedangkan maslah – masalah yang berhubungan dengan ketetapan
hasil pengukuran dikenal dengan istilah reliabilitas.
 
A.      Validitas
Alat ukur yang baik adalah alat ukur yang dapat dengan tepat mengukur apa yang ingin diukur.
Jika kita ingin mengukur panjang sebuah meja maka kita harus dapat memilih alat ukur yang
tepat untuk mengukur panjang meja tersebut.Untuk menghitung waktu tempuh pelari cepat
dalam perlombaan lari cepat 100 meter maka kita juga harus dapat memilih alat ukur yang tepat
untuk digunakan. Demikian juga jika kita ingin mengukur hasil belajar siswa maka kita juga
dituntut untuk menggunakan alat ukur ( dalam hal ini tes ) yang dapat dengan tepat mengukur
hasil belajar yang kita harapkan.

Pengertian validitas mengacu pada ketepatan interpretasi yang dibuat dari


hasil pengukuran atau evaluasi ( Gronlund dan Linn, 1990). Secra umum
validitas ada tiga jenis :
a.       Validitas isi ( concent validity ).
PowerPoint b.      Validitas konstrak ( construct validity ).

Presentation c.       Validitas yang dikaitkan dengan kriteria tertentu ( criterion related validity ).

Validitas isi diperlukan untuk menjawab pertanyaan “ sejauh mana item – item yang ada dalam tes
dapat mengukur keseluruhan materi yang telah diajarkan “. Tinggi rendahnya validitas isi dapat
ditetapkan berdasarkan analisis rasional atau pertimbangan ahli terhadap isi tes tersebut.Hal ini
merupakan tuntutan yang harus dipenuhi oleh tes hasil belajar. Tinggi rendahnya validitas isi suatu
tes dapat dilihat pada perencanaan atau kisi – kisi tes. Semakin representatif materi yang dapat
ditanyakan dalam tes tersebut menunjukkan semakin tinggi validitas isinya.
Validitas Kelompok 6

Validitas konstrak mengacu pada sejauh mana


alat ukur tersebut dapat mengungkap
keseluruhan konstrak yang digunakan sebagai
dasar dalam penyusunan tes tersebut.Yang
dimaksud dengan konstrak disini adalah konsep
hipotesis (hipotetical concept) yang digunakan
sebagai dasar dalam penyusunan alat
ukur.Validitas konstrak ini banyak digunakan
terutama dalam pengukuran – pengukuran
psikologi seperti pengukuran sikap, minat,
tingkah laku dan sebagainya.Campbell dan Fiske
(Demari Mardapi, 2004) mengembangkan satu
pendekatan untuk menentukan validitas konstrak
dengan menggunakan teknik multi trait-multi
method.Validasi dengan multi trait – multi
method dilakukan dengan menggunakan lebih
dari satu metode untuk mengukur lebih dari satu
acam trait ( sifat ). Dengan menggunakan matrik
korelasi sehingga interkorelasi antara trait dan
metode dapat dilihat dengan jelas.
Jika suatu tes dimaksudkan untuk memprediksi
keberhasilan seseorang di masa yang akan
datang atau dimaksudkan untuk mengetahui
kesesuaian anatar pengetahuan dengan
keterampilan yang dimiliki maka alat ukur yang
digunakan harus mempunyai criterion related
validity yang tinggi.
B.Reliabilitas

Hasil – hasil pengukuran yang berhubungan dengan aspek – aspek fisik seperti
mengukur panjang meja, tinggi almari, berat badan dan tinggi badan biasanya
menghasilkan reliabilitas yang sangat tinggi.Artinya walaupun pengukuran
dilakukan lebih dari sekali tetapi tetap memberikan hasil yang ridak jauh
berbeda. Hasil pengukuran yenag berbeda akan sering kita temukan jika kita
melakukan pengukuran terhadap hal – hal yang berhubungan dengan aspek –
aspek psikologi dan sosial seperti dalam pengukuran mewakili intelegensi,
sikap, dan konsep diri. Aspek – aspek sosial-psikologi seperti itu tidak dapat
diukur dengan ketepatan dan konsistensi yang tinggi.Hal ini disebabkan karena
hasil pengukuran yang diperoleh tidak dapat lepas dari pengaruh hal - hal
diluar maksud pengukuran tersebut misalnya alat ukur itu sendiri bukan
merupakan alat ukur yang tepat untuk mengukur aspek yang diinginkan.
Disamping itu karena subjek pengukurannya adalah manusia maka cara – cara
penyajian tes, emosi, motivasi. Kondisi fisik dan keadaan ruangan tes akan
mempengaruhi hasil pengukuran walaupun sebenarnya aspek – aspek yang
ingin kita ukur tersebut tidak berubah. Dengan demikian hasil pengukuran
yang diperoleh menjadi kurang reliabel.
Reliabilitas

Pengertian reliabilitas mengacu pada ketetapan hasil yang diperoleh dari suatu


Pengukuran ( Grondlund dan Linn, 1990 ). Salah satu cara untuk mengetahui
ketetapan atau reliabilitas suatu pengukuran, dapat diperoleh dengan cara
melakukan pengukuran dua kali. Hasil pengukuran dikatakan mempunyai
reliabilitas yang tinggi jika hasil pengukuran pertama hampir sama dengan
hasil pengukuran kedua. Dan sebaliknya hasil pengukuran dikatakan
mempunyai reliabilitas yang rendah jika hasil pengukuran pertama jauh
berbeda dengan hasil pengukuran kedua. Hubungan antar skor yang diperoleh
pada pengukuran pertama dengan kedua akan menghasilkan angka korelasi
bergerak antara -1 sampai dengan +1. Semakin tinggi angka koefisien
reliabilitas (mendekati 1) maka semakin tinggi reliabilitas tersebut. Suatu
perangkat tes dinyatakan cukup reliabel jika mempunyai reliabilitas lebih besar
0,5 (Fernandes, 1984).
Reliabilitas

Konsep reliabilitas dalam arti equivalent tes dimaksudkan untuk mengetahui


apakah dua set tes yang digunakan paralel atau tidak. Keparalelan dua set tes
ini diperoleh dengan cara mengembangkan dua set tes yang paralel dari kisi -
kisi tes yang sama kemudian masing - masing tes tersebut diujikan pada dua
kelas yang mempunyai tingkat kemampuan yang sama. Hasil kedua tes
tersebut dikorelasikan, jika hasil korelasinya tinggi, hal ini menunjukan kedua
tes paralel.koefisien korelasinya dapat dihitung dengan menggunakan formula
product-moment.
konsep reliabilitas dalam arti konsistensi internal dimaksudkan untuk
mengetahui apakah kumpulan butir soal yang ada dalam satu set tes tersebut
mengukur dimensi hasil belajar yang sama atau tidak. Konsep reliabilitas
dalam asrti konsistensi dapat dihitung menggunakan formula Kuder-
Richardson (KR-20 atau KR-21). Jika hasil korelasinya tinggi, hal ni menunjukan
bahwa antara butir soal dalam satu set tes tersebut adalah konsisten dengan
yang lain.
Validitas dan Reliabilitas
C. Hubungan antara
Validitas dan Reliabilitas
Ketepatan hasil pengukuran ( validitas )
sangat diperlukan untuk memperoleh alat
ukur yang dapat memberikan hasil
pengukuran yang tepat ( valid ). Walaupun
D. Meningkatkan Reliabilitas Tes
demikian alat ukur yang mempunyai Reliabilitas suatu tes dapat ditingkatkan
reliabilitas tinggi belum tentu secara dengan menambah jumlah butir kedalam tes
otomatis mempunyai validitas yang tinggi. tersebut. Penambahan butir soal pada tes
Karena tingginya reliabilitas  yang dihasilkan akan meningkatkan reliabilitas jika butir soal
oleh suatu alat ukur jika tidak dibarengi yang ditambahkan adalah butir soal yang
dengan tingginya validitas dapat homogen dengan butir soal – soal yang ada.
memberikan informasi yang salah tentang  
apa yang ingin kita ukur.
 
Kegiatan
Belajar 2
Analisis dan Perbaikan Instrumen A. Analisis Butiran Soal

Menurut Nitko (1983), analisis butir soal


menggambarkan suatu proses pengambilan data
dan penggunaan informasi tentang tiap - tiap butir
soal terutama tentang respon siswa terhadap
setiap butir soal. Lebih Lnjut dikatakan bahwa arti
penting penggunaan analisis butir soal adalah
sebagai berikut :
 
Kegiatan Belajar 2
1.      Untuk mengetahui apakah butir soal – butir soal yang disusun sudah berfungsi sesuai dengan apa yang
dikehendaki oleh penyusun soal. Untuk menentukan apakah soal – soal yang kita susun telah berfungsi
sebagaimana seharusnya maka kita harus memperhatikan hal – hal sebagai berikut :

Apakah soal – soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku seperti telah
A dirumuskan dalam tujuan instruksional khusus ?

B Apakah tingkat kesukaran sudah kita perhatikan ?

C Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang
kurang pandai ?

D Apakah kunci soal yang kita buat sudah benar sesuai dengan maksud soa ?

E Jika menggunakan tes pilihan berganda, apakah pengecoh yang kita pilih sudah berfungsi dengan baik ?

F Apakah soal tersebut dapat ditafsirkan ganda atau tidak ?


Analisis Butiran Soal

01 Untuk mengetahui apakah butir


Sebagai umpan balik bagi siswa untuk
02
1 2
soal – butir soal yang disusun
sudah berfungsi sesuai dengan mengetahui kemampuan mereka dalam
apa yang dikehendaki oleh menguasai suatu materi.
penyusun soal.

03 Sebagai umpan balik bagi guru untuk 3 4


mengetahui kesulitan – kesulitan yang dialami
siswa dalam memahami suatu materi.
Sebagai acuan untuk merevisi
soal. 04

5
05 Untuk memperbaiki kemapuan kita dalam
menulis soal.
.
ANALISIS
Butiran soal
Pada saat kita engujikan suatu set soal untuk
mengambil keputusan penting tentang hasil belajar
siswa maka idealnya kita harus yakin bahwa set soal
tersebut adalah valid dan reliabel. Validitas set soal
dapat diketahui dari kisi – kisi soal sedangkan
reliabelitas soala baru dapat diketahui setelah uji
coba. Dalam rangka memperoleh reliabilitas set soal
inilah analisis butir soal dilakukan. Dalam
menganalisis butir soal paling tidak ada dua
karakteristik butir soal yang perlu diperhatikan yaitu
tingkat kesukaran dan daya beda butir – butir soal.
B. Kapan Analisis Butiran soal dilakukan?
1 Tingkat kesukaran butir soal
Besarnya tingkat kesukaran butir soal, dapat dihitung dengan memperhatikan
proporsi peserta tes yang menjawab benar terhadap setiap butir soal. Secara
matematis tingkat kesukaran butir soal dapat dihitung dengan rumus :

P=
Keterangan
P adalah indeks kesukaran butir soal
B adalah jumlah peserta tes yang menjawab benar
N adalah jumlah peserta tes
Menurut Fernandes (1984), kategori kesukaran butir soal adalah sebagai berikut :
P > 0,75 : mudah
0,25 ≤ P ≤ 0,75 : sedang
P < 0,24 : sukar

Butir soal yang baik adalah butir soal yang memiliki tingkat kesukaran dalam kategori sedang.
2. Beda daya
Daya beda butir soal memiliki pengertian seberapa jauh butir soal tersebut
dapat membedakan kemampuan individu peserta tes. Daya beda butir soal
dapat dihitung dengan menggunakan rumus :

D=PA – PB

D D = indeks daya beda butir soal


.

PA PA = proporsi kelompok atas yang menjawab benar.

PB PB = proporsi kelompok bawah yang menjawab salah


 
Daya Beda
Secara teoritis indeks beda soal (D) = 1
akan tercapai apabila semua siswa dalam
kelompok atas menjawab benar dan
semua siswa dalam kelompok bawah
menjawab salah. Indeks daya beda soal
(D) = -1 jika semua sisa dalam kelompok
atas menjawab salah dan semua siswa baik
dalam kelopok bawah justru menjawab gat aik
benar. Sedangkan indeks daya beda soal san = b ang
(D) = 0 apabila proporsi siswa yang 40 = ,40 s ed
0, 0
≤ ,30 = aik
menjawab benar dalam kelompok atas ≥
D 0≤ D 0 b
dan kelompok bawah adalah sama. < a k
Menurut Fernandes (1984) kategori 0,3 0 ≤ D = tid
indeks daya beda butir soal adalah : 0,2 0,20 Butir soal yang perlu diperbaiki adalah butir soal yang
D< terlalu sukar atau terlalu mudah dan butir soal yang
pengecohnya mempunyai daya beda positif atau
kuncinya mempunyai daya beda negatif. Perbaikan
butir soal dapat dilakukan pada pokok soal atau pada
alternatif jawaban.
 
C. Mengenal Tes Uraiaan
Dimana
SA          :  jumlah skor kelompok atas
SB          :  jumlah skor kelompok bawah
N            :  25% peserta didik
Cara menganalisis tes uraian menurut Skor maks  :  skor maksimal tiap buti tes
Whitney dan Sabers (Mehrens dan Skor min    :   skor minimal tiap butir tes
Lehmann, 1984) adalah : (1) tentukan  
jumlah siswa yang termasuk kelompok
atas (25%) dan kelompok bawah
(25%), (2) hitung jumlah skor kelompok
atas dan jumlah skor kelompok bawah,
dan (3) hitung tingkat kesukaran dan
daya beda setiap butir soal dengan
rumus berikut : 
D. Memperbaiki Butiran Soal
Memperbaiki Butiran Soal
Beberapa hal yang perlu diperhatikan dalam memperbaiki
butir soal antara lain : a) perhatikan tingkat kesukaran
soal. Butir soal dianggap baik jika mempunyai tingkat
kesukaran (P) antara 0,25 sampai dengan 0,75 atau
mendekati angka tersebut, b) perhatikan daya beda butir
soal. Butir soal dianggap baik jika kunci atau jawabannya
dianggap benar mempunyai beda positif tinggi dan
pengecohnya mempunyai daya beda negatif.
 
 
Memperbaiki
Non-Tes
Analisis dan Perbaikan Instrumen

E. Memperbaiki Non-Tes
Prosedur memperbaiki instrument non-tes sama dengan
prosedur memperbaiki tes. Penyempurnaan butir yang
lemah dapat dilaksanakan dengan memperbaiki butir
yang kurang baik atau mengganti butir yang lama dengan
butir yang baru. Penyebab butir soal kurang baik, antara
lain: a) penggunaan bahasa kurang komunikatif, b)
kalimat dapat ditafsirkan ambiguous (dapat ditafsirkan
ganda), c) pertanyaan / pernyataan yang dibuat
menyimpang dari indikator, dan d) pertanyaan /
pernyataan tidak mengukur tarif (sifat) yang akan diukur.
 
 
PowerPoint Presentation kelompok 6

Kesimpulan

Modul 5 Kualitas Alat Ukur


Untuk mengetahui perkembangan dan kemajuan belajar siswa, perlu dilakukan suatu penilaian dengan menggunakan berbagai
teknik yang tepat. Penilaian dalam pembelajaran dilakukan tidak hanya untuk menilai hasil belajar siswa melainkan juga menilai
proses belajar siswa. Dalam melakukan penilaian pembelajaran, ada beberapa hal yang harus diperhatikan guru, terutama yang
berhubungan dengan jenis kompetensi yang akan dinilai, tujuan penilaian yang dilakukan, teknik – teknik penilaian yang
digunakan, dan jenis penilaian yang akan digunakan. Dengan demikian kegiatan penilaian yang dilakukan menjadi tepet sasaran,
terarah, dan terencana.
Secara teoritis terdapat hubungan timbal balik antara tujuan pembelajaran, proses pembelajaran, dan penilaian hasil belajar. Jika
tujuan pembembelajaran yang dirumuskan sudah tepat dan proses pembelajaran yang dilakukan sudah maksimal maka salah
satu hal yang perlu kita cermati adalah alat penilaian hasil belajar. pengukuran memiliki dua karakteristik utama yaitu pertama
penggunaan angka atau skala tertentu, dan kedua menurut suatu aturan atau formula tertentu. Contoh kegiatan pengukuran
adalah ketika kita mengukur tinggi atau berat badan seseorang. Kita akan mengetahui berapa tingginya atau beratnya. Atribut
atau karakteristik yang kita cari dari contoh pengukuran tersebut yaitu tinggi atau berat, kemudian hasil pengukuran tersebut kita
akan memperoleh angka, misalkan tinggi 1,75 meter atau beratnya 70 kilogram.
THANK YOU
Wasallamualaikum

Anda mungkin juga menyukai