Oleh :
H. WARSONO., M.S
PENDAHULUAN
Terminologi
Asesmen
Evaluasi
Penilaian Pendidikan
Umpan Balik
Makna
Menilai
Why we must
to evaluate?
d. Fungsi pengukuran
c. Fungsi selektif
keberhasilan
Penilaian terkait dengan proses transformasi:
Sebelum kegiatan pembelajaran;
Apakah yang mau dicapai siswa?
Apakah siswa sudah punyai bagian kemampuan yang akan dicapai.
2) Jika belum tercapai, bagian mana yang belum tercapai, apa faktor penyebabnya
Ciri-ciri Penilaian dalam Pendidikan
a. Penilaian dilakukan secara tak langsung
Melalui penyelesaian soal-soal
PBM Evaluasi
Dokter Guru
Diagnosis Diagnostik
Terapi Bantuan
Lanjutan..... Manfaat tes formatif
bagi :
Istilah:
•Tes
•Testing
•Testee
•Tester
2. Syarat tes:
•Terikat dengan kualitas
•Pengadministrasian dalam
pelaksanaan
Lanjutan.....
Gilbert Sax
Kelemahan tes (1980)
•Menyinggung pribadi
•Mengkategorikan siswa secara tetap
•Tidak mendukung kecemerlangan dan daya kreasi siswa
•Hanya mengukur aspek tingkah laku yang sangat terbatas
Dimana:
= koefisien korelasi antara variabel X dan variabel Y, dua
variabel yang dikorelasikan
Nilai koefisien korelasi selalu terdapat antara -1,00 sampai
+1,00
Koefisien negatif menunjukkan hubungan kebalikan
Koefisien positif menunjukkan adanya kesejajaran.
1 2 3 4 5 6 7 8 9 10
1 Harto 1 0 1 0 1 1 1 1 1 1 8
2 Yoyo 0 0 1 0 1 0 0 1 1 1 5
3 Oki 0 1 0 0 0 1 0 1 0 1 4
4 Dina 1 1 0 0 1 1 0 0 1 0 5
5 Rosi 1 1 1 1 1 1 0 0 0 0 6
6 Dina 1 0 1 0 1 0 1 0 0 0 4
7 Lia 1 1 1 1 1 1 1 0 0 0 7
8 Annida 0 1 0 1 1 1 1 1 1 1 8
Keterangan:
= koefisien korelasi biseral
= rerata skor dari subjek yang menjawab betul item yang
dicari validitasnya
= rerata skor total
= standar deviasi dari skor
= proporsi siswa yang menjawab benar
1. Mencari
2. Mencari
6. Memasukan ke rumus
4. Tes Terstandar sebagai Kriterium
dalam Menentukan Validitas
Tes terstandar mempunyai identitas:
•Telah diuji coba beberapa kali di tempat yang berbeda-beda
•Telah diketahui koefisien validitas
•Telah diketahui koefisien reliabilitas
•Telah diketahui koefisien taraf kesukaran soal
•Telah diketahui koefisien daya pembeda.
Contoh perhitungan:
Tabel persiapan perhitungan validitas tes matematika
dengan kriterium tes standar matematika
Y2
No Nama X Y X2 XY Keterangan
4 Seno 6 7 36 49 42
5 Hartini 7 7 49 49 49
6 Heru 6 5 36 25 30
siswa
A 1 0 1 1 1 1 0 1 6 1 0 1 0 1 0 1 0 1 0 1 0 6 1 0 1 1 1 0 1 1 1 0 7 19
B 1 1 1 1 1 1 1 0 7 1 1 1 1 0 1 1 1 1 0 0 1 9 1 1 1 1 1 1 1 1 1 0 9 25
C 1 0 1 0 1 0 1 0 4 1 1 0 0 0 0 1 1 0 1 1 0 6 1 0 1 1 0 1 1 0 1 1 7 17
D 0 1 1 0 0 0 0 1 3 0 0 0 1 1 0 1 0 1 0 0 0 4 1 1 0 0 1 0 0 0 1 1 5 12
E 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 0 1 1 11 1 1 1 1 1 1 1 1 1 1 10 29
F 1 1 0 1 1 0 1 1 6 1 0 1 1 1 1 1 1 0 1 1 0 9 1 1 1 1 1 0 0 1 1 1 8 21
G 1 0 1 0 1 1 0 1 5 1 0 0 0 1 1 1 0 1 1 1 0 7 1 1 1 1 0 0 0 1 1 1 7 19
H 1 1 1 1 1 0 1 1 7 1 1 1 1 1 0 1 1 1 1 0 1 10 1 1 1 1 1 1 1 1 1 0 9 26
I 1 1 1 0 0 0 1 1 5 1 0 1 1 0 0 0 0 1 1 1 0 6 1 1 0 1 1 0 0 1 0 0 5 16
J 1 0 1 0 1 0 1 0 4 1 0 0 0 0 0 0 1 1 1 0 1 5 1 1 0 1 1 0 0 0 1 1 6 15
K 1 1 1 1 1 1 1 0 7 1 1 1 1 1 1 1 1 1 1 0 0 10 1 1 1 1 1 1 1 0 1 1 9 26
L 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 1 1 1 12 1 1 1 1 1 1 1 1 1 1 10 30
M 1 0 0 0 1 1 1 1 5 1 1 0 1 1 0 1 1 0 1 1 0 8 1 1 0 0 0 1 1 1 1 1 7 20
Skor tes kedua nampak naik tapi terjadi pada semua siswa.
Metode ini disebut juga self correlation method (korelasi diri sendiri)
•Metode Belah Dua (Split-half method)
Mengatasi kelemahan dua metode yang sebelumnya.
Tester hanya membuat satu seri tes dan satu kali melaksanakan tes
disebut juga single test-single trial method.
Pada waktu membelah dua dan mengkorelasikan dua belahan,
baru diketahui reabilitas separo tes. Untuk mengetahui reabilitas
seluruh tes harus digunakan rumus:
Rumus Spearman – Brown;
1 A 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5
2 B 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3
3 C 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3
4 D 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2
5 E 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1
6 F 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1
7 G 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2
8 H 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5
1) Pembelahan ganjil genap Gunakan rumus korelasi
Item ganjil Item genap product moment!
No Nama (1,3,5,7,9) (2,4,6,8,10)
(X) (Y)
1 A 5 3
2 B 3 2
3 C 0 4
4 D 3 2
5 E 3 3
6 F 4 0
7 G 4 3
8 H 3 5
Dimana:
= varians beda
D = difference yaitu perbedaan antara
skor belahan pertama (awal) dengan
skor belahan kedua (akhir)
atau
Keterangan:
= reabilitas seluruh soal
= Varians responden
= Varians sisa
Langkah-langkah penggunaan rumus Hoyt:
1. Mencari jumlah kuadrat responden
Rumusnya:
Keterangan:
= Jumlah kuadrat responden
= skor total tiap responden
= banyaknya item
= banyaknya responden atau subjek
Langkah 2:
Mencari jumlah kuadrat item dg rumus:
Keterangan:
= jumlah kuadarat item
= jumlah kuadrat jawaban benar seluruh item
= kuadrat dari jumlah skor total
Langkah 3:
Mencari jumlah kuadrat total dg rumus;
Keterangan:
= jumlah kuadrat total
= jumlah jawab benar seluruh item
= jumlah jawab salah seluruh item
Langkah 4:
Mencari jumlah kuadrat sisa, dg rumus;
Langkah 5:
Mencari Varians responden dan varians sisa dg Tabel F.
harus dicari derajat bebas (d.b) = N-1
Jadi Variansi =
Langkah 6:
Memasukkan ke dalam rumus
Mencari reliabilitas tes bentuk uraian
Butir soal uraian menghendaki graduasi penilaian
Skor untuk masing-masing butir soal dicantumkan pada kolom
item menurut apa adanya.
Keterangan:
= reliabilitas yang dicari
= jumlah varians skor tiap-tiap soal
= varian total
Tabel analisis item
No
subjek Nomor item
1 2 3 4 5 6 7 8 9 10 11 12
1 1 1 0 1 1 1 0 1 1 1 0 1
2 1 1 0 1 1 0 0 1 0 0 1 0
3 1 0 0 0 0 0 0 1 0 1 0 1
4 1 1 1 1 1 1 1 1 1 1 1 1
5 1 0 1 1 1 1 0 1 1 1 1 1
6 0 0 0 1 1 0 0 1 1 0 0 1
7 1 1 0 1 1 0 0 1 0 0 0 1
8 1 0 0 1 1 1 0 1 1 1 0 1
Tujuan Institusional
Tujuan kurikulum
hasil pembelajaran
• “...Barang siapa bertakwa kepada Allah niscaya Dia akan membukakan jalan keluar
baginya”.
Ayat 2
• “dan Dia memberinya rezekinya dari arah yang tidak disangka-sangka. Dan barang
sapa bertakwa kepada Allah, niscaya Allah akan mencukupkan (keperluan)nya. ...”
• “... Dan barang siapa bertakwa kepada Allah, niscaya Dia menjadikan kemudahan
Ayat 3,4 baginya dalam urusannya”.
• “itulah perintah Allah yang diturunkanNya kepadamu; barang siapa yang bertakwa
kepada Allah, niscaya Allah akan menghapus kesalahan-kesalahannya dan akan
melipatgandakan pahala baginya.
Ayat 5
2. Taksonomi Bloom (1956)
Prinsip dasar yang digunakan oleh Bloom dan Krathwohl:
1) Prinsip metodologis 3) Prinsip logis
2) Prinsip psikologis 4) Prinsip tujuan
a. Ranah kognitif
a.1 Ingatan (Pengetahuan); terdiri atas:
• Mengenal (recognition)
siswa diminta memilih satu dari beberapa jawaban. Contoh:
Tumbuhan dibawah ini yang termasuk monokotil adalah
a. Zalaca edulls b. Muntingia calabura c. Lantana camara
• Mengungkap/mengingat kembali (recall)
siswa diminta untuk mengingat kembali satu atau lebih fakta-
fakta yang sederhana.
Contoh:
Organel sel yang berfungsi untuk respirasi sel disebut...
a.2. Pemahaman (comprehension)
Siswa diminta untuk membuktikan bahwa ia memahami
hubungan yang sederhana antara fakta-fakta atau konsep.
Contoh:
Jelaskanlah terjadinya proses pembekuan darah manusia !
b
a t
a.5. Sintesis (Synthesis)
Siswa diminta untuk menggabungkan atau menyusun kembali
(recoganize) hal-hal spesifik agar dapat mengembangkan struktur
baru.
Contoh:
Dari hasil pengamatan dilapangan diperoleh data komponen biotik
sbb: semut, cacing, unggas, belalang, katak, rumput Paspalum.
Susunlah data tersebut di atas sehingga membentuk rantai
makanan!
a.6 Evaluasi (evaluation)
Siswa dituntut agar mampu menilai suatu kasus secara tepat dan benar.
Acuan “benar/salah” adalah hukum, dalil, prinsip pengetahuan.
Contoh:
Apabila seorang pasen bergolongan darah A ditransfusi dengan darah
golongan A sedangkan pasen kedua bergolongan darah B ditransfusi
dengan darah golongan A. Dari dua kasus tsb, kasus yang mana yang akan
berdampak tidak baik?
b.2 Responding;
Menjawab, membantu, mendiskusikan, menghormat,
berbuat, melakukan, membaca, memberikan, menghafal,
melaporkan, memilih, menceritakan, menulis.
b.3 Valuing;
Menggambarkan, membedakan, memilih, mengusulkan,
kerja, mengambil bagian (share), mempelajari
b.4 Organization;
Mengubah, mengatur, menggabungkan, membandingkan,
melengkapi, mempertahankan, menerangkan,
menggeneralisasikan, mengidentifikasikan,
mengintegrasikan, mengorganisir, memodifikasikan,
menyiapkan, menghubungkan.
1. Standar Kompetensi
2. Indikator
(KTSP)
• Mengetahui
• Memahami
• Mengerti Standar Kompetensi (KTSP)
• Menghayati
• Menyadari
• Menghargai
Istilah Standar tidak mengandung arti bahwa tes itu mengukur apa
yang harus dan dapat diajarkan pada suatu tingkat tertentu atau bahwa
tes itu menyiapkan suatu standar prestasi dimana siswa harus dan
dapat mencapai suatu tingkat tertentu. Tes standar dipolakan untuk
penampilan prestasi sekarang (yg ada) silaksanakan secara seragam,
diusahakan dalam kondisi seragam baik itu diberikan kpd seorang siswa
dlm pelaksanaan perseorangan maupun siswa sbg anggota kelompok.
Kebaikan Kelemahan
a. Mudah disusun a. Validitas dan reabilitas rendah
b. Tidak memberi kesempatan kepada b. Kurang dapat mencakup lingkup materi
siswa untuk bespekulasi dalam yang luas
menjawab c. Penilaian banyak dipengaruhi
c. Mendorong siswa berani subjektifitas penilai
mengemukakan pendapat serta d. Pemerikasaan jawaban sulit karena
menyusun dalam bentuk kalimat yang membutuhkan pertimbangan lebih
baik menurut gaya bahasa sendiri banyak dari penilai
d. Dapat diketahui sejauhmana siswa e. Perlu waktu yang lama untuk
mendalami suatu masalah memerikasa jawaban
2. Tes Objektif
Kebaikan Kelemahan
a. Dapat mencakup lingkup materi yang a. Proses penyusunan soal lebih sulit
luas b. Soal-soal cenderung mengukur aspek
b. Objektifitas tinggi berfikir tingkat rendah (ingatan dan
c. Mudah memeriksa jawaban karena ada pemahaman)
kunci jawaban c. Peluang berspekulasi dalam menjawab
d. Pemeriksaan jawaban dapt diwakilkan ke besar
orang lain d. Kemugkinan kerja sama dalam menjawab
lebih mudah terjadi
Cara memberi skor pada soal objektif
1. Tes tipe: B – S a. b.
S=R-W S=R
S=R
II. Penilaian ranah afektif
a. Skala Likert: Skala ini disusun dalam bentuk suatu pernyataan
dan diikuti oleh lima jawaban yang mneunjukkan tingkatan.
Misal:
SS = Sangat Setuju
S = Setuju
TB = Tidak Berpendapat
TS = Tidak Setuju
STS = Sangat Tidak Setuju
b. Skala Thursone
1 2 3 4 5 6 7 8 9 10
Nama:........... Kelas:...........
Skor
No Keterangan 1 2 3 4 5
1. Terampil menyiapkan alat X
2. Tekun dalam bekerja X
3. Menggunakan waktu sangat efektif X
4. Mampu bekerja sama X
5. Memperhatikan keselamatan kerja X
6. Memperhatikan kebersihan X
7. Hasil masakan enak X
Taraf kesukaran
Indeks kesukaran (difficulty indeks) (P): 0,0 – 1,0
0,0 ---------------------------- 1,0
sukar mudah
b. Daya pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dg siswa yang bodoh
(berkemampuan rendah).
Tanda negatif pd (D) digunakan jika suatu soal “terbalik” menunjukkan kualitas
testee. Yaitu siswa pandai disebut bodoh dan siswa bodoh disebut pandai.
Seluruh pengikut tes dikelompokkan menjadi 2 kelompok, kelompok pandai atau
kelompok atas (upper group).
Jika seluruh kelompok atas dpt menjawab soal tsb dgn benar, sdg seluruh
kelompok bawah menjawab salah, maka soal tsb mempunyai D 1,00
Jika seluruh kelompok atas menjawab salah, tetapi semua kelompok bawah
menjawab betul, maka nilai D = -1,00
Jika siswa berkelompok atas dan siswa kelompok bawah sama-sama menjawab
benar atau sama-sama menjawab salah, maka soal tersebut mempunyai nilai D =
0,00 karena tidak mempunyai daya pembeda sama sekali.
F 5
G 5
H 4 Kelompok bawah (JB)
I 4
J 3
Keterangan :
J = Jumlah peserta tes
JA = Banyaknya peserta kelompok atas
JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas yang menjawab benar soal itu
BB = Banyaknya peserta kelompok bawah yang menjawab benar soal itu
10 orang 10 orang
1) P = 21 = 0,35
60
2) D = PA – PB
= 15 – 6
30 30
=9
30
= 0,30
3) Distraktor : semua distraktornya berfungsi dengan baik karena sudah dipih oleh lebih dari
5% peserta tes.
4) Dilihat dari omitnya adalah baik, karena tidak lebih dari 10% peserta tes.
PENYUSUNAN TES
1. Fungsi Tes
Fungsi untuk kelas
Fungsi untuk bimbingan
Fungsi untuk administrasi
d. Taraf kesukaran
indeks kesukaran (difficulty indeks) (P): 0,0 – 1,0
0,0 1,0
sukar mudah
b. Daya pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dg siswa yang bodoh
(berkemampuan rendah).
Tanda negatif pd (D) digunakan jika suatu soal “terbalik” menunjukkan kualitas
testee. Yaitu siswa pandai disebut bodoh dan siswa bodoh disebut pandai.
Seluruh pengikut tes dikelompokkan menjadi 2 kelompok, kelompok pandai atau
kelompok atas (upper group).
Jika seluruh kelompok atas dpt menjawab soal tsb dgn benar, sdg seluruh
kelompok bawah menjawab salah, maka soal tsb mempunyai D 1,00
Jika seluruh kelompok atas menjawab salah, tetapi semua kelompok bawah
menjawab betul, maka nilai D = -1,00
Jika siswa berkelompok atas dan siswa kelompok bawah sama-sama menjawab
benar atau sama-sama menjawab salah, maka soal tersebut mempunyai nilai D =
0,00 karena tidak mempunyai daya pembeda sama sekali.
F 5
G 5
H 4 Kelompok bawah (JB)
I 4
J 3
Keterangan :
J = Jumlah peserta tes
JA = Banyaknya peserta kelompok atas
JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas yang menjawab benar soal itu
BB = Banyaknya peserta kelompok atas yang menjawab salah soal itu
PA = BA
JA= Proporsi peserta kelompok atas yang menjawab benar
PB = BB
JB= Proporsi peserta kelompok bawah yang menjawab benar
Contoh perhitungan:
Hasil tes yg terdiri atas 10 butir soal dikerjakan oleh 20 siswa adalah sbb
Siswa KLP Nilai Soal Skor
1 2 3 4 5 6 7 8 9 10 Siswa
A B 1 0 1 0 0 0 1 1 1 0 5
B A 0 1 1 1 1 1 0 0 1 1 7 A=5 K=7
C A 1 0 1 0 1 1 1 1 1 1 8 B=7 L=5
D B 0 0 1 0 0 1 1 1 1 0 5
E A 1 1 1 1 1 1 1 1 1 1 10 C=8 M=3
F B 1 1 1 0 0 1 1 1 1 0 6 D=5 N=7
G B 0 1 1 0 0 1 1 1 1 1 6
H B 0 1 1 0 0 1 0 1 1 1 6 E = 10 O=9
I A 1 1 1 0 0 1 1 1 1 1 8
J A 1 1 1 1 0 0 1 0 1 1 7
F=6 P=3
K A 1 1 1 0 0 1 1 1 1 0 7 G=6 Q=8
L B 0 1 1 1 1 0 0 1 1 0 5
M B 0 1 1 0 0 0 0 1 1 0 3
H=6 R=8
N A 0 0 1 0 1 1 1 1 1 1 7 I=8 S=6
O A 1 1 1 1 1 1 1 1 1 1 9
P B 0 1 1 0 0 1 0 0 1 0 3 J=7 T=6
Q A 1 1 1 1 0 1 1 1 1 1 8
R A 1 1 1 0 1 1 1 1 1 0 8
S B 1 0 1 0 0 1 1 1 1 0 6
T B 0 1 1 1 0 1 1 1 1 0 6
JMLH 11 15 1 8 6 16 15 17 20 10
Urutan dari skor tertinggi ke skor terendah
10 orang 10 orang
1) P = 21 = 0,35
60
2) D = PA – PB
= 15 – 6
30 30
=9
30
= 0,30
3) Distraktor : semua distraktornya berfungsi dengan baik karena sudah dipih oleh lebih dari
5% peserta tes.
4) Dilihat dari omitnya adalah baik, karena tidak lebih dari 10% peserta tes.