Anda di halaman 1dari 114

EVALUASI PENDIDIKAN

Oleh :
H. WARSONO., M.S
PENDAHULUAN

Terminologi

Membandingkan sesuatu dengan suatu ukuran ;


Mengukur
bersifat kuantitatif
Mengambil keputusan dengan pertimbangan
Menilai
baik buruk ; bersifat kualitatif

Evaluasi Kegiatan mengukur dan menilai

Asesmen
Evaluasi
Penilaian Pendidikan

•Evaluasi merupakan sebuah proses pengumpulan data


Ralph Tyler (1950) untuk menentukan sejauh mana, dalam hal apa, dan
bagaimana tujuan pendidikan telah tercapai.

•Menambahkan : evaluasi bukan sekedar mengukur


Cronbach dan
sejauh mana tujuan tercapai, tetapi digunakan untuk
Stufflebean mengambil keputusan.
Sekolah diibaratkan tempat mengolah sesuatu memiliki “bahan
mentah” (siswa baru/in put) dan “hasil olahan” (keluaran/output)
sedang sekolah diibaratkan tempat pengolahan (transformasi).

Hubungan antara in put, transformasi dan output adalah sbb;

INPUT TRANSFOR OUTPUT


MASI

Umpan Balik
Makna
Menilai

• Mengetahui sejauh mana siswa berhasil mengikuti pelajaran yang


disampaikan guru.
Siswa

• Siswa telah berhasil mencapai tujuan pembelajaran


• Siswa yang belum berhasil mencapai tujuan pembelajaran,
• Metode yang digunakan sudah tepat atau belum,
Guru • Apakah materi yang disampaikan sudah tepat?

• Apakah lingkungan telah optimal mendukung pembelajaran ?


• Tepat/ tidak kurikulum sebagai bahan pertimbangan
Sekolah • Hasil penilaian sebagai pedoman : mencapai standar?
b. Fungsi sebagai
a. Fungsi diagnostik
penempatan

Why we must
to evaluate?

d. Fungsi pengukuran
c. Fungsi selektif
keberhasilan
Penilaian terkait dengan proses transformasi:
Sebelum kegiatan pembelajaran;
Apakah yang mau dicapai siswa?
Apakah siswa sudah punyai bagian kemampuan yang akan dicapai.

Selama kegiatan pembelajaran


1) Apa yang akan dicapai siswa melalui pembelajaran
2) Apakah langkah yang diambil guru sudah benar:
 Secara individu
 Secara kelompok

Setelah kegiatan Pembelajaran


1) Apakah tujuan yang ingin dicapai siswa telah tercapai
 Seberapa jauh
 Berapa orang

2) Jika belum tercapai, bagian mana yang belum tercapai, apa faktor penyebabnya
Ciri-ciri Penilaian dalam Pendidikan
a. Penilaian dilakukan secara tak langsung
 Melalui penyelesaian soal-soal

b. Menggunakan ukuran kuantitatif


c. Menggunakan unit-unit yang tetap (IQ 150) – normal
d. Bersifat relatif
e. Sering terjadi kesalahan.
• Pada alat ukur
• Penilai
• Anak yang dinilai
• Situasi penilaian berlangsung
Carl Witherington:
Anak pandai/ intelegen mempunyai:
Kemampuan bekerja dengan bilangan
Kemampuan menggunakan bahasa yang baik
Kemampuan menangkap sesuatu yang baru (cepat mengikuti
pembicaraan)
Kemampuan mengingat-ngingat
Kemampuan memahami hubungan
Kemampuan untuk berfantasi

David Lazer: tentang anak intelegen;


Kemampuan verbal
Kemampuan mengamati dan rasa
ruang
Kemampuan gerak kinetis-fisik
Kemampuan logik/matematika
Kemampuan hubungan intra personal
Kemampuan hubungan inter personal
Kemampuan dalam musik/irama
1% luar biasa mempunyai IQ 30-70
5% dungu, mempunyai IQ 70-80
14% bodoh, mempunyai IQ 80-90
60% normal, mempunyai IQ 90-110
14% pandai, mempunyai IQ 110-120
5% sangat pandai, mempunyai IQ 120-130
1% genius, mempunyai IQ > 130
1% luar biasa t.a:
•Idiot, IQ 0-25
•Imbisil, IQ 26-50
•Debil, IQ 51-70
PRINSIP DAN ALAT EVALUASI

1. Prinsip Evaluasi Triangulasi


Goals

PBM Evaluasi

Terdapat hubungan antara ketiga komponen tersebut.


Evaluator
2. Alat
menggunakan
Evaluasi
Teknik
evaluasi

Teknik nontes Teknik tes Merupakan alat


pengumpul informasi
bersifat lebih resmi

•Skala bertingkat (rating scale)


•Kuesioner (questionair) •Tes diagnostik
•Daftar cocok (check list) •Tes formatif
•Wawancara (interview) •Tes sumatif
•Pengamatan (observation)
•Riwayat hidup
Lanjutan.....

•Digunakan untuk mengetahui kelemahan-


Tes Diagnostik kelemahan siswa, untuk selanjutnya diberi
perlakuan yang tepat

Dokter Guru

Diagnosis Diagnostik

Terapi Bantuan
Lanjutan..... Manfaat tes formatif
bagi :

• Untuk mengetahui apakah siswa sudah menguasai bahan program secara


menyeluruh
• Merupakan penguatan (reinforcment) bagi siswa
• Usaha perbaikan
Siswa • Sebagai siagnosis

• Mengetahui sejauh mana bahan yang diajarkan telah dikuasai


• Bagian-bagian ajar mana yang belum jadi milik siswa
Guru • Dapat memprediksi sukses atau tidak program yang diberikan

• Apakah program yang telah diberikan tepat?


• Pogram membutuhkan pengetahuan prasyarat?
• Diperlukan alat, sarana dan prasarana?
Program • Metode, pendekatan, dan evaluasi sudah tepat?
Lanjutan.....
Manfaat tes sumatif
bagi:

a. Untuk menentukan nilai; kedudukan siswa

b. Untuk menentukan seorang anak dapat atau tidak


mengikuti kelompok dalam menerima program berikutnya

c. Untuk mengisi catatan kemajuan belajar siswa; bagi orang tua


siswa, BP, Pihak lain bila ia akan pindah
TES

1. Pengertian: Alat atau prosedur yang


digunakan untuk mengetahui atau
mengukur sesuatu dalam suasana,
dengan cara dan aturan-aturan yang
telah ditentukan

Istilah:
•Tes
•Testing
•Testee
•Tester
2. Syarat tes:
•Terikat dengan kualitas
•Pengadministrasian dalam
pelaksanaan
Lanjutan.....

Gilbert Sax
Kelemahan tes (1980)

•Menyinggung pribadi
•Mengkategorikan siswa secara tetap
•Tidak mendukung kecemerlangan dan daya kreasi siswa
•Hanya mengukur aspek tingkah laku yang sangat terbatas

3. Ciri-ciri tes yang baik


harus memiliki:
•Validitas
•Reliabilitas
•Objektivitas
•Praktibilitas
•Ekonomis
VALIDITAS
Agar dapat diperoleh data yang valid instrumen/alat evaluasi harus
valid. Dengan kata lain, instrumen evaluasi disyaratkan valid agar
dioperoleh hasil evaluasi yang valid.
Validitas:
•Soal secara keseluruhan
•Butir soal (item)
1. Ragam Validitas
1) Validitas logis: kondisi valid tersebut dipandang terpenuhi
karena instrumen yang bersangkutan sudah dirancang dengan
baik, mengikuti teori dan ketentuan yang ada.
Validitas ini ada dua macam:
• Validitas isi: instrumen evaluasi disusun berdasarkan isi
materi pelajaran
• Validitas konstrak (consttuct validity):
Instrumen evaluasi disusun berdasarkan konstrak aspek-
aspek kejiwaan yang seharusnya dievaluasi.
2) Validitas empiris:
Sebuah instrumen dikatakan memiliki validitas empiris apabila
sudah diuji dari pengalaman. Dengan demikian instrumen
tidak cukup disusun hanya berdasarkan ketentuan seperti
pada validitas logis, tetapi harus dibuktikan melalui
pengalaman.
Validitas empiris ada dua macam:
 Validitas “ada sekarang” (concurent validity): untuk
mengetahui apakah tes sudah valid atau belum diperlukan
kriterium masa lalu yang sekarang datanya dimiliki (seperti
nilai ulangan harian atau nilai tes sumatif tahun terdahulu)
 Validitas prediksi (predictive validity):
Suatu tes dikatakan memiliki validitas prediksi bila mempunyai
kemampuan untuk memprediksi apa yang akan terjadi pada
masa yang akan datang.
Contoh: tes masuk Perguruan Tinggi.
2. Cara Mengetahui Validitas Alat Ukur
Teknik Korelasi Product Moment; dikemukakan oleh Pearson:
 Rumus korelasi product moment dengan simpangan:

koefisien korelasi antara variabel x dan variabel y, dua


variabel yang dikorelasikan (x = X-X dan y = Y-Y)
= jumlah perkalian x dengan y
= kuadrat dari x
= kuadrat dari y
Rumus korelasi product moment dengan angka kasar:

Dimana:
= koefisien korelasi antara variabel X dan variabel Y, dua
variabel yang dikorelasikan
Nilai koefisien korelasi selalu terdapat antara -1,00 sampai
+1,00
Koefisien negatif menunjukkan hubungan kebalikan
Koefisien positif menunjukkan adanya kesejajaran.

Untuk melakukan interpretasi mengenai besarnya korelasi


adalah sbb:

Antara 0,800 sampai dengan 1,00 : sangat tinggi


Antara 0,600 sampai dengan 0,800 : tinggi
Antara 0,400 sampai 0,600 : cukup
Antara 0,200 sampai 0,400 : rendah
Antara 0,00 sampai 0,200 : sangat rendah
Penafsiran harga koefisien korelasi ada dua cara:
a. Dengan melihat harga r dan interpretasikan misalnya korelasi sangat tinggi,
tinggi, cukup, rendah dsb.
b. Dengan berkonsultasi ke tabel harga kritik r product moment sehingga dapat
diketahui signifikan atau tidak korelasi tersebut. Jika harga r < harga kritik dalam
tabel, maka korelasi tersebut tidak signifikan. Jika harga r > harga kritik dalam
tabel, maka korelasi tersebut signifikan.

1. Validitas Butir Soal atau Validitas Item


Jika dari hasil perhitungan mengenai validitas soal diketahui bahwa validitas
soal tes misal sangat rendah atau rendah, selanjutnya guru ingin mengetahui
butir-butir soal mana saja yang menyebabkan soal-soal secara keseluruhan
tersebut jelek karena validitas soalnya rendah maka perlu dicari validitas bitur
soal.

Sebuah item dikatakan valid apabila mempunyai dukungan yang besar


terhadap skor total. Skor pada validitas butir soal/ item menyebabkan skor
total menjadi tinggi atau rendah.
Untuk soal-soal bentuk objektif skor item biasa diberikan dengan 1 bagi item
yang dijawab benar, dan 0 (nol) bagi item yang dijawab salah.
Skor
No NAMA Butir Soal
total

1 2 3 4 5 6 7 8 9 10
1 Harto 1 0 1 0 1 1 1 1 1 1 8
2 Yoyo 0 0 1 0 1 0 0 1 1 1 5
3 Oki 0 1 0 0 0 1 0 1 0 1 4
4 Dina 1 1 0 0 1 1 0 0 1 0 5
5 Rosi 1 1 1 1 1 1 0 0 0 0 6
6 Dina 1 0 1 0 1 0 1 0 0 0 4
7 Lia 1 1 1 1 1 1 1 0 0 0 7

8 Annida 0 1 0 1 1 1 1 1 1 1 8

Misal akan dihitung validitas item no 6.


Skor tersebut sebagai X, skor total sebagai Y
No Nama X Y Ket.
X = skor item no 6
1 Harto 1 8 Y = skor total
2 Yoyo 0 5
3 Oki 1 4
4 Dina 1 5
5 Rosi 1 6
6 Dina 0 4
7 Lia 1 7
8 Annida 1 8

Data di atas dimasukan ke dalam rumus korelasi product


moment dengan angka kasar;
Koefisien validitas item no 6 adalah 0,52
Cara lain mencari validitas yaitu dengan menggunakan rumus
koefisien korelasi biseral:

Keterangan:
= koefisien korelasi biseral
= rerata skor dari subjek yang menjawab betul item yang
dicari validitasnya
= rerata skor total
= standar deviasi dari skor
= proporsi siswa yang menjawab benar

= proporsi siswa yang menjawab salah


Apabila item 6 dicari validitasnya dengan rumus tersebut maka
perhitungannya melalui langkah sebagai berikut:

1. Mencari

2. Mencari

3. Dari perhitungan kalkulator diperoleh harga standar deviasi,


yaitu Untuk n kecil, diambil standar
deviasi yang

4. Menentukan harga p, yaitu

5. Menentukan harga q, yaitu

6. Memasukan ke rumus
4. Tes Terstandar sebagai Kriterium
dalam Menentukan Validitas
Tes terstandar mempunyai identitas:
•Telah diuji coba beberapa kali di tempat yang berbeda-beda
•Telah diketahui koefisien validitas
•Telah diketahui koefisien reliabilitas
•Telah diketahui koefisien taraf kesukaran soal
•Telah diketahui koefisien daya pembeda.

Cara menentukan validitas soal yang menggunakan tes terstandar


sebagai kriterium dilakukan dengan cara mengalikan koefisien
validitas yang diperoleh dengan koefisien validitas tes terstandar.

Contoh perhitungan:
Tabel persiapan perhitungan validitas tes matematika
dengan kriterium tes standar matematika
Y2
No Nama X Y X2 XY Keterangan

1 Nining 5 7 25 49 35 X= hasil tes matematika yang dicari


validitasnya
2 Maruti 6 6 36 36 36

3 Bambang 5 6 25 36 30 Y= hasil tes terstandar

4 Seno 6 7 36 49 42

5 Hartini 7 7 49 49 49

6 Heru 6 5 36 25 30

Jumlah 35 38 207 244 222

Dimasukan ke rumus korelasi product moment dengan angka kasar


Jika tes terstandar diketahui validitasnya 0,89 maka bilangan 0,108
belum merupakan validitas yang dicari. Bilangan tersebut harus
dikalikan dengan 0,89 sehingga hasilnya = 0,108 x 0,89 = 0,096
5. Validitas Faktor
Validitas faktor adalah butir-butir soal dalam faktor dikatakan
valid bila mempunyai dukungan yang besar terhadap soal-soal secara
keseluruhan. Ini ditandai dengan adanya jumlah sekor untuk butir-
butir faktor tersebut menunjukkan adanya kesejajaran dengan skor
total.
Apabila suatu materi ajar t.a pokok-pokok bahasan atau
sekelompok pokok bahasan yang merupakan satu kesatuan.
Contoh :
Soal Fisika meliputi pokok bahasan bunyi (8 butir), cahaya
(12), dan listrik (10) t.a 30 butir soal.

Bila guru ingin mengetahui validitas faktor maka ada 3 faktor


dalam soal ini.
Butir-butir soal dalam faktor dikatakan valid apabila mempunyai
dukungan yang besar terhadap soal-soal secara keseluruhan; yakni
apabila jumlah skor untuk butir-butir faktor tersebut menunjukkan
adanya kesejajaran dengan skor total.

Cara mengetahui kesejajaran tersebut dengan menggunakan rumus


product moment.

Contoh: Misal akan mengetahui validitas faktor 1 (soal-soal


mengenai BUNYI);
Contoh Tabel Analisis Butir untuk menghitung validitas butir dan
vaiditas faktor
butir 1 2 3 4 5 6 7 8 skor fact 9 10 11 12 13 14 15 16 17 18 19 20 skor fact 21 22 23 24 25 26 27 28 29 30 skor fact skor total

siswa

A 1 0 1 1 1 1 0 1 6 1 0 1 0 1 0 1 0 1 0 1 0 6 1 0 1 1 1 0 1 1 1 0 7 19

B 1 1 1 1 1 1 1 0 7 1 1 1 1 0 1 1 1 1 0 0 1 9 1 1 1 1 1 1 1 1 1 0 9 25

C 1 0 1 0 1 0 1 0 4 1 1 0 0 0 0 1 1 0 1 1 0 6 1 0 1 1 0 1 1 0 1 1 7 17

D 0 1 1 0 0 0 0 1 3 0 0 0 1 1 0 1 0 1 0 0 0 4 1 1 0 0 1 0 0 0 1 1 5 12

E 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 0 1 1 11 1 1 1 1 1 1 1 1 1 1 10 29

F 1 1 0 1 1 0 1 1 6 1 0 1 1 1 1 1 1 0 1 1 0 9 1 1 1 1 1 0 0 1 1 1 8 21

G 1 0 1 0 1 1 0 1 5 1 0 0 0 1 1 1 0 1 1 1 0 7 1 1 1 1 0 0 0 1 1 1 7 19

H 1 1 1 1 1 0 1 1 7 1 1 1 1 1 0 1 1 1 1 0 1 10 1 1 1 1 1 1 1 1 1 0 9 26

I 1 1 1 0 0 0 1 1 5 1 0 1 1 0 0 0 0 1 1 1 0 6 1 1 0 1 1 0 0 1 0 0 5 16

J 1 0 1 0 1 0 1 0 4 1 0 0 0 0 0 0 1 1 1 0 1 5 1 1 0 1 1 0 0 0 1 1 6 15

K 1 1 1 1 1 1 1 0 7 1 1 1 1 1 1 1 1 1 1 0 0 10 1 1 1 1 1 1 1 0 1 1 9 26

L 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 1 1 1 12 1 1 1 1 1 1 1 1 1 1 10 30

M 1 0 0 0 1 1 1 1 5 1 1 0 1 1 0 1 1 0 1 1 0 8 1 1 0 0 0 1 1 1 1 1 7 20

Bunyi (faktor 1) Cahaya (faktor 2) Listrik (faktor 3)


Menghitung Kesejajaran Faktor 1 dengan skor total
Skor
Nama Skor X2 Y2
faktor 1 XY
siswa total (Y)
(X)
A 6 19 36 361 114
B 7 25 49 625 175
C 4 17 16 289 68
D 3 12 9 144 36
E 8 29 64 841 232
F 6 23 36 529 138
G 5 19 25 361 95
H 7 26 49 676 182
I 5 16 25 256 80
J 4 15 16 225 60
K 7 26 49 676 182
L 8 30 64 900 240
M 5 20 25 400 100
Jumlah .... .... .... .... ....
RELIABILITAS
1. Arti Reliabilitas Bagi Sebuah Tes
 Reliabilitas berhubungan dengan kepercayaan tes
 Suatu tes dikatakan memiliki taraf kepercayaan yang tinggi jika tes tersebut
memberikan hasil yang tetap. Seandainya hasilnya berubah-ubah, namun
perubahan itu tidak signifikan.
 Jika validitas terkait dengan ketepatan objek (tidak menyimpang dari
kenyataan; berarti data tersebut benar) maka reabilitas terkait dengan
pemotretan berkali-kali.
 Instrumen yang baik adalah instrumen yang dapat dengan ajeg memberikan
data yang sesuai dengan kenyataan.
Kata “ajeg” (tetap) tidak berarti sama , tetapi mengikuti perubahan secara
ajeg.
Misal: jika siswa A mula-mula lebih rendah dari siswa B, maka jika diadakan
pengukuran ulang si A juga berada lebih rendah dari B.

Scarvia B. Anderson dkk: Validitas dan Reliabilitas merupakan syarat penting


bagi tes
Validitas lebih penting, namun reliabilitas perlu, karena menyokong
terbentuknya validitas. Suatu tes mungkin reliabel tapi belum tentu valid.
Sebaliknya tes yang reliabel biasanya valid.
Terdapat tiga kelompok hal yang mempengaruhi hasil tes:
a. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes
dan kualitas butir-butir soal.
 Makin panjang tes makin tinggi reliabilitasnya.

Cara menghitung reliabilitas berhubung dengan penambahan


banyaknya butir soal, menggunakan rumus Spearman dan
Brown:
= koefisien reabilitas setelah tes
ditambah butir soal baru

= brp kali butir-butir soal itu ditambah

= besarnya koefisien reabilitas


sblm butir-butir soal ditambah
Contoh : suatu tes terdiri atas 40 butir soal mempunyai koefisien
reliabilitas 0,70 kemudian butir-butir soal itu ditambah menjadi 60
butir soal. Maka koefisien reabilitas baru adalah:

Dengan demikian penambahan 20 butir soal dari 40 butir soal


memperbesar koefisien reabilitas sebesar 0,09.

Menurut Remmers & Gage


b. Hal yang berhubungan dengan tercoba (testee)
Tes yang dicobakan kepada kelompok yang bukan dipilih
menunjukkan reliabilitas yang lebih besar daripada yang dicobakan
kepada kelompok tertentu yang dipilih.

c. Hal yang berhubungan dengan penyelenggaraan tes.


Petunjuk/ perintah sebelum tes dimulai
Pengawas
Suasana lingkungan.

2. Cara-cara Mencari Koefisien Reliabilitas


•Metode Bentuk Pararel (equivalent) dua buah tes yang pararel
dicari koefisien korelasi antar kedua tes sebagai koefisien.
Reabilitas. Kebaikan: tidak ada faktor “masih ingat soalnya” (practice
effect) atau carry-over effect
Kelemahan: tester harus menyusun dua seri tes, perlu waktu lama.
•Metode Belah Dua (Split-half method)
•Metode Tes Ulang (test-retest method)
Tester hanya membuat satu seri tes tapi tes dilakukan 2 kali.
single-test-double trial method.
•Hasil dari dua kali tes itu dihitung korelasinya.
•Tenggang waktu antar pemberian tes jadi masalah.
•Umumnya hasil tes yang kedua cenderung lebih baik. (tidak mengapa) Yang
penting harus ada kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh
koefisien korelasi yang tinggi.
Contoh:
Tes Pertama Tes Kedua
Siswa
Skor Rangking Skor Rangking
A 15 3 20 3
B 20 1 25 1
C 9 5 15 5
D 18 2 23 2
E 12 4 18 4

Skor tes kedua nampak naik tapi terjadi pada semua siswa.
Metode ini disebut juga self correlation method (korelasi diri sendiri)
•Metode Belah Dua (Split-half method)
Mengatasi kelemahan dua metode yang sebelumnya.
Tester hanya membuat satu seri tes dan satu kali melaksanakan tes
disebut juga single test-single trial method.
Pada waktu membelah dua dan mengkorelasikan dua belahan,
baru diketahui reabilitas separo tes. Untuk mengetahui reabilitas
seluruh tes harus digunakan rumus:
Rumus Spearman – Brown;

=Korelasi antar skor-skor setiap


belahan
= koefisien Reabilitas yang sdh
disesuaikan
Ada dua cara membelah butir soal:
1) Belahan ganjil genap
2) Belahan awal akhir.
Contoh perhitungan reabilitas dg metode belah dua
Langkah pertama : analisis item
item (butir soal) yang dijawab benar diberi skor 1, item yang
dijawab salah diberi skor 0.
Tabel analisis item tes matematika
1,2,
1,3,5 2,4,6 6,7,8
Nomor item skor 3,4,
No Nama ,7,9 ,8,10 ,9,10
5
1 2 3 4 5 6 7 8 9 10 total ganjil genap awal akhir

1 A 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5

2 B 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3

3 C 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3

4 D 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2

5 E 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1

6 F 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1

7 G 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2

8 H 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5
1) Pembelahan ganjil genap Gunakan rumus korelasi
Item ganjil Item genap product moment!
No Nama (1,3,5,7,9) (2,4,6,8,10)
(X) (Y)
1 A 5 3
2 B 3 2
3 C 0 4
4 D 3 2
5 E 3 3
6 F 4 0
7 G 4 3
8 H 3 5

Dihitung dengan rumus korelasi product moment dengan angka


kasar diketahui bahwa:
.Nilai ini baru menunjukkan reabilitas separo tes.
Oleh karena itu, untuk belahan ini disebut dengan istilah atau singkatan

Dari . Untuk mencari realiabilitas seluruh tes digunakan rumus Spearman-


Brown yang rumusnya lebih dikemukakan di depan, jika koefisien reliabilitas separo tes ini
dimasukkan ke dalam rumus hitungannya demikian:
2) Pembelahan Awal Akhir
Dihitung dengan rumus korelasi product moment dengan
angka kasar diperoleh =-0,3831. Dg rumus Spearman Brown
diperoleh = -0,5538

3) Penggunaan rumus Flanagan


Dimana:
= reabilitas tes
= varians belahan pertama
(belahan item ganjil)
= varians belahan kedua (item
genap)
= varians total yaitu varians skor
total
4) Penggunaan rumus Rulon

Dimana:
= varians beda
D = difference yaitu perbedaan antara
skor belahan pertama (awal) dengan
skor belahan kedua (akhir)

5) Penggunaan rumus K-R 20 Dimana:


= reabilitas tes secara total
= proporsi subjek yang
menjawab item dengan benar
= proporsi subjek yang
menjawab 1 item dg salah (q=1-p)
= jumlah hasil perkalian antara
p dan q
n = banyaknya item
S = standar deviasi test
6) Penggunaan rumus K-R 21

7) Penggunaan rumus Hoyt

atau

Keterangan:
= reabilitas seluruh soal
= Varians responden
= Varians sisa
Langkah-langkah penggunaan rumus Hoyt:
1. Mencari jumlah kuadrat responden
Rumusnya:

Keterangan:
= Jumlah kuadrat responden
= skor total tiap responden
= banyaknya item
= banyaknya responden atau subjek
Langkah 2:
Mencari jumlah kuadrat item dg rumus:

Keterangan:
= jumlah kuadarat item
= jumlah kuadrat jawaban benar seluruh item
= kuadrat dari jumlah skor total
Langkah 3:
Mencari jumlah kuadrat total dg rumus;

Keterangan:
= jumlah kuadrat total
= jumlah jawab benar seluruh item
= jumlah jawab salah seluruh item
Langkah 4:
Mencari jumlah kuadrat sisa, dg rumus;

Langkah 5:
Mencari Varians responden dan varians sisa dg Tabel F.
harus dicari derajat bebas (d.b) = N-1
Jadi Variansi =
Langkah 6:
Memasukkan ke dalam rumus
Mencari reliabilitas tes bentuk uraian
Butir soal uraian menghendaki graduasi penilaian
Skor untuk masing-masing butir soal dicantumkan pada kolom
item menurut apa adanya.

Rumus yang digunakan adalah rumus alpha:

Keterangan:
= reliabilitas yang dicari
= jumlah varians skor tiap-tiap soal
= varian total
Tabel analisis item
No
subjek Nomor item

1 2 3 4 5 6 7 8 9 10 11 12
1 1 1 0 1 1 1 0 1 1 1 0 1
2 1 1 0 1 1 0 0 1 0 0 1 0
3 1 0 0 0 0 0 0 1 0 1 0 1
4 1 1 1 1 1 1 1 1 1 1 1 1
5 1 0 1 1 1 1 0 1 1 1 1 1
6 0 0 0 1 1 0 0 1 1 0 0 1
7 1 1 0 1 1 0 0 1 0 0 0 1
8 1 0 0 1 1 1 0 1 1 1 0 1

Berdasarkan Tabel tsb diatas carilah reabilitas soal dg rumus-rumus


yang telah dipelajari pada bab ini !
TAKSONOMI
1. Arti dan Letak Taksonomi dlm Pendidikan
• Scriven (1967): Harus ada hubungan yang erat antara Kegiatan
Belajar dan Mengajar (KBM):
1). Tujuan Kurikulum dg bahan pelajaran
2). Bahan pelajaran dg alat evaluasi
3). Tujuan kurikulum dg alat evaluasi
• Tujan Pembelajaran harus dirumuskan oleh guru sebelum
pembelajaran berlangsung.
• Tujuan Pembelajaran harus dikomunikasikan kepada siswa.
•UU RI No 20 th.2003 tentang Sistem Pendidikan Nasional;
BAB II DASAR, FUNGSI DAN TUJUAN
Pasal 3:
Pendidikan nasional berfungsi mengembangkan kemampuan dan
membentuk watak serta peradaban bangsa yang bermartabat dalam
rangka mencerdaskan kehidupan bangsa, bertujuan untuk
berkembangnya potensi peserta didik agar menjadi manusia yang
beriman dan bertaqwa kepada Tuhan Yang Maha Esa, berakhlak
mulia, sehat, berilmu, cakap, kreatif, mandiri dan menjadi warga
negara yang demokratis serta bertanggung jawab.
Tujuan Pendidikan Nasional

Tujuan Institusional

Tujuan kurikulum

Tujuan Pembelajaran Umum (TPU/TIU)- dlm Kur 1975, 1984, 1994


(Standar Kompetensi (SK)- pada KBK dan KTSP

Tujuan Pembelajaran Khusus (TPK/TIK)- pada Kur 1975, 1984, 1994


Indikator (?)-pada KBK dan KTSP
•Tujuan Pembelajaran Umum – belum terukur
•Tujuan Pembelajaran Khusus – terukur

hasil pembelajaran

Perubahan tingkah laku

Ada tiga Ranah (domain): a. kognitif


(Menurut Bloom dkk)
b. afektif
c. psikomotor
Takwa:
Al Qur’an Surat 65
•Ayat 2 : “...Barang siapa bertakwa kepada Allah niscaya Dia akan
membukakan jalan keluar baginya”.
•Ayat 3 : “dan Dia memberinya rezekinya dari arah yang tidak
disangka-sangka. Dan barang sapa bertakwa kepada Allah,
niscaya Allah akan mencukupkan (keperluan)nya. ...”
•Ayat 4 : “... Dan barang siapa bertakwa kepada Allah, niscaya Dia
menjadikan kemudahan baginya dalam urusannya”.
•Ayat 5: “itulah perintah Allah yang diturunkanNya kepadamu;
barang siapa yang bertakwa kepada Allah, niscaya Allah akan
menghapus kesalahan-kesalahannya dan akan
melipatgandakan pahala baginya.
Bertakwa Al-qur’an Surat At-Talaq (65)

• “...Barang siapa bertakwa kepada Allah niscaya Dia akan membukakan jalan keluar
baginya”.
Ayat 2

• “dan Dia memberinya rezekinya dari arah yang tidak disangka-sangka. Dan barang
sapa bertakwa kepada Allah, niscaya Allah akan mencukupkan (keperluan)nya. ...”
• “... Dan barang siapa bertakwa kepada Allah, niscaya Dia menjadikan kemudahan
Ayat 3,4 baginya dalam urusannya”.

• “itulah perintah Allah yang diturunkanNya kepadamu; barang siapa yang bertakwa
kepada Allah, niscaya Allah akan menghapus kesalahan-kesalahannya dan akan
melipatgandakan pahala baginya.
Ayat 5
2. Taksonomi Bloom (1956)
Prinsip dasar yang digunakan oleh Bloom dan Krathwohl:
1) Prinsip metodologis 3) Prinsip logis
2) Prinsip psikologis 4) Prinsip tujuan

a. Ranah kognitif
a.1 Ingatan (Pengetahuan); terdiri atas:
• Mengenal (recognition)
siswa diminta memilih satu dari beberapa jawaban. Contoh:
Tumbuhan dibawah ini yang termasuk monokotil adalah
a. Zalaca edulls b. Muntingia calabura c. Lantana camara
• Mengungkap/mengingat kembali (recall)
siswa diminta untuk mengingat kembali satu atau lebih fakta-
fakta yang sederhana.
Contoh:
Organel sel yang berfungsi untuk respirasi sel disebut...
a.2. Pemahaman (comprehension)
Siswa diminta untuk membuktikan bahwa ia memahami
hubungan yang sederhana antara fakta-fakta atau konsep.
Contoh:
Jelaskanlah terjadinya proses pembekuan darah manusia !

a.3. Penerapan (Application)


Siswa dituntut memiliki kemampuan untuk memilih suatu
abstraksi tertentu (konsep, hukum, dalil, aturan, gagasan, cara)
secara tepat dan benar untuk diterapka dalam situasi baru.
Contoh:
Bila kita memiliki tanaman hias di rumah, pada malam hari sebaiknya
tanaman hia tsb di simpan di:
a. Ruang tamu b. Ruang keluarga
c. Kamar tidur d. Depan rumah
a.4. Analisis (Analysis)
Siswa diminta untuk menganalisis suatu hubungan atau situasi yang
kompleks atas konsep-konsep dasar.
Contoh:
v c

b
a t
a.5. Sintesis (Synthesis)
Siswa diminta untuk menggabungkan atau menyusun kembali
(recoganize) hal-hal spesifik agar dapat mengembangkan struktur
baru.
Contoh:
Dari hasil pengamatan dilapangan diperoleh data komponen biotik
sbb: semut, cacing, unggas, belalang, katak, rumput Paspalum.
Susunlah data tersebut di atas sehingga membentuk rantai
makanan!
a.6 Evaluasi (evaluation)
Siswa dituntut agar mampu menilai suatu kasus secara tepat dan benar.
Acuan “benar/salah” adalah hukum, dalil, prinsip pengetahuan.
Contoh:
Apabila seorang pasen bergolongan darah A ditransfusi dengan darah
golongan A sedangkan pasen kedua bergolongan darah B ditransfusi
dengan darah golongan A. Dari dua kasus tsb, kasus yang mana yang akan
berdampak tidak baik?

Note: Anderson dan David R. Krarhwohl.2001.A Taxonomy for learning,


Teaching, and Assessing. Longman. New York, San Francisco,
Boston, London, Toronto, Sydney, Tokyo, Singapore, Madrid,
Mexico City, Munich, Cape Town, Hong Kong, Montreal

Sintesis diganti dengan “Creat” (mencipta); Put elements together to from


a coherent or functional whole; recognize element into a new
pattern or structure.
Posisinya (“creat” menjadi a.6, sedangkan evaluasi pada posisi a.5
a.5. Sintesis;
Mengkatagorikan, mengombinasikan, mengarang,
menciptakan, membuat desain, menjelaskan,
memodifikasikan, mengorganisasikan, menyusun,
membuat rencana, mengatur kembali, merekonstruksikan,
menghubungkan, mereorganisasikan, merevisi, menuliskan
kembali, menuliskan, menceritakan.

1.6. Evaluasi (Evaluation);


Menilai, membandingkan, menyimpulkan,
mempertentangkan, mengkritik, mendeskripsikan,
membedakan, menerangkan, memutuskan, menafsirkan,
menghubungkan, membantu.
b. Ranah Afektiv (Affective domain)
b.1 Reesiving;
Menjawab, membantu, mendiskusikan, menghormat,
berbuat, melakukan membaca, memberikan, menghafal,
melaporkan, memilih, menceritakan, menulis.

b.2 Responding;
Menjawab, membantu, mendiskusikan, menghormat,
berbuat, melakukan, membaca, memberikan, menghafal,
melaporkan, memilih, menceritakan, menulis.

b.3 Valuing;
Menggambarkan, membedakan, memilih, mengusulkan,
kerja, mengambil bagian (share), mempelajari
b.4 Organization;
Mengubah, mengatur, menggabungkan, membandingkan,
melengkapi, mempertahankan, menerangkan,
menggeneralisasikan, mengidentifikasikan,
mengintegrasikan, mengorganisir, memodifikasikan,
menyiapkan, menghubungkan.

b.5 Characterization by value or vale complex


Membedakan, menerapkan, mengusulkan,
memperagakan, mempengaruhi, mendengarkan,
memodifikasikan, mempertunjukkan, menanyakan,
merevisi, melayani, memecahkan, menggunakan.
c. Ranah Psikomotor (Psychomotor domain)
c.1 Muscular or motor skills
Mempertontonkan gerak, menunjukkan hasil (pekerjaan
tangan), melompat, menggerakan, menampilkan,

c.2 Manipulations of materials or object


Mereparasi, menyusun, membersihkan, menggeser,
meindahkan, membentuk.

c.3 Neuromuscular coordination


Mengamati, menerapkan, menghubungkan,
menggandeng, memadukan, memasang, memotong,
menarik, menggunakan
TUJUAN PEMBELAJARAN
1. Tujuan Instruksional Umum (TIU)
2. Tujuan Instruksional Khusus (TIK)
(Kurikulum 1975)

1. Standar Kompetensi
2. Indikator
(KTSP)

Rumusan TIK (Indikator) yang lengkap memuat komponen:


 Audience
 Behavior
 Condition
 Degree
Audience : adalah Para siswa yang mengikuti
pembelajaran
Behavior : adalah perilaku yang diharapkan dalam tujuan
pembelajaran
Condition adalah komponen TIK yang menyatakan suatu
kondisi atau situasi yang dikenakan kpd siswa pada saat ia
mendemontrasikan tigkah laku akhir.
Contoh:
•Dengan penulisan yang betul
•Urut dari yang paling tinggi.
Degree adalah komponen TIK yang menunjukkan
seberapa jauh tingkat keberhasilan yang dituntut oleh
penilai bagi tingkah laku pelajaran pada situasi akhir.
1. Kata-kata Kerja untuk TIU (Kurikulum 1975)

• Mengetahui
• Memahami
• Mengerti Standar Kompetensi (KTSP)
• Menghayati
• Menyadari
• Menghargai

2. Kata-kata kerja Oprasional untuk menyusun Tujuan Pembelajaran


Khusus (TIK):
a. Ranah Kognitiv (Cognitive domain)
a.1. Pengetahuan (knowledge)
Mendefinisikan, mendeskripsikan, mengidentifikasikan,
mendaftarkan, menjodohkan, menyebutkan,
menggeneralisasikan, memberikan contoh, menuliskan kembali.
a.2. Pemahaman (comprehension)
Membedakan, menerangkan, menjelaskan, memperluas,
menyimpulkan, menggeneralisasikan, memberikan contoh,
memperkirakan.

a.3. Penerapan (Aplication)


Mengubah, menghitung, mendemontrasikan, menemukan,
memanipulasikan, memodifikasi, mengoprasikan, meramalkan,
menyiapkan, menghasilkan, menghubungkan, menunjukkan,
memecahkan, menggunakan.

a.4. Analisis (analysis)


Memerinci, menyusun diagram, membedakan, mengidentifikasikan,
mengilustrasikan, menyimpulkan, menunjukkan, menghubungkan,
memilih, memisahkan, membagi.
TES STANDAR DAN TES BUATAN GURU
Istilah standar dlm tes dimaksudkan: semua siswa menjawab
pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dgn
mengikuti petunjuk yang sama dan dlm batas waktu yang sama pula.

Istilah Standar tidak mengandung arti bahwa tes itu mengukur apa
yang harus dan dapat diajarkan pada suatu tingkat tertentu atau bahwa
tes itu menyiapkan suatu standar prestasi dimana siswa harus dan
dapat mencapai suatu tingkat tertentu. Tes standar dipolakan untuk
penampilan prestasi sekarang (yg ada) silaksanakan secara seragam,
diusahakan dalam kondisi seragam baik itu diberikan kpd seorang siswa
dlm pelaksanaan perseorangan maupun siswa sbg anggota kelompok.

Diusahakan sistem skoringnya snagat objektif sehingga reabilitasnya


tinggi, tidak kena bias karena faktor-faktor lain, dan penggunaan skor
dan norma yang relevan
Perbedaan tes standar dg tes buatan guru
Tes standar Tes buatan guru
1) Didasarkan atas bahan dan tujuan umum 1) Didasarkan atas bahan dan tujuan
dari sekolah-sekolah diseluruh negara. khusus yang dirumuskan oleh guru untuk
2) Mencakup aspek yang luas dan kelasnya sendiri
pengetahuan atau keterampilan dengan 2) Dapat terjadi hanya mencakup
hanya sedikit butir tes untuk setiap pengetahuan atau keterampilan yang
keterampilan atau topik sempit
3) Disusun dengan kelengkapan staf 3) Biasanya disusun sendiri oleh guru
profesor, pembahas, editor, butir tes. dengan sedikit atau tanpa bantuan orang
4) Menggunakan butir-butir tes yang sudah lain/ tenaga ahli
diujicobakan (try out), dianalisis dan 4) Jarang-jarang menggunakan butir-butir
direvisi sebelum menjadi sebuah tes. tes yang sudah diujicobakan, dianalisis,
5) Mempunyai reabilitas yang tinggi. dan direvisi.
6) Dimungkinkan menggunakan nor 5) Mempunyai reabilitas sedang atau
rendah
6) Norma kelompok terbatas kelas tertentu.
Prosedur untuk memperoleh tes standar:
•Penyususnan
•Uji coba
•Analisis
•Revisi
•Edit
Kegunaan Tes Standar
a) Jika ingin membuat perbandingan
b) Jika banyak orang yang akan memasuki sekolah tapi tidak tersedia data
tentang calon
Kegunaan Tes Buatan Guru
a) Untuk menentukan seberapa baik siswa telah menguasai bahan pelajaran
yang diberikan dalam waktu tertentu
b) Untuk menentukan apakah suatu tujuan telah tercapai
c) Untuk memperoleh nilai
Tes standar dan tes buatan guru dianjurkan dipakai jika hasilnya akan
digunakan untuk
1) Mengadakan diagnosis siswa
2) Menentukan tempat siswa dalam suatau kelas atau kelompok
3) Memberikan bimbingan
4) Memilih siswa-siswa untuk program khusus.
Kelengkapan Tes Standar
Tes stadar memiliki manual tes standar yang memuat:

1) Ciri-ciri mengenai tes


2) Tujuan serta keuntungan-keuntungan dari tes
3) Proses standarisasi tes
4) Petunjuk cara melaksanakan tes
5) Petunjuk cara menskor
6) Petunjuk interpretasi hasil
7) Saran-saran lain
PENYUSUNAN TES
Perbandingan Fungsi Tes
Fungsi untuk kelas Fungsi untuk bimbingan Fungsi untuk administrasi
a. Mengadakan diagnosis a. Menentukan arah a. Memberi petunjuk dalam
terhadap kesulitan belajar pembicaraan dengan mengelompokkan siswa
siswa orang tua tentang anak- b. Penempatan siswa baru
b. Mengevaluasi celah antara anak mereka c. Membantu siswa memilih
bakat dan pencapaian b. Membantu siswa dalam kelompok
c. Menaikkan tingkat prestasi menentukan pilihan d. Menilai kurikulum
d. Mengelompokkan siswa c. Membantu siswa e. Memperluas hubungan
dalam kelas pada waktu mencapai tujuan masyarakat (public
metode kelompok pendidikan dan jurusan relation)
e. Merencanakan d. Memberi kesempatan f. Menyediakan informasi
pembelajaran untuk siswa kepada pembimbing, guru, untuk badan-badan lain di
secara perseorangan dan orang tua dalam luar sekolah.
f. Menentukan siswa mana memahami kesulitan anak
yang memerlukan
bimbingan khusus
g. Menentukan tingkat
pencapaian untuk setiap
anak
Langkah-langkah Penyusunan Tes

a. Menentukan tujuan mengadakan tes


b. Mengadakan pembatasan terhadap bahan yang akan di teskan
c. Menentukan Tujuan Pembelajaran Khusus (TPK) dari setiap bagian bahan
d. Menderetkan semua TPK dlm tabel persiapan yang memuat pula aspek
tingkah laku yang terkandung dalam TPK itu. Contoh:
Tabel TPK dan aspek tingkah laku yang dicakup:
TPK Ingatan Pemahaman Aplikasi Keterangan
1. Siswa dapat 
menyebutkan fungsi
tiga organel sel
2. Siswa dapat 
membedakan reaksi
terang dengan reaksi
gelap pada peristiwa
fotosintesis
e. Menyusun Tabel spesifikasi yang memuat materi, aspek berfikir yang
dievaluasi, beserta imbangan antara kedua hal tersebut.
f. Menuliskan butir-butir soal, berdasarkan TPK-TPK yang telah tulis di dalam
Tabel spesifikasi.
TES TERTULIS PRESTASI BELAJAR
I. Tes tertulis untuk prestasi belajar dapat berbentuk tes subjektif
dan tes objektif. Masing-masing bentuk tes memiliki kebaikan
dan kelemahan.
1. Tes subjektif

Kebaikan Kelemahan
a. Mudah disusun a. Validitas dan reabilitas rendah
b. Tidak memberi kesempatan kepada b. Kurang dapat mencakup lingkup materi
siswa untuk bespekulasi dalam yang luas
menjawab c. Penilaian banyak dipengaruhi
c. Mendorong siswa berani subjektifitas penilai
mengemukakan pendapat serta d. Pemerikasaan jawaban sulit karena
menyusun dalam bentuk kalimat yang membutuhkan pertimbangan lebih
baik menurut gaya bahasa sendiri banyak dari penilai
d. Dapat diketahui sejauhmana siswa e. Perlu waktu yang lama untuk
mendalami suatu masalah memerikasa jawaban
2. Tes Objektif
Kebaikan Kelemahan
a. Dapat mencakup lingkup materi yang a. Proses penyusunan soal lebih sulit
luas b. Soal-soal cenderung mengukur aspek
b. Objektifitas tinggi berfikir tingkat rendah (ingatan dan
c. Mudah memeriksa jawaban karena ada pemahaman)
kunci jawaban c. Peluang berspekulasi dalam menjawab
d. Pemeriksaan jawaban dapt diwakilkan ke besar
orang lain d. Kemugkinan kerja sama dalam menjawab
lebih mudah terjadi
Cara memberi skor pada soal objektif
1. Tes tipe: B – S a. b.
S=R-W S=R

Keterangan: S = skor yang diperoleh


R = Right (jawaban yang benar)
W = Wrong (jawaban yang salah)
2. Tes tipe Pilihan Ganda (Multiple chOice):
a. s = R- W
Keterangan:
O-1
S = Skor yang diperoleh
b. S=R R = Jawaban betul
W = Jawaban salah
O = jumlah option
1 = bilangan tetap

3. Tes tipe menjodohkan (matching)

S=R
II. Penilaian ranah afektif
a. Skala Likert: Skala ini disusun dalam bentuk suatu pernyataan
dan diikuti oleh lima jawaban yang mneunjukkan tingkatan.
Misal:
SS = Sangat Setuju
S = Setuju
TB = Tidak Berpendapat
TS = Tidak Setuju
STS = Sangat Tidak Setuju

b. Skala Thursone
1 2 3 4 5 6 7 8 9 10

very neutral very


favourable unfavourable

c. Skala Guttman: Skala ini merupakan pernyataan- pernyataan yang


menghendaki jawaban “ya” atau “tidak”
d. Pengukuran minat: Skala ini sama dengan skala Likert
III. Pengukuran Ranah Psikomotor
Untuk mengukur hasil belajar yang berupa penampilan,
instrumennya dapat berupa matriks. Contoh:

Nama:........... Kelas:...........
Skor
No Keterangan 1 2 3 4 5
1. Terampil menyiapkan alat X
2. Tekun dalam bekerja X
3. Menggunakan waktu sangat efektif X
4. Mampu bekerja sama X
5. Memperhatikan keselamatan kerja X
6. Memperhatikan kebersihan X
7. Hasil masakan enak X

Skor : 5+3+2+3+3+5+4 = 25 = 3,57


7 7
TABEL SPESIFIKASI
1. Fungsi:
Agar soal yang disusun tidak menyimpang dari materi serta
aspek kejiwaan (tingkah laku) yang akan dicakup dalam tes.
• Disebut juga Grid, kisi-kisi, blue print
Aspek yang Ingatan Pemahaman Aplikasi Jumlah
Diungkap
Pokok
Materi:
Materi I ..... (25%) 1,2,6,7,8,9,10 3,4,9 5 10
Materi II ..... (40%) 11,18,22 12,13,14,15,19,20, 16,17,21,25,26 16
23,24
Materi III .....(35%) 27,32,26 28,33,37 29,30,31,34,35,38 14
,39,40
Jumlah (100%) 12 14 14 40
Tindak Lanjut Sesudah Penyusunan Tabel Spesifikasi
a. Menentukan bentuk soal
hal yang harus dipertimbangkan adalah
1) waktu yang tersedia
2) sifat materi yang dites

a.1. Ditinjau dari segi aspek berfikir:


• Mendaftar fakta-fakta, istilah, definisi yang terdapat dalam
materi yang akan diajarkan. Itu semua berhubungan dengan
aspek ingatan
• Mendaftar setiap konsep (pengertian) yang tercakup dalam
seluruh materi. Berhubungan dengan aspek pemahaman.
• Mencari hubungan antar dua atau beberapa konsep yang ada. Ini
berhubungan dengan aspek pemahaman atau juga aplikasi.
• Mempertentangkan konsep-konsep, menggeneralisasikan dan
menghubungkan dengan kehidupan sehari-hari. Ini berhubungan
dengan aspek aplikasi.
a.2 ditinjau dari segi konstruksi soal:
• Memilih fakta-fakta tunggal; bentuk soal B – S atau isian singkat
hubungan sebab akibat; bentuk soal Pilihan ganda
• Memilih konsep-konsep yang agak kompleks sifatnya bentuk soal
uraian.

b. Menuliskan soal tes


Hal-hal yang harus diperhatikan:
• Bahasa harus sederhana dan mudah dipahami.
• Suatu soal tidak boleh mengandung penafsiran ganda
• Petunjuk pengerjaan.
KISI-KISI PENULISAN SOAL (Model KTSP)
TAHUN AJARAN 2009/2010

Sekolah :......... Alokasi Waktu :.........


Mata Pelajaran :......... Jumlah :.........
Kelas/Program :......... Penulis :.........
No Urut Kompetensi Bahan Uraian Indikator Bentuk Tes Nomor
Dasar Kelas/smt Materi Soal Soal
ANALISIS HASIL TES
Menilai Tes yang Dibuat Sendiri

 Secara teori, siswa dalam suatu kelas merupakan populasi yg


heterogen,
 Bila diberi sebuah tes di kelas tsb maka hasilnya terdistribusi
menurut kurva normal.

 Apabila keadaan setelah hasil tes dianalisis tidak seperti yang


diharapkan dlm kurva normal, maka “ada apa” pada soal tesnya.
• Seluruh siswa memperoleh skor jelek? Perlu dilakukan analisis
• Seluruh siswa memperoleh skor baik?

Empat cara menilai tes:


a. Meneliti secara jujur soal yang sudah disusun di dapat informasi:
• Perintah tidak jelas
• Taraf kesukaran, dll.
Pertanyaan-pertanyaan tsb antara lain:
1) Apakah banyaknya soal untuk setiap topik sudah seimbang?
2) Apakah semua soal menanyakan materi ajar yang tlh diajarkan?
3) Apakah soal yang disusun tidak merupakan pertanyaan yang
membingungkan?
4) Apakah soal itu tidak sukar dimengerti?
5) Apakah soal itu dapat dikerjakan oleh sebagian besar siswa?

b. Dengan cara menganalisis soal (item analysis)


Diperoleh informasi yg sangat khusus mengenai butir soal yg disusun

Faedah menganalisis soal:


1) Membantu kita dlm mengidentifikasi butir soal yang jelek
2) Memperoleh informasi yang akan dpt digunakan untuk menyempurnakan
item
3) Memperoleh gambaran secara selintas ttg soal yg kita susun.
Analisis soal terutama dpt dilakukan untuk tes objektif.

c. Dengan cara mengecek validitas soal


Validitas yang paling penting untuk di cek : Validitas kurikuler (content
validity)
d. Dengan cara mengecek reliabilitas
Indikator soal memiliki reliabilitas tinggi a.l kebanyakan item
memiiki Daya beda yang tinggi.
Kesesuaian Tuj Pembel dgn butir soal
2. Analisis Butir Soal (item Analysis)
Meliputi:
a. Taraf kesukaran
b. Daya pembeda
c. Pola jawaban soal.

Taraf kesukaran
Indeks kesukaran (difficulty indeks) (P): 0,0 – 1,0
0,0 ---------------------------- 1,0
sukar mudah

P= B B= banyaknya siswa yg menjawab soal dg benar


JS JS= Jumlah seluruh siswa peserta tes
Klasifikasi indeks kesukaran:

• Soal dg P 0,00 – 0,30 soal sukar


• Soal dg P 0,30 – 0,70 soal sedang
• Soal dg P 0,70 – 1,00 soal mudah

b. Daya pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dg siswa yang bodoh
(berkemampuan rendah).

Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi


(D).

-1,00 0,00 1,00


(D) (-) (D) rendah (D) tinggi (+)

Tanda negatif pd (D) digunakan jika suatu soal “terbalik” menunjukkan kualitas
testee. Yaitu siswa pandai disebut bodoh dan siswa bodoh disebut pandai.
Seluruh pengikut tes dikelompokkan menjadi 2 kelompok, kelompok pandai atau
kelompok atas (upper group).

Jika seluruh kelompok atas dpt menjawab soal tsb dgn benar, sdg seluruh
kelompok bawah menjawab salah, maka soal tsb mempunyai D 1,00

Jika seluruh kelompok atas menjawab salah, tetapi semua kelompok bawah
menjawab betul, maka nilai D = -1,00

Jika siswa berkelompok atas dan siswa kelompok bawah sama-sama menjawab
benar atau sama-sama menjawab salah, maka soal tersebut mempunyai nilai D =
0,00 karena tidak mempunyai daya pembeda sama sekali.

Cara menentukan daya pembeda (nilai D)

a) Untuk kelompok kecil (siswa kurang dari 100 orang)


Seluruh kelompok testee dibagi dua sama besar, 50% kelompok atas 50%
kelompok bawah.
Contoh:
Siswa Skor
A 9
B 8
C 7 Kelompok atas (JA)
D 7
E 6

F 5
G 5
H 4 Kelompok bawah (JB)
I 4
J 3

b) Untuk kelompok besar


Untuk kelompok besar biasanya hanya diambil kedua kutubnya saja
27% skor teratas sbg kelompok atas (JA)
27% skor terbawah sbg kelompok bawah (JB)
Contoh:
9
9
8
8
8 27% Sebagai JA
.
.
.
.
.
.
.
.
.
.
2 27% Sebagai JB
1
1
1
0
Rumus untuk mencari D
D = BA – BB = PA – PB
JA JB

Keterangan :
J = Jumlah peserta tes
JA = Banyaknya peserta kelompok atas
JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas yang menjawab benar soal itu
BB = Banyaknya peserta kelompok bawah yang menjawab benar soal itu

PA = Proporsi peserta kelompok atas yang menjawab benar


PB = Proporsi peserta kelompok bawah yang menjawab benar
Contoh perhitungan:
Hasil tes yg terdiri atas 10 butir soal dikerjakan oleh 20 siswa adalah sbb
Siswa KLP Nilai Soal Skor
1 2 3 4 5 6 7 8 9 10 Siswa
A B 1 0 1 0 0 0 1 1 1 0 5
B A 0 1 1 1 1 1 0 0 1 1 7 A=5 K=7
C A 1 0 1 0 1 1 1 1 1 1 8 B=7 L=5
D B 0 0 1 0 0 1 1 1 1 0 5
E A 1 1 1 1 1 1 1 1 1 1 10 C=8 M=3
F B 1 1 1 0 0 1 1 1 1 0 6 D=5 N=7
G B 0 1 1 0 0 1 1 1 1 1 6
H B 0 1 1 0 0 1 0 1 1 1 6 E = 10 O=9
I A 1 1 1 0 0 1 1 1 1 1 8
J A 1 1 1 1 0 0 1 0 1 1 7
F=6 P=3
K A 1 1 1 0 0 1 1 1 1 0 7 G=6 Q=8
L B 0 1 1 1 1 0 0 1 1 0 5
M B 0 1 1 0 0 0 0 1 1 0 3
H=6 R=8
N A 0 0 1 0 1 1 1 1 1 1 7 I=8 S=6
O A 1 1 1 1 1 1 1 1 1 1 9
P B 0 1 1 0 0 1 0 0 1 0 3 J=7 T=6
Q A 1 1 1 1 0 1 1 1 1 1 8
R A 1 1 1 0 1 1 1 1 1 0 8
S B 1 0 1 0 0 1 1 1 1 0 6
T B 0 1 1 1 0 1 1 1 1 0 6
JMLH 11 15 1 8 6 16 15 17 20 10
Urutan dari skor tertinggi ke skor terendah

Klp Atas Klp Bawah


10 6
9 6 Item yang baik adalah item
8 6 yang mempunyai indeks
8 6 diskriminasi 0,4 – 0,7
8 6
8 5
7 5
7 5
7 3
7 3

10 orang 10 orang

(Lihat Tabel pd slide 9) Untuk butir soal no 8


Misal untuk butir soal no 1;
PA = 0,8 PB = 0,9
PA = 0,8 PB = 0,3 D = 0,8 – 0,9
D = 0,8 – 0,3 = -0,1
= 0,5
Klasifikasi daya pembeda (D)
D: 0,00 – 0,20 jelek (poor)
D: 0,20 – 0,40 cukup (satisfactory)
D: 0,40 – 0,70 baik (good)
D: 0,70 – 1,00 baik sekali (exellent)
D: negatif, tidak baik (sebaiknnya jangan digunakan)

c. Pola Jawaban Soal


Adalah distribusi testee dlm hal menentukan pilihan jawaban pd soal bentuk
PG. Pola jawaban soal didpt dg menghitung banyaknya testee yang memilih pilihan
jawaban a,b,c atau d atau yg tidak memilih jawaban manapun (blangko) atau omit (O).
Dari pola jawaban diketahui apakah pengecoh (distractor) berfungsi sbg pengecoh
dg baik atau tidak.
Pengecoh yg tk dipilih sama sekali berarti pengecoh yang jelek

Dg melihat pola jawaban soal, dpt diketahui:


1. Taraf kesukaran soal
2. Daya pembeda soal
3. Baik/tidaknya

Distraktor dikatakan baik jika minimal dipilih oleh 5% pengikut tes.


Contoh perhitungan:
Pilihan Jawaban A B C* D o Jumlah
Kelompok Atas 5 7 15 3 0 30
Kelompok Bawah 8 8 6 5 3 30
Jumlah 13 15 21 9 3 60

1) P = 21 = 0,35
60
2) D = PA – PB
= 15 – 6
30 30
=9
30
= 0,30
3) Distraktor : semua distraktornya berfungsi dengan baik karena sudah dipih oleh lebih dari
5% peserta tes.
4) Dilihat dari omitnya adalah baik, karena tidak lebih dari 10% peserta tes.
PENYUSUNAN TES
1. Fungsi Tes
 Fungsi untuk kelas
 Fungsi untuk bimbingan
 Fungsi untuk administrasi

Hal lain yang harus diingat:


 Hubungan dengan penggunaan
 Komprehensip
 Kontinu

2. Langkah-langkah dalam Penyusunan Tes


 Menentukan tujuan mengadakan tes
 Mengadakan pembatasan terhadap bahan yang akan di tes kan
 Merumuskan Tujuan Pembelajaran
 Menderetkan semua Tujuan Pembelajaran dalam tabel persiapan yang memuat
pula aspek tingkah laku terkadang dalam TIK itu.
 Menyusun Tabel Spesifikasi
 Menuliskan butir-butir soal.
Contoh soal (Pilhan ganda tipe asosiasi:

Pernyataan dibawah ini yang termasuk simbiosis


mutualisme yaitu:
1. Anggrek dengan pohon kelapa
2. Kupu-kupu dengan bunga
3. Hiu denga ikan remora
4. Kerbau dengan burung jalak

Faktor-faktor yang mempengaruhi evolusi adalah:


1. Adaptasi
2. Mutasi
3. Seleksi alam
4. Persilangan
PG tipe hubungan antar hal (sebab-akibat)
Pilihlah:
a. Jika pernyataan benar, alasan benar dan menunjukkan
hubungan sebab akibat
b. Jika pernyataan benar, alasan benar tapi tidak
menunjukkan hubungan sebab akibat
c. Jika pernyataan benar, alasan salah
d. Jika pernyataan salah, alasan salah
Contoh: Proses fotosintesis memerlukan cahaya
matahari sebab Fotosintesis tidak terjadi pada jamur.

Pada kondisi tertentu cahaya matahari menghambat


pertumbuhan tinggi pohon Sebab cahaya menguraikan
hormon auksin pada jaringan meristematik.
Menjodohkan (matching)

Ada dua kelompok (A dan B)


Kelompok A merupakan pernyataan yang menghendaki
jawaban
Kelompok B kumpulan alternatif jawaban. (kata/frase)

 Alternatif jawaban jumlahnya harus melebihi jumlah soal


(pernyataan)
ANALISIS HASIL TES
Menilai Tes yang Dibuat Sendiri

 Secara teori, siswa dalam suatu kelas merupakan populasi yg


heterogen,
 Bila diberi sebuh tes dikelas tsb maka hasilnya terdistribusi
menurut kurva normal.

 Apabila keadaan setelah hasil tes dianalisis tidak seperti yang


diharapkan dlm kurva normal, maka “ada apa” pada soal tesnya.
• Seluruh siswa memperoleh skor jelek? Perlu dilakukan analisis
• Seluruh siswa memperoleh skor baik?

Empat cara menilai tes:


a. Meneliti secara jujur soal yang sudah disusun di dapat informasi:
• Perintah tidak jelas
• Taraf kesukaran, dll.
Pertanyaan-pertanyaan tsb antara lain:
1) Apakah banyaknya soal untuk setiap topik sudah seimbang?
2) Apakah semua soal menanyakan materi ajar yang tlh diajarkan?
3) Apakah soal yang disusun tidak merupakan pertanyaan yang
membingungkan?
4) Apakah soal itu tidak sukar dimengerti?
5) Apakah soal itu dapat dikerjakan oleh sebagian besar siswa?

b. Dengan cara menganalisis soal (item analysis)


Diperoleh informasi yg sangat khusus mengenai butir soal yg disusun

Faedah menganalisis soal:


1) Membantu kita dlm mengidentifikasi butir soal yang jelek
2) Memperoleh informasi yang akan dpt digunakan untuk menyempurnakan
item
3) Memperoleh gambaran secara selintas ttg soal yg kita susun.
Analisis soal terutama dpt dilakukan untuk tes objektif.

c. Dengan cara mengecek validitas soal


Validitas yang paling penting unk di cek : Validitas kurikuler (content
validity)
d. Dengan cara mengecek reabilitas
Indikator soal memiliki reabilitas tinggi a.l kebanyakan item memiliki
Daya beda yang tinggi.

2. Analisis Butir Soal (item Analysis)


Meliputi:
a. Taraf kesukaran
b. Daya pembeda
c. Pola jawaban soal.

d. Taraf kesukaran
indeks kesukaran (difficulty indeks) (P): 0,0 – 1,0
0,0 1,0
sukar mudah

P= B B= banyaknya siswa yg menjawab soal dg benar


JS JS= Jumlah seluruh siswa peserta tes
Klasifikasi indeks kesukaran:

• Soal dg P 0,00 – 0,30 soal sukar


• Soal dg P 0,30 – 0,70 soal sedang
• Soal dg P 0,70 – 1,00 soal mudah

b. Daya pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dg siswa yang bodoh
(berkemampuan rendah).

Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi


(D).

-1,00 0,00 1,00


(D) (-) (D) rendah (D) tinggi (+)

Tanda negatif pd (D) digunakan jika suatu soal “terbalik” menunjukkan kualitas
testee. Yaitu siswa pandai disebut bodoh dan siswa bodoh disebut pandai.
Seluruh pengikut tes dikelompokkan menjadi 2 kelompok, kelompok pandai atau
kelompok atas (upper group).

Jika seluruh kelompok atas dpt menjawab soal tsb dgn benar, sdg seluruh
kelompok bawah menjawab salah, maka soal tsb mempunyai D 1,00

Jika seluruh kelompok atas menjawab salah, tetapi semua kelompok bawah
menjawab betul, maka nilai D = -1,00

Jika siswa berkelompok atas dan siswa kelompok bawah sama-sama menjawab
benar atau sama-sama menjawab salah, maka soal tersebut mempunyai nilai D =
0,00 karena tidak mempunyai daya pembeda sama sekali.

Cara menentukan daya pembeda (nilai D)

a) Untuk kelompok kecil (siswa kurang dari 100 orang)


Seluruh kelompok testee dibagi dua sama besar, 50% kelompok atas 50%
kelompok bawah.
Contoh:
Siswa Skor
A 9
B 8
C 7 Kelompok atas (JA)
D 7
E 6

F 5
G 5
H 4 Kelompok bawah (JB)
I 4
J 3

b) Untuk kelompok besar


Untuk kelompok besar biasanya hanya diambil kedua kutubnya saja
27% skor teratas sbg kelompok atas (JA)
27% skor terbawah sbg kelompok bawah (JB)
Contoh:
9
9
8
8
8 27% Sebagai JA
.
.
.
.
.
.
.
.
.
.
2 27% Sebagai JB
1
1
1
0
Rumus untuk mencari D
D = BA – BB = PA – PB
JA JB

Keterangan :
J = Jumlah peserta tes
JA = Banyaknya peserta kelompok atas
JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas yang menjawab benar soal itu
BB = Banyaknya peserta kelompok atas yang menjawab salah soal itu
PA = BA
JA= Proporsi peserta kelompok atas yang menjawab benar
PB = BB
JB= Proporsi peserta kelompok bawah yang menjawab benar
Contoh perhitungan:
Hasil tes yg terdiri atas 10 butir soal dikerjakan oleh 20 siswa adalah sbb
Siswa KLP Nilai Soal Skor
1 2 3 4 5 6 7 8 9 10 Siswa
A B 1 0 1 0 0 0 1 1 1 0 5
B A 0 1 1 1 1 1 0 0 1 1 7 A=5 K=7
C A 1 0 1 0 1 1 1 1 1 1 8 B=7 L=5
D B 0 0 1 0 0 1 1 1 1 0 5
E A 1 1 1 1 1 1 1 1 1 1 10 C=8 M=3
F B 1 1 1 0 0 1 1 1 1 0 6 D=5 N=7
G B 0 1 1 0 0 1 1 1 1 1 6
H B 0 1 1 0 0 1 0 1 1 1 6 E = 10 O=9
I A 1 1 1 0 0 1 1 1 1 1 8
J A 1 1 1 1 0 0 1 0 1 1 7
F=6 P=3
K A 1 1 1 0 0 1 1 1 1 0 7 G=6 Q=8
L B 0 1 1 1 1 0 0 1 1 0 5
M B 0 1 1 0 0 0 0 1 1 0 3
H=6 R=8
N A 0 0 1 0 1 1 1 1 1 1 7 I=8 S=6
O A 1 1 1 1 1 1 1 1 1 1 9
P B 0 1 1 0 0 1 0 0 1 0 3 J=7 T=6
Q A 1 1 1 1 0 1 1 1 1 1 8
R A 1 1 1 0 1 1 1 1 1 0 8
S B 1 0 1 0 0 1 1 1 1 0 6
T B 0 1 1 1 0 1 1 1 1 0 6
JMLH 11 15 1 8 6 16 15 17 20 10
Urutan dari skor tertinggi ke skor terendah

Klp Atas Klp Bawah


10 6
9 6 Item yang baik adalah item
8 6 yang mempunyai indeks
8 6 diskriminasi 0,4 – 0,7
8 6
8 5
7 5
7 5
7 3
7 3

10 orang 10 orang

(Lihat Tabel pd slide 9) Untuk butir soal no 8


Misal untuk butir soal no 1;
PA = 0,8 PB = 0,9
PA = 0,8 PB = 0,3 D = 0,8 – 0,9
D = 0,8 – 0,3 = -0,1
= 0,5
Klasifikasi daya pembeda (D)
D: 0,00 – 0,20 jelek (poor)
D: 0,20 – 0,40 cukup (satisfactory)
D: 0,40 – 0,70 baik (good)
D: 0,70 – 1,00 baik sekali (exellent)
D: negatif, tidak baik (sebaiknnya jangan digunakan)

c. Pola Jawaban Soal


Adalah distribusi testee dlm hal menentukan pilihan jawaban pd soal bentuk
PG. Pola jawaban soal didpt dg menghitung banyaknya testee yang memilih pilihan
jawaban a,b,c atau d atau yg tidak memilih jawaban manapun (blangko) atau omit (O).
Dari pola jawaban diketahui apakah pengecoh (distractor) berfungsi sbg pengecoh
dg baik atau tidak.
Pengecoh yg tk dipilih sama sekali berarti pengecoh yang jelek

Dg melihat pola jawaban soal, dpt diketahui:


1. Taraf kesukaran soal distractor
2. Daya pembeda soal
3. Baik/tidaknya

Distraktor dikatakan baik jika minimal dipilih oleh 5% pengikut tes.


Contoh perhitungan:
Pilihan Jawaban A B C* D o Jumlah
Kelompok Atas 5 7 15 3 0 30
Kelompok Bawah 8 8 6 5 3 30
Jumlah 13 15 21 9 3 60

1) P = 21 = 0,35
60
2) D = PA – PB
= 15 – 6
30 30
=9
30
= 0,30
3) Distraktor : semua distraktornya berfungsi dengan baik karena sudah dipih oleh lebih dari
5% peserta tes.
4) Dilihat dari omitnya adalah baik, karena tidak lebih dari 10% peserta tes.

Anda mungkin juga menyukai