SEPUTAR PENGUKURAN,
PENILAIAN, DAN
EVALUASI PENDIDIKAN
Oleh:
Prof. Dr.Yusrizal, M.Pd
Tiada gading yang tak retak, demikian juga buku ini mengandung
banyak kekurangan dan kekurangsempurnaan. Karenaya, penulis
menerima dengan hati terbuka berbagai saran dan kritik-kritik
konstruktif yang dapat dijadikan dasar perbaikan dalam
penerbitan berikutnya,
PRAKATA............................................................................. i
DAFTAR ISI.......................................................................... ii
BAB 1. Konsep Dasar Evaluasi ...................................................... 1
1. Pendahuluan.......................................................................... 1
2. Evaluasi ................................................................................ 5
3. Penilaian ............................................................................... 24
4. Pengukuran ........................................................................... 38
BAB 2. Taksonomi Tujuan Pendidikan ................................. 49
1. Pengertian ............................................................................. 49
2. Ranah Kognitif ..................................................................... 50
3. Ranah Afektif ....................................................................... 58
4. Ranah Psikomotor.................................................................63
BAB 3. Alat Ukur Tes ........................................................... 69
1. Pendahuluan.......................................................................... 69
2. Klasifikasi Tes ...................................................................... 75
3. Bentuk Tes ............................................................................ 84
BAB 4. Penyusunan dan Penulisan Soal................................111
1. Pendahuluan..........................................................................111
2. Kaedah Penulisan Soal .........................................................115
BAB 5. Analisis Butir Soal ....................................................129
1. Pengertian .............................................................................129
2. Tingkat Kesukaran Butir.......................................................139
3. Daya Beda Butir ................................................................... 142
4. Keefektifan Pengecoh ........................................................... 150
BAB 6. Validitas Alat Ukur Tes ............................................ 159
1. Konsep Dasar........................................................................ 159
2. Jenis-Jenis Validitas.............................................................. 160
BAB 7 . Reliabilitas Alat Ukur Tes ....................................... 181
1. Konsep Dasar........................................................................ 181
2. Jenis-Jenis Reliabilitas.......................................................... 182
BAB 8 .Penilaian (Asesmen) ................................................. 207
1. Penilaian Berbasis Kelas....................................................... 208
2. Penilaian Autentik ................................................................ 241
BAB 9 Alat Ukur Nontes ...................................................... 247
1. Konsep Dasar Nontes ........................................................... 247
2. Observasi .............................................................................. 248
3. Wawancara ........................................................................... 253
4. Kuesioner (Angket) .............................................................. 256
5. Sosiometri ............................................................................. 259
BAB 10.Pengukuran dan Penilaian Sikap ............................. 261
1. Konsep Dasar........................................................................ 261
2. Skala Likert........................................................................... 271
3. Skala Guttman ...................................................................... 276
4. Skala Thrustone .................................................................... 279
5. Skala Semantik Diferensial................................................... 281
BAB 11. Pengolahan Tes Hasil Belajar ................................. 291
1. Pengertian dan Konsep ......................................................... 291
2. Penskoran.............................................................................. 295
DAFTAR PUSTAKA ............................................................ 315
BAB 1. KONSEP – KONSEP
DASAR EVALUASI,
1 PENDAHULUAN
1. Mengapa seorang guru harus mampu menilai hasil
belajar siswa?
Jawab:
Seorang guru harus mampu menilai hasil belajar siswa
karena:
1) Dalam kegiatan belajar mengajar, terdapat tiga
kemampuan pokok yang dituntut dari seorang guru
yakni: kemampuan dalam merencanakan materi dan
kegiatan belajar-mengajar, kemampuan melaksanakan
dan mengelola kegiatan belajar-mengajar, serta
menilai hasil belajar siswa (Gagne, 1974)
2) Dalam Standar Nasional Pendidikan meliputi 8
standar yaitu: (1) standar isi, (2) standar proses, (3)
standar kompetensi lulusan, (4) standar pendidik dan
tenaga kependidikan, (5) standar sarana dan prasarana,
(6) standar pengelolaan, (7) standar pembiayaan, dan
(8) standar penilaian. Setiap pendidik harus
memahami landasan yuridis maupun filosofis yang
melatarbelakangi munculnya standar penilaian,
mekanisme, dan prosedur evaluasi.
1) Dalam Permendiknas No.16 Tahun 2007 tentang
Kualifikasi Akademik dan Standar Kompetensi Guru
dinyatakan bahwa salah satu kompetensi inti guru
adalah menyelenggarakan penilaian dan evaluasi
proses dan hasil belajar
1
2
a. Tes Kinerja
Tes Kinerja dalam hal ini adalah berbagai jenis tes
yang dapat berbentuk tes keterampilan tertulis, tes
identifikasi, tes simulasi, uji petik kerja, dan
sebagainya.
3
b. Demonstrasi
Teknik demonstrasi dapat dilakukan dengan cara
mengumpulkan data kuantitatif dan kualitatif sesuai
dengan kompetensi yang dinilai.
c. Observasi
Observasi terkait dengan kegiatan evaluasi proses dan
hasil belajar dapat dilakukan secara formal, yaitu
observasi dengan menggunakan instrumen yang
sengaja dirancang untuk mengamati unjuk kerja dan
kemajuan belajar peserta didik, maupun observasi
informal yang dapat dilakukan oleh pendidik tanpa
menggunakan instrumen.
d. Penugasan
Penugasan adalah bentuk evaluasi yang dapat
dilakukan dengan model proyek yang berupa sejumlah
kegiatan yang dirancang, dilakukan dan diselesaikan
oleh peserta didik di luar kegiatan kelas dan harus
dilaporkan, baik secara tertulis maupun lisan.
e. Portofolio
Portofolio adalah kumpulan dokumen dan karya-karya
peserta didik dalam karya tertentu yang
diorganisasikan untuk mengetahui minat,
perkembangan belajar dan prestasi siswa.
f. Tes tertulis
Tes tertulis merupakan teknik penilaian yang paling
banyak digunakan oleh pendidik, adalah tes yang bisa
berupa tes dengan jawaban pilihan atau isian, baik
pilihan ganda benar-salah ataupun menjodohkan, serta
tes yang jawabannya berupa isian ataupun uraian
g. Tes Lisan
Tes dapat pula berupa tes lisan, yaitu tes yang
dilaksanakan melalui komunikasi langsung dengan
bertatap muka antara peserta didik dengan satu atau
beberapa penguji.
h. Jurnal
Jurnal pada dasarnya merupakan catatan siswa selama
berlangsungnya proses pembelajaran, sehingga jurnal
4
2. EVALUASI
7. Apa yang dimaksud dengan Evaluasi ?
Jawab:
Istilah evaluasi berasal dari bahasa Inggris evaluation
yang berarti tindakan atau proses untuk menentukan nilai
sesuatu.
1) Evaluation refer to the act or process to determining
the value of something. Evaluasi mengacu pada suatu
tindakan atau suatu proses untuk menentukan nilai
dari sesuatu (Wandt dan Brown, 1957)
2) Evaluation is “the systematic process of collecting,
analyzing, and interpreting information to determine
the extent to which pupils are achieving instructional
objectives. (Answers the question “How
6
8. Discrepancy Model
Model ini ditekankan untuk mengetahui kesenjangan yang
terjadi pada setiap komponen program. Evaluasi
kesenjangan dimaksudkan untuk mengetahui tingkat
kesesuaian antara standar yang sudah ditentukan dalam
program dengan penampilan aktual dari program tersebut.
1. Pendekatan Eksperimental
Tujuan dari pendekatan ini adalah memperoleh
kesimpulan yang bersifat umum tentang dampak suatu
program dengan menciptakan situasi yang dikontrol,
seperti membandingkan kelompok yang menerima
program dan yang tidak. Pendekatan ini membuat
evaluator sebagai orang ketiga yang objektif dalam
menarik kesimpulan.
3. PENILAIAN
33. Apa yang dimaksud dengan penilaian?
Jawab:
Beberapa pengertian penilaian (assessment) yang
dikemukakan beberpa pakar, yaitu:
1) Penilaian adalah salah satu prosedur yang digunakan
untuk memperoleh informasi mengenai kinerja siswa
(Miller, Linn & Gronlund, 2009).
2) Penilaian adalah salah satu prosedur sistematik untuk
mengumpulkan informasi yang dapat digunakan
untuk membuat kesimpulan mengenai karakteristik
orang atau objek (Reynolds, at all, 2009).
3) Penilaian adalah proses yang memberikan informasi
tentang individu siswa, kurikulum atau program,
institusi atau segala sesuatu yang berkaitan dengan
sistem institusi (Stark dan Thomas, 1994).
4) Penilaian adalah suatu proses mengumpulkan data
dengan tujuan agar dapat dilakukan keputusan
mengenai suatu objek (Salvia dan Ysseldike,1996).
5) Penilaian adalah suatu pertimbangan profesional atau
proses yang memungkinkan seseorang untuk
membuat suatu pertimbangan mengenai nilai sesuatu
(Mehrens and Lehmann, 1984).
6) Penilaian merupakan proses kegiatan untuk
mengambil keputusan berdasarkan informasi yang
diperoleh dari pengukuran hasil belajar baik melalui
instrumen tes maupun non tes (Suryabrata, 2000).
Jadi Penilaian (assessment) adalah:
1) penerapan berbagai cara dan penggunaan beragam
alat penilaian untuk memperoleh informasi tentang
sejauh mana hasil belajar siswa atau ketercapaian
kompetensi siswa. Penilaian menjawab pertanyaan
tentang sebaik apa hasil atau prestasi belajar seorang
siswa.
25
Dimensi
No Penilaian Evaluasi
Perbedaan
1 Fokus Kepada luaran Kepada luaran
yang diinginkan yang diinginkan
oleh siswa/ oleh guru/dosen
mahasiswa (yang ((evaluator) dan
dinilai) dan pada pada kualitas
pertumbuhan
2 Pihak yang Diperlukan, Diperlukan,
memerlukan diminta oleh diminta oleh
siswa.mahasiswa evaluator
3 Konten, timing Formatif, Sumatif: final
dan tujuan berlangsung terus untuk
pokok untuk memper- memperbaiki
baiki pembelajaran kualitas
4 Konsekuensi Tidak memiliki Sering
konsekuensi/resiko mengandung
konsekuensi/resi
ko
5 Perbandingan Tidak pernah Sering
terhadap membandingkan membandingkan
kualitas kualitas kualitas
27
Dimensi
No Penilaian Evaluasi
Perbedaan
6 Pengembangan Memiliki standar Memiliki
standar kualitas yang standar kualitas
kualitas dikembangkan yang
oleh para dikembangkan
siswa/mahasiswa oleh evaluator
dengan bekerja
sama dengan
penilai
7 Orientasi Berorientasi Berorientasi
fokus dari proses: bagaimana produk: apa saja
pengukuran pembelajaran yang telah
berlangsung dipelajari
8 Temuan dan Diagnostik, Pertimbangan
penggunaanya mengidentifikasi sampai kepada
hal-hal yang perlu seluruh
perbaikan nilai/angka
9 Standar Mutlak komparatif
pengukuran (individual0
10 Hubungan Kooperatif Kompetitif
antara objek
dengan
penilaian/
evaluasi
Baehr dalam Basuki & Hariyanto, 2014)
4. PENGUKURAN
61. Jelaskan apa yang dimaksud dengan pengukuran ?
Jawab:
Secara sederhana pengukuran dapat diartikan sebagai
kegiatan atau upaya yang dilakukan untuk memberikan
angka-angka pada suatu gejala atau peristiwa, atau benda,
sehingga hasil pengukuran akan selalu berupa angka.
Pengukuran (measurement) adalah suatu proses atau
sistem yang digunakan untuk menentukan nilai kuantitatif
sesuatu hal, benda atau keadaan. Untuk memahami
pengertian pengukuran, berikut ini kita melihat beberapa
pendapat para ahli evaluasi.
1) Measurement is the act of process of measuring,
maksudnya suatu tindakan dari proses mengukur
(Wolf,1984)
2) Measurement is the assignment of numerals to objects
or events according to rules that give numeral
quantitative meaning”, yakni secara teknis,
pengukuran adalah pengalihan dari angka ke objek
atau peristiwa sesuai dengan aturan yang memberikan
makna angka secara kuantitatif (Wiersma dan Jurs,
1990)
3) Pengukuran adalah prosedur pemberian angka (biasa
disebut skor) untuk suatu atribut tertentu atau
karakteristik orang-orang sedemikian rupa untuk
menjaga hubungan dunia nyata antara orang-orang
berkaitan dengan atribut yang diukur (Lord and
Novick, 1974).
39
Contoh: Pekerjaan:
PNS 5
TNI/POLRI 4
Pedagang 3
Petani 2
Wiraswata 1
Nama
No Skor Nilai Keputusan
siswa
1 Abubakar 80 B Lulus baik
2 Dian 90 A Lulus sangat baik
3 Firdaus 75 B Lulus baik
45
4.Mengevaluasi pengajaran,
Pengukuran dan evaluasi dapat juga menilai pengajaran.
Melalui pengukuran dan evaluasi yang tak terpisahkan dari
proses, umpan balik tentang pengajaran, dapat bertindak
sebagai dasar penting untuk perbaikan dan peningkatan di
kelas.
BAB 2. TAKSONOMI
TUJUAN PENDIDIKAN
1. PENGERTIAN
81. Apa yang dimaksud dengan Taksonomi Tujuan
Pendidikan?
Jawab:
Taksonomi tujuan pendidikan (the taxonomy of
educational objective) adalah suatu kerangka untuk
mengklasifikasikan pernyataan-pernyataan yang
digunakan untuk mempredikasi kemampuan peserta didik
dalam belajar sebagai hasil dari kegiatan pembelajaran.
2. RANAH KOGNITIF
84. Bagaimana struktur ranah kognitif original
Taksonomi Bloom ?
Jawab:
Adapun struktur ranah kognitif original taksonomi Bloom
adalah:
1) Knowledge
(a) Knowledge of spesifics
Knowledge of terminology
Knowledge of spesific fact
(b) Knowledge of ways and means of dealing with
spesifics
Knowledge of conventions
Knowledge of trends and sequences
Knowledge of classifications and categories
Knowledge of criteria
Knowledge of methodology
(c) Knowledge of universals and abstraction in a field
Knowledge of principles and generalizations
Knowledge of theories and structures
51
2) Comprehension
(a) Translation
(b) Interpretation
(c) Extrapolation
3) Application
4) Analysis
(a) Analysis of elements
(b) Analysis of relationship
(c) Analysis of organizational principles
5) Synthesis
(a) Production of a unique communication
(b) Production of a plan, or proposed set of operations
(c) Derivation of a set of abstract relation
6) Evaluation
(a) Evaluation in terms of internal evidence
(b) Judgments in terms of external criteria
Menurut taksonomi Bloom, keterampilan manusia
dalam berpikir diklasifikasikan dalam enam kategori.
1) Knowledge:
remembering or recalling appropriate, previously
learned information to draw out factual (usually
right or wrong) answers. Use words and phrases
such as: how many, when, where, list, define, tell,
describe, identify, etc., to draw out factual
answers, testing students' recall and recognition.
2) Comprehension:
grasping or understanding the meaning of
informational materials. Use words such as:
describe, explain, estimate, predict, identify,
differentiate, etc., to encourage students to
translate, interpret, and extrapolate.
3) Application:
applying previously learned information (or
knowledge) to new and unfamiliar situations. Use
words such as: demonstrate, apply, illustrate,
show, solve, examine, classify, experiment, etc., to
52
1) Remember (Mengingat)
Mengingat adalah kemampuan memperoleh kembali
pengetahuan yang relevan dari memori jangka panjang.
56
2) Understand (Memahami)
Memahami adalah kemampuan merumuskan makna dari
pesan pembelajaran dan mampu mengkomunikasikannya
dalam bentuk lisan, tulisan maupun grafik. Siswa
mengerti ketika mereka mampu menentukan hubungan
antara pengetahuan yang baru diperoleh dengan
pengetahuan mereka yang lalu. Kategori Understand
terdiri dari proses kognitif Interpreting
(menginterpretasikan), Exemplifying (memberi contoh),
Classifying (mengklasifikasikan), Summarizing
(menyimpulkan), Inferring (menduga), Comparing
(membandingkan), dan Explaining (menjelaskan).
3) Apply (Menerapkan)
Menerapkan adalah kemampuan menggunakan prosedur
untuk menyelesaikan masalah. Siswa memerlukan latihan
soal sehingga siswa terlatih untuk mengetahui prosedur
apa yang akan digunakan untuk menyelesaikan soal.
Kategori menerapkan (Apply) terdiri dari proses kognitif
kemampuan melakukan (Executing) dan kemampuan
menerapkan (Implementing).
4) Analyze (Menganalisis)
Menganalisis meliputi kemampuan untuk memecah suatu
kesatuan menjadi bagian-bagian dan menentukan
bagaimana bagian-bagian tersebut dihubungkan satu
dengan yang lain atau bagian tersebut dengan
keseluruhannya. Analisis menekankan pada kemampuan
merinci sesuatu unsur pokok menjadi bagian-bagian dan
melihat hubungan antar bagian tersebut. Di tingkat
analisis, seseorang akan mampu menganalisa informasi
57
5) Evaluate (Menilai)
Menilai didefinisikan sebagai kemampuan melakukan
judgement berdasar pada kriteria dan standar tertentu.
Kriteria sering digunakan adalah menentukan kualitas,
efektifitas, efisiensi, dan konsistensi, sedangkan standar
digunakan dalam menentukan kuantitas maupun kualitas.
Evaluasi mencakup kemampuan untuk membentuk suatu
pendapat mengenai sesuatu atau beberapa hal, bersama
dengan pertanggungjawaban pendapat itu yang berdasar
kriteria tertentu. Adanya kemampuan ini dinyatakan
dengan memberikan penilaian terhadap sesuatu. Kategori
menilai terdiri dari Checking (mengecek) dan Critiquing
(mengkritik).
6) Create (Berkreasi)
Create didefinisikan sebagai menggeneralisasi ide baru,
produk atau cara pandang yang baru dari sesuatu kejadian.
Create di sini diartikan sebagai meletakkan beberapa
elemen dalam satu kesatuan yang menyeluruh sehingga
terbentuklah dalam satu bentuk yang koheren atau
fungsional. Siswa dikatakan mampu create jika dapat
membuat produk baru dengan merombak beberapa
elemen atau bagian ke dalam bentuk atau stuktur yang
belum pernah diterangkan oleh guru sebelumnya. Proses
create umumnya berhubungan dengan pengalaman
belajar siswa yang sebelumnya.
58
3. RANAH AFEKTIF
89. Jelaskan bagaimana jenjang hasil belajar ranah
afektif?
Jawab:
Ranah hasil belajar afektif adalah ranah yang berhubungan
dengan emosi seperti perasaan, nilai, apresiasi, motivasi
dan sikap. Menurut Krathwohl, et.all, 1964) ada lima
jenjang atau kategori dalam ranah afektif sebagai hasil
belajar; yaitu (a) Receiving/attending/menerima/
memperhatikan (b) Responding/menanggapi (c) Valuing/
penilaian (d) Organization/ Organisasi (e)
Characterization by a value or value complex/
karakteristik nilai atau internalisasi nilai
1) .Receiving (Menerima)
Merupakan tingkat afektif yang terendah, meliputi
penerimaan secara pasif terhadap suatu masalah, situasi,
59
1) Responding (Menanggapi)
Merupakan bagian afektif yang meliputi keinginan dan
kesenangan menanggapi atau merealisasikan sesuatu
sesuai dengan nilai-nilai yang dianut masyarakat. Tingkat
responding merupakan partisipasi aktif peserta didik, yaitu
sebagai bagian dari perilakunya. Pada tingkat ini peserta
didik tidak saja memperhatikan fenomena khusus tetapi ia
juga bereaksi.
Contoh: berpartisipasi dalam diskusi kelas.
2) Valuing (Penilaian)
Mengacu pada nilai dan kepercayaan terhadap gejala atau
stimulus tertentu. Reaksi-reaksi yang dapat muncul seperti
menerima, menolak atau tidak menghiraukan. Valuing
melibatkan penentuan nilai, keyakinan atau sikap yang
menunjukkan derajat internalisasi dan komitmen. Derajat
rentangannya mulai dari menerima suatu nilai, misalnya
keinginan untuk meningkatkan keterampilan, sampai pada
tingkat komitmen.
Contoh: mengapresiasi seni, menghargai peran,
menunjukkan keprihatinan, menunjukkan alasan perasaan
jengkel.
3) Organization (Organisasi)
Meliputi konseptualisasi nilai-nilai menjadi satu sistem
nilai. Sikap-sikap yang membuat lebih konsisten dapat
menimbulkan konflik-konflik internal dan membentuk
suatu sistem nilai internal. Pada tingkat organization, nilai
satu dengan nilai lain dikaitkan, konflik antar nilai
diselesaikan, dan mulai membangun sistem nilai internal
yang konsisten.
60
4) Characterization (Karakteristik)
Merupakan keterpaduan semua sistem nilai yang telah
dimiliki seseorang yang mempengaruhi pola kepribadian
dan tingkah lakunya. Misalnya bersedia mengubah
pendapat jika ditunjukkan bukti-bukti yang tidak
mendukung pendapatnya. Characterization nilai
merupakan tingkat ranah afektif tertinggi. Pada tingkat ini
peserta didik memiliki sistem nilai yang mengendalikan
perilaku sampai pada waktu tertentu hingga terbentuk gaya
hidup.
Contoh: menunjukkan rasa percaya diri ketika bekerja
sendiri, kooperatif dalam aktivitas kelompok
memodifikasi,
mengorganisasi, menyusun
5 Internalisasi menampilkan kepercayaan
nilai-nilai diri, menjaga, bekerjasama
(karakterisasi)
4. RANAH PSIKOMOTOR
Bloom tidak sempat merumuskan kategori/tingkatan
untuk ranah psikomotorik. Yang mengembangkan
kategori psikomotorik, adalah ahli psikologi lainnya,
yakni Dave (1967), Simpson (1972), dan Harrow (1972).
64
Kesiapan/Set,
Kemampuan untuk mempersiapkan diri, baik mental,
fisik, dan emosi, dalam menghadapi sesuatu. Contoh:
melakukan pekerjaan sesuai urutan, menerima kelebihan
dan kekurangan seseorang
Respon terpimpin (Guided respons)
Respon terpimpin (Guided respons), adalah langkah
permulaan dalam mempelajari keterampilan yang
kompleks, meliputi: menirukan, trial and error. Ketetapan
dari performance ditentukan oleh instruktur atau oleh
kriteria yang sesuai. Contoh: Mengikuti arahan dari
instruktur.
Mekanisme (Mechanism)
Mekanisme (Mechanism), merupakan performance yang
menunjukkan bahwa respons yang dipelajari telah
menjadi kebiasaan dan gerakangerakan dapat dilakukan
dengan penuh kepercayaan dan kemahiran. Ini merupakan
performance dari bermacam-macam keterampilan.
Contoh: menggunakan computer.
Originasi (Origination)
Originasi (Origination), yaitu penciptaan pola-pola
gerakan yang baru untuk menyesuaikan dengan
situasi/masalah yang khusus. Hasil belajarnya ditekankan
pada kreativitas yang didasarkan pada keterampilan
tingkat tinggi.
66
1) Kejujuran
a. Bahan tes atau tugas sama dengan bahan yang diajarkan
(validitas bahan);
b. Bahan tes atau tugas sama dengan tujuan
pembelajaran/kopetensi;
c. Tingkat kesulitan test atau tugas sesuai dengan tingkat
kemampuan peserta test;
d. Tidak ada test atau tugas yang mencurangi atau menipu;
e. Bobot test atau tugas ditetapkan atau dinyatakan.
2) Keseimbangan
a. Bobot atau banyaknya test atau tugas berbanding
dengan waktu yang digunakan untuk mengajar;
b. Jumlah test atau tugas sesuai dengan waktu yang
tersedia untuk penyelesaian;
c. Kesulitan test atau tugas berurutan dari yang mudah
hingga yang sulit;
d. Urutan tingkat kognisi dan afeksi test atau tugas
berurutan dari yang rendah sampai yang tinggi;
e. Tipe tes atau tugas bervariasi.
3) Kejelasan
a. Perintah dan instruksi tes atau tugas jelas;
b. Urutan tes atau tugas sama dengan urutan bahan ajar;
c. Lay-out tes atau tugas jelas;
d. Jarak spasi dan margin tes atau tugas jelas;
e. Tampilan tes atau tugas profesional.
75
2. KLASIFIKASI TES
116. Jelaskan bagaimana klasifikasi tes ?
Jawab:
1. Berdasarkan cakupan sasaran yang diukur
Tes diklasifikasikan atas dua kelompok besar yaitu tes
yang kinerja maksimum dan tes yang mengukur kinerja
tipikal (Fernandes, 1984)
a. Tes Kinerja Maksimum (Maximum
Perfoormance Test) adalah jenis tes yang
dirancang untuk mengungkap apa yang mampu
dilakukan oleh seseorang dan seberapa baik ia
mampu melakukannya (Azwar, 2010). Peserta tes
selalu didorong untuk berusaha sebaik-baiknya
agar memperoleh skor setinggi mungkin. Contoh
tes jenis ini yaitu: tes intelegensi, tes bakat, tes
prestasi belajar, dan sebagainya
b. Tes Kinerja Tipikal (Typical Performance Test)
adalah jenis tes yang dirancang untuk mengungkap
kecenderungan reaksi atau perilaku individu ketika
berada dalam situasi-situasi tertentu (Azwar, 2010).
Peserta tes didorong untuk memberi jawaban
sejujur-jujurnya. Contoh tes jenis ini misalnya: tes
minat, tes sikap, skala kepribadian, dan sebagainya.
4) Berdasarkan pelaksanaannya
Tes dibedakan atas:
a. Tes awal (Pre-Test)
Tes awal merupakan tes yang dilaksanakan sebelum
bahan pelajaran diberikan kepada siswa dengan
tujuan unyk mengetahui sejauh manakah materi atau
bahan pelajaran yang akan diajarkan telah dapat
dikuasai oleh siswa.
b. Tes akhir (Post-Test)
Tes akhir merupakan tes yang dilaksanakan dengan
tujuan untuk mengetahui apakah semua materi
pelajaran yang tergolong penting sudah dikuasi
dengan sebaik-baiknya oleh siswa. Pada dasarnya
materi pre-test sama dengan materi post-test.
Jawab:
Kelebihan tes tindakan antara lain:
a) Terjadinya pengecekan terhadap terbentuk atau
tidaknya ketrampilan yang dirumuskan di dalam
tujuan pembelajaran
b) Membuat pergantian suasana sehingga kejenuhan
dapat dikurangi atau dihilangkan.
3. BENTUK TES
129. Ada berapa macam bentuk tes ?
Jawab:
Secara umum bentuk tes hasil belajar dapat dibedakan
atas a).Tes Subjektif dan b).Tes objektif (Gronlund,
1982).
a. Tes Subjektif adalah tes yang dalam pemeriksaannya
banyak dipengaruhi oleh unsur-unsur subjektif
b. Tes Objektif adalah tes yang dalam pemeriksaannya
dapat dilakukan secara objektif
85
Contoh:
Kegiatan evaluasi terdiri dari:
(1) mengukur
(2) menguji
(3) menilai
(4) memberikan hasil
3. Bahasa/Budaya
a. Rumusan kalimat soal komunikatif
b. Butir soal menggunakan bahasa Indonesia yang
baku.
125
2. Konstruksi
a. Pernyataan dirumuskan dengan singkat (tidak
melebihi 20 kata) dan jelas.
b. Kalimatnya bebas dari pernyataan yang tidak
relevan objek yang dipersoalkan atau
kalimatnya merupakan pernyataan yang
diperlukan saja.
c. Kalimatnya bebas dari pernyataan yang bersifat
negatif ganda.
d. Kalimatnya bebas dari pernyataan yang
mengacu pada masa lalu.
e. Kalimatnya bebas dari pernyataan yang faktual
atau dapat diinterpretasikan sebagai fakta.
f. Kalimatnya bebas dari pernyataan yang dapat
diinterpretasikan lebih dari satu cara
126
3. Bahasa/Budaya
a. Bahasa soal harus komunikatif dan sesuai
dengan jenjang pendidikan peserta didik atau
responden.
b. Soal harus menggunakan bahasa Indonesia
baku.
c. Soal tidak menggunakan bahasa yang berlaku
setempat/tabu
Nomor Soal
NO Aspek yang ditelaah
1 2 3 4 5 ..
A Materi
1 Soal sesuai dengan
indikator (menuntut tes
tertulis untuk bentuk
pilihan ganda
2 Materi yang ditanyakan
sesuai dengan
kompetensi (urgensi,
relevasi, kontinyuitas,
keterpakaian sehari-hari
tinggi)
3 Pilihan jawaban homogen
4 dan logis
Hanya ada satu kunci
jawaban
134
Nomor Soal
NO Aspek yang ditelaah
1 2 3 4 5 ..
B Konstruksi
5 Pokok soal dirumuskan
dengan singkat, jelas, dan
tegas
6 Rumusan pokok soal dan
pilihan jawaban
merupakan pernyataan
yang diperlukan saja
7 Pokok soal tidak
memberi petunjuk kunci
jawaban
8 Pokok soal bebas dan
pernyataan yang bersifat
negatif ganda
9 Pilihan jawaban homogen
dan logis ditinjau dari segi
materi
10 Gambar, grafik, tabel,
diagram, atau sejenisnya
jelas dan berfungsi
11 Panjang pilihan jawaban
relatif sama
12 Pilihan jawaban tidak
menggunakan pernyataan
"semua jawaban di atas
salah/benar" dan
sejenisnya.
13 Pilihan jawaban yang
berbentuk angka/waktu
disusun berdasarkan
urutan besar kecilnya
angka atau kronologisnya
14 Butir soal tidak
bergantung pada jawaban
soal sebelumnya
C Bahasa/Budaya
15 Menggunakan bahasa
yang sesuai dengan
kaidah bahasa Indonesia
16 Menggunakan bahasa
yang komunikatif
135
Nomor Soal
NO Aspek yang ditelaah
1 2 3 4 5 ..
17 Tidak menggunakan
bahasa yang berlaku
setempat/tabu
18 Pilihan jawaban tidak
mengulang kata/
kelompok kata yang
sama, kecuali merupakan
satu kesatuan pengertian
tingkat kelas
Konstruksi
B Menggunakan kata tanya
5 atau perintah yang
menuntut jawaban uraian
Ada petunjuk yang jelas
tentang cara mengerjakan
6 soal
Ada pedoman
penskorannya
7 Tabel, gambar, grafik,
peta, atau
8 yang sejenisnya disajikan
dengan
jelas dan terbaca
Bahasa/Budaya
Rumusan kalimat coal
C komunikatif
9 Butir soal menggunakan
bahasa
10 Indonesia yang baku
Tidak menggunakan
11 kata/ungkapan
yang menimbulkan
penafsiran ganda atau
salah pengertian
Tidak menggunakan
bahasa yang
12 berlaku setempat/tabu
Rumusan soal tidak
13 mengandung
Tingkat
Jumah siswa yang menjawab benar butir soal
Kesukaran= Jumlah siswa yang mengikuti tes
atau dalam bentuk rumus :
∑𝐁
p = 𝐍
dengan :
p = Proporsi menjawab benar atau Indeks tingkat
kesukaran
∑ B = banyaknya peserta tes yang menjawab benar.
N = jumlah peserta tes yang menjawab.
Mean
Tingkat Kesukaran = Skor maksimumyang ditetapkan
Xb −Xs
rpbis = SD
√p/q
keterangan
rbis = koefisien korelasi point biserial
Xb = rata-rata skor siswa yang menjawab benar bagi
butir yang dicari validitasnya
Xs = rata-rata skor total
SD = simpangan baku skor total
P = proporsi siswa yang menjawab benar , yaitu
banyak siswa yang
menjawab benar dibagi dengan jumlah siswa
q = proporsi siswa yang menjawab salah
( q = 1 – p)
145
√3,357 = 1,398
∑𝑋 2 = 82 + 82 + 72 + 72 + 72 + 52 +62 + 52 +
52 +42
∑𝑋 2 = 402
(6) Menentukan korelasi dengan persamaan
Xb −Xs 6,5−6,2
rpbis = SD
√p/q = 1,398
√0,80/0,20 = 0,496
MeanA −MeanB
D= Skor Maks
dengan:
D = daya beda soal uraian
Mean A = rata-rata skor siswa pada kelompok atas
Mean B = rata-rata skor siswa pada kelompok bawah
Skor Maks = skor maksmum yang ada pada pedoman
penskoran
147
KA−KB
D = N(S
Maks −SMin )
keterangan :
D = Daya pembeda
KA = Jumlah skor kelompok atas
KB = Jumlah skor kelompok bawah
N = Jumlah siswa kelompok atas atau bawah
SMaks = Skor tertinggi setiap soal uraian
SMin= Skor terendah setiap soal uraian
Jawab:
Apabila suatu butir soal tidak dapat membedakan
kemampuan siswa di antara yang yang telah
memahami dan belum memahami materi, maka butir
soal itu dapat dicurigai "kemungkinan penyebabnya"
adalah:
D = KA/N – KB/N = PA - PB
150
4. KEEFEKTIFAN PENGECOH
263. Apa yang dimaksud dengan pengecoh atau
distraktor dalam
soal pilihan ganda ?
Jawab:
Pengecoh (distractor) yang juga dikenal dengan istilah
penyesat atau penggoda adalah pilihan jawaban
(option) yang bukan kunci, sebagai alternatif yang
mirip dengan kunci.
n−1
Ip = Np (N− N )
B
Keterangan:
Np = jumlah siswa yang memilih pengecoh
n = banyak option (pilihan)
N = jumlah siswa yang ikut tes
NB = jumlah siswa yang menjawab benar butir
soal ybs
Kriteria:
> 200% : sangat buruk
0 – 25% atau 176-200% : buruk
26%-50% atau 151-175% : kurang baik
51%-75% atau 126-150% : baik
76%-125% :sangat baik
Jumlah A B* C D E O Jumlah
Pilihan
Kelompok 1 13 1 - - - 15
Atas (BA)
Kelompok 3 5 2 4 - 1 15
Bawah (BB)
Jumlah 4 18 3 4 1 20
Penjelasan : Misalkan kunci butir itu B (B*)
O (omit) artinya tidak memberikan pilihan (kosong)
Ba −Bb
E= dimana : E = indeks efektivitas pengajaran
T
Ba = jumlah siswa yang menjawab
betul sesudah menerima
pengajaran
Bb = jumlah siswa yang menjawab
betul sebelum menerima
pengajaran
T = Total jumlah seluruh peserta tes
Soal 1 2 3 4 5
Pretes PR PT PR PT PR PT PR PT PR PT
(PR)
Postes
(PT)
1. A - + + + - - + - - +
2. B - + + + - - + - + +
3. C - + + + - - + - - +
4. D - + + + - - + - - +
5. E - + + + - - + - + +
6. F - + + + - - + - - -
Adopsi dari Joesmani, 1988-
+ = jawaban betul,
- = jawaban salah
Kesimpulan analisinya:
Soal 1 :adalah soal yang ideal, sebelum diajar semua
siswa menjawab salah, tetapi
setelah diajar semua siswa menjawab betul
Indeks Efektivitas Pengajaran adalah:
6−0
E= 6
= 100
0−0
E= 6
= ), 00
BAB 6. VALIDITAS
ALAT UKUR TES
1.KONSEP DASAR
281. Apa yang dimaksud dengan validitas ?
Jawab:
Validitas berasal dari kata validity yang mempunyai
arti sejauh mana ketepatan dan kecermatan suatu
instrumen pengukur (tes) dalam melakukan fungsi
ukurnya.
1) Validitas adalah suatu konsep yang berkaitan
dengan sejauh mana tes telah mengukur apa yang
seharusnya diukur (Supranata: 2004)
2) Validitas didefinisikan sebagai seberapa cermat
suatu alat ukur melakukan fungsi ukurnya
(American Psychological Association, 1999)
3) Validitas merupakan derajad sejauh mana tes
mengukur apa yang ingin diukur (Borg dan Gall,
1983).
4) Validitas berhubungan dengan interpretasi atau
makna dan penggunaan hasil pengukuran peserta
didik (Nitko, 1996).
N∑XY − (∑X)(∑Y)
rxy =
√{N∑X 2 − (∑X)2 }{N∑Y 2 − (∑Y)2 }
dengan
𝑟𝑥𝑦 : koefisien korelasi product moment
X : skor tiap pertanyaan/ item
Y : skor total
N : jumlah responden
Mp − Mt p
rbis = √
SD q
dengan:
rbis = koefisien korelasi point biserial
Mp = rerata skor dari subjek yang menjawab betul bagi
butir yang dicari validitasnya
Mt = rerata skor total
SD = standar deviasi dari skor total
p = proporsi siswa yang menjawab betul (banyaknya
siswa yang menjawab betul dibagi dengan
jumlah seluruh siswa)
q = proporsi peserta didik yang menjawab
salah (q = 1 – p)
Nomor Butir
Siswa Total
1 2 3 4 5 6 7 8 9 10
A 3 5 4 3 4 5 3 4 5 4 40
B 4 5 5 3 5 4 4 5 5 4 44
C 2 3 4 2 3 4 4 3 4 4 33
D 1 3 4 3 3 3 3 3 3 3 29
E 3 4 5 3 4 3 3 4 3 4 36
F 1 2 3 2 1 2 1 2 3 2 19
G 3 3 4 2 1 3 2 2 3 3 26
N∑XY − (∑X)(∑Y)
rxy =
√{N∑X 2 − (∑X)2 }{N∑Y2 − (∑Y)2 }
(7)(819) − (24)(227)
rxy =
√{7(88) − (24)2 }{7(7799 − (227)2 }
(5733) − (5448)
rxy =
√{(616) − (576)}{(54593) − (51529)}
(285) 285
rxy = = 350,1 = 0,814
√(40)(3064)
163
Skor
Nomor Soal
No Siswa Total
1 2 3 4 5 6 7 8 9 10
1 A 1 0 1 0 1 1 1 1 1 1 8
2 B 0 0 1 0 1 0 0 1 1 1 5
3 C 0 1 0 0 0 1 0 0 0 1 3
4 D 1 1 0 0 1 1 0 1 1 0 5
5 E 1 1 1 1 1 1 0 0 0 0 6
6 F 1 0 1 0 1 0 1 0 0 0 4
7 G 1 1 1 1 1 1 1 0 0 0 7
8 H 0 1 0 1 1 1 1 1 1 1 8
x 5 5 5 3 7 6 4 3 4 4 46
P 0,75
q 0,25
(8+ 3+5+6+7+8) 37
Mp = = = 6,17
6 6
(5) Menghitung Standar Deviasi dengan rumus
∑𝑥 2 = 288
Mp −Mt p
rpbis = √q
SD
Penilai Butir
1 2 3 4 5
A 1 0 1 1 0
B 1 1 0 1 0
C 1 0 1 1 1
D 0 0 1 1 0
E 0 0 1 1 1
Jlh cocok 3 1 4 5 2
Jlh tidak 2 4 1 0 3
cocok
Jika cocok = 1,
Jika tidak cocok= 0
Butir 1: Mp = 3, M = 5
CVR = (2 Mp/M) -1
CVR = (6/5) – 1 = 0,20, jadi butir 1
dinyatakan tidak valid
Butir 2: Mp = 1, M = 5
CVR = (2 Mp/M) -1
CVR = (2/5) – 1 = -0,60, jadi butir 2
dinyatakan tidak valid
Butir 3: Mp = 4, M = 5
CVR = (2 Mp/M) -1
CVR = (8/5) – 1 = 0,60, jadi butir 3
dinyatakan valid
Butir 4: Mp = 5, M = 5
CVR = (2 Mp/M) -1
CVR = (10/5) – 1 = 1,0, jadi butir 4 dinyatakan
valid
Butir 5: Mp = 2, M = 5
CVR = (2 Mp/M) -1
CVR = (4/5) – 1 = -0,20, jadi butir 5 dinyatakan
tidak valid
Penilai 1
Penilai/Kategori
Kurang penting
penting
Kurang A B
Penilai 2 penting
penting C D
Penilai/ Penilai 1
Kategori Kurang
penting penting
Kurang
4
penting 3
Penilai 2
penting 2 16
𝟏𝟔
Validitas isi =𝟒+𝟑+𝟐+𝟏𝟔 = 0,64
Jawab:
Pengujian validitas dilakukan pada setiap butir
pertanyaan, dan hasilnya dapat dilihat melalui hasil r-
hitung yang dibandingkan dengan r-tabel, dimana r-
tabel dapat diperoleh melalui df (degree of freedom) =
n-2 (signifikan 5%, n = jumlah sampel)
Siswa X Y 𝐗𝟐 𝐘𝟐 XY
G 51 47 2601 2209 2397
H 74 70 5476 4900 5180
I 70 65 4900 4225 4550
J 66 60 4356 3600 3960
∑x ∑y ∑x 2 ∑𝑦 2 ∑xy
603 551 37273 31217 34003
N∑XY − (∑X)(∑Y)
rxy =
√{N∑X 2 − (∑X)2 }{N∑Y 2 − (∑Y)2 }
(10)(34003) − (603)(551)
rxy =
√{10(37273) − (603)2 }{10(31217 − (551)2 }
(340030) − (332253)
rxy =
√{(372730) − (363609)}{(312170 − (303601)}
(7777)
rxy =
√(9121)(8569)
(7777) 7777
rxy = = = 0,879
√78157849 8840,7
BAB 7. RELIABILITAS
ALAT UKUR TES
1. KONSEP DASAR
324. Jelaskan pengertian reliabilitas itu ?
Jawab:
Reliability berasal dari kata rely yang artinya percaya
dan reliabel yang artinya dapat dipercaya.
Keterpercayaan berhubungan dengan ketetapan dan
konsistensi. Tes dikatakan dapat dipercaya apabila
memberikan hasil pengukuran hasil belajar yang
relatif tetap secara konsisten. Beberapa ahli
memberikan batasan reliabilitas.
1) Reliabilitas berhubungan dengan akurasi
instrumen dalam mengukur apa yang diukur,
kecermatan hasil ukur dan seberapa akurat
seandainya dilakukan pengukuran ulang
(Thorndike dan Hagen, 1977)
2) Reliabilitas adalah konsisten atau keajegan atau
ketetapan dari nilai yang diperoleh dari tiap
individu yang sama manakala diadakan tes ulang
dengan tes yang sama pada waktu yang berbeda
atau dengan butir soal yang sejenis (Anastasia dan
Urbina, 1997).
3) Reliabilitas adalah sejauh mana hasil pengukuran
dengan alat tersebut dapat dipercaya (Suryabrata,
2004)
4) Reliabilitas suatu tes adalah kesesuaian antara
dua upaya yang dilakukan untuk mengukur trait
yang sama melalui metode yang sangat serupa
(Bachman, 1990),
5) Reliabilitas merupakan derajat keajegan
(consistency) di antara dua buah hasil pengukuran
pada objek yang sama (Mehrens & Lehmann,
1984)
182
Keterangan
2 x r11 𝑟𝑥𝑥 = reliabilitas,
22
r𝑥𝑥 = 1+ r11 r11 = korelasi diantara
22 22
dua belahan
Siswa X Y
A 5 3
B 1 2
C 5 4
D 0 2
E 4 4
Keterangan :
X = jumlah skor butir belahan ganjil
Y = jumlah skor butir belahan genap
No X Y X2 Y2 XY
1 5 3 25 9 15
2 1 2 1 4 2
3 5 4 25 16 20
4 0 2 0 4 0
5 4 4 16 16 16
Jumlah 15 15 67 49 53
190
N∑XY − (∑X)(∑Y)
rxy =
√{N∑X 2 − (∑X)2 }{N∑Y 2 − (∑Y)2 }
Keterangan :
X = skor butir belahan ganjil
Y = skor butir belahan genap
N = jumlah responden
(5)(53) − (15)(15)
rxy =
√{(5)(67) − (225)}{(5)(49) − (225)}
265 − 225
rxy =
√(335 − 225)(245 − 225)
40 40 40
rxy = = = 46,9 = 0,85
√(110)(20) √2200
Keterangan:
r11 = 2 (1 − 𝑟11 = koefisien reliabilitas
SD2 2
1 + SD2
SD12 = varians belahan pertama
) SD22 = varians belahan kedua
SD2
t
SD2𝑡 = varias skor total
Siswa Butir
1 2 3 4 5 6 7 8 9 10
A 1 1 1 0 1 0 1 1 1 1
B 0 0 1 0 0 1 0 0 0 1
C 1 1 1 1 1 0 1 1 1 1
D 0 1 0 0 0 0 0 1 0 0
E 1 1 1 1 0 1 1 1 1 0
Adopsi dari Purwanto (2008)
192
2) Menghitung varians
Perhitungan varians dilakukan menggunakan rumus
sebagai berikut :
(∑ xi2 )
∑ X i2 −
SD2i = N
N
(𝟏𝟓)𝟐
67 − 67−45
SD12= 𝟓 𝟓 = 5
= 3,8
(15)2
49− 49−45
SD22 = 5
5
= 5
= 0,8
(30)2
222− 222−180
SD2t = 5
5
= 5
= 8,4
193
𝑆12 + 𝑆22
r11 = 2 (1 − 𝑆𝑡2
)
3,8+0,8
𝑟11 = 2 (1 = 8,4
)
4,6
r11 = 2 (1 − ) = 2(1 − 0,547) = 2 – 1,094 = 0,906
8,4
(∑ d)2
∑d2 − N
SD2d =
N
4) dan varian total dengan rumus
(∑xt )2
∑xt2 −
SD2t = N
N
5) Menghitung reliabilitas dengan rumus Rulon
Keterangan:
SD2d SD2𝑑 = varians beda
r11 = 1 - SD2
t SD2t = varians total
Siswa Butir
1 2 3 4 5 6 7 8 9 10
A 1 1 1 0 1 0 1 1 1 1
B 0 0 1 0 0 1 0 0 0 1
C 1 1 1 1 1 0 1 1 1 1
D 0 1 0 0 0 0 0 1 0 0
E 1 1 1 1 0 1 1 1 1 0
Adopsi dari Purwanto (2008)
Soal
Siswa
1 2 3 4 5 6
A 1 0 1 1 0 1
B 1 1 1 1 1 1
C 1 0 0 0 0 1
D 1 1 1 0 0 1
E 1 1 1 1 1 1
F 0 1 0 0 0 0
G 1 1 0 0 0 1
H 0 1 0 1 0 0
∑ 6 6 4 4 2 6 28 24.00
p 0,75 0,75 0,50 0,50 0,25 0,75 3,50
q 0,25 0,25 0,50 0,50 0,75 0,25 2,50
pq 0,19 0,19 0,25 0,25 0,19 0,19 1,26
Siswa Butir
1 2 3 4 5
A 15 20 17 18 20
B 10 7 12 9 10
C 5 7 5 8 5
D 20 20 17 20 18
E 15 17 15 18 17
F 7 8 7 5 9
G 15 17 14 15 15
H 20 19 17 20 17
I 15 15 16 14 15
J 4 3 4 4 3
Adopsi dari Purwanto (2008)
199
Siswa Butir Xi X i2
1 2 3 4 5
A 15 20 17 18 20 90 8100
B 10 7 12 9 10 48 2304
C 5 7 5 8 5 30 900
D 20 20 17 20 18 95 9025
E 15 17 15 18 17 82 6724
F 7 8 7 5 9 36 1296
G 15 17 14 15 15 76 5776
H 20 19 17 20 17 93 8649
I 15 15 16 14 15 75 5625
J 4 3 4 4 3 18 324
∑ 643 48723
∑𝑋𝑖 643
M= = = 64,3
𝑁 10
n M(n−M) 5
KR-21 =(n−1) (1 − ) = (5−1) (1 −
n SD2t
64,3(5−64,3
5 𝑥 737,81
)
Kr 21 =0.98
200
Siswa Butir
1 2 3 4 5
A 15 20 17 18 20
B 10 7 12 9 10
C 5 7 5 8 5
D 20 20 17 20 18
E 15 17 15 18 17
F 7 8 7 5 9
G 15 17 14 15 15
H 20 19 17 20 17
I 15 15 16 14 15
J 4 3 4 4 3
201
(∑x1 )2 1262
∑x2
1− 1890− 1890−1587,6
SD12 = N
= 10
= = 30,24
N 10 10
(∑x2 )2 1332
∑x2
2− 2135− 2135−1768,9
SD22 = N
= 10
= = 36,61
N 10 10
(∑x3 )2 1242
∑x2
3− 1778− 1778−1537,6
SD23 = N
= 10
= = 24,04
N 10 10
(∑x4 )2 1312
∑x2
4− 2005− 2005−1716,1
SD24 = N
= 10
= = 33,89
N 10 10
(∑x5 )2 1292
∑x2
5− 1967− 1967−1664,1
SD25 = N
= 10
= = 30,29
N 10 10
(∑xt )2 6432
∑x2
t− 48732− 48732−42344,9
SD2t = N
= 10
= = 737,71
N 10 10
(4) Mencari koefisien reliabilitas dengan rumus alpha
Cronbach
2
n SD2
t −∑(SDi ) 5 737,71−155,07 4 582,64
ᾶ=( ) =( ) = x = 9,99
n− 1 SD2
t 5−1 737,71 5 737,71
SEM = Sx √1 − rxx
dengan Sx = SD skor total tes
rxx = estimasi koefisien reliabilitas
Keterangan:
𝑟𝑛 = koefisien reliabilittas setelah ditambahkan soal
n = perkalian penambahan soal
r = koefisien reliabilitas awal
Observasi √
Penilaian diri √
Penilaian antar √
teman
Penilaian kinerja √ √
Penilaian √
portofolio
Penilaian proyek √ √
Penilaian produk √
Penilaian jurnal √
Inventori √
208
Menggali Informasi,
Penilaian kelas yang baik harus dapat memberikan
informasi yang cukup bagi guru untuk mengambil
keputusan dan umpan balik
Melihat yang benar dan yang salah,
Dalam melaksanakan penilaian, guru hendaknya
melakukan analisis terhadap hasil penilaian dan kerja
siswa secara seksama untuk melihat adanya kesalahan
yang secara umum terjadi pada siswa dan sekaligus
melihat hal-hal positif yang diberikan siswa.
371. Bagaimana karakteristik Penilaian Kelas ?
Jawab:
Adapun karakteristik penilaian kelas, yaitu:
Pusat belajar.
Penilaian kelas berfokus perhatian guru dan siswa pada
pengamatan dan perbaikan belajar, dari pada pengamatan
dan perbaikan mengajar
Partisipasi aktif siswa.
Karena difokuskan pada belajar, maka penilaian kelas
memerlukan partisipasi aktif siswa. Kerjasama dalam
penilaian, siswa memperkuat penilaian materi mata
pelajaran dan skill dirinya
Formatif.
Tujuan penilaian kelas adalah untuk memperbaiki mutu
belajar siswa. Penilaian bukan hanya untuk memberi nilai
atau skor (grading) siswa, tetapi juga untuk mendapatkan
informasi bagi perbaikan mutu belajar siswa.
Kontekstual spesifik.
Pelaksanaan penilaian kelas adalah jawaban terhadap
kebutuhan khusus bagi guru dan siswa. Kebutuhan khusus
berada dalam kontekstual guru dan siswa yang harus
bekerja dengan baik dalam kelas.
Umpan balik.
Penilaian kelas adalah suatu alur proses umpan balik
(feedback loop) di kelas.
212
Jawab:
Untuk mengevaluasi apakah penilaian kinerja
(Performance Assessment) sudah dapat dianggap
berkualitas baik, terdapat tujuh kriteria yang harus
diperhatikan yaitu:
a. Generability, artinya apakah kinerja peserta tes
(students’ performance) dalam melakukan tugas yang
diberikan guru sudah memadai untuk
digeneralisasikan dengan tugas-tugas lain?
b. Authenticity, artinya apakah tugas yang diberikan
tersebut sudah sesuai dengan apa yang sering
dihadapinya dalam praktek kehidupan sehari-hari?
c. Multiple foci, artinya apakah tugas yang diberikan
kepada peserta tes sudah mengukur lebih dari satu
kemampuan-kemampuan yang diinginkan (more than
one instructional outcomes?)
d. Teachability, artinya apakah tugas yang diberikan
merupakan tugas yang hasilnya semakin baik karena
adanya usaha mengajar guru di kelas?
e. Fairness, artinya apakah tugas yang diberikan sudah
adil (fair) untuk semua peserta tes, tidak “bias” untuk
semua kelompok jenis kelamin, suku bangsa, agama,
atau status sosial ekonomi.
f. Feasibility, artinya apakah tugas-tugas yang diberikan
dalam penilaian keterampilan atau penilaian kinerja
(“Performance Assessment”) memang relevan untuk
dapat dilaksanakan mengingat faktor-faktor seperti
biaya, ruangan (tempat), waktu, atau peralatannya?
g. Scorability, artinya apakah tugas yang diberikan dapat
diskor dengan akurat dan reliabel?
217
4. Memfokuskan 4. Memfokuskan
pembelajaran pada unjuk pembelajaran pada
kerja siswa materi pelajaran
219
Pronunciation
Grammar
Vocabulary
5 Performance ( eye contact,
facial expression, gesture)
Skor yang dicapai
Skor maksimum
Keterangan
Baik mendapat skor 1
Tidak baik mendapat skor 0
Nama Siswa:
Petunjuk:
Untuk setiap kemampuan berilah lingkaran pada nomor
1. bila siswa selalu melakukan
2. bila kadang-kadang
3. bila jarang, dan
4. bila tidak pernah
I. Ekspresi Fisik (Physical Expression)
A. Berdiri tegak melihat pada penonton
1 2 3 4
B. Merubah ekspresi wajah sesuai dengan perubahan
pernyataan yang
disajikan
1 2 3 4
Sumber: Setiadi, 2008
392. Bagaimana contoh instrumen penilaian kinerja yang
menggunakan Graphic Rating Scale ?
Jawab:
Nama Siswa:
Petunjuk:
Tulislah X pada garis dimana kemampuan siswa
teramati pada waktu
berpidato
I. Ekspresi Fisik (Physical Expression)
A. Berdiri tegak melihat pada penonton
Nama Siswa:
Petunjuk:
Tulislah X pada garis dimana kemampuan siswa teramati
pada waktu berpidato
I. Ekspresi Fisik (Physical Expression)
A. Berdiri tegak melihat pada penonton
b. Penilaian Proyek
395. Apa yang dimaksud dengan Penilaian Proyek ?
Jawab:
Penilaian proyek merupakan kegiatan penilaian
terhadap suatu tugas yang harus diselesaikan dalam
periode/waktu tertentu. Tugas tersebut berupa suatu
investigasi sejak dari perencanaan, pengumpulan data,
pengorganisasian, pengolahan dan penyajian data.
Penilaian projek adalah penilaian yang dilakukan
dengan memberikan tugas kepada peserta didik untuk
melakukan suatu projek yang melibatkan
pengumpulan, pengorganisasian, analisis data, dan
pelaporan hasil kerjanya dalam kurun waktu tertentu.
227
c. Penilaian Produk
399. Apa yang dimaksud dengan penilaian produk
( product assessment)
Jawab:
Penilaian hasil kerja (produk) adalah penilaian
terhadap keterampilan peserta didik dalam
mengaplikasikan pengetahuan yang dimiliki ke dalam
229
d. Penilaian Portofolio
405. Apa yang dimaksud dengan portofolio ?
Jawab:
Portofolio adalah kumpulan dokumen dan karya-karya
peserta didik dalam bidang tertentu yang
diorganisasikan untuk mengetahui minat,
perkembangan prestasi, dan kreativitas peserta didik
(Popham, 1995).
Portofolio adalah kumpulan hasil karya seorang siswa,
sebagai hasil pelaksanaan tugas kinerja, yang
ditentukan oleh guru atau oleh siswa bersama guru,
sebagai bagian dari uasaha mencapai tujuan
belajar, atau mencapai kompetensi yang
ditentukan dalam kurikulum.
No Pernyataan TP JR KD SR SL
1 Saya
menginformasikan
hal-hal yang
berkaitan dengan
fisika kepada
teman-teman
2 Saya bertanya
kepada guru hal-
hal yang
berhubungan
dengan pelajaran
fisika
3 Saya hadir setiap
ada jampelajaran
fisika di sekolah
4 Saya membuat
catatan yang rapi
untuk mata
pelajaran fisika
5 Saya menyerahkan
tugas-tugas fisika
tepat waktu
6 dan seterusnya
241
2. OBSERVASI
442. Apa yang dimaksud dengan observasi ?
Jawab:
Observasi adalah suatu teknik penilaian non-tes yang
menginventarisasikan data tentang sikap dan
kepribadian siswa dalam kegiatan belajarnya.
Observasi dilakukan dengan mengamati kegiatan dan
perilaku siswa secara langsung. Data yang diperoleh
dijadikan bahan penilaian
No Nama siswa SB B C K SK
1 Azizah √
2 Dian wahyuni √
3 Eva √
4 Farmawati √
5 Rosalia √
Keterangan : SB = Sangat Baik
B = Baik
C = Cukup
K = Kurang
SK = Sangat Kurang
452. Berikan sebuah contoh skala kiraan/lajuan (Rating
Scale) itu!
Jawab:
Contoh skala kiraan/lajuan (Rating Scale), misalnya
pedoman observasi keterampilan menulis
Nama Siswa :.............................
Kelas :...............................
Tanggal Observasi :..............................
No Aspek yang dinilai Skor pilihan
1 Cara memegang pensil 1 2 3 4 5
2 Posisi duduk waktu menulis
3 Posisi tangan terhadap kertas
4 Letak kertas yang akan ditulis
5 Jarak mata dari kertas yang akan
ditulis
6 Bentuk huruf
7 Cara merangkai huruf
8 Kejelasan tulisan
9 Keindahan tulisan
10 Kebenaran tulisan
Keterangan: 5 = Sangat Baik, 4 = Biak, 3 = Cukup, 2
= Tidak Baik 1 = Sangat Tidak Baik
253
3. WAWANCARA
453. Apa yang dimaksud dengan wawancara ?
Jawab:
An interview is a personal interaction between
interviewer (teacher) and one or more interviwees
(students) in which verbal questions are asked,
Wawancara adalah interaksi pribadi antara
pewawancara (guru) dengan satu atau beberapa yang
diwawancarai (siswa) ketika pertanyaan verbal
diajukan kepada mereka (Johnson and Johnson, 2002)
4.KUESIONER (ANGKET)
460. Apa yang dimaksud dengan kuesioner (angket) ?
Jawab:
Kuesioner (angket) adalah sebuah daftar pertanyaan
yang harus diisi oleh orang yang akan diukur
(responden).
Kuesioner (angket) adalah alat penilaian hasil belajar
yang berupa daftar pertanyaan tertulis untuk
menjaring informasi tentang sesuatu, misalnya tentang
latar belakang keluarga siswa, kesehatan siswa,
tanggapan siswa terhadap metode pembelajaran,
media, dan lain- lain
5. SOSIOMETRI
468. Apa yang dimaksud dengan sosiometri ?
Jawab:
Sosiometri adalah suatu teknik untuk mempelajari
atau mengetahui hubungan sosial peserta didik atau
subjek yang dinilai.
Petunjuk :
Petunjuk :
2) Skala Guttman
3) Skala Thrustone
4) Skala Differensial Semantik
2. SKALA LIKERT
494. Bagaimana penjelasan tentang Skala Likert ?
Jawab:
Skala ini mula-mula dikembangkan oleh Rensis Likert
untuk mengukur masyarakat di tahun 1932. Di dalam
skala ini menggunakan ukuran ordinal. Skala sikap
Likert tersusun atas beberapa pernyataan positif
(favorable statements) dan pernyataan negatif
(unfavorable statements) yang mempunyai lima
kemungkinan jawaban (option) dengan kategori yang
continuum, dari mulai jawaban sangat setuju (strongly
agree) sampai sangat tidak setuju (strongly disagree).
Dalam skala Likert, responden (subyek) diminta untuk
membaca dengan seksama setiap pernyataan yang
disajikan, kemudian ia diminta untuk menilai
pernyataan-pernyataan itu. Penilaian terhadap
pernyataan-pernyataan itu sifatnya subyektif,
tergantung dari kondisi sikap masing-masing individu.
Derajat penilaian siswa terbagi ke dalam 5 (lima)
kategori yang tersusun secara bertingkat, mulai dari
Sangat Tidak Setuju (STS), Tidak Setuju (TS), Netral
(N), Setuju (S), dan Sangat Setuju (SS) atau bisa pula
disusun sebaliknya.
Misalnya:
Contoh:
Sikap siswa terhadap pelajaran fisika
No Sikap Siswa STS TS N S SS
1 Pelajaran fisika
bermanfaat
2 Pelajaran fisika
sulit
3 Tidak semua
siswa harus
belajar fisika
4 Pelajaran fisika
harus dibuat
mudah
5 Harus banyak
latihan pada
Pelajaran fisika
Cara kedua:
Misalnya ingin diketahui sikap siswa terhadap
pembelajaran guru fisika. Untuk tujuan itu digunakan alat
ukur skala Likert skala 5, dan terdiri atas 30 butir
pernyataan. Maka langkah analisisnya adalah sebagai
berikut:
a. Menetukan skor maksimal. yaitu skor jawaban
terbesar dikali banyak item
5 x 30 = 150
b. Menetukan skor minimal. yaitu skor jawaban terkecil
di kali banyak item
1 x 30 = 30
c. Menentukan nilai rata-rata, yaitu hasil penjumlahan
skor maksimal dengan skor minimal dibagi dua (150 +
30) : 2 = 90
d. Mencari skor mentah untuk setiap siswa dengan
rumus:
Skor mentah = jumlah frekwensi x bobot
e. Membandingkan skor mentah setiap siswa dengan nilai
rata-rata
f. Menentukan keputusan sebagai berikut:
276
3. SKALA GUTTMAN
501. Bagaimana penjelasan lebih lanjut Skala
Guttman?
Jawab:
Skala Guttman dikembangkan oleh Louis Guttman. (1)
Skala Guttman merupakan skala kumulatif. Artinya
jika seseorang mengiyakan pertanyaan yang berbobot
lebih berat, maka ia juga akan mengiyakan pertanyaan
yang kurang berbobot lainnya. (2) Skala Guttman
ingin mengukur satu dimensi saja dari suatu variabel
yang multi dimensi, sehingga skala ini termasuk
mempunyai sifat idimensional.(3) Skala guttman
selain dapat dibuat dalam pilihan ganda juga dapat
dibentuk dalam chek list, jawaban yang dibuat skor
tertinggi satu dan yang terendah nol.(4) Pada skala
Guttman jawaban yang diberikan sangat tegas,
misalnya setuju atau tidak setuju, ya atau tidak, positif
atau negatif, dan sebagainya. Jawaban yang harus
diberikan pada skala Guttman dengan membubuhkan
tanda cek (√) pada kolom “setuju” atau “tidak Setuju”.
Jadi ada dua kategori yang dikothomi.
Contoh:
1) Pengguguran kandungan dapat diterima apapun
alasannya
2) Pengguguran kandungan dapat diterima bila
untuk alasan KB
3) Pengguguran kandungan dapat diterima bila
sebagai akibat perkosaan
277
e
Kr = 1 - n
di mana:
n = jumlah kemungkinan jawaban, yaitu jumlah
pertanyaan x jumlah responden.
e = jumlah error.
Kr = koefisien reprodusibilitas
Skala Guttman menghendaki nilai Kr > 0,90
4. SKALA THRUSTONE
507. Bagaimana penjelasan lebih lanjut tentang Skala
Thrustone ?
Jawab:
Skala Thurstone atau sering juga disebut metode equal
appearing interval memuat sejumlah pernyataan yang
harus dipilih oleh responden, yang masing-masing
telah diberi skor (bobot) tertentu. Pernyataan yang
kontribusinya terhadap sikap lebih tinggi diberi skor
lebih besar, sebaliknya pernyataan yang kontribusinya
lebih rendah diberi skor lebih kecil. Cara penentuan
skor untuk setiap pernyataan yang disajikan
dipertimbangkan oleh pembuat angket, atau
(sebaiknya) meminta pertimbangan beberapa ahli agar
lebih obyektif.
Thurstone dibuat dalam bentuk sejumlah (40-50)
pernyataan yang relevan dengan variable yang hendak
diukur kemudian sejumlah ahli (20-40) orang menilai
relevansi pernyataan itu dengan konten atau konstruk
yang hendak diukur. Adapun contoh skala penilaian
model Thurstone adalah seperti gambar di bawah ini.
280
Contoh:
Berikan tanda√ pada nomor yang isinya disetujui
1. -------- Ruang kelas terbuka menjurus ke
kenakalan anak
2. -------- Saya tidak mau anak saya masuk ke
sekolah dengan ruang kelas terbuka
3. -------- Anak yang belajar di ruang kelas terbuka
menjadi lebih kreatif
4. -------- Ruang kelas terbuka terlalu tidak
berdisiplin untuk belajar maksimum
5. -------- Ruang kelas terbuka adalah tipu daya
kaum komunis
6. -------- Ruang kelas terbuka memperlancar
perkembangan afektif anak
7.
8.
9. -------- Suara di ruang kelas terbuka terlalu
nyaring untuk dapat memperlancar belajar
Contoh:
Petunjuk: Berilah tanda cek (√) di atas tanda (-)
sesuai dengan sikap anda terhadap pembelajaran guru
di kelas.
282
Pelajaran Fisika
Pernyataan +3 + 2 +1 0 -1 -2 -3 Pernyataan
Kiri Kanan
Menyenangkan - - - - - - - Mombosankan
Sulit - - - - - - - Mudah
Bermanfaat - - - - - - - Sia-sia
Menantang - - - - - - - Menjemukan
Hafalan - - - - - - - Penalaran
2. PENSKORAN
531. Bagaimana cara penskoran soal pilihan ganda
ragam biasa?
Jawab:
Dalam penskoran untuk soal bentuk pilihan ganda
ragam biasa, ada 2 macam yaitu dengan hukuman dan
tanpa hukuman.
(1) Pemberian skor tanpa hukuman dengan rumus
berikut:
S = ∑R dengan : S = Score , ∑R =Right, W =Wrong
Skor yang diperoleh sebanyak jumlah soal yang
benar dikurangi dengan jumlah yang salah
(2) Pemberian skor dengan hukuman menggunakan
rumus, yaitu :
∑W
S = ∑R -
k−1
dengan:
S = skor yang dicari
∑R = jumlah jawaban benar
∑W = jumlah jawaban salah
k = jumlah pilihan jawaban (option)
Contoh:
- Banyaknya soal = 10 buah (T)
- Banyaknya yang betul = 8 buah (R)
- Banyaknya yang salah = 2 buah (W)
- Banyaknya pilihan = 4 buah (k)
- Maka skornya menjadi : 8 - {2 / (4 - 1)} = 8 - (2 / 3) = 7,33
296
∑W
S = ∑R - ( ) x Wt
k−1
(1) S = ∑R – ∑W
Keterangan: S = skor yang dicari
∑R = jumlah jawaban betul
∑W = jumlah jawaban salah
Contoh:
- Banyaknya soal = 10 buah (T)
- Banyaknya yang betul = 8 buah (R)
- Banyaknya yang salah = 2 buah (W)
- Skornya menjadi (S) : 8 - 2 = 6
Jika pemberian skor dengan hukuman/denda
(2) S = T - 2W (T singkatan dari total, artinya
jumlah soal dalam tes)
297
Contoh .
- Banyaknya soal = 10 buah (T)
- Banyaknya yang betul = 8 buah (R)
- Banyaknya yang salah = 2 buah (W)
- Skornya menjadi 10 - (2x2) = 10 - 4 = 6
∑W
S = R - (n
1 − 1)(n2 − 1)
b) Metode Rating
Dalam metode rating, jawaban sempurna tidak
dibagi-bagi kepada bagian-bagian. Guru yang
melakukan penskoran membaca dengan sekasama
setiap soal, dan menangkap ruang lingkup yang
ada dalam jawaban. Langkah-langkah
penskorannya adalah:
(a) Membaca jawaban siswa
(b) Mengelompokkan jawaban siswa ke dalam
salah satu kategori yang menunjukkan tingkat
kualitas jawaban (sangat baik, baik, sedang,
kurang, sangat kurang)
(c) Membandingkan jawaban dengan kategori
yang diberikan pada jawaban
(d) Skor yang diberikan sesuai dengan kategori
itu merupakan skor akhir jawaban siswa dari
soal tersebut.
299
𝑛1 n2
S = Wt1[ 𝑥 100 ] + Wt 2 [ 𝑥 100]
𝑛1 n2
dengan : Wt1 = bobot soal 1 dan Wt2 = bobot soal 2
301
Skor Mentah
Nilai = x 100
Skor Tertinggi di Kelas
A
M + 1,5 SD
B
M + 0,5 SD
C
M-+ 0,5 SD
D
M - 1,5 SD
E
10
M + 2,25 SD
9
M + 1,75 SD
M + 1,25 SD 8
M + 0,75 SD 7
6
M + 0,25 SD
5
M - 0,25 SD
M - 0,75 SD 4
M - 1,25 SD 3
2
M - 1,75 SD
1
M - 2,25 SD
0
306
X
P= x 100
SMI
dengan : p = persentil
X = skor yang dicari
SMI = skor Maksimal Ideal
Skor Maksimal Ideal (SMI) adalah skor yang
mungkin dicapai oleh siswa jika semua soal dapat
dijawab dengan betul
1
cfb+ 2 fb
P= x 100
N
dengan : p = persentil
cfb = cumulatif frekuensi below yaitu
jumlah frekuenai yang mendapat skr di
bawah skor yang akan dicari
persentilnya
fb = frekuensi daerah persentil, yaitu jumlah
frekuensi yang mendapat skor sama
dengan skor yang akan dicari
persentilnya
N = jumlah subjek
Keterangan:
X = skor yang dicapai
X− M
Z= M = rata-rata
SD
SD = standar deviasi
Skor Z matematika:
X− M 65−6
Z= = = 4 =+1,25
SD 4
DAFTAR PUSTAKA
Agung. (1992), Metode Penelitian Sosial Pengertian dan Pemakaian
Praktis, PT. Gramedia Pustaka Utama, Jakarta.