SEPUTAR PENGUKURAN,
PENILAIAN, DAN
EVALUASI PENDIDIKAN
Oleh:
Prof. Dr.Yusrizal, M.Pd
Tiada gading yang tak retak, demikian juga buku ini mengandung
banyak kekurangan dan kekurangsempurnaan. Karenaya, penulis
menerima dengan hati terbuka berbagai saran dan kritik-kritik
konstruktif yang dapat dijadikan dasar perbaikan dalam
penerbitan berikutnya,
PRAKATA............................................................................. i
DAFTAR ISI.......................................................................... ii
BAB 1. Konsep Dasar Evaluasi ...................................................... 1
1. Pendahuluan.......................................................................... 2
2. Evaluasi ................................................................................ 4
3. Penilaian ............................................................................... 16
4. Pengukuran ........................................................................... 26
BAB 2. Taksonomi Tujuan Pendidikan ................................. 34
1. Pengertian ............................................................................. 34
2. Ranah Kognitif ..................................................................... 35
3. Ranah Afektif ....................................................................... 40
4. Ranah Psikomotor................................................................. 44
BAB 3. Alat Ukur Tes ........................................................... 48
1. Pendahuluan.......................................................................... 48
2. Klasifikasi Tes ...................................................................... 52
3. Bentuk Tes ............................................................................ 58
BAB 4. Penyusunan dan Penulisan Soal................................ 78
1. Pendahuluan.......................................................................... 78
2. Kaedah Penulisan Soal ......................................................... 81
BAB 5. Analisis Butir Soal .................................................... 90
1. Pengertian ............................................................................. 90
2. Tingkat Kesukaran Butir....................................................... 97
3. Daya Beda Butir ................................................................... 99
4. Keefektifan Pengecoh ........................................................... 105
BAB 6. Validitas Alat Ukur Tes ............................................ 112
1. Konsep Dasar ........................................................................ 112
2. Jenis-Jenis Validitas.............................................................. 112
BAB 7 . Reliabilitas Alat Ukur Tes ....................................... 128
1. Konsep Dasar ........................................................................ 128
2. Jenis-Jenis Reliabilitas .......................................................... 129
BAB 8 .Penilaian (Asesmen) ................................................. 147
1. Penilaian Berbasis Kelas....................................................... 152
2. Penilaian Autentik ................................................................ 173
BAB 9 Alat Ukur Nontes ...................................................... 177
1. Konsep Dasar Nontes ........................................................... 177
2. Observasi .............................................................................. 178
3. Wawancara ........................................................................... 181
4. Kuesioner (Angket) .............................................................. 183
5. Sosiometri ............................................................................. 185
BAB 10.Pengukuran dan Penilaian Sikap ............................. 187
1. Konsep Dasar ........................................................................ 187
2. Skala Likert........................................................................... 194
3. Skala Guttman ...................................................................... 198
4. Skala Thrustone .................................................................... 200
5. Skala Semantik Diferensial................................................... 201
BAB 11. Pengolahan Tes Hasil Belajar ................................. 208
1. Pengertian dan Konsep ......................................................... 208
2. Penskoran.............................................................................. 211
DAFTAR PUSTAKA ............................................................ 226
BAB 1. KONSEP – KONSEP
DASAR EVALUASI,
1 PENDAHULUAN
1. Mengapa seorang guru harus mampu menilai hasil belajar siswa?
Jawab:
Seorang guru harus mampu menilai hasil belajar siswa karena:
1) Dalam kegiatan belajar mengajar, terdapat tiga kemampuan pokok yang dituntut dari
seorang guru yakni: kemampuan dalam merencanakan materi dan kegiatan belajar-
mengajar, kemampuan melaksanakan dan mengelola kegiatan belajar-mengajar, serta
menilai hasil belajar siswa (Gagne, 1974)
2) Dalam Standar Nasional Pendidikan meliputi 8 standar yaitu: (1) standar isi, (2) standar
proses, (3) standar kompetensi lulusan, (4) standar pendidik dan tenaga kependidikan, (5)
standar sarana dan prasarana, (6) standar pengelolaan, (7) standar pembiayaan, dan (8)
standar penilaian. Setiap pendidik harus memahami landasan yuridis maupun filosofis
yang melatarbelakangi munculnya standar penilaian, mekanisme, dan prosedur evaluasi.
1) Dalam Permendiknas No.16 Tahun 2007 tentang Kualifikasi Akademik dan Standar
Kompetensi Guru dinyatakan bahwa salah satu kompetensi inti guru adalah
menyelenggarakan penilaian dan evaluasi proses dan hasil belajar
3. Jelaskan tiga jenis penilaian yang diamanatkan dalam Peraturan Pemerintah (PP) No.
19 Tahun 2005!
Jawab:
Adapun tiga jenis penilaian yang diamanatkan dalam Peraturan Pemerintah (PP) No.19
Tahun 2005 yaitu; (1) penilaian oleh pendidik dilakukan secara berkesinambungan untuk
memantau proses, kemajuan, dan perbaikan hasil pembelajaran, (2) penilaian oleh satuan
pendidikan bertujuan menilai pencapaian standar kompetensi lulusan untuk semua
mata pelajaran sesuai programnya sebagai bentuk transparansi, profesional, dan
akuntabel lembaga, (3) penilaian oleh pemerintah bertujuan menilai pencapaian
kompetensi lulusan secara nasional pada mata pelajaran tertentu.
4. Bagaimana teknik penilaian untuk memperoleh data proses dan hasil belajar menurut
Pedoman Umum Badan Standar Nasional Pendidikan (BSNP) ?
Jawab:
Teknik penilaian yang dapat digunakan untuk memperoleh data proses dan hasil belajar
menurut pedoman umum BSNP, digunakan antara lain yaitu:
1
30
BAB 2. TAKSONOMI
TUJUAN PENDIDIKAN
1. PENGERTIAN
81. Apa yang dimaksud dengan Taksonomi Tujuan Pendidikan?
Jawab:
Taksonomi tujuan pendidikan (the taxonomy of educational objective) adalah suatu kerangka
untuk mengklasifikasikan pernyataan-pernyataan yang digunakan untuk mempredikasi
kemampuan peserta didik dalam belajar sebagai hasil dari kegiatan pembelajaran.
2. RANAH KOGNITIF
84. Bagaimana struktur ranah kognitif original Taksonomi Bloom ?
Jawab:
Adapun struktur ranah kognitif original taksonomi Bloom adalah:
42
107. Jelaskan apa yang dimaksud dengan tes, testing, testee dan tester ?
Jawab:
Secara harfiah kata “test” berasal dari kata bahasa dari bahasa latin “testum’ yaitu alat untuk
mengukur tanah (Fresch and Wheaton: 2002). Dalam bahasa Prancis kuno, kata tes berarti
ukuran yang dipergunakan untuk membedakan emas dan perak dari logam-logam yang lain.
Dalam bahasa Indonesia diterjemahkan dengan tes yang berarti ujian atau percobaan
Dari segi istilah:
1) A test Ia a systematic prosedure for observing a person’s behavior and describing it
with the aid of numerical scale or catogory system (Tes adalah suatu prosedur
sistematik untuk mengamati tingkah laku seseorang dan mendeskripsikannya dengan
menggunakan skala numerik atau sistem kategori (Cronbach, 1970).
2) Tes adalah suatu proses baku untuk memperoleh sampel tingkah laku dari suatu ranah
tertentu (Crocker dan Algina, 1986).
3) Tes adalah suatu prosedur dimana suatu sampel perilaku induvidu diperoleh, dievaluasi,
dan diskor dengan menggunakan prosedur standar (Reynold, et.all, 2009).
4) Tes didefinisikan sebagai suatu instrumen prosedur sistematis untuk mengamati dan
menggambarkan satu atau lebih karakteristik siswa yang menggunakan skala numerik
atau skema klasifikasi (Nitko & Brookhart, 2007).
5) Tes adalah prosedur yang sistematik guna mengukur sampel perilaku seseorang.
Sistematik juga memiliki pengertian obyektif, standart dan syarat-syarat kualitas lainnya
( Brown, 1976).
Jadi tes adalah:
1) Suatu instrumen atau prosedur yang sistematis untuk mengukur tingkah laku, yang
dirancang dan dilaksanakan kepada siswa pada waktu dan tempat tertentu serta
dalam kondisi yang memenuhi syarat-syarat tertentu yang jelas.
2) Seperangkat tugas yang harus dikerjakan atau sejumlah pertanyaan yang harus
dijawab oleh peserta didik untuk mengukur tingkat pemahaman dan penguasaannya
terhadap cakupan materi yang dipersyaratkan dan sesuai dengan tujuan pengajaran
tertentu.
Testing adalah saat pada waktu tes itu sedang dilaksanakan atau berlangsung atau saat
pengambilan tes
68
BAB 6. VALIDITAS
ALAT UKUR TES
1.KONSEP DASAR
282. Apa yang dimaksud dengan validitas ?
Jawab:
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya.
1) Validitas adalah suatu konsep yang berkaitan dengan sejauh mana tes telah
mengukur apa yang seharusnya diukur (Supranata: 2004)
2) Validitas didefinisikan sebagai seberapa cermat suatu alat ukur melakukan fungsi
ukurnya (American Psychological Association, 1999)
3) Validitas merupakan derajad sejauh mana tes mengukur apa yang ingin diukur (Borg
dan Gall, 1983).
4) Validitas berhubungan dengan interpretasi atau makna dan penggunaan hasil
pengukuran peserta didik (Nitko, 1996).
Pengertian sahih (valid) mencakup dua konsep yakni : (1) jitu, dan (2) teliti ( Hadi,
1979).
Jitu disebut juga tepat, mengandung arti alat ukur yang mengukur sesuatu sesuai dengan
sasarannya. Timbangan jitu atau tepat untuk mengukur berat bukan untuk mengukur
panjang. Meteran tepat untuk mengukur panjang bukan untuk mengkur suhu.
Teliti disebut juga seksama atau cermat. Dalam pengukuran mengandung makna jika
alat ukur itu mempunyai kemampuan secara teliti menunjukkan besar kecilnya gejala
atau bagian gejala sesuatu yang diukur. Benda yang panjangnya 5 meter ditunjukkan
oleh alat ukur itu sepanjang 5 meter, bukan 4 meter bulan pula 6 meter
Jadi validitas ialah tingkat di mana dengan sesungguhnya sebuah tes dapat mengukur apa
yang hendak diukur.
BAB 7. RELIABILITAS
ALAT UKUR TES
1. KONSEP DASAR
325. Jelaskan pengertian reliabilitas itu ?
Jawab:
Reliability berasal dari kata rely yang artinya percaya dan reliabel yang artinya dapat
dipercaya. Keterpercayaan berhubungan dengan ketetapan dan konsistensi. Tes dikatakan
dapat dipercaya apabila memberikan hasil pengukuran hasil belajar yang relatif tetap
secara konsisten. Beberapa ahli memberikan batasan reliabilitas.
1) Reliabilitas berhubungan dengan akurasi instrumen dalam mengukur apa yang
diukur, kecermatan hasil ukur dan seberapa akurat seandainya dilakukan pengukuran
ulang (Thorndike dan Hagen, 1977)
2) Reliabilitas adalah konsisten atau keajegan atau ketetapan dari nilai yang diperoleh
dari tiap individu yang sama manakala diadakan tes ulang dengan tes yang sama pada
waktu yang berbeda atau dengan butir soal yang sejenis (Anastasia dan Urbina,
1997).
3) Reliabilitas adalah sejauh mana hasil pengukuran dengan alat tersebut dapat
dipercaya (Suryabrata, 2004)
4) Reliabilitas suatu tes adalah kesesuaian antara dua upaya yang dilakukan untuk
mengukur trait yang sama melalui metode yang sangat serupa (Bachman, 1990),
5) Reliabilitas merupakan derajat keajegan (consistency) di antara dua buah hasil
pengukuran pada objek yang sama (Mehrens & Lehmann, 1984)
Jadi, Reliabilitas sering diartikan dengan keterandalan atau keajegan. Artinya suatu
tes memiliki keterandalan bilamana tes tersebut dipakai mengukur berulang–ulang
hasilnya sama
326. Apakah yang dimaksud dengan kata “ajeg” atau “tetap” dari reliabilitas itu adalah
hasil tes berkali-kali itu harus tetap sama ?
Jawab:
Yang dimaksud dengan ajeg atau tetap tidak selalu sama, tetapi mengikuti perubahan
secara ajeg. misalnya; jika si A dalam sebuah tes mula-mula lebih rendah dibandingkan
dengan si B, maka jika diadakan pengukuran ulang, si A juga berada lebih rendah dari si
B, itulah yang dikatakan ajeg atau tetap, yaitu sama dalam kedudukan siswa di antara
anggota kelompok yang lain
2. OBSERVASI
442. Apa yang dimaksud dengan observasi ?
Jawab:
Observasi adalah suatu teknik penilaian non-tes yang menginventarisasikan data tentang
sikap dan kepribadian siswa dalam kegiatan belajarnya. Observasi dilakukan dengan
mengamati kegiatan dan perilaku siswa secara langsung. Data yang diperoleh dijadikan
bahan penilaian
165
DAFTAR PUSTAKA
Agung. (1992), Metode Penelitian Sosial Pengertian dan Pemakaian Praktis, PT.
Gramedia Pustaka Utama, Jakarta.
Allen, M.J. & Yen, W.M. (1979). Introduction to measurement theory. Monterey,
CA: Brooks/Cole Publishing Company.
Alkin, M.D., Daillak, R., and White, P. (1979). Using evaluations: does evaluation
make a difference? Beverly Hills, Cliff: Sage
Anderson, L.W and D.R. Krathwohl (Eds). (2001). A Taxonomy for Learning
Teaching and Assessing.
Basuki, Ismet dan Hariyanto (2014), Asesmen Pembelajaran, Bandung: PT Remaja Rosdakarya
Baumeister, Roy, F (1999), The Self in Social Psychology, Philadelphia: Psychology Press
Borg, Walter R dan Gall, Meredith Damien (1983). Educational research an introduction. New York :
Longman
Jemmars
Crocker, L. & Algina, J. (1986). Introduction to Classical and Modern Test Theory_.
New York: Holt, Rinehart and Winston, Inc.
Cronbach, L.I (1970), Essentials of psychological testing, New York: Harper Collins
Cronbach, L., J., and others. (1980). Toward reform of program evaluation: aims,
methods, and institutional arrangements. San Fransisco: Jossey-Bass
Depdiknas (2008), Panduan Analisis Butir Soal, Jakarta: Direktorat Pembinaan SMA
Dizney, Henry !1971), Classroom Evaluation for Teachers, Dubuque, Iowa: Wm. C.
Brown Company Publisher
Djaali & Mulyono, Pudji. (2008). Pengukuran dalam Bidang Pendidikan, Jakarta:
Grasindo
Fresch, Mary Jo & Aileen Wheaton. (2002). Teaching and Assessing Spelling. Ohio: Scholastic Inc.
Gronlund, Norman .E & Linn, Robert .L. (1995). Measurement and Evaluation in Teaching.
New York: McMillan Publishing Company
Harahap, Nasrun dk (1982), Teknik Penilaian Hasil Belajar, Jakarta; Bulan Bintang
Jihad, Asep dan Haris, Abdul (2008), Evaluasi Pembelajaran, Yogyakarta: Multi Pressindo
Kaufman, et.all (1980), Needs Assessment, Concept and Application, New Jersey:
Engelewood Clifts, Educational Technology Publications
Klewnoswaki, Val. (2002). Developing Portfolio for Learning and Assessment. London:
RoutledgeFalmer.
Komalasari, Gantina, Eka Wahyuni dan Karsih (2011).Asesmen Teknik Nontes dalam
Perspektif BK Komprehensif, Jakarta: PT Indes
203
Lord, F.M. and Novick, M.R. (1974). Statistical Theories of Mental Test Scores.
Reading, MA: Addison-Wesley
Mardapi, Djemari (2004) , Penyusunan Tes Hasil Belajar, Yogyakarta: Program Pascasarjana
Universitas Negeri Yogyakarta,
Nurkancana , Wayan & Sumartana (1990), Evaluasi Hasil Belajar, Surabaya: Usaha
Nasional
O'Malley, J. Michael, and Lorraine Valdez Pierce. (1996). Authentic Assessment for
English Language Learning: Practical Approaches for Teachers. New York:
Addison-Wesley Publishing
Rokeach, Milton (1968), Beliefs, Attitudes, anf Values: A Theory of Organiation and
Change, San Fransisco: Jossey-Bass
Salvia, J. & Ysseldyke, J.E. (1996). Assessment. 6th Edition. Boston: Houghton
Mifflin Company.
Silverius, Suje (1991), Evaluasi Hasil Belajar dan Umpan Balik, Jakarta: PT
Grasindo
Singarimbun, Masri dan Effendi, Sofian (Ed.). Metode Penelitian Survai. Cetakan-2,
Jakarta: UI-Press, 1993.
Sukardi. (2008), Evaluasi Pendidikan: Prinsip & Operasionalnya, Jakarta: Bumi Aksara
Sunarti dan Rahmawati, Selly (2013),Penilaian Dalam Kurikulum 2013, Yogyakarta: penerbit Andi
Surapranata, Sumarna dan Muhammad Hatta. 2006. Penilaian Portofolio: Implementasi Kurikulum 2004.
Bandung: PT Remaja Rosdakarya.
Stark, J.S. & Thomas, A. (1994). Assessment and program evaluation. Needham Heights:
Simon & Schuster Custom Publishing
Tayibnapis, Farida Yusuf( 2008). Evaluasi Program dan Instrumen Evaluasi. Jakarta:
PT Rineka Cipta
Thorndike, Robert, L., & Hagen, Elizabeth. P. (1977). Measurement and evaluation in psychology and
education. New York: John Wiley & Sons.
Weeden, P., Winter, J., & Broadfoot, P. (2002). Assessment. London; New York:
RoutledgeFalmer.
Wiersma, W and Jurs (1990), Educational Measurement And Testing, Boston: Allyn
and Bacon
Zainul, Asmawi dan Noehi Nasoetion (1997), Penilaian Hasil Belajar. Pusat Antar
Universitas, Direktorat Jenderal Pendidikan Tinggi: Departemen Pendidikan dan Kebudayaan.
TENTANG PENULIS