Anda di halaman 1dari 26

TANYA JAWAB

SEPUTAR PENGUKURAN,
PENILAIAN, DAN
EVALUASI PENDIDIKAN

Oleh:
Prof. Dr.Yusrizal, M.Pd

SYIAH KUALAUNIVERSITY PRESS


Hak Cipta Dilindungi Undang-Undang
Dilarang keras memperbanyak, memfotocopy sebagian
Atau seluruh isi buku ini, serta memperjual belikannya
Tanpa mendapat izin tertulis dari Penerbit.

Diterbitkan oleh Syiah Kuala University Press


Darussalam – Banda Aceh, 23111

©2016, Penerbit Syiah Kuala University Press, Banda Aceh


ii 232 hlm. 15 cm x 23 cm
Judul Buku : Tanya Jawab Seputar Pengukuran, Penilaian, dan
Evaluasi Pendidikan
Penulis : Prof. Dr. Yusrizal, M.Pd
Editor Bahasa : Dr. Ramli, M.Pd
Penerbit: Syiah Kuala University Press
Telp (0651) 801222.
Email : upt.percetakan@gmail.com
Cetakan kesatu: 2015
ISBN : 978-602-1270-44-8
E-ISBN : 978-623-7086-81-9
Anggota IkatanPenerbit Indonesia (IKAPI)
PRAKATA

Puji syukur kami panjatkan ke hadirat Allah SWT, atas berkat


rahmad, taufik, serta hidayah-NYA penulisan buku “Tanya
Jawab Seputar Pengukuran, Penilaian dan Evaluasi Pendidikan”
ini dapat diselesaikan. Selawat dan salam semoga dilimpahkan
oleh Allah SWT kepada junjungan kita Nabi Muhammad SAW
yang senantiasa kita jadikan contoh dan suru teladan dalam
kehidupan kita.

Berdasarkan pengalaman mengajar mata kuliah Evaluasi


Pendidikan pada berbagai program studi magister pendidikan
PPs Unsyiah menunjukkan bahwa hampir semua mahasiswa
yang umumnya guru, pengetahuan tentang evaluasinya belum
memuaskan, pada hal dalam Permendiknas No 16 Tahun 2007
tentang Kualifikasi Akademik dan Standar Kompetensi Guru
dinyatakan bahwa salah satu kompetensi inti guru adalah
menyelenggarakan penilaian dan evaluasi proses dan hasil
belajar. Pertanyaan-pertanyaan mendasar yang diajukan semisal
apa pengertian dari pengukuran, penilaian dan evaluasi, apa
perbedaan antara ketiga istilah tersebut; apa beda antara skor dan
nilai; apa yang dimaksud dengan penilaian acuan norma dan
acuan patokan; jawaban mereka belum benar. Untuk alasan-
alasan inilah buku ini diterbitkan dalam bentuk tanya jawab..

Buku tanya jawab ini dikelompokkan urutan tanya jawabnya


dalam 11 BAB yaitu: BAB I. Konsep-Konsep Dasar Evaluasi,
BAB 2. Taksonomi Tujuan Pendidikan, BAB 3. Alat Ukur Tes,
BAB 4.Penyusunan dan Penulisan Soal, BAB 5.Analisis Butir
Soal, BAB 6.Validitas Alat Ukur, BAB 7. Reliabilitas Alat Ukur,
BAB 8. Penilaian (Asesmen) BAB 9. Alat Ukur Nontes. BAB
10 Pengukuran dan Penilaian Sikap, dan BAB 11. Pengolahan
Tes Hasil.Belajar.
Sebagai suatu usaha awal, penulis berharap buku ini dapat
bermanfaat dalam membantu para guru dan calon guru
memahami dan menggunakannya dalam proses pengajaran.

Tiada gading yang tak retak, demikian juga buku ini mengandung
banyak kekurangan dan kekurangsempurnaan. Karenaya, penulis
menerima dengan hati terbuka berbagai saran dan kritik-kritik
konstruktif yang dapat dijadikan dasar perbaikan dalam
penerbitan berikutnya,

Banda Aceh, Agustus 2015


DAFTAR ISI

PRAKATA............................................................................. i
DAFTAR ISI.......................................................................... ii
BAB 1. Konsep Dasar Evaluasi ...................................................... 1
1. Pendahuluan.......................................................................... 2
2. Evaluasi ................................................................................ 4
3. Penilaian ............................................................................... 16
4. Pengukuran ........................................................................... 26
BAB 2. Taksonomi Tujuan Pendidikan ................................. 34
1. Pengertian ............................................................................. 34
2. Ranah Kognitif ..................................................................... 35
3. Ranah Afektif ....................................................................... 40
4. Ranah Psikomotor................................................................. 44
BAB 3. Alat Ukur Tes ........................................................... 48
1. Pendahuluan.......................................................................... 48
2. Klasifikasi Tes ...................................................................... 52
3. Bentuk Tes ............................................................................ 58
BAB 4. Penyusunan dan Penulisan Soal................................ 78
1. Pendahuluan.......................................................................... 78
2. Kaedah Penulisan Soal ......................................................... 81
BAB 5. Analisis Butir Soal .................................................... 90
1. Pengertian ............................................................................. 90
2. Tingkat Kesukaran Butir....................................................... 97
3. Daya Beda Butir ................................................................... 99
4. Keefektifan Pengecoh ........................................................... 105
BAB 6. Validitas Alat Ukur Tes ............................................ 112
1. Konsep Dasar ........................................................................ 112
2. Jenis-Jenis Validitas.............................................................. 112
BAB 7 . Reliabilitas Alat Ukur Tes ....................................... 128
1. Konsep Dasar ........................................................................ 128
2. Jenis-Jenis Reliabilitas .......................................................... 129
BAB 8 .Penilaian (Asesmen) ................................................. 147
1. Penilaian Berbasis Kelas....................................................... 152
2. Penilaian Autentik ................................................................ 173
BAB 9 Alat Ukur Nontes ...................................................... 177
1. Konsep Dasar Nontes ........................................................... 177
2. Observasi .............................................................................. 178
3. Wawancara ........................................................................... 181
4. Kuesioner (Angket) .............................................................. 183
5. Sosiometri ............................................................................. 185
BAB 10.Pengukuran dan Penilaian Sikap ............................. 187
1. Konsep Dasar ........................................................................ 187
2. Skala Likert........................................................................... 194
3. Skala Guttman ...................................................................... 198
4. Skala Thrustone .................................................................... 200
5. Skala Semantik Diferensial................................................... 201
BAB 11. Pengolahan Tes Hasil Belajar ................................. 208
1. Pengertian dan Konsep ......................................................... 208
2. Penskoran.............................................................................. 211
DAFTAR PUSTAKA ............................................................ 226
BAB 1. KONSEP – KONSEP
DASAR EVALUASI,
1 PENDAHULUAN
1. Mengapa seorang guru harus mampu menilai hasil belajar siswa?
Jawab:
Seorang guru harus mampu menilai hasil belajar siswa karena:
1) Dalam kegiatan belajar mengajar, terdapat tiga kemampuan pokok yang dituntut dari
seorang guru yakni: kemampuan dalam merencanakan materi dan kegiatan belajar-
mengajar, kemampuan melaksanakan dan mengelola kegiatan belajar-mengajar, serta
menilai hasil belajar siswa (Gagne, 1974)
2) Dalam Standar Nasional Pendidikan meliputi 8 standar yaitu: (1) standar isi, (2) standar
proses, (3) standar kompetensi lulusan, (4) standar pendidik dan tenaga kependidikan, (5)
standar sarana dan prasarana, (6) standar pengelolaan, (7) standar pembiayaan, dan (8)
standar penilaian. Setiap pendidik harus memahami landasan yuridis maupun filosofis
yang melatarbelakangi munculnya standar penilaian, mekanisme, dan prosedur evaluasi.
1) Dalam Permendiknas No.16 Tahun 2007 tentang Kualifikasi Akademik dan Standar
Kompetensi Guru dinyatakan bahwa salah satu kompetensi inti guru adalah
menyelenggarakan penilaian dan evaluasi proses dan hasil belajar

2. Apa yang dimaksud dengan standar penilaian pendidikan?


Jawab:
Standar penilaian pendidikan adalah standar nasional pendidikan yang berkaitan dengan
mekanisme, prosedur, dan instrumen penilaian hasil belajar peserta didik.

3. Jelaskan tiga jenis penilaian yang diamanatkan dalam Peraturan Pemerintah (PP) No.
19 Tahun 2005!
Jawab:
Adapun tiga jenis penilaian yang diamanatkan dalam Peraturan Pemerintah (PP) No.19
Tahun 2005 yaitu; (1) penilaian oleh pendidik dilakukan secara berkesinambungan untuk
memantau proses, kemajuan, dan perbaikan hasil pembelajaran, (2) penilaian oleh satuan
pendidikan bertujuan menilai pencapaian standar kompetensi lulusan untuk semua
mata pelajaran sesuai programnya sebagai bentuk transparansi, profesional, dan
akuntabel lembaga, (3) penilaian oleh pemerintah bertujuan menilai pencapaian
kompetensi lulusan secara nasional pada mata pelajaran tertentu.

4. Bagaimana teknik penilaian untuk memperoleh data proses dan hasil belajar menurut
Pedoman Umum Badan Standar Nasional Pendidikan (BSNP) ?
Jawab:
Teknik penilaian yang dapat digunakan untuk memperoleh data proses dan hasil belajar
menurut pedoman umum BSNP, digunakan antara lain yaitu:

1
30

BAB 2. TAKSONOMI
TUJUAN PENDIDIKAN
1. PENGERTIAN
81. Apa yang dimaksud dengan Taksonomi Tujuan Pendidikan?
Jawab:
Taksonomi tujuan pendidikan (the taxonomy of educational objective) adalah suatu kerangka
untuk mengklasifikasikan pernyataan-pernyataan yang digunakan untuk mempredikasi
kemampuan peserta didik dalam belajar sebagai hasil dari kegiatan pembelajaran.

82. Apa yang dimaksud dengan Taksonomi Tujuan Pendidikan Bloom ?


Jawab:
Taksonomi tujuan pendidikan Bloom adalah struktur hierarkhi yang mengidentifikasikan
skills mulai dari tingkat yang rendah hingga yang tinggi. Taksonomi tujuan pendidikan ini
merupakan kerangka konsep kemampuan berpikir yang dicetuskan oleh Bloom pada tahun
1956, dan dinamakan Taxonomy Bloom. Taksonomi tujuan pendidikan Bloom dibagi menjadi
beberapa domain (ranah, kawasan) dan setiap domain tersebut dibagi kembali ke dalam
pembagian yang lebih rinci berdasarkan hirarkinya. Tujuan pendidikan dibagi ke dalam tiga
domain, yaitu: Ranah Kognitif berisi perilaku yang menekankan aspek intelektual, seperti
pengetahuan, dan keterampilan berpikir. Ranah afektif berisi perilaku terkait dengan emosi,
misalnya perasaan, nilai, minat, motivasi, dan sikap. Ranah Psikomotorik berisi perilaku yang
menekankan fungsi manipulatif dan keterampilan motorik/kemampuan fisik, berenang, dan
mengoperasikan mesin

83. Bagaimana klasifikasi hasil belajar menurut Bloom ?


Jawab:
Menurut Bloom, klasifikasi hasil belajar peserta didik dapat dikelompok kan ke dalam 3
(tiga) aspek/ranah, yaitu:
1. Hasil belajar yang berkaitan dengan perkembangan kognitif
(pengetahuan).
2. Hasil belajar yang berkaitan dengan perkembangan afektif (sikap dan
nilai-nilai).
3. Hasil belajar yang berkaitan dengan perkembangan keterampilan
(psikomotorik).
(Ketiga aspek di atas dapat juga dikelompokkan dengan istilah 3H:
head, hand, and heart).

2. RANAH KOGNITIF
84. Bagaimana struktur ranah kognitif original Taksonomi Bloom ?
Jawab:
Adapun struktur ranah kognitif original taksonomi Bloom adalah:
42

BAB 3. ALAT UKUR TES


1. PENDAHULUAN
106. Bagaimana klasifikasi alat ukur pendidikan?
Jawab:
Alat ukur pendidikan dapat diklasifikasikan antara lain sebagai berikut: (a) isian inventori
(biasanya berbentuk isian atau kuesioner), (b) tes (tes hasil belajar, tes kinerja, tes inteligensi,
tes bakat, tes kepribadian), (c) kuesioner berisikan sejumlah butir yang ditanyakan kepada
responden), (d) wawancara (interviu atau wawancara dilakukan oleh pewawancara kepada
responden), (e) observasi (pengamatan), (f) daftar cocok (chek list), (g) skala (alat ukur kiraan
atau rating), (h) studi kasus, (i) riwayat hidup, (j) sosiometri, dan (k) asesmen portofolio
(Koyan, 2012)

107. Jelaskan apa yang dimaksud dengan tes, testing, testee dan tester ?
Jawab:
Secara harfiah kata “test” berasal dari kata bahasa dari bahasa latin “testum’ yaitu alat untuk
mengukur tanah (Fresch and Wheaton: 2002). Dalam bahasa Prancis kuno, kata tes berarti
ukuran yang dipergunakan untuk membedakan emas dan perak dari logam-logam yang lain.
Dalam bahasa Indonesia diterjemahkan dengan tes yang berarti ujian atau percobaan
Dari segi istilah:
1) A test Ia a systematic prosedure for observing a person’s behavior and describing it
with the aid of numerical scale or catogory system (Tes adalah suatu prosedur
sistematik untuk mengamati tingkah laku seseorang dan mendeskripsikannya dengan
menggunakan skala numerik atau sistem kategori (Cronbach, 1970).
2) Tes adalah suatu proses baku untuk memperoleh sampel tingkah laku dari suatu ranah
tertentu (Crocker dan Algina, 1986).
3) Tes adalah suatu prosedur dimana suatu sampel perilaku induvidu diperoleh, dievaluasi,
dan diskor dengan menggunakan prosedur standar (Reynold, et.all, 2009).
4) Tes didefinisikan sebagai suatu instrumen prosedur sistematis untuk mengamati dan
menggambarkan satu atau lebih karakteristik siswa yang menggunakan skala numerik
atau skema klasifikasi (Nitko & Brookhart, 2007).
5) Tes adalah prosedur yang sistematik guna mengukur sampel perilaku seseorang.
Sistematik juga memiliki pengertian obyektif, standart dan syarat-syarat kualitas lainnya
( Brown, 1976).
Jadi tes adalah:
1) Suatu instrumen atau prosedur yang sistematis untuk mengukur tingkah laku, yang
dirancang dan dilaksanakan kepada siswa pada waktu dan tempat tertentu serta
dalam kondisi yang memenuhi syarat-syarat tertentu yang jelas.
2) Seperangkat tugas yang harus dikerjakan atau sejumlah pertanyaan yang harus
dijawab oleh peserta didik untuk mengukur tingkat pemahaman dan penguasaannya
terhadap cakupan materi yang dipersyaratkan dan sesuai dengan tujuan pengajaran
tertentu.
Testing adalah saat pada waktu tes itu sedang dilaksanakan atau berlangsung atau saat
pengambilan tes
68

BAB 4. PENYUSUNAN DAN


PENULISAN SOAL
1. PENDAHULUAN
185. Bagaimana langkah-langkah penyusunan tes ?
Jawab:
Langkah-langkah umum penyusunan/pengembangan tes adalah sebagai berikut (Brennan,
2006)
1) Penentuan tujuan tes
Langkah awal dalam mengembangkan instrumen tes adalah menetapkan tujuannya.
Tujuan tes harus dirumuskan secara jelas sehingga dapat memberikan arah dan lingkup
pengembangan tes selanjutnya
2) Penyusunan kisi-kisi tes
Tujuan penyusunan kisi-kisi adalah untuk menentukan ruang lingkup dan sebagai
petunjuk dalam penulisan soal. Kisi-kisi dapat berupa format atau matriks. Kisi-kisi tes
adalah deskripsi mengenai ruang lingkup dan isi dari apa yang akan diujikan, serta
memberikan rincian mengenai soal-soal yang diperlukan oleh tes tersebut. Kisi-kisi
pada umumnya berisi (1) rincian materi pembelajaran/aspek yang akan dievaluasi, (2)
tingkah laku yang akan diukur berikut deskripsi indikatornya, (3) proporsi dan jumlah
soal, serta (4) bentuk soal
3) Penulisan soal
Dalam penulisan butir soal, penulis harus memperhatikan kaidah penulisan soal.
Menulis soal adalah penjabaran indikator kompetensi yang hendak diukur menjadi
pertanyaan-pertanyaan yang karakteristiknya sesuai dengan kisi-kisi.
4) Penelaahan soal
Penelaahan soal adalah mengkaji secara teoritik soal tes yang telah disusun. Penelaahan
ini dilakukan dengan memperhatikan tiga aspek, yaitu aspek materi, aspek konstruksi,
dan aspek bahasa. Biasanya pada penelaahan soal dilakukan review dan revisi oleh
orang lain.
5) Uji coba soal termasuk analisisnya
Soal yang sudah dibuat dan sudsah direproduksi atau diperbanyak itu diujicobakan
kepada sejumlah sampel yang telah ditentukan. Sampel uji-coba harus mempunyai
karakteristik yang kurag lebih sama dengan karakteristik peserta tes sesungguhnya.
Berdasarkan data hasil uji-coba dilakukan analisis, terutama analisis butir soal yang
meliputi tingkat kesukaran, validita butir, dan fungsi pengecoh.
6) Perakitan soal menjadi perangkat tes
Dalam perakitan tes perlu mengelompokkan butir soal itu menurut bentuknya, bukan
menurut jenis materinya atau menurut jenjang pengetahuan yang hendak diukur.
7) Penyajian tes
Setelah diperoleh tes terstandar, naskah tes siap diberikan atau disajikan kepada peserta
tes. Hal-hal yang perlu diperhatikan dalam penyajian tes adalah waktu penyajian,
petunjuk yang jelas mengenai cara menjawab atau mengerjakan tes, ruangan dan tempat
duduk peserta tes
98

BAB 6. VALIDITAS
ALAT UKUR TES
1.KONSEP DASAR
282. Apa yang dimaksud dengan validitas ?
Jawab:
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya.
1) Validitas adalah suatu konsep yang berkaitan dengan sejauh mana tes telah
mengukur apa yang seharusnya diukur (Supranata: 2004)
2) Validitas didefinisikan sebagai seberapa cermat suatu alat ukur melakukan fungsi
ukurnya (American Psychological Association, 1999)
3) Validitas merupakan derajad sejauh mana tes mengukur apa yang ingin diukur (Borg
dan Gall, 1983).
4) Validitas berhubungan dengan interpretasi atau makna dan penggunaan hasil
pengukuran peserta didik (Nitko, 1996).
Pengertian sahih (valid) mencakup dua konsep yakni : (1) jitu, dan (2) teliti ( Hadi,
1979).
Jitu disebut juga tepat, mengandung arti alat ukur yang mengukur sesuatu sesuai dengan
sasarannya. Timbangan jitu atau tepat untuk mengukur berat bukan untuk mengukur
panjang. Meteran tepat untuk mengukur panjang bukan untuk mengkur suhu.
Teliti disebut juga seksama atau cermat. Dalam pengukuran mengandung makna jika
alat ukur itu mempunyai kemampuan secara teliti menunjukkan besar kecilnya gejala
atau bagian gejala sesuatu yang diukur. Benda yang panjangnya 5 meter ditunjukkan
oleh alat ukur itu sepanjang 5 meter, bukan 4 meter bulan pula 6 meter
Jadi validitas ialah tingkat di mana dengan sesungguhnya sebuah tes dapat mengukur apa
yang hendak diukur.

2. JENIS – JENIS VALIDITAS


283. Berapa jenis validitas itu?
Jawab:
Secara garis besar ada dua macam validitas, yaitu validitas tes dan validitas butir

284. Apa yang dimaksud dengan validitas tes ?


Jawab:
Validitas tes adalah kemampuan suatu tes untuk mengukur apa yang seharusnya diukur
(Allen & Yen, 1979). Messick (1989) menjelaskan bahwa validitas tes merupakan suatu
integrasi pertimbangan evaluatif derajat keterangan empiris yang mendasarkan pemikiran
teoritis yang mendukung ketepatan dan kesimpulan berdasarkan pada skor tes
112

BAB 7. RELIABILITAS
ALAT UKUR TES

1. KONSEP DASAR
325. Jelaskan pengertian reliabilitas itu ?
Jawab:
Reliability berasal dari kata rely yang artinya percaya dan reliabel yang artinya dapat
dipercaya. Keterpercayaan berhubungan dengan ketetapan dan konsistensi. Tes dikatakan
dapat dipercaya apabila memberikan hasil pengukuran hasil belajar yang relatif tetap
secara konsisten. Beberapa ahli memberikan batasan reliabilitas.
1) Reliabilitas berhubungan dengan akurasi instrumen dalam mengukur apa yang
diukur, kecermatan hasil ukur dan seberapa akurat seandainya dilakukan pengukuran
ulang (Thorndike dan Hagen, 1977)
2) Reliabilitas adalah konsisten atau keajegan atau ketetapan dari nilai yang diperoleh
dari tiap individu yang sama manakala diadakan tes ulang dengan tes yang sama pada
waktu yang berbeda atau dengan butir soal yang sejenis (Anastasia dan Urbina,
1997).
3) Reliabilitas adalah sejauh mana hasil pengukuran dengan alat tersebut dapat
dipercaya (Suryabrata, 2004)
4) Reliabilitas suatu tes adalah kesesuaian antara dua upaya yang dilakukan untuk
mengukur trait yang sama melalui metode yang sangat serupa (Bachman, 1990),
5) Reliabilitas merupakan derajat keajegan (consistency) di antara dua buah hasil
pengukuran pada objek yang sama (Mehrens & Lehmann, 1984)
Jadi, Reliabilitas sering diartikan dengan keterandalan atau keajegan. Artinya suatu
tes memiliki keterandalan bilamana tes tersebut dipakai mengukur berulang–ulang
hasilnya sama

326. Apakah yang dimaksud dengan kata “ajeg” atau “tetap” dari reliabilitas itu adalah
hasil tes berkali-kali itu harus tetap sama ?
Jawab:
Yang dimaksud dengan ajeg atau tetap tidak selalu sama, tetapi mengikuti perubahan
secara ajeg. misalnya; jika si A dalam sebuah tes mula-mula lebih rendah dibandingkan
dengan si B, maka jika diadakan pengukuran ulang, si A juga berada lebih rendah dari si
B, itulah yang dikatakan ajeg atau tetap, yaitu sama dalam kedudukan siswa di antara
anggota kelompok yang lain

327. Apa kegunaan dari reliabilitas itu ?


Jawab:
Kegunaan reliabilitas adalah untuk mengetahui atau menunjukkan keajekan suatu tes
dalam mengukur gejala yang sama pada waktu dan kesempatan yang berbeda
129

BAB 8. PENILAIAN (ASESMEN)


365. Ada berapa macam teknik penilaian untuk menilai hasil pembelajaran siswa ?
Jawab:
Secara umum ada sembilan macam teknik penilaian untuk menilai hasil pembelajaran
siswa. yaitu: (1) tes, (2) observasi, (3) penilaian diri, (4) penilaian antar teman, (5)
penilaian kinerja, (6) penilaian portofolio. (7) peniaian produk, (8) penilaian proyek,
dan (9) penilaian jurnal

366. Bagaimana hubungan antara teknik penilaian dengan aspek penilaian?


Jawab:
Adapun hubungan antara teknik penilaian dengan aspek penilaian adalah sebagai berikut:
Aspek Penilaian
Teknik Penialain
Pengetahuan Ketrampilan Sikap
Tes √
Observasi √
Penilaian diri √
Penilaian antar teman √
Penilaian kinerja √ √
Penilaian portofolio √
Penilaian proyek √ √
Penilaian produk √
Penilaian jurnal √
Inventori √

367. Bagaimana hubungan antara teknik penilaian dengan instrumen penilaian?


Jawab:
Adapun hubungan antara teknik penilaian dengan instrumen penilaian adalah sebagai berikut:
Teknik Penilaian Instrumen Penilaian
Tes Soal tes
Observasi Pedoman observasi
(check list, rating scale)
Penilaian diri Angket
Penilaian antar teman Angket
Penilaian kinerja Rubrik
Penilaian portofolio Rubrik
Penilaian proyek Rubrik
Penilaian produk Rubrik
Penilaian jurnal Rubrik
Inventori Skala
156

BAB 9 . ALAT UKUR NONTES


1. KONSEP DASAR NONTES
437. Apa yang dimaksud dengan non tes ?
Jawab:
Nontes: penilaian menggunakan pertanyaan atau pernyataan yang tidak menuntut
jawaban benar atau salah.

438. Apa yang dimaksud dengan penilaian nontes ?


Jawab:
Penilaian nontes adalah penilaian yang mengukur kemampuan siswa-siswa secara
langsung dengan tugas-tugas yang riil

439. Kapan instrumen nontes digunakan?


Jawab:
Instrumen nontes digunakan terutama untuk mengukur hasil belajar yang berkenaan
dengan soft skills dan vocational skills, terutama yang berhubungan dengan apa yang
dapat dibuat atau dikerjakan oleh peserta didik daripada apa yang diketahui atau
dipahaminya.
Instrument ini biasanya digunakan terkait dengan penampilan yang dapat diamati dari
pada pengetahuan dan proses mental lainnya yang tidak dapat diamati dengan panca indra
(Widiyoko : 2009).

440. Apa kelebihan nontes dibanding dengan tes ?


Jawab:
Adapun kelebihan nontes dari tes adalah sifatnya lebih komprehensif, artinya dapat
digunakan untuk menilai berbagai aspek dari individu sehingga tidak hanya untuk
menilai aspek kognitif, tetapi juga aspek efektif dan psikomotorik, yang dinilai saat
proses pelajaran berlangsung.(Sudjana, 2004)

441. Alat penilaian apa yang tergolong teknik nontes ?


Jawab:
Alat penilaian yang tergolong teknik non-tes antara lain: a) kuesioner/ angket, b)
wawancara (interview), 3) daftar cocok (check-list), 4) pengamatan/observasi, 5)
penugasan, 6) portofolio, 7) jurnal, 8) inventori, 9) penilaian diri (self-assessment), dan 9)
penilaian oleh teman sejawat (peer assessment)

2. OBSERVASI
442. Apa yang dimaksud dengan observasi ?
Jawab:
Observasi adalah suatu teknik penilaian non-tes yang menginventarisasikan data tentang
sikap dan kepribadian siswa dalam kegiatan belajarnya. Observasi dilakukan dengan
mengamati kegiatan dan perilaku siswa secara langsung. Data yang diperoleh dijadikan
bahan penilaian
165

BAB 10. PENGUKURAN DAN


PENILAIAN SIKAP
1. KONSEP DASAR
472. Apa yang dimaksud dengan penilaian sikap ?
Jawab:
(1) Yang dimaksud dengan penilaian sikap adalah proses pengumpulan dan pengelolaan
informasi yang berkaitan dengan ranah sikap untuk menentukan proses dan hasil
belajar peserta didik pada mata pelajaran tertentu
(2) Yang dimaksud dengan penilaian sikap adalah serangkaian kegiatan yang dirancang
untuk mengukur sikap peserta didik sebagai hasil dari suatu program pembelajaran.

473. Apa beda antara skala sikap dan skala penilaian ?


Jawab:
Beda antara skala sikap dan skala penilaian adalah:
Skala sikap adalah mengukur keadaan atau perasaan atau penilaian yang bersangkutan
Skala Penilaian adalah mengukur penampilan atau perilaku orang lain oleh seseorang
melalui pernyataan perilaku individu pada suatu rentang kontinum atau suatu kategori
yang bernama nilai (Djaali dan Muljono, 2008)

474. Apa saja komponen sikap itu ?


Jawab:
Sikap itu memiliki tiga komponen yaitu :
1. Komponen afektif --- kehidupan emosional individu, yakni perasaan tertentu (positif
atau negatif) yang mempengaruhi penerimaan atau penolakan terhadap objek sikap,
sehingga timbul rasa senang-tidak senang, takun-tidak takut.
2. Komponen kognitif --- aspek intelektual yang berhubungan dengan bilief, idea atau
konsep terhadap objek sikap.
3. Komponen behavioral --- kecenderungan individu untuk bertingkah laku tententu
terhadap objek sikap

475. Cakupan sikap mana yang dinilai dalam Kurikulum 2013 ?


Jawab:
Dalam Kurikulum 2013 ada dua macam penilaian sikap yang harus dilakukan, yaitu (1)
sikap spiritual dan (2) sikap sosial
1. Penilaian sikap spiritual yaitu: menghargai dan menghayati ajaran agama yang
dianut
2. Penilaian sikap sosial mencakup antara lain yaitu:
(1) jujur
(2) disiplin
(3) tanggung jawab
(4) toleransi
(5) gotong royong
184

BAB 11. PENGOLAHAN TES


HASIL BELAJAR
1. PENGERTIAN DAN KONSEP
521. Apa yang dimaksud dengan pengolahan hasil tes ?
Jawab:
Pengolahan hasil tes merupakan kegiatan lanjutan pelaksanaan ujian, yaitu memeriksa
hasil ujian dengan mencocokkan jawaban peserta dengan kunci jawaban

522. Bagaimana cara menginterpretasikan hasil tes ?


Jawab:
Untuk menginterpretasikan hasil tes dapat dilakukan dengan dua cara (metode), yaitu
berdasarkan standar absolut (criterion-referenced interpretation) yang dikenal dengan
PAP (Penilaian Acuan Patokan), dan standar relatif (norm-referenced interpretation)
yang kita kenal dengan PAN (Penilaian Acuan Norma) (Linn dan Gonlund, 1995).

523. Apa yang dimaksud dengan Skor ?


Jawab:
Skor adalah hasil pekerjaan menskor (memberikan angka) yang diperoleh dengan jalan
menjumlahkan angka-angka bagi setiap butir item yang oleh testee telah dijawab betul
dengan memperhatikan bobot jawaban betulnya.

524. Ada berapa macam jenis skor itu ?


Jawab:
Adapun jenis skor dibedakan atas 3 macam, yaitu :
i. Skor yang diperoleh (obtained score) adalah sejumlah biji yang dimiliki oleh teste
sebagai hasil mengerjakan tes. Kelemahan-kelemaha butir tes, situasi yang tidak
mendukung, kecemasan dan faktor lainnya dapat berakibat pada skor yang diperoleh.
ii. Skor sebenarnya (true score) atau skor univers-skor alam (universe score), adalah
nilai hipotetis yang sangat tergantung dari perbedaan individu, berkenaan dengan
pengetahuan yang dimiliki secara tetap
iii. Skor kesalahan (error score), perbedaan antara skor yang diperoleh dan skor
sebenarnya disebut dengan istilah kesalahan dalam pengukuran atau kesalahan skor,
atau skor kesalahan

525. Jelaskan faktor-faktor yang mempengaruhi skor


Jawab:
Adapun faktor-faktor yang mempengaruhi skor, yaitu:
1 Karakteristik umum yang permanen peserta tes,seperti kemampuan
yang dimiliki siswa dalam menghadapi tes
2. Karakteristik khusus yang permanen peserta tes, misalnya yang
berkaitan dengan atribut yang diukur dalam tes, pengetahuan dan
kemampuan khusus yang berkaitan dengan soal, dan sebagainya
3. Karakteristik umum yang temporer, seperti: kesehatan, kelelahan,
200

DAFTAR PUSTAKA

Agung. (1992), Metode Penelitian Sosial Pengertian dan Pemakaian Praktis, PT.
Gramedia Pustaka Utama, Jakarta.

Aiken, Lewis R. (1994). Psychological Testing and Assessment,(Eight Edition),


Boston: Allyn and Bacon.

Allen, M.J. & Yen, W.M. (1979). Introduction to measurement theory. Monterey,
CA: Brooks/Cole Publishing Company.

Alkin, M.D., Daillak, R., and White, P. (1979). Using evaluations: does evaluation
make a difference? Beverly Hills, Cliff: Sage

American Psychological Association (APA). (1999). Standards for Educational and


Psychological Testing. Washington, D.C.: American Educational Research
Association.

Anastasi. Anne and Urbina, Susana. (1997). Psicoholological Testing. (Seventh


Edition). New Jersey: Prentice-Hall, Inc.

Anderson, L.W and D.R. Krathwohl (Eds). (2001). A Taxonomy for Learning
Teaching and Assessing.

Arifin, Zaenal. (2009). Evaluasi Pembelajaran,. Bandung: PT remaja Rosdakarya

Arikunto.S & Cepi, S. A. J. (2004). Evaluasi program pendidikan: Pedoman


teoritis bagi praktisi pendidikan. Jakarta: Bumi Aksara.

Asaad, Abubakas,S and Hailaya, Wilham, M (2004), Measurement And Evaluation,


Manila: Rex Nbook Store

Azwar, Syarifuddin (2010). Tes Prestasi: Fungsi dan Pengembangan Pengukuran


Prestasi Belajar, edisi II, cetakan ke 4 :Pustaka Pelajar.

Azwar, Syarifuddin (2012), Reliabilitas dan Validitas, Yogyakrta: Pustaka Pelajar

Basuki, Ismet dan Hariyanto (2014), Asesmen Pembelajaran, Bandung: PT Remaja Rosdakarya

Baumeister, Roy, F (1999), The Self in Social Psychology, Philadelphia: Psychology Press

Borg, Walter R dan Gall, Meredith Damien (1983). Educational research an introduction. New York :
Longman

Brennan, Robert L. (2006). Educational measurement. Fourth Editon. Praeger


Publishers, 88 Post Road West, Westport CT. 06881.
Brown, Frederick G (1976), Principles of Educational and Psychological Testing,
New York: Holt, Rinehart and Winston

Buchori, Muchtar (1980), Teknik-Teknik Evaluasi Dalam Pendidikan, Bandung:


201

Jemmars

Crocker, L. & Algina, J. (1986). Introduction to Classical and Modern Test Theory_.
New York: Holt, Rinehart and Winston, Inc.

Cronbach, L.I (1970), Essentials of psychological testing, New York: Harper Collins

Cronbach, L., J., and others. (1980). Toward reform of program evaluation: aims,
methods, and institutional arrangements. San Fransisco: Jossey-Bass

Dave, R.H. (1967). Taxonomy of educational objectives and achievement testing.


London: University of London Press.

Depdiknas (2009), Penilaian, Jakarta: Direktorat Jenderal Peningkatan Mutu


Pendidikan dan tenaga Kependidikan

Depdiknas (2008), Panduan Analisis Butir Soal, Jakarta: Direktorat Pembinaan SMA

Depdiknas (2004). Kurikulum 2004: Pedoman Khusus Pengembangan Portofolio


untuk Penilaian.

Dizney, Henry !1971), Classroom Evaluation for Teachers, Dubuque, Iowa: Wm. C.
Brown Company Publisher

Djiwandono, Soenardi. (2008). Tes Bahasa Jakarta: PT Indeks

Djaali & Mulyono, Pudji. (2008). Pengukuran dalam Bidang Pendidikan, Jakarta:
Grasindo

Ebel, Robert L. & David A. Frisbie (1991) Essential Of Educational Measurement


(5th Edition).New Delhi: Prentice‐Hall, Inc.

Fernandes,H.J.X (1984), Testing And Measurement, Jakarta: National Education


Planning, Evaluation and Curriculum Development

Fogarty, R. (Ed.). (1996). Student Portfolios, A Collection of Articles. Victoria,


Australia: Hawker Brownlow Education.

Fresch, Mary Jo & Aileen Wheaton. (2002). Teaching and Assessing Spelling. Ohio: Scholastic Inc.

Gabel, D.L. (1993). Handbook of Research on Science Teaching and Learning.


New York: Maccmillan Company.
Gagne, R. M. & Brigg, L. J. (1974). Principle of instructional design. New York:
Holt, Rinehart, and Wins, Inc.

Gregory, Robert J. (2000). Psychological Testing: History, Principles, and


Applications. Boston: Allyn and Bacon.

Griffin, P. & Nix, P. (1991). Educational Assessment and Reporting. Sydney:


Harcout Brace Javanovich, Publisher
202

Gronlund, N.E. (1982). Constructing Achievement Test, 3rd edition. Eaglewood


Cliffs, N.J: prentice–Hall inc.

Gronlund, Norman E. and Linn, Robert L. (1995). Measurement and Assessment in


teaching (Seventh Edition). Ohio: Merrill, an immprint of Prentice Hall.

Gronlund, Norman .E & Linn, Robert .L. (1995). Measurement and Evaluation in Teaching.
New York: McMillan Publishing Company

Hadi, Sutrisno. (2001). Metodologi Research, Jilid 2. Yogyakarta: Penerbit Andi.

Haladyna, Thomas M (1999). Developing and Validating Multiple-Choice


Items, (2 nd edition), Mahwah, NJ: Lawrence Erlbaum Associates

Haladyna, Thomas M. (1994). Developing and Validating Multiple-Choice Test


Items. New Jersey: Lawrence Erlbaum Associates, Publishers.

Harahap, Nasrun dk (1982), Teknik Penilaian Hasil Belajar, Jakarta; Bulan Bintang

Harrow, A. J. (1972). A taxonomy of the psychomotor domain: A guided for


developing behavioral objective. New York: David Mc Key Company.

Hayat ,Bahrul (2008) Prinsip-prinsip dan Strategi Penilaian di Kelas


Jakarta: Pusat Penilaian Pendidikan Balitbang Depdiknas

Hopkins, Kenneth D. and Julian C. Stanley. (1981). Educational and Psychological


Measurement and Evaluation. Englewood Cliffs, NJ: Prentice-Hall, Inc.

Hopkins, Charles D. dan Richard L. Antes (1989). Classroom Testing Construction.


Illinois: F. E. Peacock.

Jihad, Asep dan Haris, Abdul (2008), Evaluasi Pembelajaran, Yogyakarta: Multi Pressindo

Joesmani (1988), Pengukuran dan Evaluasi Dalam Pengajaran, Jakarta: Proyek


Pengembangan Lembaga Pendidikan Tenaga Kependidikan

Johnson,D.W.& Johnson,R.T. (2002), Meaningful Assessment, a Manageable and


Cooperative Process, Boston: Allyn and Bacon

Kaufman, et.all (1980), Needs Assessment, Concept and Application, New Jersey:
Engelewood Clifts, Educational Technology Publications

Kemendikbud. 2013. Konsep Kurikulum 2013 (Materi Pelatihan Implementasi


Kurikulum 2013). Jakarta: BPSDMPK dan PMP Kemendikbud.

Klewnoswaki, Val. (2002). Developing Portfolio for Learning and Assessment. London:
RoutledgeFalmer.

Komalasari, Gantina, Eka Wahyuni dan Karsih (2011).Asesmen Teknik Nontes dalam
Perspektif BK Komprehensif, Jakarta: PT Indes
203

Koyan, I Wayan (2012), Konstruksi Tes, Singaraja: Universitas Pendidikan Ganesha


Press

Krathwohl, D. R. (2002). A Revision of Bloom’s Taxonomy: An Review. Theory


Into Practice. Volume 41, Number 4. College Education. The Ohio State
University.

Krathwohl, D. R. et.all (1964).Taxanomy of Educational Objectives, Handbook II;


Affective Domain, New York; McKay

Kunandar (2013), Penilaian Autentik, Jakarta: PT RajaGrafindo Persada

Kusaeri dan Suprananto (2012), Pengukuran dan Penilaian Pendidikan,Yogyakarta:


Graha Ilmu

Lord, F.M. and Novick, M.R. (1974). Statistical Theories of Mental Test Scores.
Reading, MA: Addison-Wesley

Mardapi, Djemari (2008), Teknik Penyusunan Instrumen Tes dan Nontes,


Jogyakarta: Mitra Cendekia

Mardapi, Djemari (2004) , Penyusunan Tes Hasil Belajar, Yogyakarta: Program Pascasarjana
Universitas Negeri Yogyakarta,

Masrun dan Martaniah, S.M (1973), Psikologi Pendidikan, Yogyakarta: Yayasan


Penerbit Fakultas Psikologi UGM

Mathew, Donal K., (1963), Measurement in Physical Education, Second Edition,


WB.Sounders Company, Philadelphia, London.

Mehrens, W. A. & Lehmann, I. J. (1984). Measurement and evaluation in education


and psychology, Third edition. New York: Holt, Rinehart and Winston.

Messick, S. (1989). “Validity” dalam Linn, R. L. (Eds.), Educational measurement


third edition. (pp. 13-103). New York: McMillan.
Miller, M.David, Robert l.Linn and Norman E. Gronlund (2009), Measurement and
Assessment in Teaching, New Jersey: Pearson Education International

Millman, Jason and Greene, Jennifer. (1993).The Spesification and Development


of Tests of Achiievement and Ability in Robert L. Lin (Editor).
Educational Measurement, Third Edition. Phoenix: American Council on
Education, Series on Higher Education Oryx Press.

Mueller, D. J. (1986). Measuring social attitudes. New York: Teachers College,


Columbia University.

Nitko, Anthony J,. & Brookhart, Susan M. (2007). Educational assessment of


student. Pearson Education Inc., Upper Saddle River, New Jersey,

Nitko, Anthony J.( 1996). Educational Assessment of Students. Englewood Cliffs,


204

New Jersey: Prentice-Hall, Inc.

Nurgiyantoro, Burhan. (2010). Penilaian dan Pengajaran Bahasa dan Sastra.


Yogyakarta: BPFEE.

Nurkancana , Wayan & Sumartana (1990), Evaluasi Hasil Belajar, Surabaya: Usaha
Nasional

Phillips, Allen D. (1979). Measurement and Evaluation in physical education.


Canada: John Whiley & Sons, Inc.

Popham, W. James. (1995). Classroom assessment: what teachers need to


know. Needham Heights, MA: Allyn & Bacon, A Simmon & Schuster Company.

Purwanto (2009). Evaluasi Hasil Belajar, Yogyakarta: Pustaka Pelajar

O'Malley, J. Michael, and Lorraine Valdez Pierce. (1996). Authentic Assessment for
English Language Learning: Practical Approaches for Teachers. New York:
Addison-Wesley Publishing

Reynolds, Cecil.R, at.all (2009), Measurement and Assessment in Education, New


Jersey: Upper Saddle River

Rokeach, Milton (1968), Beliefs, Attitudes, anf Values: A Theory of Organiation and
Change, San Fransisco: Jossey-Bass

Salvia, J. & Ysseldyke, J.E. (1996). Assessment. 6th Edition. Boston: Houghton
Mifflin Company.

Sax, G. (1980). Principles of educational and psychological measurement and


evaluation. Belmont: Wadsworth Publishing Company.

Setiadi, Hari (2008), Penilaian Kinerja, Jakarta: Pusat Penilaian Pendidikan,


Departemen Pendidikan Nasional

Simpson, E.J (1972), The Classification of Educational Objectives, Psychomotor


Domain, Ilinois: Teacher of Home Economic

Silverius, Suje (1991), Evaluasi Hasil Belajar dan Umpan Balik, Jakarta: PT
Grasindo

Singarimbun, Masri dan Effendi, Sofian (Ed.). Metode Penelitian Survai. Cetakan-2,
Jakarta: UI-Press, 1993.

Slameto. (1998). Evaluasi Pendidikan. Jakarta: Bumi Aksara.

Stalnaker, J. M. (1951). The Essay Type of Examination. In E. F. Lindquist


(Ed.), Educational Measurement (pp. 495-530). Menasha, Wisconsin:
George Banta.
205

Subali, Bambang (2010), Penilaian, Evaluasi dan Remediasi Pembelajaran Biologi,


Yogyakarta: Jurusan Biologi FMIPA, Universitas Negeri Yogyakarta

Sudijono (2006), Pengantar Evaluasi Pendidikan, Jakarta: PT Raja Grafindo


Persada

Sudjana, Nana, 2004, Penilaian Hasil Proses Belajar Mengajar, Remaja


Rosdakarya, Bandung.

Sudjana, Djudju (2006), Evaluasi Program Pendidikan Luar Sekolah, Rosdakarya.

Suherman, E. (2001). Evaluasi Proses dan Hasil Belajar Matematika. Jakarta:


Universitas Terbuka.

Sukardi. (2008), Evaluasi Pendidikan: Prinsip & Operasionalnya, Jakarta: Bumi Aksara

Sunarti dan Rahmawati, Selly (2013),Penilaian Dalam Kurikulum 2013, Yogyakarta: penerbit Andi

Surapranata, Sumarna dan Muhammad Hatta. 2006. Penilaian Portofolio: Implementasi Kurikulum 2004.
Bandung: PT Remaja Rosdakarya.

Surapranata, Sumarna. (2005). Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil


Tes. Bandung: PT Remaja Rosdakarya Offset

Suryabrata, Sumadi. (2000),. Pengembangan Alat Ukur Psikologis. Yogyakarta:


Penerbit Andi.

Suryabrata, Sumadi (1987). Pengembangan tes hasil belajar. Jakarta:Rajawali

Susetyo, Budi (2011), Menyususn Tes Hasil Belajar, Bandung: CV Cakra

Stark, J.S. & Thomas, A. (1994). Assessment and program evaluation. Needham Heights:
Simon & Schuster Custom Publishing

Stiggins,R.J (1994), Student Centered Classroom Assessment, New York:


Macmillan College Publishing Company

Stufflebeam, D. L. & Shienkfield, A. J. (1985). Systematic Evaluation. Boston:


Kluwer-Nijhoff Publishing.

Stufflebeam, Daniel L., (l974). Evaluation models. Boston: Kluwer-nijhoff


Publishing.

Supratinya, A (2014), Pengukuran Psikologis, Yogyakarta: Universitas Sanata Dharma

Tayibnapis, Farida Yusuf( 2008). Evaluasi Program dan Instrumen Evaluasi. Jakarta:
PT Rineka Cipta

Thoha, Chabib M (2001), Teknik Evaluasi Pendidikan, Jakarta: PT RajaGrafindo Persada


206

Thorndike, Robert, L., & Hagen, Elizabeth. P. (1977). Measurement and evaluation in psychology and
education. New York: John Wiley & Sons.

Wandt, Edwin and Brown, Gerald, W (1957), Essentials of Educational Evaluation,


New York: Holt Rinehart and Winston

Weeden, P., Winter, J., & Broadfoot, P. (2002). Assessment. London; New York:
RoutledgeFalmer.

Wiersma, W and Jurs (1990), Educational Measurement And Testing, Boston: Allyn
and Bacon

Widoyoko, S. Eko Putra (2014), Penilaian Hasil Pembelajaran di Sekolah, Yigyakarta:


Pustaka Pelajar,

Widoyoko, S. Eko Putra (2009) Evaluasi Program Pembelajaran: Panduan Praktis


Bagi Pendidik dan Calon Didik, Yogyakarta: Pustaka Belajar

Wolf, Richard, M. (1984). Evaluation in Education. New York: Praeyer Publishers.

Zainul, Asmawi dan Noehi Nasoetion (1997), Penilaian Hasil Belajar. Pusat Antar
Universitas, Direktorat Jenderal Pendidikan Tinggi: Departemen Pendidikan dan Kebudayaan.
TENTANG PENULIS

Prof. Dr. Yusrizal, M.Pd dilahirkan di


Pidie, Aceh pada 31 Desember 1952.
Setelah lulus Sarjana Pendidikan Fisika dari
FKIE-IKIP Yogyakarta pada 1981, langsung
diangkat menjadi staf pengajar pada Jurusan
Fisika FKIP Universitas Syiah Kuala,
Darussalam-Banda Aceh. Gelar Magister
Pendidikan (bidang Pendidikan Sains) diperolehnya dari PPs
Universitas Negeri Surabaya (UNESA) pada tahun 2000.
Gelar
Doktor diperolehnya dari PPs Universitas Negeri Jakarta (UNJ)
pada tahun 2008 dalam Bidang Penelitian dan Evaluasi
Pendidikan. Pada thun 2011 diangkat menjadi Guru Besar
bidang ilmu Evaluasi pendidikan Unsyiah.
Selain mengajar mata kuliah Evaluasi pengajaran Fisika di
FKIP Unsyiah, juga mengajar mata kuliah Tes dan Pengukuran
pada Program Studi Pendidikan Keolahragaan, mengajar
Language Testing and Evaluation pada Program Studi
Pendidikan Bahasa Inggris, mengajar
Evaluasi Pendidikan di Program Studi-Program Studi:
Pendidikan IPA, Pendidikan Matematika, Pendidikan Bahasa
dan sastra Indonesia serta di Program Studi Magister
Administrasi Pendidikan PPs Unsyiah. Bercita-cita untuk dapat
menerbitkan sejumlah buku mengenai Evaluasi
Pendidikan/Pembelajaran: Tanya Jawab Seputar Pengukuran,
Penilaian dan Evaluasi Pendidikan merupakan awal dari cita-
citanya itu.

Anda mungkin juga menyukai