Anda di halaman 1dari 429

Pengukuran & Evaluasi Hasil Dan Proses Belajar

@Prof. Dr. Yusrizal, M.Pd

Editor : Mukhlisuddin Ilyas


Desain sampul/Tata Letak: Musthafa.Net

Diterbitkan oleh:
Penerbit Pale Media Prima
Jln. Melati No171, Sembilegi Baru Kidul
Maguwoharjo, Depok, Sleman
Daerah Istimewa Yogyakarta
Tlp. ((0274) 4332233 Fax: (0274) 485222
Email: pale.mediaprima@gmaial.com

Cetakan Pertama Oktober 2016


Ukuran : 13.5 x 21 cm (a5)
Halaman: xii+264

HAK CIPTA DILINDUNGAN UNDANG-UNDANG


All Rights Reserved. Dilarang mengutip atau
memperbanyak sebagian atau seluruh isi buku ini
tanpa ada izin ini dari Penerbit.
Hak cipta dilindungi
Undang-undang
All Right Reserved

Undang-Undang No. 19 tahun 2002


Tentang Hak Cipta

1. Barang siapa sengaja melanggar dan tanpa hak


melakukan perbuatan sebagaimana dimaksud
dalam pasal (2) Ayat (1) atau pasal 49 Ayat (1) dan Ayat
(2) dipidana dengan pidana penjara masing-masing
paling singkat 1 bulan dan/atau denda paling sedikit
Rp. 1.000.000,- (satu juta rupiah) atau pidana penjara
paling lama 7 (tujuh) tahun dan/atau denda paling
banyak Rp. 500.000.000 (lima ratus juta rupiah)

2. Barang siapa dengan sengaja menyiarkan,


memamerkan, mengedarkan, atau menjual kepada
umum suatu ciptaan atau barang hasil pelanggaran
hak ciptaan atau hak terkait sebagai pada Ayat (1)
dipidanan dengan pidana penjara paling lama 5 (lima)
tahun dan/atau denda paling banyak Rp.500.000.000
(lima ratus juta rupiah)

| Pengukuran & Evaluasi Hasil Dan Proses Belajar iii


Prof. Dr. Yusrizal, M.Pd

iv | Pengukuran & Evaluasi Hasil Dan Proses Belajar


PRAKATA
Puji syukur kami panjatkan ke hadirat Allah SWT, atas
berkat rahmad, taufik, serta hidayah-NYA penulisan buku
“Tanya Jawab Seputar Pengukuran, Penilaian dan Evaluasi
Pendidikan” ini dapat diselesaikan. Selawat dan salam
semoga dilimpahkan oleh Allah SWT kepada junjungan
kita Nabi Muhammad SAW yang senantiasa kita jadikan
contoh dan suru teladan dalam kehidupan kita.

Dalam Permendiknas No 16 Tahun 2007 tentang


Kualifikasi Akademik dan Standar Kompetensi Guru
disebutkan bahwa salah satu kompetensi inti guru
adalah menyelenggarakan pengukuran dan evaluasi baik
hasil maupun proses belajar. Namun, dari pengalaman
mengajar mata kuliah Evaluasi Pendidikan pada berbagai
program studi magister pendidikan PPs Unsyiah sejak

| Pengukuran & Evaluasi Hasil Dan Proses Belajar v


Prof. Dr. Yusrizal, M.Pd

tahun 2008 menunjukkan bahwa hampir semua mahasiswa


yang umumnya guru, pengetahuan tentang evaluasinya
belum memuaskan.

Berdasarkan alasan tersebut buku Pengukuran & Evaluasi


Hasil dan Proses Belajar ini disusun. Buku ini terdiri atas
Enam Unit yang urutannya sebagai berikut:
Unit I.Pengukuran dan Evaluasi, Unit II.Taksonomi Bloom dan
Ranah Hasil Belajar, Unit III. Instrumen Evaluasi dan Teknik
Penilaian, Unit IV. Kualitas Instrumen, Unit V. Penyusunan
Soal dan Penskoran, dan UnitVI. Pengukuran dan Penilaian
Ranah Afektif.

Sebagai suatu usaha awal, penulis berharap buku ini


dapat bermanfaat dalam membantu para guru dan calon
guru memahami dan menggunakannya dalam proses
pembelajaran.

Tiada gading yang tak retak, demikian juga buku ini


mengandung banyak kekurangan dan kekurangsempurnaan.
Karenaya, penulis menerima dengan hati terbuka berbagai
saran dan kritik-kritik konstruktif yang dapat dijadikan
dasar perbaikan dalam penerbitan berikutnya,

Banda Aceh, Agustus 2016

vi | Pengukuran & Evaluasi Hasil Dan Proses Belajar


DAFTAR ISI
PRAKATA
DAFTAR ISI
UNIT I. PENGUKURANDAN EVALUASI
BAB 1.Sejarah Pengukuran dan Evaluasi
A. Pengembangan Tes Inteligensi
B. Pengembangan Tes Prestasi
C. Pengembangan tes Karakter dan Kepribadian

BAB 2. Konsep Pengukuran, Penilaian dan Evaluasi


A. Pengertian Pengukuran
B. Skala Pengukuran
C. Pengertian Penilaian
D. Penilaian Tradisional dan Penilaian Alternatif
E. Pengertian Evaluasi
F. Jenis Evaluasi
G. Prinsip-Pinsip Evaluasi
H. Fungsi Pengukuran dan Evaluasi

BAB.III. Belajar dan Hasil Belajar


A. Belajar, Prestasi dan Hasil Belajar
B. Pengukuran dan Evaluasi Hasil Belajar
C. Instrumen Dalam Evaluasi

UNIT II.TAKSONOMI BLOOM DAN RANAH HASIL .


BELAJAR
BAB 4 . Ranah Kognitif
A. Taksonomi Bloom Original
B. Taksonomi Bloom Revisi

| Pengukuran & Evaluasi Hasil Dan Proses Belajar vii


Prof. Dr. Yusrizal, M.Pd

BAB 5. Taksonomi Tujuan Afektif dan Psikomotor


A. Taksonomi Ranah Afektif
B. Taksonomi Ranah Psikomotor

UNIT III. INSTRUMEN EVALUASI DAN TEKNIK .


PENILAIAN
BAB 6. Instrumen Tes
A. Pengertian Tes
B. Tujuan Tes
C. Klasifikasi Tes
D. Jenis-Jenis Tes
E. Bentuk-Bentuk Tes Hasil Belajar
F. Keterbatasan Tes Sebagai Alat Ukur
G. Fungsi Tes
H. Karakteristik Tes Yang Baik

BAB 7. Bentuk Tes Hasil Belajar


A. Tes Objektif
B. Tes Esai

BAB 8. Instrumen Nontes


A. Konsep Nontes
B. Kuesioner (Angket)
C. Wawancara (Interview)
D. Daftar Cocok (Check List)
E. Skala Penilaian (Rating Scale)
F. Pengamatan/Observasi
G. Jurnal
H. Inventori

viii | Pengukuran & Evaluasi Hasil Dan Proses Belajar


I. Penilaan Diri
J. Penilaian Oleh Teman Sejawat

BAB 9.Teknik Penilaian


A. Penilaian Kinerja
B. Penilaian Produk
C. Penilaian Proyek
D. Penilaian Portofolio

UNIT IV KUALITAS INSTRUMEN DAN ANALISIS .


BUTIR
BAB 10. Validitas Tes
A.Konsep Val
B. Macam-Macam Validitas
C. Pengujian Validitas
D. Faktor-Faktor Yang Mempengaruhi Validitas

BAB 11. Reliabilitas Tes


A. Pengertian Reliabilitas
B. Jenis-Jenis Reliabilitas
C. Mengestimasi Koefisien Reliabilitas
D. Kesalahan Pengukuran Standar
E. Faktor-Faktor Yang Mempengaruhi .
Reliabilitas
F. Hubungan Antara Reliabilitas dan Validitas

BAB 12. Analisis Butir Tes


A. Pengertian Analisis Butir Tes
B. Manfaat Analisis Butir Tes

| Pengukuran & Evaluasi Hasil Dan Proses Belajar ix


Prof. Dr. Yusrizal, M.Pd

UNIT V. PENYUSUNAN SOAL DAN PENSKORAN


BAB 13. Penyusunan dan Penulisan Soal
A. Penysunan Tes
B. Kaidah Penulisan Soal
C. Penulisan Soal Penalaran Tinggi

BAB 14. Penskoran Hasil Tes


A. Penskoran Hasil Tes
B. Konversi Skor

UNIT VI.PENGUKURAN DAN PENILAIAN AFEKTIF.


BAB 15. Bentuk-Bentuk Skala Pengukuran
A.Skala Pengukuran
B. Pengukuran dan Penilaian Sikap
C. Metode Pengukuran Sikap

BAB 16. Pengembangan Instrumen Afektif


A. Prosedur Pengembangan Instrumen
B. Penulisan Butir Instrumen

BAB 17. Contoh Pengembangan Instrumen


Kinerja Guru
A. Instrumen Kinerja Guru
B. Analisis Hasil Ujicoba

DAFFTAR PUSTAKA

x | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

UNIT I
PENGUKURAN DAN EVALUASI

Pengukuran dan evaluasi merupakan bagian


penting dalam siklus pendidikan. Hasil pengukuran dan
evaluasi sangat berpengaruh dalam pembuatan keputusan
oleh pihak yang terkait seperti guru. Oleh karena itu,
pengukuran dan evaluasi merupakan salah satu kegiatan
utama yang harus dilakukan oleh seorang guru dalam
kegiatan pembelajaran. Dengan pengukuran dan evaluasi,
guru akan mengetahui perkembangan hasil belajar,
intelegensi, bakat, minat, hubungan sosial, sikap dan
kepribadian siswa serta secara umum dapat mengetahui
berhasil dan tidaknya program pembelajaran.

1 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Pengukuran dan evaluasi hasil belajar siswa yang


menjadi tanggung jawab guru di sekolah merupakan
bagian integral dari keseluruhan proses pendidikan.
Melalui kegiatan pengukuran, dapat diperoleh informasi
mengenai efektivitas pembelajaran, tingkat pencapaian/
keberhasilan belajar siswa, dan daya serap materi
pengajaran yang telah diberikan. Dalam setiap pelaksanaan
pengukuran hasil pembelajaran, guru harus
memperhatikan secara seksama alat ukur maupun kondisi
obyektif yang akan diukur, sehingga hasil pengukuran
benar-benar dapat memberikan gambaran obyektif dan
akurat tentang performa siswa yang diukurnya.
Agar evaluasi dapat berhasil dengan baik
diperlukan alat evaluasi yang tepat dan telah teruji dengan
baik. Alat evaluasi harus juga dapat menghasilkan data
yang diperlukan sesuai dengan tujuan evaluasi. Dalam
pembelajaran, guru membutuhkan data yang berkaitan
dengan perkembangan belajar siswa, oleh karena itu guru
melakukan serangkaian pengukuran sesuai dengan jenis
penilaian dan evaluasi. Secara umum dikenal ada dua
macam alat evaluasi, yaitu tes dan nontes. Secara khusus di
dalam kelas alat ukur yang dominan digunakan untuk
mengukur hasil belajar ranah kognitif adalah tes. Nontes
lazimnya digunakan untuk mengukur dan menilai ranah
afektif dan psikomotor.

2 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 1
SEJARAH PENGUKURAN
DAN EVALUASI
Pengukuran pendidikan berkembang melalui proses
evolusi, yang dimulai dari konsep-konsep sederhana
mengkuantifikasi dan menafsirkan perilaku tertentu, tes
dan pengukuran telah berkembang menjadi proses yang
kompleks meliputi seluruh ukuran kepribadian dan ukuran
bermacam-macam sistem kerja dan operasinya.
Gagasan tentang bagaimana pengukuran asal mula
tidak dapat diketahui secara pasti. Namun, dari sedikit

3 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

fakta yang ada yang dibuat oleh beberapa ahli psikologi


dapat disimpulkan bahwa konsep-konsep tes dan
pengukuran diawali dengan pengembangan bermacam-
macam tes psikologis.

A. Pengembangan Tes Inteligensi

Jean Etienne Esquirol, Psikiatris Perancis yang


pertama kali melakukan usaha-usaha untuk
menggambarkan perbedaan-perbedaan diantara
kekurangan dan ketololan mental. Dia juga
memperhitungkan sejumlah pengembangan mendatang
dalam studi mengenai keterlambatan mental. Esquirol
menggunakan kemampuan berbahasa sebagai kriteria dari
perasaan-perasaan dalam mencoba mengelompokkan
individu-individu keterlambatan mental. Pada 1838, dia
menulis buku pertamanya Des maladies mentalis, dimana
dia menjelaskan suatu pandangan objektif dan rasional
tentang gangguan mental. Dia dikenal sebagai “Bapak
Psikologi Abnormal”.
Wilhelm Wundth, ahli Filsafat dan Psikologi Jerman
mendirikan laboratorium pertama di dunia, tempat dia
melakukan eksperimen Psikologi di Leipzig, Jerman dalam
1879. Laboratorium ini diperuntukkan bagi mahasiswa-
mahasiswanya yang berminat dalam psikollogi. Kesibukan
utamanya adalah tentang pengukuran perbedaan daya-
daya sesnsori, yang menghasilkan pengetahuan psikofisik.
Dia dikenal sebagai “Bapak Psikologi Eksperimental” dan
“Pendiri Psikologi Modern”

4 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Hernann Ebbinghaus, ahli Psikologi Eksperimental


Jerman, membuat tes melengkapi kata, yang sampai
sekarang masih digunakan dalam tes-tes inteligensi. Dia
menyelidiki penglihatan warna dan kapasitas mental. Dia
merupakan salah seorang yang pertama
mendemonstrasikan bahwa belajar dan memori dapat
dipelajari secara eksperimen. Meskipun beberapa
tekniknya tentang demonstrasi ini mendapat kritikan,
sumbangan-sumbangannya untuk studi kuantitatif tentang
proses-proses mental lebih tinggi, termasuk tes-tes
inteligensi menjadi penting. Dia dikenal sebagai “Pendiri
Studi Memori Kuantitatif”
Francis Galton, ahli psikologi Inggris, tercatat
sebagai orang paling awal yang menerapkan analisis
statistik pada gejala perilaku dan mental. Dia adalah
seorang peninjau dan penanya inteligensi manusia. Dia
merupakan orang pertama yang menggunakan metode
kuesioner dan survey dalam menyelidiki perbedaan mental
kelompok-kelompok berbeda. Akibatnya, dia mampu
memperbaiki tes-tes pendidikan mental.
Karl Pearson, ahli matematika Inggris yang
mengembangkan teknik-teknik statistik modern. Pada awal
tahun1900-an dia tertarik pada kerja Francis Galton yang
berkeinginan menemukan hubungan-hubungan statistik
untuk menjelaskan bagaimana cirri-ciri biologis
diturunkan ke generasi-generasi. Pearson memperluas
ide-ide regesi Galton dan mengembangkan metode-metode
korelasi yang dikenal “ Koefisien Korelasi Product Moment
Pearson” Sebagian karyanya menjadi dasar statistik abad
ke 20. Pearson adalah mahasiswa Galton.

5 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Charles Spearman, ahli Psikologi Inggris, yang


terpengaruh selama belajar oleh karya-karya Francis
Galton. Berbekal pengetahuan statistiknya yang kuat, dia
membuat suatu estimasi inteligensi sekelompok anak-anak.
Dia akhirnya mengembangkan teori dua faktor inteligensi.
Seperti Pearson, dia mengembangkan metode korelasi
yang dikenal sebagai “Koefisien Korelasi Perbedaan Rank
Spearman. Spaerman adalah juga mahasiswa Galton.
Edward L.Thorndike, ahli Psikologi Amerika yang
mengembangkan psikologi Conecsionis. Thorndike dan
mahasiswa-mahasiswanya menggunakan pengukuran-
pengukuran inteligensi pada manusia sejak 1903. Selama
1920-an dia mengembangkan sebuah tes inteligensi yang
terdiri dari melengkapi, ilmu hitung, kata-kata, dan
petunjuk-petunjuk tes yang dikenal sebagai “CAVD”. Tes
nya menjadi dasar tes-tes inteligensiu modern .
James McKeen Cattell, adalah ahli Psikologi Amerika,
yang menganggap penting gambar-gambar dalam psikologi
dan dalam mempelajari inteligensi manusia. Menggunakan
metode-metode statistik dan kuantifikasi datanya, dia
membantu pengembangan Psikologi Amerika sebagai sains
eksperimental. Dia merupakan ahli psikologi pertama di
Amerika yang menekankan pentingnya kuantifikasi, rankin,
dan rating. Karena sumbangan-sumbangannya yang
signifikan, dia diakui sebagai “ Bapak Tes Mental”
Clark Wissler, ahli Antropolgi Amerika, yang
menggunakan faktor korelasi untuk menemukan kesalahan
empiris metode testing inteligensi J.M.Cattel. Setelah
belajar di bawah Cattel, dia menilai hasil-hasil usaha Cattel
mengukur kemampuan mental dari siswa-siswa dengan

6 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

cara mengukur waktu reaksi mereka, waktu gerakan, dan


proses-prosen sensori serta mental sederhana lainnya. Dia
mendapatkan korelasi yang sangat kecil diantara keadaan
akademik dan tes-tes.
Alfred Binet, ahli Psikologi Perancis, yang mulai
belajar sains pada 1878. Penelitian Binet bersama puteri-
puterinya membantuut mengembangkan konsepsi tentang
inteligensi, terutama pentingnya rentang perhatian dan
saran dalam pengembangan intelektual. Sementara
memimpin Laboratorium Psikologi Eksperimental,
Theodore Simon melakulan penelitian doktoral di bawah
supervisi Binet. Kedua mereka mengembangkan Skala
Binet-Simon. Binet dan Simon merupakan peneliti-peneliti
pertama yang menggunakan umur mental sebagai ukuran
inteligensi, namun ide mereka diperbaiki oleh peneliti-
peneliti pada tahun-tahun berikutnya.
Walter V. Bingham, ahli Psikologi Terapan Amerika,
yang mempercayai bahwa inteligensi adalah sesuatu yang
rumit yang dapat diukur dengan melihat sikap-sikap
individu kepada matematis, lisan, mekanis, dan keahlian
sosial. Dia percaya bahwa faktor keturunan adalah paling
penting dalam pengembangan intelektual, dan bahwa
pengaruh-pengaruh lingkungan hanya mengubah apa yang
sudah ada di dalam diri individu.
Henry Herbert Goddard, ahli Psikologi Amerika, pada
1010 mendirikan laboratorium pertama untuk studi
psikologis orang-orang lambat secara mental. Dia
menerjemahkan Skala Binet-Simon ke dalam Bahasa
Inggris. Pandangan-pandangannya tentang inteligensi
adalah berasal atau diturunkan dari genetik Mendelian. Dia

7 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

mempercayai bahwa feeblemindedness disebabkan oleh


transmisi dari gen recessive tunggal. Dia dikenal sebagai
´Bapak Testing Inteligensi” di Amerika.
William Stern, ahli Psikologi Jerman yang mencoba
mengelompokkan orang menurut jenis, norma, dan
aberasi.Terinspirasi oleh kerja Binet, Stern
mengembangkan ide yang memperlihatkan hasil-hasil tes
inteligensi dalam bentuk angka tunggal,yaitu Inteligensi
Quotion (IQ). Dia menggambarkan inteligensi sebagai umur
mental dibagi dengan umur kronologis. Dalam bentuk
persamaan:
.

Lewis Madison Terman, ahli Psikologi Kognitif


Amerika, yang melihat apakah tes-tes mental dapat
membedakan siswa-siswa terbelakang. Akhir 1906, ketika
di Standford, Terman menerbitkan suatu revisi sempurna
skala Binet-Simon yang dikenal sebagai “ Standford-Binet”
yang merupakan tes inteligensi individu terbaik yang
tersedia. Kemudian, pada 1916, Terman menyatakan
mengubah persamaan inteligensi quotient dengan
mengalikannya angka 100 untuk menyingkirkan desimal-
desimal. Hasilnya adalah persamaan inteligensi quotient
sebagaai berikut:

8 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Robert Mearns Yerkes adalah seorang ahli Psikologi


Komparatif Amerika, yang segera setelah Amerika terlibat
Perang Dunia Pertama, mendesak Perkumpulan Psikologi
Amerika untuk menyumbang keahlian psikologi untuk
usaha perang. Yerkes bekerjasama dengan Goodard,
Terman, dan Bingham mengembangkan tes inteligensi
kelompok yang dapat mengenali tentera baru
berinteligensi rendah dan mengizinkan Tentera mengakui
orang-orang yang berpakaian sangat baik untuk tugas-
tugas sekolah latihan. Mereka membuat tes verval dan tes
nonverbal yang masing-masing dikenal sebagai Army
Alpha dan Army Beta, untuk tentera baru yang buta huruf
dan tidak bisa berbicara bahasa Inggris, Bentuk bentuk
akhir tes-tes Army Alpha dan Army Beta dipublikasin pada
1919.,
David Wechsler, seorang ahli Psikologi Ameriak,
memahami inteligensi lebih dari suatu efek dari pada suatu
sebab. Untuk dalam perbandingan dengan rata-rata
individu menentukan suatu tuntutan penting dari
inteligensi orang dewasa,dia memperkenalkan Deviasi
Quotien, suatu IQ dihitung dengan mempertimbangkan
kemampuan mental individu dibanding dengan umur
individu rata-ratanya Dia adalah orang yang
mengembangkan sebuah tes inteligensi individu orang
dewasa menjadi lampiran pada tes Standford-Binet Tes ini
pada 1939..dikenal sebagai Wechsler Adult Intelligence
Scale disingkat dengan WAIS (Skala Inteligensi Orang
Dewasa Wechsler). Pada 1949, dia mempublikasikan tes
inteligensi lain yang disebut sebagai Wechsler Intelligence

9 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Scale for Children, disingkat WISC atau tes inteligensi


Wechsler untuk anak-anak.
Joy Paul Guilford, seorang ahli Psikologi Amerika
yang membuat banyak sumbangan untuk studi
kemampuan-kemampuan intelektual manusia. Model
inteligensi manusianya dikenal sebagai “ Struktur Intelek”
yang rumit, model inteligensi tiga dimensi yang dapat
digunakan untuk panduan pengajaran pendidikan. Banyak
tes-tesnya diodefikasi dan dikembangkan dibawah
bimbingannya dengan menggunakan analisis faktor.

B. Pengembangan Tes Prestasi

Horace Mann yang memperkenalkan ujian tulis pada


sekolah-sekolah di Boston karena kelemahan tes lisan.
Sekolah Normal untuk Guru-Guru didirikan di Lexington,
Massachusetts pada 1839 atas usaha-usaha Mann. Karena
sumbangan-sumbangannya itu, dia dikenal sebagai “Bapak
Pendidikan Sekolah Umum Amerika”.
Rev. George Fisher, seorang kepala sekolah Inggris,
yang menciptakan dan menggunakan ukuran objektif
prestasi murid-murid. Pada 1864, dia menciptakan sebuah
instrument yang dinamakan “ Buku Skala”. Buku Skalanya
dibuat untuk mengukur prestasi siswa pada pokok materi
sekolah berbeda, seperti skala tulisan tangan, mengeja,
matematika, tata bahasa, komposisi, dan lainnya. Tes-tes
ini (Buku Skala) masih agak kasar, namun menjadi awal
dari tes-tes keahlian modern saat ini.

10 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

J.M. Rice, yang dikenal sebagai penemu pertama tes


objektif komparatif di Amerika. Pada 1894, dia membuat
sebuah daftar ejaan (spelling) kata-kata untuk mengukur
perbedaan-perbedaan diantara kelompok-kelompok siswa
yang diajarka secara berbeda. Rice menemukan bahwa
siswa-siswa yang belajar spelling selama tiga puluh menit
setiap hari selama delapan tahun tidak menunjukkan lebih
baik kemampuan spellingnya dari pada siswa-siswa yang
belajar spelling hanya lima belas menit setiap hari selama
delapan tahun. Dia juga mempersiapkan tes-tes serupa
untuk bahasa dan ilmu hitung. Tes-tes ini merupakan awal
dari tes-tes objektif di sekolah-sekolah berbeda.
Dr. Edward L. Thorndike, telah mengembangkan
metode untuk mengukur bermacam-macam kemampuan
dan prestasi menjelang Amerika ambil bagian dalam
Perang Dunia I. Buku pertamanya yang dikenal sebagai
“Pengukuran Mental dan Sosial” diterbitkan pada 1904. Isi
buku tersebut menjadi dasar prosedur-prosedur dan
prinsip-prinsip statistik pada teknik-teknik statistik dan
tes-tes hari ini. Dia yang pertama kali mengkonstruksi
skala menulis tangan untuk mengukur menulis tangan
anak-anak pada 1909, yang menunjukkan nilai-nilai
kualitatif untuk kualitas menulis tangan. Skala ini dikenal
sebagai Skala Menulis tangan Thorndike”. Dia juga
dipandang sebagai “Bapak Pengukuran Pendidikan”.
Cliff W. Stone, seorang mahasiswa Thorndike,
mengkonstruksi dua macam tes, pertama, mengenai empat
operasi dasar dalam ilmu hitung dan yang kedua, tes nalar
ilmu hitung pada 1908. Stone dipandang sebagai orang
pertama yang mempublikasikan tes prestasi standar dalam

11 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

ilmu hitung. Tes ini dikenal sebagai Tes Ilmu Hitung Stone
pada 1908. Tes nalar ilmu hitung merupakan sumbangan
Stone untuk testing dan pengukuran pendidikan.
S.A.Curtis, adalah juga mahasiswa Thorndike
lainnya, sama seperti Stone, Curtis tertarik dalam
mengukur pertumbuhan murid-murid dalam ilmu hitung
dan dalam menetapkan sebuah norma pencapaian untuk
setiap tingkat (grade). Dia mengembangkan serangkaian
tes-tes standar dalam ilmu hitung untuk digunakan pada
1909. Konsep kata benda (nouns) dan standar-standar
diawali oleh Curtis. Tes yang dikonstruksinya dikenal
sebagai “Rangkaian Tes Ilmu Hitung Curtis”
M.Hillegas, juga seorang mahasiswa Thorndike,
mengkonstruksi serangkaian tes-tes standar dalam Skala
Komposisi berdasarkan prinsip-prinsip dalam konstruksi
Skala Menulis Tangan Thorndike pada 1912. Skala ini
dikenal sebagai “Skala Komposisi Hillegas” dan tes ini
menjadi dasar skala komposisi hari ini.
Ayres, Mahasiswa Thorndika juga, yang
mengembangkan skala-skala ejaan (spelling) standar pada
1915. Skala ini dikenal sebagai “ Skala Ejaan Ayres”
William A.McCall, mempublikasikan buku pionirnya
berkaitan dengan adaptasi tes pada 1924. Jenis tes yang
dikonstruksinya merupakan jenis baru tes yang meluas
digunakan hari ini.
Raph. W. Tyler menyadari perlu ada perluasan tes
prestasi untuk hasil-hasil pengajaran yang tidak dapat
diukur secara akurat seperti sikap, apresiasi, minat,
gagasan, dan lainnya. Sumbangan Tyler jugamembawa
kekonsep testing modern.

12 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

C. Pengembangan Tes Karakter dan


Kepribadian

Fernand adalah terkenal sebagai orang pertama


yang mengukur karakter dengan menggunakan tes,
sementara Voelker, orang yang menciptakan situasi-situasi
sebenarnya untuk testing (pengujian) karakter.
Percival Symonds, seorang ahli psikologi yang
mengembangkan studi ilmiah tentang kepribadian.
Herman Rorschach, memperkenalkan sebuah tes
multi dimensi kepribadian yang dikenal sebagai tes
Rorschach pada 1921. Tes ini terdiri atas 10 noda tinta
yang digunakan sebagai teknik proyektif untuk menilai
aspek-aspek global kepribadian. Siswa merespons dengan
cara melapurkan apa yang dilihat dalam noda tinta, dan
reaksi-reaksinya menentukan variable-variabel
kepribadiannya seperti sifat impulsif, sensitivitas, dan
stabilitas emosi.
Raymond B, Cattel, seorang ahli Psikologi Amerika
dan Inggris, penyumbang dan pemakai teknik-teknik
statistik lanjut. Dia mencari teori teori komprehensif
perilaku manusia melalui analisis multi faktor sejak awal
karirnya dan dia tertarik dengan analisis faktor C.
Spearman. Hobinya tentang teori komprehensif perilaku
melalui metode analisis faktor telah menghasilkan
bermacam-macam model teoritis dan instrumen-
instrumen psikometrik. Pengembangan teorinya dalam
pengukuran kepribadian dengan pertanyaan diwujudkan
dalam 16 faktor kepribadian.

13 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

14 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 2
KONSEP PENGUKURAN,
PENILAIAN DAN EVALUASI
A. Pengertian Pengukuran
Beberapa definisi yang dikemuka kan para ahli
tentang pengertian pengukuran adalah sebagai berikut :
1.Measurement is the assignment of numerals to objects
or events according to rules that give numeral
quantitative meaning”, Pengukuran adalah
pengalihan dari angka ke objek atau peristiwa sesuai
dengan aturan yang memberikan makna angka secara
kuantitatif (Wiersma and Jurs,1990)

15 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

2.Measurement is a procedure for assigning numbers


(ussualy called scores) to a specified attribute or
characteristic of persons in such a manner as to
maintain the real world relationships among the
persons with regard to the attribute being measured.
Pengukuran adalah prosedur pemberian angka (biasa
disebut skor) untuk suatu atribut tertentu atau
karakteristik orang-orang sedemikian rupa untuk
menjaga hubungan dunia nyata antara orang-orang
berkaitan dengan atribut yang diukur (Lord and
Novick, 1974).

3.Measurement. is the assign of numbers to the results of


a test or other type of assessment according to a
specific rule. Pengukuran adalah pemberian angka
pada hasil suatu tes atau jenis penilaian lain menurut
aturan tertentu (Gronlund and Linn, 1995)

4.Measurement defined as the process of assigning


numerals to objects according to rules. Maksudnya
pengukuran didefinisikan sebagai proses penetapan
bilangan-bilangan pada objek menurut aturan
(Dizney, 1971)

Dari sejumlah pengertian di atas, pengukuran dapat


diartikan sebagai kegiatan atau upaya yang dilakukan
untuk memberikan angka-angka pada suatu gejala atau
peristiwa, atau benda, sehingga hasil pengukuran akan
selalu berupa angka. Menurut Zainul dan Nasution (2005)
pengukuran memiliki dua karakteristik utama, yaitu: 1)

16 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

penggunaan angka atau skala tertentu, 2) menurut suatu


aturan atau formula tertentu.
Melalui pengukuran, atribut atau karakteristik yang
terdapat dalam obyek yang diukur ditransfer menjadi
bentuk angka sehingga lebih mudah untuk dinilai. Aspek-
aspek yang terdapat dalam diri manusia seperti kognitif,
afektif dan psikomotor dirubah menjadi angka. Adapun
proses pengukuran menurut Koyan (2012) dapat dilihat
pada Gambar 2.1 berikut.

Sasaran ukur: Atribut orang, objek


Peristiwa

Alat Ukur (Skala Ukur)

Cara Ukur

Responden: orang, objek, peristiwa

Skor (Data): Bilangan

Gambar 2.1. Proses Pengukuran

Makna gambar tersebut di atas dapat dijelaskan


sebagai berikut.
1) Sasaran ukur pada responden adalah atribut orang
(hasil belajar mahapeserta didik, sikap karyawan),
atribut objek (tinggi meja, kedalaman ilmu), peristiwa

17 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(kecepatan pengolahan data); biasanya berbentuk


variable.
2) Alat ukur (skala ukur) dibuat, diuji coba, diperbaiki,
dan harus cocok dengan sasaran ukur dan responden
3) Skala ukur adalah besaran pada alat ukur (Misalnya:
satuan ukur) yang digunakan untuk memperoleh skor
atau data.
4) Cara ukur adalah cara alat ukur diberikan kepada
responden untuk memperoleh skor; dalam hal ini
perlu diperhatikan sifat alat ukur, sifat responden,
dan kualitas skor.
5) Skor adalah bilangan yang diberikan kepada atribut
orang, objek, atau peristiwa.
6) Nilai adalah arti dari skor sebagai hasil pengukuran;
skor ditransformasi menjadi nilai.

Dalam dunia pendidikan, yang dimaksud


pengukuran (measurement) adalah proses pemberian
angka atau usaha memperoleh deskripsi numerik dari
suatu tingkatan di mana seorang siswa telah mencapai
karakteristik tertentu. Sebagai contoh, guru melakukan
pengukuran terhadap proses dan hasil belajar yang
hasilnya berupa angka-angka yang mencerminkan capaian
dari proses dan hasil belajar tersebut. Angka 40, 65, atau
100 yang diperoleh dari hasil pengukuran proses dan hasil
pembelajaran tersebut bersifat kuantitatif dan belum dapat
memberikan makna apa apa, karena belum menyatakan
tingkat kualitas dari apa yang diukur. Angka hasil
pengukuran masih disebut skor mentah. Angka hasil
pengukuran baru mempunyai makna bila dibandingkan

18 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dengan kriteria atau patokan tertentu, yang disebut


penilaian. Hasil penilaian dapat berupa nilai kualitatif
(pernyataan naratif dalam kata-kata) dan nilai kuantitatif
(berupa angka)
Pengukuran dapat menggunakan tes dan non-tes.
Pengukuran yang menggunakan tes seperti tes pilihan
ganda, tes benar-salah, tes menjodohkan, tes melengkapi,
dan tes esai yang terstruktur. Pengukuran yang
menggunakan non tes, misalnya skala sikap, skala penilaian
atau skala motivasi.

B. Skala Pengukuran

Skala pengukuran adalah seperangkat aturan yang


diperlukan untuk mengkuantitatifkan data pengukuraan
dari suatu variable (Djaali & Muljono, 2008). Dalam
pengukuran terdapat karakteristik utama, yaitu
penggunaan angka atau skala tertentu Skala atau angka
dalam pengukuran dapat diklasifikasikan ke dalam 4
(empat) kategori, yaitu: skala nominal, skala ordinal, skala
interval, dan skala rasio.

1. Skala Nominal

Nominal scales classify people or objects into


categories, classes, or sets (Reynolds, at.all, 2009)

Skala nominal adalah pengukuran yang semata-


mata hanya membedakan satu atau lebih kategori dengan
kategori lainnya. Kategori-kategori tersebut bersifat

19 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

terpisah dan masing-masing kategori diberi nomor untuk


membedakannya.
Misalnya, variabel ”jenis kelamin”, nilai 1 untuk pria
dan 2 untuk wanita. Variabel ”agama”dapat diberi nomor 1
untuk Islam, 2 untuk kristen, 3 untuk Hindu, dan 4 untuk
Budha. Angka 1, 2, 3, 4 hanya sebagai label saja.
Angka atau nomor yang ditetapkan dalam skala
nominal hanya berfungsi sebagai identitas anggota suatu
kategori. Angka atau nomor yang terdapat pada baju para
pemain bola adalah contoh skala nominal. Jadi tidak dapat
dikatakan bahwa pemain dengan nomor baju 4 adalah
pemain yang selalu lebih baik daripada pemain dengan
baju nomor 8. Angka atau nomor baju pemain bola hanya
sebagai lambang atau simbol kategori saja.
Meskipun ada pemberian nomor atau angka, namun
dalam skala nominal tidak dapat menggunakan operasi-
operasi perhitungan penambahan, pengurangan,
pembagian, atau perkalian. Menurut Djaali (2008) tes yang
menggunakan skala nominal sebenarnya bukan kegiatan
pengukuran, melainkan lebih pada pengkategorisasian,
pemberian nama, dan menghitung fakta-fakta atau obyek
yang sedang diukur.

2. Skala Ordinal

Ordinal scales rank people or objects according to the


amount of characteristic they display or possess
(Reynolds, at.all, 2009)

20 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Skala ordinal adalah skala yang di samping


membedakan antara satu kategori dengan kategori lainnya,
juga mempunyai ranking atau tingkatan kategorinya. Data
dapat disusun dari yang terendah ke yang tertinggi, atau
sebaliknya.
Sebagai contoh skala ordinal adalah ranking
prestasi yang dicapai siswa di sekolah berdasarkan hasil
tesnya. Skor siswa dapat diurut mulai dari ranking
pertama, kedua, ketiga, dan seterusnya. Contoh lainnya
adalah variabel ”kecantikan” yang dapat diurut menjadi
kategori sangat cantik diberi nilai 3, cantik diberi nilai 2,
dan kurang cantik diberi nilai 1, atau sebaliknya.
Data yang diperoleh dengan pengukuran skala
ordinal disebut data ordinal, yaitu data yang berjenjang di
mana jarak antara satu data dengan data lainnya tidak
sama. Skala ordinal dapat menggunakan operasi logika
yaitu > (lebih besar), atau < (lebih kecil), namun tidak
dapat diketahui tingkat perbedaan atau jarak intervalnya.
Karena itu prosedur statistika tidak dapat digunakan pada
skala ini. Operasi tambah, kurang, kali dan bagi juga tidak
dapat digunakan pada skala ordinal.

3. Skala Interval

Interval scales rank people or objects like an ordinal


scales, but on a scale with equal units (Reynolds,
at.all 2009)

Skala interval memiliki ciri yang sama dengan skala


ordinal. Bedanya pada skala interval mempunyai jarak

21 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

yang sama antara satu data dengan data yang lain. Pada
skala interval hubungan urutan dan jarak antara angka-
angka itu mempunyai arti.
Misalnya, pada variabel ”temperatur” yang memiliki
perbedaan antara 50 dan 51 derajat Celcius sama dengan
perbedaan antara 30 dan 31 derajat Celcius. Tetapi tidak
dapat menyatakan bahwa 50 derajat Celcius itu sama
dengan dua kali lebih panas dari 25 derajat Celcius, karena
pada skala interval tidak ada titik nol mutlak.
Contoh lain dari skala interval adalah mengurutkan
kualitas kinerja guru: sangat tinggi (5), tinggi (4), cukup
tinggi (3), rendah (2), rendah sekali (1). Operasi hitung
seperti tambah, kurang. kali dan bagi dapat digunakan
pada skala interval.
Hal lain juga yang diingat adalah bahwa pada skala
interval tidak dikenal adanya nilai 0 (nol) mutlak, jadi, jika
misalnya seorang siswa hasil tesnya mendapat skor nol,
bukan berarti siswa tersebut tidak memiliki pengetahuan
sama sekali.

4. Skala Rasio

Ratio scales have the properties of interval scales plus


a true zero point (Reynolds, at.all, 2009)

Skala rasio adalah skala pengukuran yang


mempunyai nilai nol mutlak dan mempunyai jarak yang
sama. Menurut Sofian Effendi (1989) skala rasio adalah
suatu bentuk interval yang jaraknya (interval) tidak
dinyatakan sebagai perbedaan nilai antar responden, tetapi
antara seorang responden dengan nilai nol absolut.

22 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh data skala rasio adalah gaji pegawai atau


karyawan. Gaji nol rupiah berarti pegawai atau karyawan
tersebut tidak menerima uang sedikitpun. Karena adanya
nol mutlak maka semua operasi matematik dapat
diterapkan pada skala rasio ini.

Tabel 2.1. Skala pengukuran


Skala Ciri-ciri
Nominal Mempunyai nilai pembeda saja
Ordinal Mempunyai nilai pembeda dan peringkat
Interval Mempunyai nilai pembeda, peringkat dan
mempunyai jarak yang sama
Rasio Mempunyai nilai pembeda, peringkat,
jarak yang sama, dan mempunyai titik nol
mutlak

C. Pengertian Penilaian
Agar lebih jelas dan lebih memperluas wawasan
tentang pengertian penilaian, kita dapat melihat beberapa
pengertian penilaian atau asesmen yang dikemukakan para
ahli berikut ini:
1. Assessment is any of a variety of procedures used to
obtain information about student performance.
Penilaian adalah salah satu prosedur yang
digunakan untuk memperoleh informasi mengenai
kinerja siswa (Miller, Linn & Gronlund, 2009)

23 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

2. Assessment is any systematic prosedure for collecting


information that can be used to make inferences
about the characteristics of people or objects.
Penilaian adalah salah satu prosedur sistematik
untuk mengumpulkan informasi yang dapat
digunakan untuk membuat kesimpulan mengenai
karakteristik orang atau objek (Reynolds, at all,
2009)

3. Assessment is “the’ collection, synthesis, and


interpretation of information to aid the teacher in
decision making. Penilaian merupakan
'pengumpulan, sintesis, dan menafsirkan informasi
untuk membantu pengajar dalam pengambilan
keputusan (Airasian, 1997)

4. Assessment is the act of collecting information about


individuals or groups of individuals in order to better
understand them. Penilaian adalah tindakan
mengumpulkan informasi tentang individu atau
kelompok untuk lebih memahami mereka (Buttler
and McMunn, 2006)

5. Penilaian adalah proses untuk menentukan nilai


dari suatu obyek atau peristiwa dalam suatu
konteks situasi tertentu, dimana proses penentuan
nilai berlangsung dalam bentuk interpretasi yang
kemudian diakhiri dengan suatu "Judgment"
(Sudjana ,2004)

24 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

6. Penilaian mencakup semua cara yang digunakan


untuk menilai kerja individu, yaitu prestasi belajar
yang dicapai peserta didik. Proses penilaian melalui
bukti-bukti tentang pencapaian belajar peserta
didik (Mardapi, 2008)

Menurut Griffin & Nix (1991) penilaian merupakan


suatu pernyataan berdasarkan sejumlah fakta untuk
menjelaskan karakteristik seseorang atau sesuatu. Senada
dengan Griffin & Nix, Salvia dan Ysseldike (1994)
mengemukakan bahwa penilaian atau asesmen adalah
suatu proses mengumpulkan data dengan tujuan agar
dapat dilakukan keputusan mengenai suatu objek. Oleh
karena itu, kegiatan penilaian tidak terbatas hanya pada
karakteristik siswa saja, tetapi juga mencakup karakteristik
metode mengajar, kurikulum, fasilitas, dan administrasi
sekolah. Penilaian juga diartikan sebagai kegiatan
menafsirkan data hasil pengukuran atau kegiatan untuk
memperoleh informasi tentang pencapaian kemajuan
belajar siswa.
Jadi, penilaian (assessment) adalah penerapan
berbagai cara dan penggunaan beragam alat penilaian
untuk memperoleh informasi tentang sejauh mana hasil
belajar siswa atau ketercapaian kompetensi siswa.
Penilaian menjawab pertanyaan tentang sebaik apa hasil
atau prestasi belajar seorang siswa.
Pengukuran dan penilaian mempunyai hubungan
yang erat dan bertingkat. Kita tidak dapat melaksanakan
penilaian sebelum melakukan pengukuran terlebih dahulu
terhadap sesuatu. Sebaliknya, pengukuran tidak akan

25 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

berguna apabila kita tidak mengadakan penilaian terhadap


sesuatu yang telah kita ukur itu. Penilaian merupakan
langkah lanjutan setelah dilakukan pengukuran. Informasi
yang diperoleh dari pengukuran selanjutnya
dideskripsikan dan ditafsirkan. Karenanya, jika seorang
guru ingin melakukan penilaian, maka haruslah terlebih
dahulu melakukan pengukuran. Mardapi (1999)
menyatakan bahwa penilaian adalah kegiatan menafsirkan
atau mendeskripsikan hasil pengukuran
Penilaian merupakan proses kegiatan untuk
mengambil keputusan berdasarkan informasi yang
diperoleh dari pengukuran hasil belajar baik melalui
instrumen tes maupun non tes. Penilaian dilakukan setelah
siswa menjawab soa-soal yang terdapat pada tes. Hasil
jawaban siswa tersebut ditafsirkan dalam bentuk nilai. Jadi
penilaian adalah suatu proses pengumpulan dan
pengelohan data dari hasil pengukuran menjadi bentuk
yang dapat dijelaskan.

D. Penilaian Tradisional dan Penilaian


Alternatif

Gabel (1993) mengelompokkan asesmen (penilaian)


ke dalam dua kelompok, yaitu penilaian tradisional
(traditional assessment) dan penilaian alternatif
(alternative assessment). Dalam beberapa literatur,
asesmen alternatif ini kadang-kadang disebut sebagai
asesmen autentik (authentic assessment), asesmen

26 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

portofolio (portfolio assessment) atau asesmen kinerja


(performance assessment). (Herman, 1997; Popham, 1995).
Penilaian yang tergolong tradisional adalah
penilaian yang menggunakan tes Benar-Salah, tes Pilihan
Ganda, tes melengkapi, dan tes jawaban terbatas.
Sedangkan penilaian alternatif atau autentik menurut
Mueller (2008) adalah suatu bentuk tugas yang
menghendaki pembelajar untuk menunjukkan kinerja di
dunia nyata secara bermakna yang merupakan penerapan
esensi pengetahuan dan keterampilan. Penilaian autentik
memuat instrumen yang mengharuskan siswa untuk
mempertunjukkan kinerja, bukan menjawab atau memilih
jawaban dari sederetan kemungkinan jawaban yang sudah
tersedia.

E. Pengertian Evaluasi

Agar lebih jelas dan lebih memperluas wawasan


tentang pengertian penilaian, kita dapat melihat beberapa
pengertian penilaian atau asesmen yang dikemukakan para
ahli berikut ini:
Menurut pengertian bahasa, kata evaluasi berasal
dari bahasa Inggris evaluation yang berarti penilaian atau
penaksiran (Echols dan Shadily,1989). Beberapa
pengertian atau batasan evaluasi yang dikemukakan para
ahli adalah adalah sebagai berikut.
1. Evaluation refer to the act or process to determining the
value of samething. Artinya, evaluasi adalah suatu tindakan

27 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

atau suatu proses untuk menentukan nilai dari sesuatu


(Wind and Brown, 1975).

2. Evaluation is the process of delineating, obtaining, and


providing useful, information for judging decision
alternatives. Maksudnya, evaluasi merupakan proses
menggambarkan, memperoleh dan menyajikan informasi
yang berguna untuk menilai alternatif keputusan
(Stufflebeam et.al, 1974).

3. Evaluation be defined as the systematic process of


collecting, analizing, and interpreting information to
determine the extent to which pupils are achieving
instructional objectives” artinya, evaluasi merupakan
proses pengumpulan informasi, analisis dan interpretasi
informasi yang sistematis untuk menentukan sejauhmana
siswa mencapai tujuan pembelajaran (Grounlund dan Linn,
1995).

4. Evaluation a systematic process of determining the extent


to which instructional objective are achieved by pupils”,
artinya, evaluasi adalah sebuah proses sistematis yang
menentukan sejauhmana tujuan pembelajaran dicapai oleh
siswa (Anastasi 1997)
Dari pandangan-pandangan di atas, kita dapat
melihat bahwa esensi dari evaluasi adalah suatu proses
sistematis untuk mengumpulkan informasi, mengadakan
pertimbangan-pertimbangan mengenai informasi, serta
mengambil keputusan berdasarkan pertimbangan yang
telah dilakukan. Menurut Kumano (2001) evaluasi adalah

28 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

penilaian terhadap data yang dikumpulkan melalui


kegiatan asesmen.
Dalam konteks pembelajaran di kelas, evaluasi
dilakukan untuk mengetahui kemajuan dan hasil belajar
peserta didik, mendiagnosis kesulitan belajar, memberikan
umpan balik/perbaikan proses belajar mengajar, dan
penentuan kenaikan kelas. Melalui evaluasi dapat
diperoleh informasi yang akurat tentang penyelenggaraan
pembelajaran dan keberhasilan belajar peserta didik, guru,
serta proses pembelajaran itu sendiri. Dengan demikian
maka informasi yang diperoleh pada evaluasi harus
relevan, akurat, dan secara komprehensif mencerminkan
hasil belajar peserta didik.
Evaluasi merupakan suatu proses yang mempunyai
peranan sangat penting dalam dunia pendidikan karena
hasil evaluasi merupakan informasi yang dapat digunakan
sebagai landasan pengambilan bermacam-macam
keputusan. Evaluasi menentukan tingkat perbedaan antara
”apa yang dihasilkan” dengan ”apa yang diharapkan” dari
suatu program pendidikan.
Kegiatan evaluasi selalu didahului dengan kegiatan
pengukuran, yaitu proses penetapan angka menurut aturan
tertentu, kemudian dilanjutkan penilaian dan diakhiri
evaluasi. Penilaian diartikan sebagai suatu kegiatan
menafsirkan data hasil pengukuran. Dengan demikian
evaluasi merupakan suatu kegiatan yang kompleks dan
terus menerus untuk mengetahi manfaat suatu kegiatan
untuk selanjutnya digunakan sebagai pertimbangan dalam
menentukan suatu keputusan. Griffin & Nix (1991)
menyatakan pengukuran, asesmen, dan evaluasi adalah

29 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

hirarki. Maksudnya kegiatan dilakukan secara berurutan,


dimulai dengan pengukuran, kemudian penilaian, dan
terakhir evaluasi.

F. Jenis Evaluasi

Terdapat tiga jenis evaluai prestasi siswa dalam


kaitan dengan pembelaajaran ruang kelas. Ketiga jenis
evaluasi tersebut yaitu evaluasi diagnostik, evaluasi
formatif dan evaluasi sumatif.
Evaluasi diagnostik mengacu pada evaluasi yang
dilakukan sebelum pembelajaran. Tujuan utama evaluasi
diagnostik adalah untuk mengidentifikasi kekuatan dan
kelemahan siswa, atau untuk mengetahui kesulitan belajar
yang dihadapi siswa, termasuk kesalahan pemahaman
konsep. Evaluasi diagnostik dilaksanakan kalau sebagian
besar siswa gagal dalam mengikuti proses pembelajaran
pada mata pelajaran tertentu. Dari hasil evaluasi diagnostik
akan diketahui konsep-konsep apa saja yang belum
dipahami dan yang telah dipahami siswa. Dari bukti nilai
yang diperoleh melalui tes, guru dapat memperbaiki
kelemahan pengajarannya yang memastikan siswa
menguasai sesuatu pengetahuan dan ketrampilan sebelum
pengetahuan dan ketrampilan yang lebih tinggi
dilanjutkan. Biasanya soal-soal untuk evaluasi diagnostik
berisi materi yang dirasa sulit oleh siswa.
Evaluasi formatif bertujuan untuk memperoleh
informasi atau masukan mengenai tingkat keberhasilan
pelaksanaan pembelajaran. Informasi ini berguna bagi guru

30 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

untuk memperbaiki strategi mengajarnya. Evaluasi


formatif dilakukan secara periodik sepanjang semester.
Evaluasi formatif bukan untuk menentukan keberhasilan
belajar siswa, tetapi untuk mengetahui keberhasilan proses
pembelajaran. Evaluasi formatif dapat dilakukan dengan
kuiz-kuiz. Materi soal dipilih berdasarkan tujuan
pembelajaran tiap pokok materi atau sub pokok materi.
Evaluasi sumatif diberikan pada akhir suatu
pelajaran, atau akhir semester. Hasilnya untuk menentukan
keberhasilan belajar siswa. Tingkat keberhasilan ini
dinyatakan dengan skor atau nilai, pemberian sertifikat,
dan sejenisnya. Tingkat kesukaran soal pada evaluasi
sumatif bervariasi, sedang materinya harus mewakili
bahan yang telah diajarkan (Mardapi, 2004).

G. Prinsip-Prinsip Evaluasi

Pelaksanaan evaluasi agar akurat dan bermanfaat


baik bagi siswa, pendidik ataupun pihak yang
berkepentingan, maka harus memperhatikan prinsip-prisip
sebagai berikut:

a. Valid.
Evaluasi harus mengukur apa yang seharusnya
diukur dengan menggunakan jenis tes yang
terpercaya dan sahih. Artinya harus ada kesesuaian
antara alat ukur dengan fungsi pengukuran dan
sasaran pengukuran.

31 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

b. Berkelanjutan/Berkesinambungan
(kontinuitas).
Evaluasi harus dilakukan secara terus menerus dari
waktu ke waktu untuk mengetahui secara
menyeluruh perkembangan siswa, sehingga
kegiatan dan untuk kerja siswa dapat dipantau
melalui evaluasi.

c. Menyeluruh (Komprehensif).
Evaluasi harus dilakukan secara menyeluruh, yakni
meliputi berbagai aspek kompetensi yang akan
dievaluasi. Evaluasi yang menyeluruh meliputi
ranah pengetahuan (kognitif), keterampilan
(psikomotor), sikap dan nilai (afektif) yang
direfleksikan dalam kebiasaan berfikir dan
bertindak.

d. Bermakna.
Evaluasi diharapkan mempunyai makna yang
signifikan bagi semua pihak. Oleh karena itu, maka
evaluasi hendaknya mudah difahami dan dapat
ditindaklanjuti oleh pihak-pihak yang
berkepentingan.

e. Adil dan objektif.


Evaluasi harus mempertimbangkan rasa keadilan
bagi siswa dan objektif berdasarkan kenyataan yang
sebenarnya, tidak boleh dipengaruhi oleh hal-hal
yang bersifat emosional dan irasional.

32 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

f. Terbuka.
Evaluasi hendaknya dilakukan secara terbuka bagi
berbagai kalangan sehingga keputusan tentang
keberhasilan siswa jelas bagi pihak-pihak yang
berkepentingan, tanpa ada rekayasa atau sembunyi-
sembunyi yang dapat merugikan semua pihak.

g. Ikhlas.
Evaluasi harus dilakukan dengan niat dan yang
bersih, dalam rangka efisiensi tercapainya tujuan
pendidikan dan bai kepentingan siswa.

h. Praktis.
Evaluasi dilakukan dengan mudah dimengerti dan
dilaksanakan dengan beberapa indikator, yaitu: a)
hemat waktu, biaya dan tenaga; b) mudah
diadministrasikan; c) mudah menskor dan
mengolahnya; dan d) mudah ditafsirkan.

i. Sistematis.
Evaluasi dilakukan secara berencana dan bertahap
untuk memperoleh gambaran tentang
perkembangan belajar peserta didik sebagai hasil
kegiatan belajarnya.

j. Mendidik.
Evaluasi harus mampu memberikan sumbangan
positif terhadap peningkatan pencapaian belajar
siswa. Hasil penilaian harus dapat memberikan

33 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

umpan balik dan memotivasi peserta didik untuk


lebih giat belajar.

H. Fungsi Pengukuran dan Evaluasi

Menurut Assad dan Hailaya (2005) ada lima fungsi


pengukuran dan evaluasi hasil belajar yaitu:

a. Mengukur pencapaian siswa. Melalui melakukan


pengukuran, hasil belajar siswa dalam kelas dapat
ditentukan. Selain itu, gambaran apakah siswa telah
tercapai tujuan atau tidak dapat dinilai melalui
pengukuran.

b. Memotivasi siswa untuk belajar. Pengukuran


dapat membuat siswa untuk lebih giat belajar. Minat
siswa untuk mempelajari materi atau pelajaran
tertentu bangkit. Sebagai contoh, seorang siswa
yang mendapat skor tinggi dalam suatu tes hasil
belajar akan termotivasi untuk mempertahankan
skor itu, bahkan ia berharap untuk mendapatkan
skor yang lebih tinggi dalam tes berikutnya, dan
berharap dapat menjadi juara kelas. Sebaliknya, jika
perolehan skor hasil belajarnya rendah, dia
terhalang untuk berusaha dan memperbaiki
skornya pada ujian berikutnya.

c. Meramalkan keberhasilan siswa. Keberhasilan


dan kegagalan siswa dalam kelas dan kelas-kelas
lebih tinggi berikutnya dapat diprediksi melalui
pengukuran. Guru dapat membedakan apakah
sesorang siswa tertentu mempunyai kesempatan

34 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

untuk lulus dan dapat dinaikkan ke kelas


berikutnya. Misalnya, seorang siswa yang selalu
mendapat skor tinggi dalam banyak pelajaran dapat
diprediksi akan naik kelas atau lulus. Sebaliknya,
seorang siswa yang setiap waktu memperoleh skor
hasil belajarnya rendah dapat prediksi akan gagal
dan tinggal kelas.

d. Mendiagnosis kesulitan siswa. Melalui


pengukuran, kelemahan siswa dalam kelas dapat
diidentifikasi dan diremidiasi.Hasil-hasil
pengukuran juga dapat digunakan untuk
memperbaiki pembelajaran dan kinerja siswa dalam
kelas.

e. Mengevaluasi pengajaran. Pengukuran dapat


menilai pembelajaran. Melalui pengukuran yang
merupakan bagian tak terpisahkan dari proses,
umpan balik tentang pembelajaran, yang menjadi
dasar penting untuk perbaikan dan peningkatan
dalam kelas terungkap. Sebagai contoh, Perolehan
skor-skor yang tinggi dari kebanyakan siswa dalam
tes hasil belajar (pencapaian) secara tidak langsung
menunjukkan efektifnya pembelajaran di kelas.
Berdasarkan hasil ini, seorang guru dapat lebih jauh
memikirkan peningkatan aktivitas dalam pelajaran
untuk memperkuat pembelajaran siswa. Sebaliknya,
bila tes hasil belajar kebanyakan siswa rendah,
menunjukkan tidak efektifnya pembelajaran.
Dengan informasi ini, guru dapat memikirkan
perbaikan medode pengajaran dalam kelas atau
melakukan remedial pengajaran.

35 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

36 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 3
BELAJAR DAN HASIL BELAJAR

A. Belajar, Prestasi dan Hasil Belajar

Bodger dan Seaborne (2001) menyatakan bahwa


belajar itu adalah …….. “ anymore or less permanent change
of behavior or which is their result of experience”. artinya
segala sesuatu atau perubahan tetap tingkah laku atau hasil
dari pada pengalaman. Menurut Hamalik (1983) “Belajar
adalah suatu bentuk pertumbuhan atau perubahan dalam
diri seseorang yang dinyatakan dalam cara-cara bertingkah
laku baru berkat pengalaman dan latihan”. Muhammad
(1999) mengatakan bahwa belajar adalah pekerjaan yang

37 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

harus dikerjakan sendiri, diusahakan sendiri dan tidak


dapat menugaskan orang lain untuk mengerjakannya.
Belajar dapat didefinisikan sebagai upaya yang dilakukan
untuk menambah pengetahuan yang telah dimiliki (Maskul,
1998). Jadi Belajar adalah suatu proses usaha yang
dilakukan seseorang untuk memperoleh suatu perubahan
tingkah laku yang baru secara keseluruhan sebagai hasil
pengalamannya sendiri dalam interaksi dengan
lingkungannya.
Proses belajar dapat melibatkan aspek kognitif,
afektif dan psikomotorik. Pada belajar kognitif, prosesnya
mengakibatkan perubahan dalam aspek kemampuan
berpikir, pada belajar afektif mengakibatkan perubahan
dalam aspek kemampuaan merasakan, sedang belajar
psikomotorik memberikan hasil belajar berupa
keterampilan.
Kata prestasi berasal dari Bahasa Belanda prestatie,
kemudian di dalam bahasa Indonesia disebut prestasi,
diartikan sebagai hasil usaha. Prestasi banyak digunakan di
dalam berbagai bidang dan diberi pengertian sebagai
kemampuan, keterampilan, sikap seseorang dalam
menyelesaikan sesuatu (Arifin, 2009). Menurut Djamarah
(1994) “prestasi adalah hasil dari suatu kegiatan yang telah
dikerjakan, atau diciptakan secara individu maupun secara
kelompok.
Prestasi belajar menurut Kamus Besar Bahasa
Indonesia (2005) berarti: a) penguasaan pengetahuan atau
keterampilan yang dikembangkan oleh mata pelajaran,
lazimnya ditunjukkan dengan nilai tes atau angka nilai
yang diberikan guru, b) kemampuan yang sungguh-

38 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

sungguh ada atau dapat diamati (actual ability) dan yang


dapat diukur langsung dengan tes tertentu. Menurut Azwar
(2010) “prestasi belajar adalah performa maksimal seseorang
dalam menguasai bahan-bahan atau materi yang telah
diajarkan atau telah dipelajari”.
Dari pendapat di atas dapat disimpulkan bahwa
prestasi belajar adalah hasil usaha siswa yang dapat
dicapai berupa penguasan pengetahuan, kemampuan
kebiasaan dan keterampilan serta sikap setelah mengikuti
proses pembelajaran yang dapat dibuktikan dengan hasil
tes. Jadi, prestasi itu baru ada setelah melakukan kegiatan.
Hasil belajar atau prestasi belajar adalah suatu hasil yang
telah dicapai oleh siswa setelah melakukan kegiatan belajar.
Sudjana (2003) menyatakan bahwa hasil belajar
siswa pada hakikatnya adalah perubahan tingkah laku dan
sebagai umpan balik dalam upaya memperbaiki proses
belajar mengajar. Belajar adalah suatu proses perubahan
tingkah laku sebagai hasil interaksi individu dengan
lingkungannya dalam memenuhi kebutuhan hidupnya .
Menurut Habeyb (1983) hasil belajar ialah apa yang telah
didapat, diciptakan atau hasil yang menyenangkan hati
yang diperoleh dengan jalan keuletan belajar. Nawawi
(2001) mengemukakan bahwa hasil belajar ialah tingkat
keberhasilan anak didik dalam mempelajari pelajaran di
sekolah yang dinyatakan dengan nilai yang diperoleh dari
hasil tes mengenai sejumlah materi tertentu. Selanjutnya,
Purwanto (1992) menyatakan bahwa hasil belajar ialah
hasil pencapaian belajar oleh anak didik pada jangka waktu
tertentu. Dengan demikian dapat disimpulkan bahwa hasil
belajar adalah tingkat penguasaan siswa terhadap materi

39 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

pelajaran sebagai akibat dari perubahan perilaku setelah


mengikuti proses belajar mengajar berdasarkan tujuan
pengajaran yang ingin dicapai. Hasil belajar sering
digunakan sebagai ukuran untuk mengetahui seberapa
jauh seseorang menguasa bahan yang sudah diajarkan.
Untuk mengetahui hasil belajar tersebut diperlukan
serangkaian pengukuran yang menggunakan alat-alat ukur
yang memenuhi syarat.

B. Pengukuran dan Evaluasi Hasil Belajar

Tujuan pembelajaran pada hakikatnya adalah


perubahan tingkah laku yang diinginkan pada diri peserta
didik atau siswa yang tercermin pada ‘hasil belajar’ siswa
setelah mendapatkan serangkaian pengalaman belajar
(proses pengajaran). Tingkah laku sebagai hasil belajar
bisa meliputi kawasan kognitif, afektif, dan psikomotor
Untuk mengetahui hasil belajar siswa dilakukan
evaluasi. Tujuannya yaitu untuk memperoleh informasi
tentang sejauh mana hasil belajar siswa atau ketercapaian
kompetensi (rangkaian kemampuan) siswa. Penilaian hasil
belajar merupakan aktivitas yang sangat penting dalam
proses pendidikan. Semua proses di lembaga pendidikan
formal pada akhirnya akan bermuara pada hasil belajar
yang diwujudkan secara kuantitatif berupa nilai. Penilaian
menjawab pertanyaan tentang sebaik apa hasil atau
prestasi belajar seorang peserta didik. Jadi penilaian
dilakukan untuk mengetahui sejauh mana perubahan yang
terjadi melalui kegiatan belajar mengajar.

40 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Hasil belajar merupakan tingkat kemampuan yang


dimiliki seseorang dalam mencerna informasi yang
diperoleh dalam proses belajar mengajar. Hasil belajar
dapat dilihat melalui kegiatan pengukuran yang bertujuan
untuk mendapatkan data yang menunjukkan tingkat
kemampuan siswa dalam mencapai tujuan pembelajaran.
Menurut Widoyoko (2009:1), hasil belajar terkait dengan
pengukuran, kemudian akan terjadi suatu penilaian dan
menuju evaluasi, baik menggunakan tes maupun non-tes.
Hasil belajar tidak lain adalah pengukuran hasil yang sudah
dicapai oleh setiap siswa dalam ranah kognitif, afektif dan
psikomotor yang diperoleh sebagai akibat usaha kegiatan
belajar dan dinilai dalam periode tertentu. Hasil belajar
seorang siswa sering disajikan dalam bentuk simbol
berupa angka, huruf maupun kalimat yang menceritakan
hasil yang sudah dicapai oleh setiap siswa pada suatu
periode tertentu.
Hasil belajar yang merupakan hasil pengukuran
terhadap siswa meliputi aspek kognitif (pengetahuan),
afektif (sikap) dan psikomotor (keterampilan) dapat
diketahui setelah diadakan evaluasi yang disebut tes hasil
belajar (achievement test). Sudjana (2005) mengemukakan
bahwa “di antara ketiga ranah tersebut, ranah kognitiflah
yang paling banyak dinilai oleh para guru di sekolah karena
berkaitan dengan kemampuan para siswa dalam
menguasai isi bahan pengajaran”

41 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

C. Instrumen dalam Evaluasi

Ditinjau dari instrumen atau alat ukur yang


digunakan untuk melakukan pengukuran, secara umum
dibedakan menjadi dua, yaitu berbentuk tes dan non-tes
(Payne dalam Nasoetion, 2006). Alat pengukuran yang
berbentuk tes bisa dibedakan menjadi tiga macam, yaitu tes
lisan, test tertulis, dan tes perbuatan. Tes lisan bisa
diselenggarakan secara individual atau kelompok. Tes tertulis
bisa berbentuk esai (uraian) atau obyektif. Sedangkan tes
perbuatan bisa dilaksanakan secara individual atau juga
kelompok.
Alat pengukuran (penilaian) yang non-tes, yang
biasanya menyertai dalam pelaksanaan proses belajar
mengajar sangat banyak macamnya. Di antaranya bisa
disebutkan adalah observasi (baik dengan cara langsung, tak
langsung, maupun partisipasi), wawancara (terstruktur atau
bebas), angket (tertutup atau terbuka), sosiometri, checklist,
concept map, portfolio, student journal, pertanyaan-
pertanyaan, dan sebagainya. Dilihat dari wilayah atribut
yang diungkap, secara umum alat ukur dapat dikategorikan
menjadi dua wilayah yaitu wilayah kognitif dan wilayah
non kognitif (Suryabrata, 2000)

42 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

UNIT II
TAKSONOMI BLOOM DAN
RANAH HASIL BELAJAR
Kata taksonomi berasal dari dua kata dalam bahasa
Yunani yaitu tassein yang berarti mengklasifikasi dan
nomos yang berarti aturan. Jadi Taksonomi berarti
hierarkhi klasifikasi atas prinsip dasar atau aturan. Istilah
ini kemudian digunakan oleh Benjamin Samuel Bloom,
seorang psikolog bidang pendidikan yang melakukan
penelitian dan pengembangan mengenai kemampuan
berpikir dalam proses pembelajaran. Bloom, lahir pada
tanggal 21 Februari 1913 di Lansford, Pennsylvania dan

43 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

berhasil meraih doktor di bidang pendidikan dari The


University of Chicago pada tahun 1942.
Taksonomi tujuan pendidikan ini, atau yang
terkenal dengan nama taksonomi Bloom terdapat dalam
buku yang berjudul Taxonomy of Educational Objectives:
The Classification of Educational Goals. Handbook I:
Cognitive Domain yang terbit pada tahun 1956. Taksonomi
Bloom adalah struktur hierarkhi yang mengidentifikasikan
skills mulai dari tingkat yang rendah hingga yang tinggi.
Bloom meninggal pada 13 September 1999. Dalam
kerangka konsep, tujuan pendidikan ini oleh Bloom dibagi
menjadi tiga domain/ranah kemampuan intelektual
(intellectual behaviors) yaitu kognitif, afektif dan
psikomotorik.

44 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 4
RANAH KOGNITIF
A. Taksonomi Bloom Original

Taksonomi tujuan pendidikan (the taxonomy of


educational objective) Benjamin Bloom (Bloom, 1956)
mengelompokkan tujuan dan standar-standar penddikan.
Bloom, dan rekan-rekannya berhasil mengembangkan dan
mengenalkan kerangka konsep kemampuan berpikir yang
dinamakan Taxonomy Bloom, meliputi tiga ranah (domain),
yaitu kognitif (cognitive), psikomotor (psychomotor), dan
sikap (affective). Taksonomi Bloom BUKAN suatu ukuran
dari level kesulitan sebuah soal, ia merupakan kerangka
untuk mengklasifikasi pernyataan-pernyataan yang

45 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

digunakan untuk mempredikasi kemampuan siswa dalam


belajar sebagai hasil dari kegiatan pembelajaran. Benjamin
S. Bloom dan rekan-rekannya menyadari bahwa ada
perbedaan tingkatan dalam perilaku berpikir (thinking
behavior) yang berguna untuk keperluan pembelajaran di
sekolah.
Structure of the Original Taxonomy
1. Knowledge
(a) Knowledge of spesifics
Knowledge of terminology
Knowledge of spesific fact
(b) Knowledge of ways and means of dealing with
spesifics
Knowledge of conventions
Knowledge of trends and sequences
Knowledge of classifications and categories
Knowledge of criteria
Knowledge of methodology
(c) Knowledge of universals and abstraction in a
field
Knowledge of principles and generalizations
Knowledge of theories and structures
2. Comprehension
(a) Translation
(b) Interpretation
(c) Extrapolation
3. Application
4. Analysis
(a) Analysis of elements
(b) Analysis of relationship

46 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(c) Analysis of organizational principles


5. Synthesis
(a) Production of a unique communication
(b) Production of a plan, or proposed set of
operations
(c) Derivation of a set of abstract relation
6. Evaluation
(a) Evaluation in terms of internal evidence
(b) Judgments in terms of external criteria

Menurut taksonomi Bloom, ranah kognitif


mengurutkan keahlian berpikir sesuai dengan tujuan yang
diharapkan. Proses berpikir menggambarkan tahap
berpikir yang harus dikuasai oleh siswa agar mampu
mengaplikasikan teori ke dalam perbuatan. Ranah kognitif
ini terdiri atas enam level, yaitu: (1) knowledge
(pengetahuan), (2) comprehension (pemahaman atau
persepsi), (3) application (penerapan), (4) analysis
(penguraian atau penjabaran), (5) synthesis (pemaduan),
dan (6) evaluation (penilaian). Taksonomi ini dikenal
sebagai taksonomi Bloom (original taxonomy), dan menjadi
model taksonomi tujuan pembelajaran yang digunakan
sebagai acuan dalam sistem pendidikan di Indonesia. Level
taksonomi Bloom original diperlihatkan dalam gambar 4.1 .

47 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Gambar 4.1 . Level Kognitif Bloom original

a. Pengetahuan ( knowledge)
Knowledge: remembering or recalling appropriate,
previously learned information to draw out factual
(usually right or wrong) answers.

Pengetahuan merupakan tingkat kemampuan yang


hanya meminta peserta didik atau siswa untuk mengenal
atau mengetahui adanya konsep, fakta, atau istilah-istilah
tanpa harus mengerti atau dapat menilai atau
menggunakannya. Dalam hal ini biasanya siswa menjawab
saja soal secara hafalan tanpa banyak berfikir.
Di antara kata kerja soal tes yang sesuai untuk tujuan
tingkat pengetahuan adalah:
 Menyebutkan
 Menyusun daftar
 Mendefinisikan

48 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

 Mengenali
 Mendefinisikan
 Mendapatkan
 Membedakan
Soal tes untuk tingkat (level) pengetahuan meminta
siswa untuk mengingat kembali apa yang sudah
dipelajarainya,

Pertanyaan untuk pngetahuan


(a) Berikan definisi .........?
(b) Siapa yang mencipta....?
(c) Kutub magnet biasanya dinamakan...........

b. Pemahaman (comprehension)
Comprehension: grasping or understanding the
meaning of informational materials

Pemahaman (C2) merupakan tingkat kemampuan


yang mengharapkan peserta didik atau siswa mampu
memahami arti atau konsep, situasi, serta fakta yang
diketahuinya. Dalam hal ini siswa tidak hanya hafal secara
verbal akan tetapi juga memahami konsep dari masalah
atau fakta yang ditanyakan dan dapat melihatnya dari
beberapa segi.
Soal tes pada tingkat pemahaman menghendaki siswa
untuk menyatakan masalah dengan kata-katanya sendiri,
memberi contoh suatu prinsip atau konsep.
Di antara kata kerja yang sesuai dengan untuk soal
untuk mengukur pemahaman adalah:

49 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

 Menjelaskan
 Merumuskan
 Merangkum
 Memberi contoh
 Memperkirakan
 Menerangkan
 Membedakan

Pertanyan untuk pemahaman


(a) Terangkan.......
(b) Uraikan dengan perkataan anda..........
(c) Jika turun hujan maka...........................

c. Penerapan (application)
Application: applying previously learned information
(or knowledge) to new and unfamiliar situations.

Penerapan (C3) merupakan tingkat kemampuan


yang menuntut atau meminta siswa menggunakan atau
menerapkan informasi yang telah diperoleh pada situasi
baru. Soal tes pada tingkat penerapan menghendaki siswa
menggunakan informasi yang yang telah dipelajarinya
untuk menyelesaikan masalah.
Di antara kata kerja yang sesuai untuk soal menguji
penerapan adalah:
 Menerapkan
 Menghubungkan
 Menghitung
 Menyelesaikan
 Mengembangkan

50 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

 Menggunakan
 Menghasilkan

Pertanyaan untuk penerapan


(a) .Jika A dan B diketahui, bagaimana mencari C ?
(b) Cari angka yang ke tujuh dalam urutan: 12, 7,
2,..................

d. Analisis (analysis)
Analysis: breaking down information into parts, or
examining (and trying to understand the
organizational structure of) information.

Analisis (C4) merupakan tingkat kemampuan yang


meminta siswa untuk menganalisis atau menguraikan
suatu integritas atau situasi tertentu ke dalam komponen-
komponen atau unsur-unsur pembentuknya. Diharapkan
siswa dapat memahami dan sekaligus mampu memilah-
milahnya menjadi bagian-bagian, termasuk juga
menguraikan bagaimana proses terjadinya sesuatu, cara
bekerjanya sesuatu, atau mungkin juga sistematikanya.
Pada tingkat analisis: siswa diminta untuk
menguraikan informasi ke dalam beberapa bagian,
menemukan asumsi, membedakan fakta dan pendapat, dan
menemukan hubungan sebab dan akibat.
Di antara kata kerja soal tes untuk mengukur tingkat
analisis adalah:
 Membedalan
 Menemukan

51 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

 Membandingkan
 Membagi
 Menganalisis
 Memperinci
 Mengkategorikan

Pertanyaan untuk analisis


(a) Apakah bukti yang menunjukkan bahwa es itu lebih
ringan daripada air?
(b) Yang mana fakta dan yang mana opini?

e. Sintesis (synthesis)
Synthesis: applying prior knowledge and skills to
combine elements into a pattern not clearly there
before.

Sintesis (C5) merupakan tingkat kemampuan yang


meminta siswa untuk mengintegrasikan bagian-bagian
yang terpisah menjadi suatu keseluruhan yang terpadu,
atau menggabungkan bagian-bagian (unsur-unsur)
sehingga terjelma pola yang berkaitan secara logis, atau
mengambil kesimpulan dari peristiwa-peristiwa yang ada
hubungannya satu dengan lainnya.
Pada tingkat sintesis: siswa dituntut menghasilkan
suatu cerita, komposisi, hipotesis, atau teorinya sendiri,
dan mengsintesiskan pengetahuan. Soal sintesis soal yang
menuntut pembuatan cerita, menghasilkan karangan,
hipotesis dengan memadukan berbagai pengetahuan atau
ilmu.

52 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Di antara kata kerja soal tes untuk mengukur tingkat


sintesis adalah:
 Menceriterakan
 Menyusun
 Menyatukan
 Memodifikasikan
 Menghasilkan
 Mengorganisir
 Membandingkan

Pertannyaan untuk sintesis


(a) Rencanakan.................
(b) Gubahlah sebuah puisi tentang................

f. Evaluasi (evaluation)
Evaluation: judging or deciding according to some
set of criteria, without real right or wrong answers.

Evaluasi (C6) merupakan tingkat kemampuan yang


meminta siswa mengevaluasi informasi, seperti bukti
sejarah, editorial, teori-teori, dan termasuk di dalamnya
melakukan judgement terhadap hasil analisis untuk
membuat kebijakan. Soal evaluasi: merupakan soal yang
menuntut pembuatan keputusan dan kebijakan, dan
penentuan “nilai” informasi. Evaluasi merupakan tingkat
kemampuan tertinggi,
Soal evaluasi meminta siswa membuat pertimbangan
tentang sesuatu, atau menafsirkan berdasarkan kriteria
tertentu.

53 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Di antara kata kerja yang sesuai untuk menguji tingkat


evaluasi adalah:
 Membuktikan
 Memperhitungkan
 Menilai
 Menyesuaikan
 Mengkritik
 Mempertimbangkan
 Membandingkan

Pertanyaan untuk evaluasi


(a) Beri alasan mengapa anda lebih suka memilih baju
putih ?
(b) Apakah tes objektif lebih baik dari pada tes uraian ?

B. Taksonomi Bloom Revisi

Pada tahun 1990-an Lorin Anderson bersama David


Krathwohl, mengkaji kembali taksonomi Bloom dan
menyusun ulang ranah kognitif, untuk dapat mengadopsi
perkembangan dunia pendidikan abad 21. Hasilnya dikenal
dengan sebutan taksonomi Bloom revisi (Krathwohl, D. R,
2002). Adapun perubahan dari kerangka pikir taksonomi
Bloom asli ke taksonomi Bloom revisi diilustrasikan pada
Gambar 4.2.

54 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Dimensi Dimensi
tersendiri Pengetahuan

Pengetahuan Mengingat
Kata Kerja
Pemahaman Memahami

Penerapani Menerapka
n
Dimensi
Analisis Mengaalisis Proses
Kognitif
Mengevalu
Sintesis
asi

Evaluasi Mencipta

Gambar 4.2. Perubahan dari kerangka pikir taksonomi


Bloom asli ke taksonomi Boom revisi

Pada Taksonomi Bloom revisi dilakukan pemisahan


yang tegas antara dimensi pengetahuan (knowledge
dimension) dengan dimensi proses kognitif (cognitive
process). Kalau pada taksonomi Bloom asli dimensi
pengetahuan dimasukkan pada jenjang paling bawah
(Pengetahuan), sedangkan pada taksonomi yang baru
pengetahuan benar-benar dipisah dari dimensi proses
kognitif. Pemisahan ini dilakukan sebab dimensi
pengetahuan berbeda dari dimensi proses kognitif.
Pengetahuan merupakan kata benda (noun) sedangkan
proses kognitif merupakan kata kerja( verb). Secara singkat

55 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dapat dikatakan bahwa pada taksonomi Bloom revisi ada


dua dimensi yang terpisah, yaitu “knowledge dimension”
dan “cognitive process dimension.” Lihat Tabel 4.1 berikut.

Tabel 4.1 Tabel Taksonomi Bloom Revisi


Dimensi Pengetahuan Dimensi Proses Kognitif
1. Pengetahuan Faktual C.1. Mengingat (Remember)
a. Pengetahuan ttg 1.1. Mengenali (recognizing)
terminologi 1.2. Mengingat (recalling)
b. Pengetahuan ttg bagian C.2. Memahami (Understand)
detail dan unsur- unsur 1.3. Menafsirkan
2. Pengetahuan Konseptual (interpreting)
a. Pengetahuan ttg 1.4. Memberi contoh
klasifikasin dan (exampliying)
kategori 1.5. Meringkas
b. Pengetahuan ttg (summarizing)
prinsip dan 1.6. Menarik inferensi
generalisasi (inferring)
c. Pengetahuan ttg teori, 1.7. Membandingkan
model & struktur (compairing)
3. Pengetahuan Prosedural 1.8. Menjelaskan (explaining)
a. Pengetahuan ttg C.3. Mengaplikasikan (Apply)
keterampilan khusus yg 1.9. Menjalankan (executing)
berhubungan dng suatu 1.10. Mengimplementasikan
bidang tertentu dan (implementing)
pengetahuan C.4. Menganalisis (Analyze)
algoritma 1.11. Menguraikan
b. Pengetahuan ttg teknik (diffrentiating)
dan metode 1.12. Mengorganisir
c. Pengetahuan ttg (organizing)
kriteria penggunaan 1.13. Menemukan makna
suatu prosedur tersirat
4. Pengetahuan Metakognitif (attributing)
a. Pengetahuan strategik C.5. Evaluasi (Evaluate)
b. Pengetahuan ttg 1.14. Memeriksa (checking)
operasi kognitif 1.15. Mengritik (Critiquing)
c. Pengetahuan ttg diri C.6. Membuat Create)
sendiri 1.16. Merumuskan

56 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(generating)
1.17. Merencanakan
(planning)
1.18. (Memproduksi
(producing)

a. Dimensi Pengetahuan
Dimensi pengetahuan merupakan dimensi
tersendiri dalam Taksonomi Bloom revisi. Ada empat jenis
kategori pengetahuan, yaitu: pengetahuan faktual,
pengetahuan konseptual, pengetahuan prosedural, dan
pengetahuan metakognitif. Jenis-jenis pengetahuan
menunjukkan penjenjangan dari yang sifatnya konkret
(faktual) hingga yang abstrak (metakognitif).
Anderson, et.all (2001) menunjukkan kategori
dimensi pengeta- huan seperti pada Tabel 4.2 berikut.

Tabel 4.2. Kategori dimensi pengetahuan


Mayor Types and Subtypes Examples
1. Factual knowledge- the basic element student must
know to beaquainted with a discipline or solve problems in
it
1.1 Knowledge of Technical vocabulary, musical
terminology symbols
1.2 knowledge of specific Major matural resources,
details and elements reliable soyrces of information
2. Conceptual Knowledge- the interrelationships among
the basic elements within a larger structure that enable
them to function together
2.1 knowledge of Period of geological time, forms
classification and categories of business ownership
2.2 knowledge of principles Pythagorean theorem, law of
and generalizations supply and demand

57 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

2.3 knowledge of theories, Theory of evaluation, structure


models and structures of congrees
3. Procedural Knowledge- how ti do something, methods of
inquiry, and criteria for using skills, algorithms,
techniques, and methods
3.1 knowledge of subject- Skills used in painting with
specific skills and water colors, whole number
algoritms division algorithm
3.2 knowledge of subject- Interviewing techniques,
specific techniques and scientific method
methods
3.3 knowledge of criteria for Criteria used to determine
determining when to use when to apply a procedure
appropriate procedures involving Newton’s second law,
criteria used to judge the
feasibility of using a particular
method to estimate business
costs
4. Metacognitive knowledge- knowledge of cognitif in
general as well as awarenness and knowledge of one’s
own cognition
4.1 Strategic knowledge Knowledge of outlining as a
means of capturing the
structure of unit of subject
matter in a textbook,
knowledge of the use of
heuristics
4.2 knowledge about Knowledge of the types of tests
cognitive task, including particular teachers administer,
appropriate contextual and knowledge of the cognitive
conditional knowledge demands of different tasks
4.3 self-knowledge Knowledge that critiquing
essays is a personal streght,
whereas writing essays is a
personal weakness, awarenees
of one’s own knowledge level

58 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Dari Tabel 4.2 di atas dapat dijelaskan sebagai


berikut;

1) Pengetahuan Faktual (Factual knowledge):


Pengetahuan faktual meliputi elemen-elemen dasar
yang harus diketahui siswa ketika akan mempelajari
disiplin ilmu atau menyelesaikan masalah dalam
disiplin ilmu tersebut. Pengetahuan faktual pada
umumnya merupakan abstraksi tingkat rendah.
Pengetahuan faktual terbagi menjadi dua subjenis
yaitu: (1) pengetahuan tentang terminologi; dan (2)
pengetahuan tentang detail-detail dan elemen-
elemen yang spesifik.
a) Pengetahuan tentang terminologi
(knowledge of terminology):Pengetahuan ini
melingkupi pengetahuan tentang label dan
simbol verbal dan nonverbal (misalnya, kata,
angka, tanda dan gambar).
b) Pengetahuan tentang bagian detail dan
unsur-unsur (knowledge of specific details
and element): Pengetahuan tentang detail-detail
dan elemen-elemen yang spesifik. merupakan
pengetahuan tentang peristiwa, lokasi, orang,
tanggal, sumber informasi dan semacamnya.
Pengetahuan ini meliputi informasi yang
mendetail dan spesifik.

59 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

2) Pengetahuan konseptual (conceptual


knowledge)

Pengetahuan konseptual mencakup pengetahuan


tentang kategori, klasifikasi dan hubungan antar
dua atau lebih kategori atau klasifikasi pengetahuan
yang lebih kompleks dan tertata. Pengetahuan
konseptual meliputi skema, model mental, atau teori
yang implisit atau eksplisit dalam beragam model
psikologi kognitif. Pengetahuan konseptual terdiri
dari tiga subjenis yaitu: (1) pengetahuan tentang
klasifikasi dan kategori; (2) pengetahuan tentang
prinsip dan generalisasi; dan (3) pengetahuan
tentang teori, model, dan struktur.
a) Pengetahuan tentang kelasifikasi dan
kategori: Pengetahuan tentang klasifikasi dan
kategori meliputi kelas, kategori, divisi, dan
susunan yang spesifik dalam disiplin-disiplin
ilmu. Setiap disiplin ilmu memiliki serangkaian
kategori yang digunakan untuk menemukan dan
mengkaji elemen-elemen baru. Klasifikasi dan
kategori menciptakan hubungan-hubungan
antara elemen-elemen.

b) Pengetahuan tentang prinsip dan


generalisasi: Prinsip dan generalisasi
merupakan abstraksi dari sejumlah fakta,
kejadian, dan saling keterkaitan antara sejumlah
fakta. Prinsip dan generalisasi biasanya
cenderung sulit untuk dipahami siswa apabila

60 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

siswa belum sepenuhnya menguasai fenomena-


fenomena yang merupakan bentuk yang
“teramati” dari suatu prinsip atau generalisasi.

c) Pengetahuan tentang teori, model, dan


struktur: Pengetahuan ini meliputi
pengetahuan tentang prinsip dan generalisasi
serta antara keduanya yang menghadirkan
pandangan yang jelas, utuh dan sistemik tentang
sebuah fenomena, masalah, atau materi kajian
yang kompleks.

3) Pengetahuan prosedural:

Pengetahuan tentang bagaimana cara melakukan


sesuatu. Pengetahuan ini mencakup pengetahuan
tentang keterampilan, algoritma, teknik, dan
metode, yang semuanya disebut dengan prosedur
(Alexander, dkk., 1991), Seringkali pengetahuan
prosedural berisi langkah-langkah atau tahapan
yang harus diikuti dalam mengerjakan suatu hal
tertentu. Pengetahuan prosedural berkaitan dengan
pertanyaan “bagaimana”. Pengetahuan prosedural
terbagi atas tiga sub jenis yaitu: pengetahuan
tentang keterampilan dalam bidang tertentu dan
algoritma, (2) pengetahuan tentang teknik dan
metode dalam bidang tertentu, dan (3) pengetahuan
tentang kriteria untuk menentukan kapan harus
menggunakan prosedur yang tepat.

61 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

a) Pengetahuan tentang keterampilan khusus


yang berhubungan dengan suatu bidang
tertentu dan pengetahuan tentang algoritme:
adalah pengetahuan tentang keterampilan
khusus yang diperlukan untuk bekerja dalam
suatu bidang ilmu atau tentang algoritme yang
harus ditempuh untuk menyelesaikan suatu
permasalahan.
b) Pengetahuan tentang teknik dan metode
yang berhubungan dengan suatu bidang
tertentu: adalah pengetahuan yang pada
umumnya merupakan hasil konsensus,
perjanjian, atau aturan yang berlaku dalam
disiplin ilmu tertentu. Pengetahuan tentang
teknik dan metode lebih mencerminkan
bagaimana ilmuwan dalam bidang tersebut
berpikir dan memecahkan masalah yang
dihadapi.

c) Pengetahuan tentang kriteria untuk


menentukan kapan suatu prosedur tepat
untuk digunakan: adalah pengetahuan tentang
kapan suatu teknik, strategi, atau metode harus
digunakan. Siswa dituntut bukan hanya tahu
sejumlah teknik atau metode tetapi juga dapat
mempertimbangkan teknik atau metode
tertentu yang sebaiknya digunakan dengan
mempertimbangkan situasi dan kondisi yang
dihadapi saat itu.

62 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

4) Pengetahuan metakognitif
Pengetahuan metakognitif adalah pengetahuan
tentang kognisi secara umum dan pengetahuan
tentang diri sendiri. Metakognitif adalah “knowledge
and awareness about cognitive processes – or our
thought about thinking” (Margaret W. Matlin dalam
Desmita, 2006). Penelitian-penelitian tentang
metakognitif menunjukkan bahwa seiring dengan
perkembangannya siswa menjadi semakin sadar
akan pikirannya dan semakin banyak tahu tentang
kognisi, dan apabila siswa bisa mencapai hal ini
maka mereka akan lebih baik lagi dalam belajar.
Sebagai contoh pengetahuan metakognitif,
yaitu pengetahuan tentang langkah-langkah
penelitian, rencana kegiatan dan program kerja ;
pengetahuan tentang jenis metode, tes yang harus
digunakan dan dikerjakan guru ; dan pengetahuan
tentang sikap, minat, karakteristik yang harus
dikuasai untuk menjadi seorang guru yang baik.
Pengetahuan metakognitif terbagi menjadi tiga
subjenis yaitu: (1) pengetahuan strategik; (2)
pengetahuan tentang tugas-tugas kognitif yang
meliputi pengetahuan kontekstual dan kondisional;
dan (3) pengetahuan diri.

a) Pengetahuan strategik: adalah pengetahuan


tentang strategi-strategi belajar dan berpikir
serta pemecahan masalah. Subjenis pengetahuan
ini mencakup pengetahuan tentang berbagai
strategi yang dapat digunakan siswa untuk

63 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

menghafal materi pelajaran, mencari makna


teks, atau memahami apa yang mereka dengar
dari pelajaran di kelas atau yang dibaca dalam
buku dan bahan ajar lain.

b) Pengetahuan tentang tugas kognitif,


termasuk di dalamnya pengetahuan tentang
konteks dan kondisional: adalah pengetahuan
tentang jenis operasi kognitif yang diperlukan
untuk mengerjakan tugas tertentu serta
pemilihan strategi kognitif yang sesuai dalam
situasi dan kondisi tertentu.

c) Pengetahuan tentang diri sendiri: adalah


pengetahuan tentang kelemahan dan
kemampuan diri sendiri dalam belajar. Salah
satu syarat agar siswa dapat menjadi
pembelajar yang mandiri adalah
kemampuannya untuk mengetahui dimana
kelebihan dan kekurangan serta bagaimana
mengatasi kekurangan tersebut.
Keempat kategori pada dimensi
pengetahuan dianggap kontinum dari yang
kongkrit sampai yang abstrak. Konseptual dan
prosedural mempunyai tingkat keabstrakan
yang berurutan, misalkan pengetahuan
prosedural lebih konkret ketimbang
pengetahuan konseptual yang paling abstrak
(Anderson dan Krathwohl, 2001).

64 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

b. Dimensi proses kognitif


Dalam dimensi proses kognisi (cognitive process
dimension) terdapat enam kategori (Anderson dan
Krathwohl, 2001) sebagaimana pada taksonomi Bloom
lama; tetapi ada perubahan: kategori pengetahuan
(knowledge) diganti dengan ingatan (remember),
pemahaman (comprehension) diganti nama pengertian
(understand). Penerapan (application), analisis (analysis),
dan evaluasi (evaluation) dipertahankan, tetapi berganti
sebutan “application” diganti dengan “apply,” “analysis”
diganti dengan “analyze,” dan “evaluation” diganti dengan
“evaluate.” Sintetis (synthesis) bertukar tempat dengan
evaluasi dan berganti sebutan mencipta (create).
Perubahan mendasar terletak pada level 5 dan 6. Adapun
urutan atau level taksonomi Bloom revisi adalah seperti
dalam gambar 4.3 berikut.

Gambar 4.3. Level kognitif Bloom revisi

65 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

1) Mengingat (Remember)
Remembering. Can the student recall or remember the
information? (define, duplicate, list, memorize, recall,
repeat, and reproduce state)

Mengingat adalah kemampuan memperoleh


kembali pengetahuan yang relevan dari memori jangka
panjang. Kategori Remember terdiri dari proses kognitif
Recognizing (mengenal kembali) dan Recalling
(mengingat). Untuk menilai Remember, siswa diberi soal
yang berkaitan dengan proses kognitif Recognizing
(mengenal kembali) dan Recalling (mengingat). Contoh
bentuk soal yang sering digunakan untuk proses kognitif
ini adalah soal ”benar-salah”, pilihan ganda, menjodohkan,
dan mengisi titik-titik.
Mengenali kembali (Recognizing): mencakup
proses kognitif untuk menarik kembali informasi yang
tersimpan dalam memori jangka panjang yang identik atau
sama dengan informasi yang baru. Bentuk tes yang
meminta siswa menentukan betul atau salah,
menjodohkan, dan pilihan berganda merupakan tes yang
sesuai untuk mengukur kemampuan mengenali.
Mengingat (Recalling): menarik kembali informasi
yang tersimpan dalam memori jangka panjang apabila ada
petunjuk (tanda) untuk melakukan hal tersebut. Tanda di
sini seringkali berupa pertanyaan. Istilah lain untuk
mengingat adalah menarik (retrieving).

66 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Pertanyaan untuk mengingat:


 Apa yang terjadi setelah ... ?
 Berapa banyak...?
 Siapakah yang ... ?
 Dapatkah Anda menamakan ... ?
 Temukan arti dari……..
 Jelaskan apa yang terjadi setelah .....
 Siapa yang berbicara kepada ... ?
 Dapatkah Anda memberitahu mengapa ... ?
 Cari makna ... ?
 Apa yang...?
 Manakah yang benar atau salah ... ?

2) Memahami (Understand )
Understanding Can the student explain ideas or concepts?
(classify, describe, discuss, explain, identify, locate, recognize,
report, select, translate, and paraphrase)

Memahami adalah kemampuan merumuskan makna


dari pesan pembelajaran dan mampu
mengkomunikasikannya dalam bentuk lisan, tulisan
maupun grafik. Siswa mengerti ketika mereka mampu
menentukan hubungan antara pengetahuan yang baru
diperoleh dengan pengetahuan mereka yang lalu. Kategori
memahami mencakup tujuh proses kognitif: menafsirkan
(interpreting), memberikan contoh (exemplifying),
mengkelasifikasikan (classifying), meringkas
(summarizing), menarik inferensi (inferring),

67 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

membandingkan (comparing), dan menjelaskan


(explaining).
Menafsirkan (interpreting): mengubah dari satu
bentuk informasi ke bentuk informasi yang lainnya,
misalnya dari dari kata-kata ke grafik atau gambar, atau
sebaliknya, dari kata-kata ke angka, atau sebaliknya
Memberikan contoh (exemplifying): memberikan
contoh dari suatu konsep atau prinsip yang bersifat umum.
Memberikan contoh menuntut kemampuan
mengidentifikasi ciri khas suatu konsep dan selanjutnya
menggunakan ciri tersebut untuk membuat contoh.
Mengkelasifikasikan (classifying): Mengenali
bahwa sesuatu (benda atau fenomena) masuk dalam
kategori tertentu. Termasuk dalam kemampuan
mengkelasifikasikan adalah mengenali ciri-ciri yang
dimiliki suatu benda atau fenomena.
Meringkas (summarising): membuat suatu
pernyataan yang mewakili seluruh informasi atau
membuat suatu abstrak dari sebuat tulisan. Meringkas
menuntut siswa untuk memilih inti dari suatu informasi
dan meringkasnya.
Menarik inferensi (inferring): menemukan suatu
pola dari sederetan contoh atau fakta. Untuk dapat
melakukan inferensi siswa harus terlebih dapat menarik
abstraksi suatu konsep/prinsip berdasarkan sejumlah
contoh yang ada
Membandingkan (comparing): mendeteksi
persamaan dan perbedaan yang dimiliki dua objek, ide,
ataupun situasi. Membandingkan mencakup juga
menemukan kaitan antara unsur-unsur satu objek atau

68 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

keadaan dengan unsur yang dimiliki objek atau keadaan


lain. Istilah lain untuk membandingkan adalah
Menjelaskan (explaining): mengkonstruk dan
menggunakan model sebab-akibat dalam suatu system.
Termasuk dalam menjelaskan adalah menggunakan model
tersebut untuk mengetahui apa yang terjadi apabila salah
satu bagian sistem tersebut diubah

Pertannyaan untuk memahami


 Dapatkah Anda menulis dengan kata-kata Anda
sendiri ... ?
 Dapatkah Anda menulis keterangan singkat ... ?
 Bagaimana Anda akan menjelaskan…..?
 Dapatkah Anda menulis sebuah garis-garis besar
yang jelas……..?
 Menurut Anda, apa yang akan terjadi kemudian ... ?
 Apa yang kamu pikirkan...?
 Apa ide utama ... ?
 Dapatkah Anda mengilustrasikan ... ?
 Dapatkah Anda memberikan contoh dari apa yang
Anda maksud ... ?
 Dapatkah Anda memberikan definisi untuk ... ?

3) Menerapkan (Apply)
Applying Can the student use the information in a new
way? (choose, demonstrate, dramatize, employ, illustrate,
interpret, operate, schedule, sketch, solve, use, and write)

Menerapkan adalah kemampuan menggunakan


prosedur untuk menyelesaikan masalah. Siswa

69 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

memerlukan latihan soal sehingga siswa terlatih untuk


mengetahui prosedur apa yang akan digunakan untuk
menyelesaikan soal. Kategori menerapkan (Apply) terdiri
dari proses kognitif: kemampuan melakukan (Executing)
dan kemampuan menerapkan (Implementing).
Menjalankan (executing): menjalankan suatu
prosedur rutin yang telah dipelajari sebelumnya. Langkah-
langkah yang diperlukan sudah tertentu dan juga dalam
urutan tertentu. Apabila langkah-langkah tersebut benar,
maka hasilnya sudah tertentu pula.
Mengimplementasikan (implementing): memilih
dan menggunakan prosedur yang sesuai untuk
menyelesaikan tugas yang baru. Karena diperlukan
kemampuan memilih, siswa dituntut untuk memiliki
pemahaman tentang permasalahan yang akan
dipecahkannya dan juga prosedur-prosedur yang mungkin
digunakannya. Apabila prosedur yang tersedia ternyata
tidak tepat benar, siswa dituntut untuk bisa
memodifikasinya sesuai keadaan yang dihadapi.
Pertanyaan untuk menerapkan:
 Apakah Anda mengetahui kejadian lain yang ... ?
 ini terjadi di ... ?
 Dapatkah Anda mengelompok sesuai ciri-cirinya
seperti ... ?
 Faktor-faktor manakah yang akan Anda ubah
apabila ... ?
 Pertanyaan apa yang akan Anda tanyakan
tentang…..?

70 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

 Dari informasi ysng diberikan, dspstksh Anda


mengembnngkn serangkaian arahan tentang….?

4) Menganalisis (Analyze)
Analyzing Can the student distinguish between the
different parts? (appraise, compare, contrast, criticize,
differentiate, discriminate, distinguish, examine,
experiment, question, test assemble, construct, create,
design, develop, formulate, and write long familiar
Bloom's Taxonomy)

Menganalisis meliputi kemampuan untuk memecah


suatu kesatuan menjadi bagian-bagian dan menentukan
bagaimana bagian-bagian tersebut dihubungkan satu
dengan yang lain atau bagian tersebut dengan
keseluruhannya. Analisis menekankan pada kemampuan
merinci sesuatu unsur pokok menjadi bagian-bagian dan
melihat hubungan antar bagian tersebut. Di tingkat
analisis, seseorang akan mampu menganalisa informasi
yang masuk dan membagi-bagi atau menstrukturkan
informasi ke dalam bagian yang lebih kecil untuk
mengenali pola atau hubungannya dan mampu mengenali
serta membedakan faktor penyebab dan akibat dari sebuah
skenario yang rumit. Ada tiga macam proses kognitif yang
tercakup dalam menganalisis: membedakan
(differentiating), mengorganisir (organizing), dan
menemukan pesan tersirat (attributting)
Membedakan (differentiating): membedakan
bagian-bagian yang menyusun suatu struktur berdasarkan
relevansi, fungsi dan penting tidaknya. Oleh karena itu

71 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

membedakan (differentiating) berbeda dari


membandingkan (comparing). Membedakan menuntut
adanya kemampuan untuk menentukan mana yang
relevan/esensial dari suatu perbedaan terkait dengan
struktur yang lebih besar.
Mengorganisir (organizing): mengidentifikasi
unsur-unsur suatu keadaan dan mengenali bagaimana
unsur-unsur tersebut terkait satu sama lain untuk
membentuk suatu struktur yang padu.
Menemukan pesan tersirat (attributting):
menemukan sudut pandang, bias, dan tujuan dari suatu
bentuk komunikasi. Contoh: menganalisis mengapa
seseorang menulis di surat kabar bahwa hutan di Jawa
Barat masih cukup luas.

Pertanyan untuk menganalisis


 Bagian mana yang seharusnya tidak terjadi…..?
 Apabila…..terjadi, bagaimanakah akhir cerita akan
terjadi…….?
 Bagaimana ini ……sama dengan…..?
 Apa tema yang mendasari ... ?
 Apa yang Anda pikirkan sebagai kemungkinan hasil
lainnya ?
 Mengapa ..... perubahan terjadi ?
 Dapatkah Anda membandingkan Anda ... dengan
yang disajikan di ... ?
 Apa permasalahan dari ...?
 Anda membedakan antara ... ?
 Apa saja sebab motif di balik ... ?

72 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

 Apa yang mengubahnya…. ?


 Apa masalahnya dengan ... ?

5) Menilai (Evaluate)
Evaluating Can the student justify a stand or decision?
(appraise, argue, defend, judge, select, support, value,
and evaluate)

Menilai didefinisikan sebagai kemampuan


melakukan judgement berdasar pada kriteria dan standar
tertentu. Kriteria sering digunakan adalah menentukan
kualitas, efektifitas, efisiensi, dan konsistensi, sedangkan
standar digunakan dalam menentukan kuantitas maupun
kualitas. Evaluasi mencakup kemampuan untuk
membentuk suatu pendapat mengenai sesuatu atau
beberapa hal, bersama dengan pertanggungjawaban
pendapat itu yang berdasar kriteria tertentu. Ada dua
macam proses kognitif yang tercakup dalam kategori ini:
memeriksa (checking) dan mengritik (critiquing)
Memeriksa (Checking): Menguji konsistensi atau
kekurangan suatu karya berdasarkan kriteria internal
(kriteria yang melekat dengan sifat produk tersebut).
Contoh: Memeriksa apakah kesimpulan yang ditarik telah
sesuai dengan data yang ada.
Mengritik (Critiquing): menilai suatu karya baik
kelebihan maupun kekurangannya, berdasarkan kriteria
eksternal. Contoh: menilai apakah rumusan hipotesis
sesuai atau tidak (sesuai atau tidaknya rumusan hipotesis
dipengaruhi oleh pengetahuan dan cara pandang penilai).

73 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Pertanyaan untuk menilai


 Adakah solusi yang tepat untuk ... ?
 Ukurlah nilai dari....Apa yang Anda pikirkan
tentang…..?
 Dapatkah Anda mempertahankan posisi Anda
tentang ... ?
 Menurut Anda . ... sesuatu yang baik atau buruk ?
 Bagaimana anda mengatasi ... ?
 Perubahan apa yang ... apa yang Anda
rekomendasikan ?
 Apakah Anda percaya…? Bagaimana yang Anda
rasakan apabila….?
 Apa sajakah konsekwensinaya ?
 Pengaruh apakah yang akan….pada kehidupan kita?
 Apa sajakah pro dan kontra dari ... ?
 Seberapa efektifkah ... ?
 Mengapa ….berharga?
 Apa sajakah afternatif?
 Siapa yang akn mendapatkan dan iapa yang akan
kehilangan?

6) Berkreasi(Create)
Creating Can the student create new product or point
of view? (assemble, construct, create, design, develop,
formulate, and write)

Create didefinisikan sebagai menggeneralisasi ide


baru, produk atau cara pandang yang baru dari sesuatu
kejadian. Create di sini diartikan sebagai meletakkan

74 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

beberapa elemen dalam satu kesatuan yang menyeluruh


sehingga terbentuklah dalam satu bentuk yang koheren
atau fungsional. Siswa dikatakan mampu Create jika dapat
membuat produk baru dengan merombak beberapa
elemen atau bagian ke dalam bentuk atau stuktur yang
belum pernah diterangkan oleh guru sebelumnya. Proses
Create umumnya berhubungan dengan pengalaman belajar
siswa yang sebelumnya. Ada tiga macam proses kognitif
yang tergolong dalam kategori ini, yaitu: membuat
(generating), merencanakan (planning), dan memproduksi
(producing).
Membuat (generating): menguraikan suatu
masalah sehingga dapat dirumuskan berbagai
kemungkinan hipotesis yang mengarah pada pemecahan
masalah tersebut.
Contoh: merumuskan hipotesis untuk memecahkan
permasalahan yang terjadi berdasarkan pengamatan di
lapangan.
Merencanakan (planning): merancang suatu
metode atau strategi untuk memecahkan masalah.
Contoh: merancang serangkaian percobaan untuk menguji
hipotesis yang telah dirumuskan.
Memproduksi (producing): membuat suatu
rancangan atau menjalankan suatu rencana untuk
memecahkan masalah.

Pertanyan untuk berkreasi


 Dapatkah Anda merancang sebuah... untuk ... ?
 Dapatkah Anda memberikan solusi yang
memungkinkan untuk ... ?

75 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

 Jika Anda menggunakan seluruh sumber,


bagaimanakah Anda akan melakukannya dengan ... ?
 Mengapa tidak Anda temukan cara Anda sendiri
untuk ... ?
 Ada berapa cara yang dapat Anda ... ?
 Dapatkah Anda menciptakan kegunaan baru dan
tidak biasa untuk ... ?

Taksonomi Bloom revisi kadang-kadang juga


disebut sebagai taksonomi Anderson dan Krathwohl yang
berkaitan erat dengan dimensi pengetahuan yang lain yaitu
pengetahuan faktual, pengetahuan konseptual,
pengetahuan prosedural, dan pengetahuan metakognisi.
Lihat Tabel 4.2 berikut.
Tabel 4.2 Taksonomi Bloom revisi
Tingkatan Berpikir Tingkat Komunikasi
Tinggi
Menciptakan Menggeneralisasikan Negosiasi
(Creating) (generating), (negotiating),
merancang (designing), memoderatori
memproduksi (moderating),
(producing), kolaborasi
merencanakan kembali (collaborating)
(devising)
Mengevaluasi Mengecek (checking), Bertemu dengan
(Evaluating) mengkritisi (critiquing), jaringan/mendiskus
hipotesis ikan
(hypothesising), (net meeting),
eksperimen berkomentar
(experimenting) commenting),
berdebat (debating)

76 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Menganalisis Memberi atribut Menanyakan


(Analyzing) (attributeing), (Questioning),
mengorganisasikan meninjau ulang
(organizing), (reviewing)
mengintegrasikan
(integrating),
mensahihkan
(validating)
Menerapkan Menjalankan prosedur Posting, blogging,
(Applying) (executing), menjawab
mengimplementasikan (replying)
(implementing),
menyebarkan (sharing)
Memahami/ Mengklasifikasikan Bercakap (chatting),
mengerti (classification), menyumbang
(Understanding) membandingkan (contributing),
(comparing), networking,
menginterpretasikan
(interpreting),
berpendapat (inferring)
Mengingat Mengenali Menulis teks
(Remembering) (recognition), (texting), mengirim
memanggil kembali pesan singkat
(recalling), (instant messaging),
mendeskripsikan berbicara
(describing), (twittering)
mengidentifikasi
(identifying)
Berpikir Tingkat
Rendah

Selanjutnya untuk lebih jelas letak perbedaan


antara taksonomi Bloom original dan taksonomi Bloom
revisi dapat kita melihat dalam gambar 4.4.

77 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Gambar 4.4. Taksonomi Bloom original dan revised

Perbandingan antara ranah kognitif taksonomi


Bloom asli dengan ranah lognitif taksonomi Bloom revisi
dapat kita lihat dalam Tabel 4.4 berikut.

Tabel 4-4. Perbandingan antara ranah kognitif Bloom asli


dengan ranah kognitif Bloom revisi
Ranah kognitif Original (asli) Revised (revisi)
C1 Knowledge Remembering
(Pengetahuan) (Mengingat)
C2 Comprehension Understanding
(Pemahaman) (Memahami)
C3 Apply Applying
(Aplikasi) (Mengaplikasikan)
C4 Analysis Analyzing
(Analisis) (Menganalisis)
C5 Synthesis Evaluating
(Sintesis) (Mengevaluasi)
C6 Evaluation Creating
(Evaluasi) (Mencipta)

78 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Gambar 4.5 di bawah memperlihatkan kombinasi


cognitive process dan knowledge dimensions (Heer, 2012)

Gambar 4.5. Kombinasi antara cognitive process dan


knowledge dimensions

79 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 5
TAKSONOMI TUJUAN AFEKTIF
DAN PSIKOMOTOR
A. Taksonomi Ranah Afektif

Taksonomi afektif yang paling terkenal adalah yang


dikembangkan oleh Krathwohl, Bloom dan Masia (1964).
Ranah Afektif mencakup segala sesuatu yang terkait
dengan emosi, misalnya perasaan, nilai, penghargaan,
semangat,minat, motivasi, dan sikap. Lima kategori ranah
ini diurutkan mulai dari perilaku yang sederhana hingga
yang paling kompleks. Taksonomi ini menggambarkan
proses seseorang di dalam mengenali dan mengadopsi
suatu nilai dan sikap tertentu yang menjadi pedoman
baginya bertingkah laku. Krathwohl mengurutkan tujuan
afektif ke dalam 5 tingkatan dari yang paling sederhana

80 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

sampai kompleks, yaitu Penerimaan (receiving), tanggapan


(responding), penghargaan (valuing), pengorganisasian
(organization), dan pengamalan (charakterization)
1) Penerimaan (Receiving) adalah semacam kepekaan
dalam menerima rangsangan (stimulasi) dari luar yang
datang kepada siswa dalam bentuk masalah, situasi,
gejala dan lain-lain. Dalam tipe ini termasuk kesadaran,
keinginan untuk menerima stimulus, control dan
seleksi gejala atau rangsangan dari luar. Receiving juga
diartikan sebagai kemauan untuk memperhatikan
suatu kegiatan atau suatu objek. Pada jenjang ini siswa
dibina agar mereka bersedia menerima nilai-nilai yang
diajarkan kepada mereka dan mereka mempunyai
kemauan menggabungkan diri ke dalam nilai itu atau
mengidentifikasi diri dengan nilai itu.

Contoh: siswa mendengarkan penjelasan guru dengan


penuh perhatian.

Contoh kata kerja kunci:


menanyakan, mengikuti, memberi,
menahan/mengendalikan diri, mengidentifikasi,
memperhatikan, menjawab:
2) Tanggapan (Responding) adalah suatu sikap yang
menunjukkan adanya partisipasi aktif atau
kemampuan menanggapi, kemampuan yang dimiliki
seseorang untuk mengikutsertakan dirinya secara aktif
dalam fenomena tertentu dan membuat reaksi
terhadapnya dengan salah satu cara. Hal ini mencakup

81 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

ketepatan reaksi, perasaan, kepuasan dalam menjawab


stimulus dari luar yang datang kepada dirinya.

Contoh: siswa mengerjakan pekerjaan rumah,


berpartisipasi dalam diskusi kelas, memberikan
presentasi, bertanya terhadap ide-ide, konsep, atau
model baru untuk lebih memahaminya.

Contoh kata kerja kunci:


Menjawab, membantu, mentaati, memenuhi,
menyetujui, mendiskusikan, melakukan, memilih,
menyajikan, mempresentasikan, melaporkan,
menceritakan, menulis, menginterpretasikan,
menyelesaikan, mempraktekkan.

3) Penilaian (Valuing), atau menghargai artinya


memeberikan nilai atau memberikan penghargaan
terhadap suatu kegiatan atau objek, sehingga apabila
kegiatan itu idak dikerjakan kan memebrikan suatu
penyesalan. Dalam kaitannya dengan proses
pembelajaran peserta didik tidak hanya mau
menerima nilai yang diajarkan mereka telah
berkemampuan untuk menilai konsep atau fenomena
baik atau buruk.

Contoh: siswa menunjukkan kepercayaan terhadap


proses kerja kelompok dalam pemecahan masalah.

Contoh kata kerja kunci:

82 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Menunjukkan, mendemonstrasikan, memilih,


membedakan, mengikuti, meminta, memenuhi,
menjelaskan, membentuk, berinisiatif, melaksanakan,
memprakarsai, menjustifikasi, mengusulkan,
melaporkan, menginterpretasikan, membenarkan,
menolak, menyatakan/ mempertahankan pendapat,

4) Organisasi (Organization) yakni pengembangan dari


nilai ke dalam suatu sistem organisasi, termasuk
hubungan suatu nilai dengan nilai yang lain,
pemantapan dan prioritas nilai yang telah dimilikinya.
Yang termasuk kedalam organisasi ialah konsep
tentang nilai, organisasi sistem nilai dan lain-lain.

Contoh: siswa mengenali kebutuhan akan


keseimbangan kebebasan dan tanggungjawab dalam
kelompok kooperatif untuk memecahkan masalah
dalam pembelajaran.

Contoh kata kerja kunci:


Mentaati, mematuhi, merancang, mengatur,
mengidentifikasikan, mengkombinasikan,
mengorganisisr, merumuskan, menyamakan,
mempertahankan, menghubungkan, mengintegrasikan,
menjelaskan, mengaitkan,

5) Pengamalan (Characterization) adalah keterpaduan


semua sistem nilai yang telah dimiliki seseorang, yang
mempengaruhi pola kepribadian dan tingkah lakunya.

83 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Proses internalisasi nilai telah menempati tempat


tertinggi dalam hierarki nilai.
Contoh: siswa dapat bekerjasama dalam kelompok
kooperatif (menampilkan kerja tim), menggunakan
pendekatan obyektif dalam pemecahan masalah, dan
merevisi penilaiannya berdasarkan bukti baru.
Contoh kata kerja kunci:
Melakukan, melaksanakan, memperlihatkan
membedakan, memisahkan, menunjukkan,
mempengaruhi, mendengarkan, memodifikasi,
mempraktekkan, mengusulkan, merevisi,
memperbaiki, membatasi, mempertanyakan,
mempersoalkan,

B. Taksonomi Ranah Psikomotor

Ranah Psikomotorik meliputi gerakan dan


koordinasi jasmani, keterampilan motorik dan
kemampuan fisik. Ketrampilan ini dapat diasah jika sering
melakukannya. Perkembangan tersebut dapat diukur sudut
kecepatan, ketepatan, jarak, cara/teknik pelaksanaannya.
Bloom (1979) menyatakan bahwa ranah psikomotor
berhubungan dengan hasil belajar yang pencapaiannya
melalui keterampilan manipulasi yang melibatkan otot dan
kekuatan fisik. Singer (1972) menambahkan bahwa mata
pelajaran yang berkaitan dengan psikomotor adalah mata
pelajaran yang lebih beorientasi pada gerakan dan
menekankan pada reaksi–reaksi fisik dan keterampilan
tangan. Jadi, hasil belajar psikomotor tampak dalam bentuk
keterampilan (skill) dan kemampuan bertindak.

84 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Ada beberapa ahli yang mengemukakan level atau


tingkatan hasil belajar psikomotor, di antaranya yang
sering digunakan adalah hasil belajar psikomotor yang
dikembangkan oleh Dave, Simpson dan Harrow.
Menurut Dave (1967) hasil belajar psikomotor
dapat dibedakan menjadi lima tahap, yaitu: imitasi,
manipulasi, presisi, artikulasi, dan naturalisasi.
Imitasi adalah kemampuan melakukan kegiatan-
kegiatan sederhana dan sama persis dengan yang dilihat
atau diperhatikan sebelumnya. Contohnya, seorang siswa
dapat memukul bola dengan tepat karena pernah melihat
atau memperhatikan hal yang sama sebelumnya.
Manipulasi adalah kemampuan melakukan
kegiatan sederhana yang belum pernah dilihat tetapi
berdasarkan pada pedoman atau petunjuk saja. Sebagai
contoh, seorang siswa dapat memukul bola dengan tepat
hanya berdasarkan pada petunjuk guru atau teori yang
dibacanya.
Presisi adalah kemampuan melakukan kegiatan‐
kegiatan yang akurat sehingga mampu menghasilkan
produk kerja yang tepat. Contoh, siswa dapat mengarahkan
bola yang dipukulnya sesuai dengan target yang
diinginkan.
Artikulasi adalah kemampuan melakukan kegiatan
yang komplek dan tepat sehingga hasil kerjanya
merupakan sesuatu yang utuh. Sebagai contoh, siswa dapat
mengejar bola kemudian memukulnya dengan cermat
sehingga arah bola sesuai dengan target yang diinginkan.
Dalam hal ini, siswa sudah dapat melakukan tiga kegiatan

85 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

yang tepat, yaitu lari dengan arah dan kecepatan tepat


serta memukul bola dengan arah yang tepat pula.
Naturalisasi adalah kemampuan melakukan
kegiatan secara reflek, yakni kegiatan yang melibatkan fisik
saja sehingga efektivitas kerja tinggi. Sebagai contoh tanpa
berpikir panjang siswa dapat mengejar bola kemudian
memukulnya dengan cermat sehingga arah bola sesuai
dengan target yang diinginkan.
Tujuan kawasan psikomotor yang dikembangkan
oleh Simpson (1972) mulai dari tingkat yang sederhana
hingga tingkat yang rumit, yaitu: Persepsi (Perception),
Kesiapan/Set, Respon terpimpin (Guided respons),
Mekanisme (Mechanism), Complex Overt Respons, dan
Originasi (Origination)
Persepsi (Perception) adalah berhubungan
dengan penggunaan indera untuk mengarahkan kegiatan
motorik. Mulai dari kesadaran ada stimulus sampai kepada
memilih tugas yang relevan untuk menterjemahkannya ke
dalam suatu kegiatan (performance) tertentu. Contoh:
menurunkan suhu AC saat merasa suhu ruangan panas
Kesiapan/Set, adalah Kemampuan untuk
mempersiapkan diri, baik mental, fisik, dan emosi, dalam
menghadapi sesuatu. Contoh: melakukan pekerjaan sesuai
urutan, menerima kelebihan dan kekurangan seseorang
Respon terimpin (Guided respons) adalah langkah
permulaan dalam mempelajari keterampilan yang
kompleks, meliputi: menirukan, trial and error. Ketetapan
dari performance ditentukan oleh instruktur atau oleh
kriteria yang sesuai. Contoh: Mengikuti arahan dari
instruktur.

86 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Mekanisme (Mechanism) mekanisme


(Mechanism), merupakan performance yang menunjukkan
bahwa respons yang dipelajari telah menjadi kebiasaan
dan gerakangerakan dapat dilakukan dengan penuh
kepercayaan dan kemahiran. Ini merupakan performance
dari bermacam-macam keterampilan. Contoh:
menggunakan computer
Complex Oert Respons yaitu performance yang
sangat terampil dan gerakan motorik yang memerlukan
pula gerakan kompleks. Kemahiranya ditunjukkan dengan
cepat, lancar, dan tepat dengan energi minimum, tanpa
ragu-ragu dan otomatis (dilakukan dengan mudah dan
terkontrol baik). Conth: Keahlian bermain piano.
Originasi Origination), yaitu penciptaan pola-pola
gerakan yang baru untuk menyesuaikan dengan
situasi/masalah yang khusus. Hasil belajarnya ditekankan
pada kreativitas yang didasarkan pada keterampilan
tingkat tinggi.
Harrow (1972) mengemukakan bahwa ranah hasil
belajar psikomotot terdiri atas: Gerakan reflex, Gerakan-
gerakan fundamental, Kemampuan perceptual,
Kemampuan fisis, Gerakan keterampilan, dan Komunikasi
tanpa kata-kata.
Gerakan refleks, yaitu gerakan yang dilakukan
tanpa disadari yang tertuju kepada suatu rangsang
tertentu, (mengedipkan mata, menggeliat, menguap,
membegkokkan badan, dan meyesuaikan sikap badan).
Gerakan-gerakan fundamental. Merupakan pola-
pola gerakan yang terbentuk dari gabungan gerakan-
gerakan refleks dan menjadi dasar gerakan keterampilan

87 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

yang kompleks (berjalan, lari, melompat, meluncur,


membungkuk, melengkung, berputar, memegang,
menggerakan jari, dsb).
Kemampuan perseptual. Kemampuan
menafsirkan rangsangan dari berbagai cara untuk
menyesuaikan diri dengan lingkungannya (‘mendengarkan’
mengikuti perintah verbal, ‘gerakan terkoordinasi’, loncat
tali, menangkap, kinestetik discrimination, visual, auditory,
dan tactile discrimination).
Kemampuan fisis. Karakteristik organik yang
esensial untuk mengembangkan gerakan keterampilan
tinggi, termasuk ketahanan, kekuatan, fleksibilitas, dan
ketangkasan (lari jarak jauh, berenang, angkat berat, gulat,
ballet, membengkokkan/melengkungkan punggung,
menyentuh jari kaki, mengetik).
Gerakan keterampilan. Adanya tingkatan efisiensi
pada saat melakukan tugas-tugas gerakan kompleks secara
utuh, meliputi semua gerakan keterampilan yang terbentuk
atas pola-pola gerakan locomotor dan manipulatif,
termasuk keterampilan adaptif sederhana, adaptif
majemuk, dan adaptif kompleks
Komunikasi tanpa kata-kata. Komunikasi yang
dilakukan dengan cara gerakan-gerakan tubuh sampai
dengan koreografis yang canggih (sikap badan, gerak
tangan, ekspresi raut muka, gerakan dansa, gerakan tari)
Menurut Lunerta (Jihad & Haris, 2008) bentuk tes
untuk ranah psikomotor yaitu dapat berupa tes paper and
pencil, tes identifikasi, tes simulasi, dan tes unjuk kerja.
(1) Tes paper and pencil : meskipun berupa tes tulis,
namun sasarannya adalah kemampuan siswa dalam

88 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

menampilkan karya, seperti desain alat, desain


grafis, atau lainnya
(2) Tes identifikasi; tes ini dimaksudkan untuk
mengukur kemampuan siswa dalam
mengidentifikasi sesuatu hal, misalnya menemukan
bagian yang rusak dari suatu alat, dan sebagainya
(3) Tes simulasi: tes ini dilakukan jika tidak ada alat
sesungguhnya yang dapat dipakai untuk
memperagakan penampilan siswa, sehingga melalui
simulasi dapat dinilai apakah siswa sudah
menguasai keterampilan dengan bantuan peralatan
tiruan ini
(4) Tes unjuk kerja: tes ini dilakukan dengan alatyang
sesungguhnya dan tujuannya untuk mengetahui
apakah siswa sudah menguasai/terampil
menggunakan alat tersebut.
Untuk mendapat data melalui tes tersebut dapat
digunakan daftar cek (check list) atau skala
penilaian/kiraan (rating scale).

89 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

UNIT III
INSTRUMEN EVALUASI DAN
TEKNIK PENILAIAN
Ditinjau dari alat ukur atau instrumen yang
digunakan untuk melakukan pengukuran, secara umum
dibedakan menjadi dua, yaitu berbentuk tes atau non-tes.
Alat pengukuran yang berbentuk tes bisa dibedakan menjadi
tiga macam, yaitu tes lisan, test tertulis, dan tes perbuatan.
Tes lisan bisa diselenggarakan secara individual atau
kelompok. Tes tertulis bisa berbentuk esai (uraian) atau
obyektif. Sedangkan tes perbuatan bisa dilaksanakan secara
individual atau juga kelompok.
Alat pengukuran (penilaian) yang non-tes, yang
biasanya menyertai dalam pelaksanaan proses belajar
mengajar sangat banyak macamnya. Di antaranya bisa
disebutkan adalah observasi (baik dengan cara langsung, tak
langsung, maupun partisipasi), wawancara (terstruktur atau
bebas), angket (tertutup atau terbuka), sosiometri, checklist,

90 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

concept map, portfolio, student journal, pertanyaan-


pertanyaan, dan sebagainya. Dilihat dari wilayah atribut
yang diungkap, secara umum alat ukur dapat dikategorikan
menjadi dua wilayah yaitu wilayah kognitif dan wilayah
non kognitif (Suryabrata, 2000)
Teknik penilaian adalah cara-cara yang ditempuh
untuk memperoleh informasi mengenai proses dan produk
yang dihasilkan dari pembelajaran yang dilakukan siswa.
Ada beberapa teknik yang dapat dilakukan dalam rangka
penilaian ini, secara garis besar dapat dikategorikan
sebagai teknik tes & nontes, baik untuk mengakses proses
belajar maupun hasil belajar. Teknik tes merupakan cara
untuk memperoleh informasi melalui pertanyaan yang
memerlukan jawaban benar atau salah, sedangkan teknik
nontes adalah suatu cara untuk memperoleh informasi
melalui pertanyaan yang tidak memerlukan jawaban benar
atau salah, tetapi hanya digradasi positif – negatif, suka –
tidak suka, atau setuju – tidak setuju.

91 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 6
INSTRUMEN TES
A.Pengertian Tes
Secara sederhana tes dapat diartikan sebagai
himpunan pertanyaan yang harus dijawab atau
pernyataan-pernyataan yang harus dipilih atau ditanggapi,
atau tugas-tugas yang harus dilakukan oleh peserta tes
dengan tujuan untuk mengukur pengetahuan,
keterampilan, kecerdasan, atau kemampuan suatu aspek
tertentu dari peserta tes.
Kata “tes” berasal dari bahasa Latin “testum”, alat
untuk mengetahui kandungan-kandungan tanah. Dalam
bahasa Perancis, tes adalah alat atau piring untuk
menyisihkan logam mulia dari bahan-bahan lain seperti
pasir, batu, tanah, dan sebagainya. Kemudian diadopsi
dalam psikologi dan pendidikan untuk menjelaskan sebuah
alat ukur yang dikembangkan untuk dapat melihat dan
mengukur peserta tes yang memenuhi kriteria tertentu.

92 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Untuk memperoleh gambaran yang lebih jelas


tentang pengertian tes, beberapa pengertian tes yang
dibuat para ahli dikemukakan di bawah ini:
(1) ”Test is a systematic procedure for observing a
person’s behaviour and describing it with the aid of
a numerical scale or a category system. Tes adalah
suatu prosedur sistematik untuk mengamati
tingkah laku seseorang dan mendeskripsikannya
dengan menggunakan skala numerik atau sistem
kategori (Cronbach , 1970).

(2) “Test is a standard procedure for obtaining a sample


of behavior from a specified domain” Tes adalah
suatu proses baku untuk memperoleh sampel
tingkah laku dari suatu ranah tertentu (Crocker
dan Algina, 1986).

(3) Test as a systematic procedure for measuring a


sample of behavior. Tes adalah suatu prosedur
sistematik yang dipakai untuk mengukur tingkah
laku atau karakteristik seseorang (Brown, 1981).

(4) Test is procedure in which a sample of an individual’s


behavior is obtained, evaluated, and scored using
standardized procedures. Tes adalah suatu
prosedur dimana suatu sampel perilaku induvidu
diperoleh, dievaluasi, dan diskor dengan
menggunakan prosedur standar (Reynold,
Livingston, & Wilson, 2010).

93 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(5) Test is defined as an instrument of systematic


procedure for observing and describing one or more
chaaracteristics of a student using either a
numerical scale or a clasification scheme. Tes
didefinisikan sebagai suatu instrumen prosedur
sistematis untuk mengamati dan menggambarkan
satu atau lebih karakteristik siswa yang
menggunakan skala numerik atau skema
klasifikasi (Nitko & Brookhart, 2007)

(6) Dalam Encyclopedia of Educational Evaluation,


tes diartikan; “any series of questions or exercises or
other means of measuring the skill, knowledge,
intelligence, capacities or aptitudes of an individual
or group”.Artinya seperangkat pertanyaan atau
latihan atau alat pengukur kemampuan,
pengetahuan, kepandaian, kapasitas atau
kecerdasan lain dari suatu kelompok atau individu
(Anderson, et. al,1981).

Dari pendapat-pendapat di atas dapat disimpulkan


bahwa yang dimaksud dengan tes adalah prosedur yang
sistematis yang terdiri atas seperangkat pertanyaan atau
tugas-tugas untuk mengukur suatu perilaku tertentu pada
peserta didik dengan menggunakan bantuan skala numerik
atau kategori tertentu.
Kata “prosedur sistematik” yang terdapat pada
kelima pengertian di atas bermakna bahwa suatu tes itu
harus disusun, dilaksanakan, dan diskor (diberi angka)
berdasarkan aturan-aturan yang telah ditentukan

94 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

sebelumnya. Istilah “tingkah laku” berarti bahwa suatu tes


itu menghendaki agar peserta didik (siswa) menunjukkan
apa yang sudah diketahui dengan cara menjawab butir-
butir tes atau mengerjakan tugas yang terdapat dalam tes.
Melalui jawaban yang diberikan atau cara melakukan
tugas-tugas, tersebut akan terungkap berbagai informasi
mengenai aspek psikologis tertentu dari orang yang
dikenai tes Informasi yang diperoleh selanjutnya akan
dijadikan dasar untuk membuat penilaian.
Selain pengertian tes sebagai prosedur sistematis,
tes juga dianggap sebagai suatu alat. Karena itu tes dapat
dinyatakan sebagai sejumlah pertanyaan yang harus
dijawab atau serangkaian tugas yang harus dikerjakan oleh
peserta tes yang hasilnya digunakan untuk mengukur
perubahan tingkahlaku dari ranah tertentu. Tes adalah
seperangkat pertanyaan atau tugas-tugas untuk
menentukan bentuk-bentuk respon yang berkenaan
dengan perilaku peserta didik yang dicari (Salvia dan
Ysseldyke,1994).
Pada tes hasil belajar yang diukur adalah tingkah
laku ranah kognitif yaitu kemajuan belajar siswa, tingkat
pemahaman dan penguasaannya terhadap cakupan materi
yang dipersyaratkan dan sesuai dengan tujuan
pembelajaran tertentu.

B. Tujuan Tes
Terkait dengan tujuan tes dalam evaluasi
pendidikan/pembelajaran banyak para ahli menjelaskan
tentang tujuan dari tes. Rangkumannya antara lain yaitu:

95 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

1) Untuk mengetahui kemajuan belajar siswa setelah


mengikuti kegiatan pembelajaran dalam jangka
waktu tertentu.
2) Untuk mengetahui efektivitas metode pembelajaran.
3) Untuk mengetahui kedudukan siswa dalam
kelompoknya.
4) Untuk memperoleh masukan atau umpan balik bagi
guru dan siswa dalam rangka perbaikan.
5) Untuk mendeskripsikan kemampuan belajar siswa.
6) Untuk mengetahui tingkat keberhasilan PBM
7) Untuk menentukan tindak lanjut hasil penilaian
8) Untuk memberikan pertanggung jawaban
(accountability)
9) Untuk mengetahui tingkat kemampuan siswa
10) Untuk mengukur pertumbuhan dan perkembangan
siswa
11) Untukmendiagnosa kesulitan belajar siswa
12) Untuk mengetahui hasil pengajaran
13) Untuk mengetahui hasil belajar
14) Untuk mengetahui pencapaian kurikulum
15) Untuk mendorong siswa belajar

16) Untuk mendorong pendidik mengajar yang lebih baik

C. Klasifikasi Tes
Tes dapat diklasifikasikan dengan beberapa macam,
tergantung dari tujuannya (Anastasi dan Urbina, 1997).
1.Tes Kinerja Maksimum dan tes Kinerja Tipikal

96 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Menurut Cronbach (1970) tes dapat dibedakan


dalam dua kelompok besar yaitu (1) tes yang mengukur
kinerja maksimum (Maximum Performance Tests), dan (2)
Tes yang mengukur kinerja tipikal (Typical Performance
Tests).
Tes-tes kinerja maksimal adalah tes dimana
responden didorong untuk berusaha sekuat tenaga agar
mendapatkan skor tertinggi. Tes inteligensi, tes bakat dan
tes prestasi belajar merupakan contoh tes kinerja
maksimal.
Tes-tes kinerja tipikal tidak digunakan untuk
mengetahui apa yang mampu dilakukan oleh seseorang
tetapi untuk mengetahui apa yang cenderung dilakukan
seseorang. Pada tes kinerja tipikal responden didorong
untuk melaporkan secara jujur keadaan dirinya dalam
variabel yang diukur. Tes-tes kepribadian, tes minat, semua
skala sikap adalah termasuk dalam kelompok tes kinerja
tipikal.
Dalam tes-tes kinerja maksimal, jawaban subyek
adalah jawaban benar atau jawaban salah, sedangkan pada
tes-tes kinerja tipikal jawaban subyek adalah positif atau
negatif.

2.Tes Acuan Norma dan Tes Acuan Kriteria

Tes dapat dibedakan menjadi: tes acuan norma


(norm-referenced test) dan tes acuan patokan (criterion-
referenced test). Tes acuan norma atau sering disebut

97 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

sebagai tes acuan normatif adalah tes yang penafsiran


hasilnya atas dasar kinerja relatif seseorang terhadap
kinerja orang lain dalam kelompoknya..Tujuannya adalah
untuk membeda-bedakan seorang individu dengan
individu lainnya agar peringkat dapat dilakukan
berdasarkan hasil masing-masig. Seorang guru ingin
mengetahui prestasi seorang siswa dalam suatu pelajaran
tertentu, misalnya pelajaran fisika, prestasi siswa itu dapat
dibandingkan dengan siswa-siswa lain dalam kelasnya.
Gambaran prestasi yang diperoleh demikian adalah relatif
dan karenanya tes acuan norma juga dikenal sebagai tes
relatif.
Tes-tes acuan patokan adalah tes yang penafsiran
hasilnya atas dasar kinerjanya sendiri tanpa
membandingkan dengan kinerja orang lain. Pada tes acuan
patokan ini hasil tes atau skor seseorang dibandingkan
terhadap suatu acuan tertentu yang ditetapkan. Guru
menetapkan kriteria atau standar minimum yang harus
dicapai oleh setiap peserta didik. Sesudah pembelajaran,
penguasaan dan prestasi siswa dalam pelajaran tersebut di
tes. Keputusan hasil tes itu dibandingkan dengan kriteria
yang telah ditetapkan.

3.Tes Buatan Guru dan Tes Standar


Berdasarkan cara penyusunan tes, Cangelosi (1995)
membedakan tes menjadi 2 macam, yaitu tes buatan guru
(teacher-made test) dan tes terstandar (standardized test).

98 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Tes buatan guru (teacher-made test) adalah tes yang


disusun dan dikembangkan oleh guru mata pelajaran untuk
untuk keperluan pengukuran dan penilaian di kelasnya
sendiri guna memperoleh informasi tentang kemajuan
belajar siswanya. Efektivitas dan kualitas jenis tes ini
bergantung kepada ketrampilan dan kemampuan guru
dalam merancang sutu tes. Tes buatan guru ini bisa sebagai
ujian kenaikan kelas, sebagai tes satuan pelajaran, atau
sebagai kuis-kuis. Butir-butirnya dapat disajikan dalam
bermacam format: pilihan ganda, betul-salah, jawaban
singkat, melengkapi, atau soal-soal esai. Cirikhas tes ini
adalah dikonstruksi oleh guru kelas untuk mengukur
tujuan khusus pada kelas tertentu.
Tes Standar (Standardized Test) adalah tes yang
dirancang oleh ahli tes yang bekerja sebagai ahli kurikulum
sekaligus sebagai guru. Tes tersebut distandarisasi dalam
arti pengelolaan dan penyekoran yang dilakukan
berdasarkan standar dan asumsi kondisi yang seragam
sehingga hasil dari penilaian dapat dibandingkan untuk
kelas atau sekolah yang berbeda. Beberapa jenis tes
standar berdasarkan jenis normanya, yaitu tes inetelegensi,
tes bakat, tes prestasi akademik, tes minat dan sikap serta
tes kepribadian (Sax, 1980)
Sax (1980) menunjukkan perbedaan antara tes
buatan guru dan tes standar, adalah seperti dalam Tabel
6.1

Tabel 6.1.Perbandingan antara Tes Buatan Guru


dengan tes Standar
Karakteristik Tes Buatan Guru Tes Standar

99 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

1) Spesifikasi Tujuan tes spesifik Tujuan tes berlaku


tujuan untuk keperluan umum untuk siswa lintas
penilaian siswa suatu kelas atau sekolah
kelas
2) Isi Isi dapat diambil dari Butir-butir soal tetap dan
dari berbagai muatan tidak dapat dimodifikasi,
kurikulum. Butir- dan hany mencakup
butir tes dapat suatu muatan tertentu
ditambah, dikurangi dari kurikulum
dan dimodifikasi
sesuai pertimbangan
guru
Aturan bergantung Aturan bergantung
3) Aturan kepada guru. Mereka kepada pihak yang
pengelolaan dapat melakukan tes membuat tes (publisher),
dan secara seragam untuk mereka menyajikan
penskoran seluruh siswa, tetapi aturan dan petunjuk
dapat juga diadaptasi dalam sebuah manual
sesuai dengan kondisi
siswa
Tidak ada norma yang Norma dikembangkan
4) Norma menjadi acuan, tetapi oleh pembuat tes
norma itu dapat (publisher) untuk seluruh
dikembangkan guru untuk
sendiri oleh guru membandingkan kinerja
suatu kelas berdasarkan
usia dan tingkatan siswa
Kualitas dari tes 5 Data yang berupa kualitas
5) Penilaian tes dapat dinilai sendiri dari suatu hasil tes
oleh guru dikeluarkan oleh
pembuat tes (publisher)

D. Jenis-Jenis Tes
1. Berdasarkan Klasifikasi Psikologi
Dalam psikologi, tes dapat diklasifikasikan menjadi
empat jenis, yaitu: (1) tes yang mengukur intelegensi
umum, (2) tes yang mengukur kemampuan khusus atau tes

100 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

bakat, (3) tes yang mengungkap aspek kepribadian


(personality test) (4) tes yang mengukur prestasi.

a. Tes Inteligensi
Tes Inteligensi dirancang untuk mengukur
kemampuan umum seseorang dalam suatu tugas. Kita akan
ingat bahwa kecerdasan merupakan kemampuan untuk
berpikir dan belajar dari pengalaman. Hal ini diduga
tergantung pada kemampuan mewarisi dan lingkungan
dimana seseorang dibesarkan. Suatu tes kecerdasan
memberikan indikasi tentang kemampuan umum individu.
Tes kecerdasan biasanya mencakup berbagai macam tes
sebagai sampel beberapa aspek fungsi kognitif.

b. Tes Bakat
Tes bakat dibuat untuk mengungkap kemampuan
potensial dalam bidang tertentu. Jadi, tes-tes
bakat mengukur kemampuan-kemampuan khusus
dan potensi untuk belajar atau melakukan tugas-tugas
baru yang mungkin relevan dengan belajar atau kinerja di
bidang tertentu. Oleh karena itu tes bakat berorientasi ke
masa depan.
Tes bakat yang digunakan untuk memprediksi kesuksesan
dalam suatu program khusus disebut tes bakat khusus. Tes
bakat sering juga disebut tes bakat skolastik atas tes
kecerdasan bakat. Tes bakat sering digunakan untuk
proses seleksi dan penempatan. Bakat-bakat yang dapat di
tes seperti : bakat menulis, mekanik, musik, seni,
kreativitas

101 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh tes bakat adalah Ujian Masuk Bersama ke Sekolah


Kejuruan.

c. Tes Kepribadian
Tes kepribadian yang bertujuan mengungkap
karakteristik individual subjek dalam aspek yang diukur,
seperti ciri-ciri cara berfikir, merasakan atau berperilaku
Beberapa tes kepribadian mengukur sikap, yaitu
cara seseorang menanggapi orang lain, benda, atau situasi
secara emosional atau secara rasional. Beberapa tes
kepribadian mengukur minat, misalnya minat terhadap
pekerjaan. Tes kepribadian yang lain didesain untuk
mengukur keadaan emosional seseorang, atau mengukur
pola perilaku yang menyimpang atau abnormal dan
menunjukkan penyimpangan psikologis.

d. Tes Hasil Belajar (Achievement Test)


Tes hasil belajar dimaksudkan tes yang digunakan
untuk mengevaluasi hal yang telah diperoleh dalam suatu
kegiatan. Menurut Brown (2004) tes hasil belajar
merupakan “a test to see how far students achieve materials
addressed in a curriculum within a particular time frame”.
Suatu tes untuk mengetahui (mengungkap) seberapa jauh
siswa-siswa telah menguasai materi yang ditentukan dalam
kurikulum pada kurun waktu tertentu.
Tes hasil belajar adalah berkaitan dengan tujuan
pengajaran, yaitu apa yang telah diajarkan. Tes ini
bertujuan untuk mengetahui (1) sejauhmana siswa
menguasai materi pelajaran yang telah diajarkan, (2)
kualitas atau tingkatan yang dicapai, (3) perubahan dan

102 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

kemajuan pembelajaran, dan (4) keefektifan strategi


pengajaran. Menurut Azwar (2010), tes ini bertujuan untuk
mengukur prestasi atau hasil yang dicapai siswa dalam
belajar
Tes hasil belajar biasanya terdiri dari sejumlah butir
soal yang memiliki tingkat kesukaran bervariasi, mudah,
sedang, dan sukar. Tes hasil belajar disusun secara
terencana untuk mengungkap kemampuan siswa dalam
menguasai materi-materi yang yang telah diajarkan.. Tes
hasil belajar berisi butir pertanyaan atau tugas untuk
mengukur apakah pengetahuan atau keterampilan yang
telah dipelajari/dimiliki siswa dapat ditampilkan dan
dikuasai siswa secara baik..
Gronlund (1976) menyatakan bahwa tes prestasi
berfungsi sebagai alat untuk penempatan, fungsi formatif,
fungsi diagnostik dan fungsi sumatif.
Tes Penempatan: adalah tes yang diselenggarakan
menjelang dimulainya suatu program pengajaran, dengan
maksud untuk menempatkan seseorang pada kelompok
yang sesuai dengan tingkat kemampuan yang dimilikinya.
Tes Formatif: adalah tes untuk mendapatkan
informasi tentang kemajuan siswa. Tujuan tes ini adalah
untuk mengukur penguasaan siswa terhadap pokok
bahasan atau topik tertentu.Tes ini dapat dilakukan melalui
kuis-kuis atau tes pokok bahasan. Tes formatif dilakukan
pada setiap periode waktu tertentu dan digunakan untuk
memonitor kemajuan siswa (Silverius, 1991).
Tes Diagnostik: adalah tes yang dilaksanakan
untuk mendiagnosis atau mengidentifikasi kesukaran-
kesukaran dalam belajar, mendeteksi faktor-faktor yang

103 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

menyebabkan terjadinya kesukaran belajar yang dihadapi


siswa, dan menetapkan cara mengatasi kesukaran atau
kesulitan belajar tersebut. Hasil tes diagnostik dapat
digunakan sebagai dasar penyelenggaraan pengajaran
yang lebih sesuai dengan kemampuan siswa sebenarnya,
termasuk kesulitan-kesulitan belajarnya.
Tes Sumatif: adalah tes untuk mengetahui hasil
pengajaran secara keseluruhan. Karena tes ini menekankan
pada hasil pengajaran secara keseluruhan, maka butir
tesnya meliputi seluruh materi yang telah disampaikan.
Lazimnya, tes sumatif diberikan di akhir suatu pelajaran,
atau akhir semester. Hasilnya untuk menentukan
keberhasilan siswa. Tingkat keberhasilan dinyatakan
dengan skor atau nilai, pemberian sertifikat, dan
sejenisnya.

2. Berdasarkan Cara Mengerjakan


Berdasarkan cara pelaksanaannya tes dapat dibagi
menjadi tiga jenis, yaitu (1) Tes lisan (oral test), (2) Tes
Tertulis (written test), dan (3) Tes perbuatan (skill test atau
performance test.

(1)Tes lisan: adalah tes yang pelaksanaanya dilakukan


dengan mengadakan tanya jawab secara langsung antara
pendidik dan peserta didik (berbentuk tanya jawab secara
tatap muka). Tes lisan pada umumnya digunakan untuk
mengevaluasi hasil belajar dalam bentuk kemampuan
dalam mengemukakan ide-ide dan pendapat-pendapatnya
secara lisan Tes lisan memiliki kelebihan dan kelemahan.

104 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Kelebihannya adalah: (a) dapat menilai kemampuan dan


tingkat pengetahuan yang dimiliki peserta didik, sikap,
serta kepribadiannya karena dilakukan secara berhadapan
langsung; (b) bagi peserta didik yang kemampuan
berpikirnya relatif lambat sehingga sering mengalami
kesukaran dalam memahami pernyataan soal, tes bentuk
ini dapat menolong sebab peserta didik dapat menanyakan
langsung kejelasan pertanyaan yang dimaksud; (c) hasil tes
dapat langsung diketahui peserta didik. Kelemahannya
adalah (a) subjektivitas pendidik sering mencemari hasil
tes, (b) waktu pelaksanaan yang diperlukan relatif cukup
lama.

(2)Tes tertulis: adalah tes yang dilakukan secara tertulis


baik soal maupun jawabannya. Pada tes tertulis soal‐
soalnya harus dijawab peserta didik dengan memberikan
jawaban tertulis. Tes yang disampaikan secara lisan dan
dikerjakan atau dijawab secara tertulis masih digolongkan
ke dalam jenis tes tertulis. Ujian tertulis ini biasanya
dilakukan secara berkelompok dengan mengambil tempat
di suatu ruangan tertentu.

(3)Tes perbuatan: Tes yang penugasannya disampaikan


dalam bentuk lisan atau tertulis dan pelaksanaan tugasnya
dinyatakan dengan perbuatan atau unjuk kerja. Menurut
Winkel (1983) Tes perbuatan adalah “tes yang persoalan
atau pertanyaan disampaikan dalam bentuk tugas yang
harus dikerjakan oleh peserta didik. Alat yang dapat
digunakan tes ini adalah berupa observasi atau

105 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

pengamatan terhadap tingkah laku tersebut, yang hasilnya


kemudian diserahkan pada guru”.
Alat yang dapat digunakan untuk melakukan tes ini
adalah lembar pengamatan atau lembar observasi terhadap
tingkah laku tersebut Tes bentuk perbuatan ini pada
umumnya dapat digunakan untuk menilai proses maupun
hasil (produk) dari suatu kegiatan praktik. Untuk tes
perbuatan yang sifatnya individual, sebaiknya
menggunakan format pengamatan individual. Untuk tes
perbuatan yang dilaksanakan secara kelompok digunakan
format tertentu yang sudah disesuaikan untuk keperluan
pengamatan kelompok.
Selain itu, Heaton (1988) membagi jenis tes menjadi
4 bagian utama, yaitu: (1) tes hasil belajar (achievement
test), (2) tes penguasaan (proficiency test), (3) tes bakat
(aptitude test), dan (4) tes diagnostik (diagnostic test).

E. Bentuk-Bentuk Tes Hasil Belajar

Tes yang merupakan salah satu alat ukur hasil


belajar memiliki berbagai bentuk. Wiersma dan Jurs (1990)
menyatakan bahwa terdapat dua bentuk utama butir tes,
yang disebut tes objektif dan esai, yang masing-masing
memiliki format yang bervariasi. Gronlund (1976)
menyatakan “The items used in classroom tests are typically
divided into two general categories: (1) the objective item
which is highly structured and requires the pupil to suplply a
word or two or to select the correct answer from among a
limited number of alternatives, and (2) the essay question

106 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

which permits the pupil to select, organize, and present his


essay form. Tes yang digunakan dalam ruang kelas (tes
hasil belajar) secara umum dibagi menjadi dua kategori,
yaitu: 1) butir objektif yang terstruktur dan meminta
siswa untuk mengisi satu atau dua kata atau memilih
jawaban benar dari sejumlah pilihan, dan 2) pertanyaan
esai (uraian) yang memungkinkan siswa untuk memilih,
mengatur, dan menyajikan bentuk uraiannya.

F. Keterbatasan Tes Sebagai Alat Ukur

Keterbatasan tes sebagai alat ukur muncul karena


langkah-langkah mengukur atribut itu dilakukan secara
tidak langsung. Oleh karena keakuratan informasi yang
diperoleh dari hasil tes tergantung pada keterwakilan dan
kecukupan sampel butir-butir tes terhadap perilaku yang
terkait dengan atribut. Dengan kata lain, tes sebagai alat
ukur harus memiliki sampel yang representatif dari butir-
butir yang mengukur semua dan apa yang ingin
diukur. Selain itu, tidak seperti pengukuran fisik,
instrumen atau alat ukur tes tidak mutlak. Nilai nyata dari
skor 0 persen tidak berarti bahwa peserta didik memiliki
prestasi nol dan karena itu tidak belajar apa-apa.
Kita telah mengetahui bahwa seorang siswa yang
memiliki skor 60 dalam tes tertentu memiliki kemampuan
lebih daripada yang siswa lain yang memiliki skor 30.
Namun, kita mengetahui seberapa besar lebuhnya itu. Oleh
karena itu, skor-skor tes perlu diinterpretasikan dengan
hati-hati.

107 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

G. Fungsi Tes
1. Sebagai alat untuk mengukur hasil belajar siswa.
Sebuah tes dapat digunakan untuk mengetahui
sejauh mana materi ajar telah dikuasai oleh siswa.
Misalnya, jika guru mengajar topik tertentu di kelas,
pada akhirnya guru memberikan tes dan banyak siswa
memperoleh skor yang tinggi. Ini merupakan indikasi
bahwa mereka telah memahami topik dengan sangat
baik.Tetapi jika skor mereka yang sangat rendah, ini
menunjukkan bahwa usaha kita sia-sia. Karenanya, kita
perlu melakukan pembelajaran yang lebih baik. Hasil tes
inilah yang akan membantu guru memutuskan apakah
akan melanjutkan ke topik berikutnya atau mengulang
topik yang sama.

2. Sebagai motivator dalam pembelajaran.


Menurut Ebel (1991), bahwa tes kadang-kadang
dapat dianggap sebagai motivator dari luar diri
(ekstrinsik). Pengalaman menunjukkan bahwa para
siswa akan lebih giat belajar jika mengetahui bahwa
diakhir program nanti akan dilakukan tes. Tanpa tes,
akan banyak siswa yang enggan untuk belajar secara
mandiri, sementara beberapa siswa lainnya
berkemungkinan kurang memberi perhatian saat guru
sedang mengajar. Kita dapat membayangkan jika ada
guru yang tidak memberikan tes maka hal itu sama
seperti siswa mendengarkan khutbah di masjid.

108 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

3. Sebagai upaya perbaikan kualitas pembelajaran.


Melalui penggunaan tes penempatan, tes diagnostik, dan
tes formatif dapat memperbaiki kualitas pembelajaran,
4. Sebagai penentu berhasil atau tidaknya siswa sebagai
syarat untuk melanjutkan pendidikan ke jenjang yang
lebih tinggi dengan melaksanakan tes sumatif

H. Karakteristik Tes yang Baik


Sebuah tes dikatakan tes yang baik jika tes tersebut
memiliki ciri-ciri antara lain memiliki validitas, reliabilitas,
objektivitas, praktikabilitas, dan ekonomis.
1. Memiliki validitas. Tes dikatakan memiliki validitas
jika tes tersebut dengan secara tepat, secara benar,
secara shahih, atau secara absah dapat mengukur
apa yang seharusnya diukur, yaitu mengukur hasil
belajar yang telah dicapai oleh siswa setelah mereka
menempuh proses belajar mengajar dalam jangka
waktu tertentu.
2. Memiliki reliabilitas. Tes dikatakan memiliki
reliabilitas jika hasil-hasil pengukuran yang
dilakukan dengan menggunakan tes tersebut secara
berulang kali terhadap subjek yang sama,
menunjukkan hasil yang tetap atau sifatnya ajeg dan
stabil.
3. Memiliki objektivitas. Tes dikatakan memiliki
objektivitas jika tes tersebut disusun dan
dilaksanakan menurut tujuan instruksional khusus
yang telah ditentukan, bukan atas kemauan dan
kehendak dari tester, serta dalam pemberian skor

109 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dan penentuan nilai harus terhindar dari unsur-


unsur subjektivitas tester.
4. Memiliki praktikabilitas. Tes dikatakan memiliki
praktikabilitas jika tes tersebut praktis (mudah
dilaksanakan, mudah pemeriksaannya, dan
dilengkapi dengan petunjuk-petunjuk yang jelas)
dan mudah mudah pengadministrasiannya.
5. Memiliki ekonomis. Tes dikatakan memiliki
ekonomis jika pelaksanaan tes tersebut tidak
membutuhkan ongkos/biaya yang mahal, tenaga
banyak, dan waktu yang lama
Selain ciri-ciri tersebut , masih ada ciri tambahan
agar tes dapat dipandang sebagai tes yang baik, yaitu:
mudah dilaksanakan dan mudah untuk diskor (Basuki dan
Hariyanto, 2014).

110 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 7
111 | Pengukuran & Evaluasi Hasil Dan Proses Belajar
Prof. Dr. Yusrizal, M.Pd

BENTUK TES HASIL


BELAJAR
A. Tes Objektif
1.Pengertian Tes Objektif

Nelson (1970) menyatakan “The objective test is


highly structured. The examinee is presented with items for
which he must select answers from the alternatives given
rather than construct the answers himself”, tes objektif
adalah tes yang sangat terstruktur. Peserta tes disajikan
dengan butir-butir dimana mereka harus memilih jawaban
dari pilihan-pilihan yang diberikan tanpa menyusun
jwaban sendiri.
Pengertian kata “objektif” di sini dimaksudkan
bahwa tes jenis ini, objektif dilihat dari sistem
penskorannya, artinya siapa saja yang memeriksa lembar
jawaban tes akan menghasilkan skor yang sama. Jadi, tes
objektif adalah tes yang sistem penskorannya objektif.
Tes objektif merupakan perangkat tes yang butir-butir
soalnya mengandung alternatif jawaban yang harus dipilih
oleh peserta tes. Alternatif jawaban telah disediakan oleh
pembuat butir soal. Peserta tes diminta memilih jawaban
dari alternatif jawaban yang telah disediakan. Karenanya,
pemberian skor terhadap jawaban soal dapat dilakukan
secara objektif oleh pemeriksa. (Hopkins dan Antes, 1989)
mengemukakan bahwa dalam butir soal objektif,
pemeriksaan tes tidak memberikan penilaian tentang mutu

112 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

jawaban siswa, tetapi hanya mencocokkan jawaban siswa


dengan kunci jawaban
Tes objektif mempunyai beberapa keunggulan yang
dapat digunakan dalam pembelajaran di sekolah. Pertama,
tes objektif itu singkat dan siswa tidak perlu menulis
banyak dalam menjawab. Kedua, materi dan tujuan
pengajaran dapat terwakili dengan baik. Ketiga, tes objektif
adalah reliabel. Keempat, tes objektif dapat digunakan pada
kelas dengan jumlah siswa yang banyak, dan dalam
melakukan penyekoran dapat akurat, hanya menggunakan
kunci jawaban yang dapat dilakukan oleh orang atau mesin
(Brown dan Thornton, 1971).
Tes objektif digunakan untuk mengevaluasi hasil
belajar berupa kemampuan-kemampuan:

a) Mengingat dan mengenal kembali fakta-fakta


b) Memahami hubungan antara dua hal atau lebih
c) Mengaplikasikanprinsip-prinsip
d) Menganalisis
e) Mengsintesis
f) mengevaluasi

2. Kelebihan Tes Objektif


 Tes objektif meningkatkan skor jawaban siswa pada
butir-butir tes karena penskoran tidak dipengaruhi
oleh bias penskor ketika penskoran dilakukan tetapi
oleh kebenaran jawabannya.
 Penskoran tes objektif adalah mudah dan
membutuhkan sedikit waktu. Penskoran juga dapat

113 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dilakukan oleh komputer dan memberikan efesiensi


yang tinggi bagi besar peserta tes.
 Hasil tes objektif terutama tes pilihan ganda dapat
digunakan untuk tujuan diagnostik karena tes
objektif dapat memberi petunjuk terhadap
kesalahan-kesalahan faktual dan kesalah pahaman
yang memerlukan perbaikan.
 Untuk pengambilan sampel materi pada tes objektif
adalah cukup karena lebih representatif mewakili isi
materi dan luas bahan karena memungkinkan
jumlahnya butirnya yang banyak Hasilnya
memberikan kemampuan peserta tes lebih valid dan
reliabel.
 Tes objektif efisien untuk mengukur pengetahuan
tentang fakta-fakta. Tes objektif dapat juga
dirancang untuk mengukur pemahamn,
ketrerampilan berpikir dan hasil-hasil belajar
kompleks lainnya.
 Butir tes objektif dapat menjadi sebagai pretes (tes
awal), disempurnakan melalui analisis butir,
dibakukan, dan digunakan kembali beberapa kali
jika ditangani dengan benar.
 Tes objektif adalah adil untuk semua peserta tes
karena tidak bertugas pada keterampilan lain di
luar keterampilan yang dimaksudkan untuk
mengukur. Artinya validitasnya tidak dipengaruhi
oleh tulisan tangan yang baik, atau banyak kata-kata
yang tidak berguna.

3. Kelemahan Tes Objektif

114 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

 Tes objektif tidak mendorong pengembangan


peserta tes dalam keterampilan yang diinginkan
seperti kemampuan untuk memilih, mengatur atau
mensitesiskan ide-ide dan menyajikannya secara
benar dalam bentuk logis dan koheren.
 Tes objektif cenderung mengukur hanya
pengetahuan faktual. Kelemahan ini dapat diatasi
dengan mengembangkan butir-butir untuk butir
objektif secara ketat beradasarkan langkah-langkah
yang terlibat dalam proses pengembangan butir.
 Pengembangan butir tes objektif yang baik
memerlukan pelatihan pengembang tes dalam
keterampilan yang diperlukan untuk
mengkonstruksi efektif, butir yang valid dan
relaibel.
 Tes objektif membutuhkan waktu, komitmen dan
perencanaan yang memadai
 Butir tes objektif memberi kemungkinan untuk
menebak terutama ketika butir tes tidak terampil
dikembangkan. Seorang peserta tes dapat menebak
dengan benar pada beberapa butir dan
mendapatkan angka tidak layak bahkan dalam tes
objektif yang dikonstruk secara baik. Adalah lebih
mudah untuk menipu dalam tes objektif daripada
tes esai jika tes ini kurang dikelola.

4. Klasifikasi Tes Objektif


Menurut Gronlund dan Linn (1990) tes objektif
dapat diklasifikasikan menjadi dua jenis, yaitu (1) soal

115 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dengan respon pilihan (Selected Response Items) dan (2)


soal dengan respon isian (Supply Response Items)

4.1.Jenis Respon Pilihan


Tes respon pilihan (Selected Response Items) adalah
jenis tes di mana peserta tes memilih jawaban yang paling
sesuai atau pilihan yang benar. Adapun yang termasuk
dalam kelompok ini adalah tes benar-salah, tes
menjodohkan, dan tes pilihan ganda

a. Tes Benar- Salah


Tes bentuk benar-salah (true-false) terdiri
dari sebuah pernyataan atau proposisi yang harus
dinilai oleh peserta tes atau siswa dan kemudian
memberi tanda, apakah benar atau salah. Dalam tes
ini pernyataan disajikan kepada peserta tes dan ia
diminta untuk menyatakan apakah pernyataan itu
Benar atau Salah, Ya atau Tidak, Setuju atau Tidak
Setuju, dan sebagainya.
Kelebihan tes benar-salah:
(1) Sangat mudah untuk mengkonstruksi butir
respon pilihan (alternatif) namun validitas dan
reliabilitas butir tersebut bergantung pada
keterampilan para pengkonstruk butir. Untuk
mengkonstruk butir respon pilihan tidak ambigu,
yang mengukur hasil belajar signifikan, memerlukan
banyak keahlian.(2) Sejumlah besar butir respon
pilihan mencakup materi sampel yang luas dapat
diperoleh dan peserta tes dapat meresponnya

116 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dalam jangka waktu yang singkat. (3) penilaiannya


objektif.
Kelemahan tes benar-salah:
(1) Tes ini membutuhkan materi pelajaran yang
dapat diutarakan sehingga pernyataan tersebut
benar atau salah tanpa batasan atau pengecualian
seperti dalam ilmu sosial. (2) Tes ini terbatas untuk
hasil belajar dalam bidang pengetahuan saja kecuali
untuk membedakan antara fakta dan pendapat atau
mengidentifikasi hubungan penyebab dan akibat.(3)
Tes ini rentan terhadap menebak dengan peluang
benarnya adalah 50%. (4) Apabila jumlah butir
soalnya sedikit, indeks daya pembeda butir soal
cenderung rendah.
Ada enam variasi tes benar-salah yaitu:
benar-salah (true-false), ya-tidak (yes-no), betul-
salah (right-wrong), pembetulan atau koreksi
(correction),pilihan benar-salah jamak (multiple
true-false), dan ya-tidak dengan penjelasan (yes-no
with explanation). Nitko (1996) mengemukakan
Variasi ”benar-salah” berbentuk proposisi yang
harus dinilai oleh peserta didik, apakah penyataan
itu benar atau salah. Variasi bentuk “ya-tidak”
menanyakan pertanyaan langsung, terhadap mana
peserta didik menjawab atau tidak. Pada variasi
bentuk ”betul-salah,” dikemukakan perhitungan,
persamaan, atau kalimat yang harus dinilai oleh
peserta didik apakah betul atau tidak betul. Variasi
bentuk “koreksi atau pembetulan,” meminta kepada
peserta didik untuk menilai sebuah proposisi,

117 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

seperti pada bentuk benar-salah, tetapi peserta


didik juga diminta untuk memperbaiki atau
mengoreksi setiap pernyataan yang salah dan
membetulkannya. Variasi bentuk pilihan “benar-
salah” tampaknya sama dengan butir pilihan ganda,
malahan pada saat memilih satu opsi yang benar,
peserta didik memperlakukan tiap opsi sebagai
suatu pernyataan “benar-salah” yang terpisah, yakni
lebih dari satu pilihan bisa benar. Sedangkan pada
variasi “ya-tidak” dengan penjelasan, menanyakan
pertanyaan langsung dan meminta peserta didik
untuk menjawab “ya” atau “tidak,” dan dijelaskan
mengapa pilihannya benar.
Penggunaan tes Benar-Salah:
(1) Jenis tes ini umumnya digunakan untuk
mengukur kemampuan mengidentifikasi kebenaran
dari pernyataan fakta, definisi istilah, pernyataan
prinsip-prinsip dan hasil pembelajaran yang relatif
sederhana. (2) Juga digunakan untuk mengukur
kemampuan membedakan fakta dari pendapat,
tahyul dari keyakinan ilmiah. (3) Tes ini paling baik
digunakan untuk mengukur kemampuan mengenali
hubungan-hubungan penyebab-dan-akibat. (4) Tes
ini paling baik digunakan dalam situasi dimana
hanya ada dua kemungkinan pilihan seperti benar
atau salah, lebih atau kurang, dan sebagainya, dan
/(5) Tes jenis ini berguna ketika sejumlah besar
materi pembelajaran harus segera diuji

b. Tes Menjodohkan

118 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Tes menjodohkan adalah tes yang terdiri dari


dua kelompok. Kelompok pertama berisi kata-kata
pertanyaan, di mana kata-kata ini memiliki jodoh
atau pasangan pada kelompok kedua. Tugas peserta
tes atau siswa ialah menjodohkan masing-masing
kata atau pertanyaan tersebut dari kelompok satu
dan kelompok ke dua.
Bentuk soal menjodohkan terdiri atas sub
kelompok pernyataan yang pararel. Kedua
kelompok pernyataan ini berada dalam satu
kesatuan. Kelompok sebelah kiri merupakan bagian
yang berisi soal dan kelompok sebelah kanan berisi
jawabannya. Jumlah jawaban dibuat lebih banyak
dari jumlah soal.
Kelebihan tes menjodohkan adalah:
(1) Tes menjodohkan bentuknya yang kompak dan
dapat mengukur sejumlah besar hasil belajar yang
berkaitan dengan fakta-fakta, dan mudah
menyusunnya.terdiri Bentuk rapi ini
memungkinkan untuk mengukur sejumlah besar
materi faktual yang terkait dalam waktu yang relatif
singkat.(2) Tes menjodohkan memungkinkan
pengambilan sampel isi materi yang banyak, yang
menghasilkan validitas isi yang relatif lebih
tinggi.(3) Faktor menebak dapat dikontrol jika
terampil dalam mengkonstruksi butir seperti
respon benar setiap stimulus harus berfungsi (4)
Penskorannya sederhana dan objektif, serta dapat
dilakukan dengan komputer

119 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Kelemahan tes menjodohkan adalah:


1) sukar mengukur proses mental yang tinggi,
2) siswa cenderung untuk membuat tafsiran-
tafsiran,
3) kemungkinan menebak relative tinggi.

Penggunaan tes menjodohkan:


1) Tes ini digunakan ketika hasil pembelajaran
menekankan pada kemampuan untuk
mengidentifikasi hubungan diantara hal-hal
dan sejumlah stimulus yang homogen dan
respon yang dapat diperoleh,
2) Pada dasarnya digunakan untuk
menghubungkan dua hal yang memiliki
dasar logis untuk digabungkan,
3) Tes ini memadai untuk mengukur
pengetahuan faktual seperti pengujian
pengetahuan istilah, definisi, tanggal,
peristiwa, petunjuk ke peta serta diagram-
diagram.

c. Tes Pilihan Ganda


Thorndike dan Hagen (1977)
menyatakan:”the multiple choice item consists of two
parts: the stem which presents the problem, and the
list of possible answers or options. In the standard
from of the item, one of the options is the correct or
the best answer and the others are misleads or foils or
distractors.

120 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Soal pilihan ganda adalah bentuk soal yang


konstruksinya terdiri atas dua bagian yaitu pokok
soal (stem) dan alternatif jawaban (option). Satu di
antara alternatif jawaban tersebut adalah jawaban
benar atau yang paling benar (kunci jawaban),
sedangkan alternatif jawaban yang lain berfungsi
sebagai pengecoh (distractor).

Stem
Item atau Butir Soal Distractor

Option
Kunci

Pokok soal dapat dibuat dalam dua bentuk,


yaitu pokok soal dalam bentuk pertanyaan tidak
selesai atau dalam bentuk kalimat tanya. Jumlah
alternatif jawaban yang dibuat biasanya empat atau
lima. Hal ini senada dengan pendapat Thorndike
dan Hagen (1977)” an item must have at least 3
answer choices to be classified as a multiple choice
itemand typical pattern is to have 4 or 5 answe”.
Semakin banyak alternatif jawaban yang dibuat,
maka probabilitas siswa untuk menebak jawaban
semakin kecil. Tata tulis tes pilihan ganda adalah
sebagai berikut (Kemdikbud, 2010).

121 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(1) Jika pokok soal (stem) ditulis dengan kalimat


tidak selesai, maka awal kalimat ditulis dengan
huruf besar dan awal option ditulis dengan
huruf kecil, dan pada akhir kalimat disertai
dengan empat buah titik.
Perhatikan struktur tes pilihan ganda berikut:
---------------------------------------------------------------------
---------------------------------------------------------------------
Pokok Soal
------------------------------------------....
-----------------------------* Kunci jawaban
----------------------------- Pengecoh
----------------------------- Pengecoh
---------------------------- Pengecoh

(2) Jika pokok kalimat ditulis dengan kalimat


tanya, maka awal kalimat ditulis dengan huruf
kapital dan akhir kalimat diberi tanda tanya.
Setiap awal option dimulaii dengan huruf
kapital dan diakhiri dengan tanda titik.

Perhatikan struktur tes pilihan ganda berikut:


---------------------------------------------------------------------
---------------------------------------------------------------------
Pokok Soal
------------------------------------------?
----------------------------- .* Kunci jawaban
-----------------------------. Pengecoh

122 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

-----------------------------. Pengecoh
----------------------------. Pengecoh

Petunjuk menulis soal pilihan ganda:


Mengkonstruksi butir soal pilihan ganda yang baik
membutuhkan waktu yang cukup untuk menulis,
menelaah, dan merevisinya. Sebaiknya kita menulis
(mencicil) beberapa soal setiap hari ketika materi
masih segar dalam ingatan setelah mengajar,
dibandingkan dengan menulis soal sekaligus setelah
selesai (di akhir ) penyajian materi.

Menulis Stem:
Stem dari butir soal pilihan ganda memiliki suatu
masalah atau menyatakan sebuah pertanyaan.
Aturan mendasar pada penulisan stem bahwa siswa
harus memahami pertanyaan tanpa harus membaca
beberapa kali dan tanpa membaca semua pilihan
(option).

Menulis Respons (tanggapan):


Soal-soal pilihan ganda biasanya mempunyai empat
atau lima pilihan (option) untuk membuatnya sukar
bagi siswa dalam menebak jawaban yang benar.
Aturan mendasar untuk penulisan respons
(tanggapan) adalah (a) siswa harus dapat memilih
respons yang tepat tanpa harus memilah-milah
kerumitan yang tidak ada hubungannya dengan
mengetahui jawaban yang benar, dan (b) mereka

123 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

tidak harus mampu menebak jawaban yang benar


dari cara respons tersebut ditulis.

Penggunaan tes Pilihan Ganda:


(1) Tes pilihan ganda merupakan bentuk tes yang
paling banyak digunakan dari bentuk tes yang ada.
Tes ini dapat digunakan untuk mengukur berbagai
hasil pembelajaran dari yang sederhana hingga ke
yang kompleks, (2) Tes pilihan ganda dapat
disesuaikan dengan materi dan tujuan pembelajaran
pada tingkat-tingkat pengetahuan dan pemahaman.
(3) Tes pilihan ganda dapat digunakan untuk
mengukur hasil-hasil pengetahuan yang berkaitan
dengan kosa kata, fakta, prinsip, metode dan
prosedur dan juga aspek-aspek pemahaman yang
berhubungan dengan penafsiran fakta-fakta,
prinsip-prinsip dan metode-metode, (4)
Kebanyakan dari tes-tes prestasi dan bakat yang
standar dikembangkan secara komersil
menggunakan jenis tes pilihan ganda.
Tes pilihan ganda dapat digunakan untuk
mengukur pengetahuan, ingatan dan juga pemikiran
tingkat tinggi. Haladyna (1999) mengemukakan
bahwa pertanyaan-pertanyaan pilihan ganda dapat
mengukur empat jenis isi (fakta, konsep, prinsip,
dan prosedur) dan lima jenis perilaku kognitif
(mengingat, memahami, memprediksi,
mengevaluasi, dan menyelesaikan masalah).

Kelebihan tes Pilihan Ganda:

124 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(1) Tes pilihan ganda adalah penerapannya yang


luas dalam pengukuran bermacam-macam fase
pencapaian, (2) Tes pilihan ganda berguna dalam
mendiagnosis dan memungkinkan membedakan
diantara peserta tes berdasarkan apa yang sedang
diukur yang dimiliki mereka, (3) Dapat mengukur
berbagai jenjang kognitif (dari ingatan sampai
dengan evaluasi (4) Tes pilihan ganda dapat diskor
dengan computer

Kekurangan Tes Pilihan Ganda:


(1) Memerlukan waktu yang relatif lama untuk
menulis soalnya; (2) Sulit membuat pengecoh yang
homogen dan berfungsi ;(3) Terdapat peluang
untuk menebak kunci jawaban. (4) Tes pilihan
ganda membutuhkan waktu respon yang lebih lama
dari pada tes objektif jenis lain

Ragam Tes Pilihan Ganda


Ragam tes pilihan ganda dapat dibedakan
atas: 1) Ragam Tes Pilihan Ganda menurut soalnya,
dan 2) Ragam Tes Pilihan Ganda menurut
jawabannya.

Ragam Tes Pilihan Ganda menurut soalnya:

Terdapat 5 (lima) ragam soal pilihan ganda


berdasarkan soalnya yaitu: (1) pilihan ganda biasa
(melengkapi pilihan), (2) pilihan ganda asosiasi, (3)

125 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

pilihan ganda analisis hubungan atau sebab akbiat,


(4) Pilihan ganda analisis kasus, dan (5) pilihan
ganda membaca diagram, grafik, tabel. Penggunaan
kelima ragam itu memungkinkan soal pilihan ganda
dapat mengukur aspek kognitif tingkat tinggi
(analisis, sintesis, dan evaluasi).

(1) Tes pilihan ganda melengkapi pilihan.

Soal tes pilihan ganda jenis ini terdiri dari pokok


soal (stem) yang berupa pernyataan yang belum
lengkap atau suatu pertanyaan yang dilengkapi
dengan 4 atau 5 kemungkinan jawaban yang disebut
option. Tugas siswa adalah memilih jawaban yang
benar (sesuai kunci). Ragam ini paling banyak
digunakan. Kekeliruan penggunaan ragam ini
umumnya pada segi kaidah bahasa dan penempatan
pilihan (option).

Petunjuk:
Pililah satu jawaban yang tepat pada soal di bawah
ini dengan memberi tanda silang (X) pada huruf
dilembaran jawaban

Contoh soal:

Untuk pembelajaran yang menuntut pencapaian


kompetensi tertentu sebagaimana diharapkan dan
termuat pada kurikulum saat ini, maka lebih tepat
menggunakan….

126 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

A. Penilaian Acuan Normatif


B. Penilaian Acuan Patokan
C. Penilaian Berbasis Kelas
D. Penilaian Berbasis Kompetensi

(2) Tes pilihan ganda asosiasi.

Tes jenis ini merupakan modifikasi dari tes pilihan


ganda biasa. Bentuk asosiasi juga terdiri dari satu
pernyataan dan beberapa alternatif jawaban, hanya
saja terdapat lebih dari satu jawaban yang benar.
Soal dengan ragam asosiasi ini mengharuskan siswa
berpikir lebih komprehensif sebab pilihan jawaban
yang benar bisa 3, 2, 1 atau semua salah.
Petunjuk::

Pilihlah:
A. Jika (1), (2), dan (3) betul;
B. Jika (1) dan (3) betul;
C. Jika (2) dan (4) betul;
D. Jika hanya (4) yang betul.

Contoh soal:
Kegiatan evaluasi terdiri dari:
(1) mengukur
(2) menilai
(3) memberikan hasil
(4) persiapan

127 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(3)Tes pilihan ganda hubungan antar hal atau


sebab akibat

Tes soal ini memuat pernyataan dan alasan, dengan


pola memuat pernyataan dan memuat alasan. Soal
pilihan ganda jenis ini terdiri dari 2 kalimat
pernyataan, yang dihubungkan dengan kata SEBAB.
Kedua kalimat bisa merupakan sebab akibat, bisa
juga keduanya benar tetapi tidak berhubungan, bisa
salah satu benar, dan bisa juga keduanya salah.

Petunjuk:
Pada soal berikut terdapat kalimat-kalimat yang
terdiri atas pernyataan yang diikuti alasan

Pilihlah:
A. Jika pernyataan benar, alasan benar, dan ada
hubungan sebab
akibat
B. Jika pernyataan benar, alasan benar, dan tidak
ada hubungan sebab akibat
C. Jika pernyataan benar, alasan salah
D. Jika pernyataan salah, dan alasan salah
E. Baik pernyataan maupun alasan salah

128 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh soal:
Motivasi adalah salah satu seni penting yang harus
dikuasai oleh orang pimpinan
SEBAB
Kemampuan memotivasi bawahan adalah salah satu
cara untuk mendapatkan sumberdaya manusia yang
mau dan mampu bekerja

(4) Tes pilihan ganda tinjauan atau analisis


kasus.

Bentuk tes soall tinjauan/ analisis kasus sama


dengan ragam butir 1 (melengkapi atau menjawab
pertanyaan), hanya isi yang terkandung dalam
pokok soal berupa kasus. Peristiwa khusus, hasil
kerja di laboratorium, atau kejadian di sekitar kita
dapat dijadikan kasus.

Petunjuk:
Untuk soal berikut disediakan suatu teks yang harus
dipahami secara cermat. Kemudian menyusul soal
yang memasalahkan hal-hal yang berhubungan
dengan isi teks. Pilihlah satu jawaban yang paling
tepat pada soal yang mengiringi teks.

129 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh soal:

Sebuah benda digantung dengan pegas, dengan h


adalah tinggi benda dari tanah. Bila sekarang benda
itu ditarik sedikit ke bawah, kemudian dilepaskan,
benda itu akan berayun naik turun secara harmonic
dengan frekuensi ayunan per detik.

Ayunan benda itu disebabkan oleh:


A. Tarikan searah dari pegas
B. Tarikan searah dari gravitasi
C. Interaksi antara pegas dan gaya gesekan udara
D. Interaksiantara gaya gravitasi dan gaya gesekan
udara

(5) Tes pilihan ganda analisis diagram, grafik,


tabel.

Bentuk tes soal ini disajikan berupa diagram,


gambar, grafik atau tabel. Ragam tes pilihan ganda
ini dapat mengukur aspek berpikir lebih tinggi.

Petunjuk:
Dalam menjawab soal berikut ini hendaknya
digunakan table serta data yang ada di dalamnya.

Contoh:

130 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Tabel di bawah ini menggambarkan rata-rata suhu


dan curah hujan di kota X selama 10 bulan Januari
s.d Oktober)

Udara Jan Feb Mar Apr Mei Jun Jul Ag Sep Okt
t

Suhu 28,9 29,9 31,3 29,9 29,1 28,6 27,9 28 28,9 28,7
udara ,1
(oC) 0,0

0,0 2,0
Curah 1,0 4,0 23,0 86,0 27,0 1, 42,0
Hujan
0
(mm)
Adopsi dari Zainul & Nasution, 2005.

Pertanyaan: Manakah yang benar untuk kota X ?


A. Bulan yang terpanas suhu udaranya adalah
bulan yang sedikit curah hujannya
B. Setiap bulan selalu turun hujan di kota X
C. Terjadi dua kali musim hujan dalam selam 10
bulan di kota X
D. Waktu yang paling baik untuk menanam padi di
kota X adalah pada bulan Juni

2) Ragam Tes Pilihan Ganda menurut


jawabannya.
Ada tujuh (tujuh) ragam soal pilihan ganda
berdasarkan jawabannya yaitu: (1) jawaban yang
benar; (2) jawaban yang paling tepat/baik; (3)
banyak jawaban yang benar; (4) jawaban sebagai
isian; dan (5) pengecualian negatf.

131 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(1) Jawaban yang Benar.


Salah satu dari optionnya mutlak benar, sementara
yang lainnya mutlak salah.

Contoh:
Siapakah yang menemukan telepon ?
A. Edison
B. Bell
C. Morse
D. Marconi

(2) Jawaban yang paling tepat/Baik.


Kemungkinan jawaban mempunyai tingkat
kebenaran yang berbeda.Yang paling tinggi tingkat
kebenarannya adalah yang paling benar
Contoh:
Jenis tes yang digunakan untuk mengukur
pembelajaran sekolah disebut :

A. Sebuah tes diagnostik .


B. Sebuah tes kemampuan .
C. Sebuah tes profil .
D. Sebuah tes prestasi

(3) Banyak Jawaban yang Benar.


Kemungkinan jawaban(option) dapat berisi lebih
dari satu jawaban yang benar.

Contoh:

132 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Pancasila adalah....
A. Dasar negara Republik Indonesia
B. Lima azas orde baru
C. Falsafah hidup bangsa Indonesia
D. Alat peersatu bangsa Indonesia

(4) Jawaban sebagai Isian.


Ujung dari pertanyaanya terdapat kekosonga
sehingga perlu diisi

Contoh:
Penemu rumus kesetaraan energi dan massa
adalah....
A. Rutherford
B. Einstein
C. Sommerfeld
D. Maxwell

(5) Pengecualian Negatif.


Pada ragam ini jawaban yang paling benar ialah
perkecualian dari pokok soal

Contoh;
Di bawah adalah kebaikan tes bentuk objektif
dibandingkan tes bentuk uraian, kecuali …
A. Cepat dan obyektif dalam memeriksa
jawaban peserta
B. Dapat mewakili bahan atau materi yang telah
dibelajarkan

133 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

C. Mudah membuat pertanyaanya


dibandingkan tes uraian
D. Waktu yang diperlukan singkat untuk
menjawab satu butir soal

4.2. Jenis Respon Isian


Tes respon isian (Supply Response Items) atau
bentuk tes mengisi jawaban cenderung
menunjukkan kompromi antara tes esai dan tes
objektif. Yang termasuk dalam kelompok ini adalah
butir soal jawaban singkat (short answer) dan butir
soal melengkapi (completion).

a. Tes Jawaban Singkat


Bentuk soal jawaban singkat merupakan soal
yang menghendaki jawaban dalam bentuk kata,
bilangan, kalimat atau simbol dan jawabannya
hanya dapat dinilai benar atau salah. Kaidah utama
dalam menulis bentuk soal jawaban singkat adalah:
soal harus sesuai dengan indikator, jawaban yang
benar hanya satu, dan rumusan kalimat soal harus
komunikatif.

Penggunaan tes Jawaban Singkat:


(1) Sangat cocok mengukur berbagai hasil
pembelajaran yang relatif sederhana seperti
mengingat informasi yang dihafal dan hasil-hasil
pemecahan masalah yang diukur dalam matematika
dan sains.(2) Dapat digunakanuntuk mengukur

134 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

kemampuan untuk menafsirkan diagram, bagan,


grafik dan data bergambar.(3) Digunakan paling
efektif untuk mengukur hasil belajar tertentu
seperti hasil belajar perhitungan dalam matematika
dan sains.

Kelebihan tes Jawaban Singkat:


(1) sangat mudah menyusunnya, karena secara
relatif biasanya mengukur hasil belajar yang
msederhana (2) Dapat meminimalkan menebak
karena peserta tes harus memberi jawaban dengan
berpikir dan mengingat kembali informasi yang
diminta atau membuat perhitungan yang diperlukan
untuk memecahkan masalah yang disajikan. Hal ini
berbeda dengan butir pilihan dimana sebagian
pengetahuan memungkinkan peserta tes memilih
jawaban yang benar.

Kelemahan tes Jawaban Singkat:


(1) Tidak cocok untuk mengukur hasil belajar yang
kompleks. Ia cenderung untuk mengukur hanya
pengetahuan faktual dan bukan kemampuan untuk
menerapkan pengetahuan tersebut dan mendorong
menghafal jika digunakan berlebihan. (2)
Cenderung mengukur kemampuan mengingat
(simple recall).(3) Tes jawaban singkat tidak dapat
diskor dengan komputer.
Ada dua bentuk soal jawaban singkat, yaitu
bentuk pertanyaan langsung dan bentuk pertanyaan
tidak lengkap.

135 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh :
1) Berpakah luas segitiga yang panjang alasnya 8
cm dan tingginya 6cm?
2) Luas daerah segitiga yang panjang alasnya 8 cm
dan tingginya 6 cm adalah....
Bentuk soal jawaban singkat cocok untuk
mengukur pengetahuan yang berhubungan dengan
istilah, fakta, prinsip, metode, prosedur dan
penafsiran data sederhana.

b. Tes Melengkapi
Tes melengkapi adalah butir soal yang
meminta peserta didik atau siswa untuk melengkapi
suatu kalimat dengan satu frase, satu angka atau
satu formula.

Penggunaan tes melengkapi:


Tes ini biasanya digunakan dalam tes matematika
dasar, seperti menjumlah, mengurangi, membagi
dan sebagainya. Selain itu, tes ini dapat juga
digunakan untuk menguji kemampuan mengingat

Kelebihan tes Melengkapi:


(1) mudah dikonstruksi, dalam waktu yang relatif
singkat dapat diknstruksi sejumlah butir, (2)
mampu menguji sebagian besar pokok bahasan
dalam waktu yang relatif singkat.

Kelemahan tes Melengkapi:

136 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(1) Tidak dapat menguji semua tingkat kemampuan


hasil belajar, (2) Terlalu menekankan pada
kemampuan mengingat, sehingga hasil tes tidak
menggambarkan keseluruhan kemampuan hasil
belajar.

5. Kapan Menggunakan Tes Objektif


Tes objektif digunakan ketika tugas yang sangat
terstruktur yang diperlukan untuk membatasi jenis
respon (jawaban) peserta tes dapat membuat dan
memperoleh jawaban yang benar dari siswa dengan
menunjukkan pengetahuan atau keterampilan khusus
yang disebut dalam butir.

 Tes objektif digunakan untuk menilai lebih efektif


pencapaian salah satu tujuan hasil belajar
sederhana dan juga hasil kompleks dalam
pengetahuan, pemahaman, dan penerapan, dan
bahkam di tingkat yang lebih tinggi meliputi luasan
materi yang lebih luas jika terampil dikonstruk.
Adalah dimungkinkan untuk menetapkan sebanyak
120 tes objektif tersebar di banyak satuan pelajaran
dan beberapa tingkat kognitif selama satu atau dua
jam.
 Tes objektif digunakan ketika yang diinginkan
tujuannya, menskornya mudah dan akurat terutama
bila jumlah peserta tes besar.
 Tes objektif digunakan untuk mengukur
pemahaman, keterampilan berpikir dan hasil belajar
kompleks dari siswa

137 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

B. TES ESAI
1.Pengertian Tes Esai

Tes esai sering disebut tes subjektif, karena proses


pemberian skornya. dipengaruhi oleh opini atau penilaian
dari pendidik atau pemeriksa tes tersebut. Stalnaker
(1951) mengemukakan “ A test item which requires a
response composed by the examinee, usually in the form of
one or more sentences, of a nature that no single response or
pattern of response can be listed as correct, and the accuracy
and quality of which can be judged subjectively only by one
skilled or informed in the subject’’. Esai adalah sebuah tes
yang membutuhkan jawaban yang disusun oleh peserta tes,
biasanya dalam bentuk satu kalimat atau lebih kalimat,
bersifat yang bukan jawaban tunggal atau pola jawaban
dapat terdaftar sebagai benar, dan akurat serta kualitas
yang dapat dinilai subjektif hanya oleh para ahli.
Nurkancana dan Sunartana (1990) mengemukakan “Tes
uraian adalah butir tes yang mengandung pertanyaan atau
tugas yang jawaban atau pengerjaan tes harus dilakukan
dengan cara mengekspresikan pikiran eksamini secara
naratif. Jadi tes esai atau uraian menghendaki peserta tes
atau siswa untuk mengorganisasikan, merumuskan, dan
mengemukakan sendiri jawabannya. Dengan kata lain
bahwa peserta tes atau siswa tidak memilih jawaban, akan

138 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

tetapi memberikan jawaban dengan kata-katanya sendiri


secara bebas.
Berdasarkan pengertian di atas, tes esai adalah tes
yang terdiri dari pertanyaan-pertanyaan atau butir-butir
yang dirancang untuk memperoleh respon dari peserta tes
atau siswa melalui jawaban bebas mereka terhadap materi
yang telah mereka pelajari. Dalam hal ini peserta tes
(peserta ujian) memiliki tanggungjawab pemikiran untuk
merespon atau menanggapi pertanyaan yang diajukan.
Mereka memiliki kebebasan untuk mengekspresikan atau
menyatakan jawabannya dalam kata-kata sendiri. Jawaban
atas pertanyaan-pertanyaan yang diberikan peserta didik
biasanya mempunyai kualitas dan derajat kebenaran yang
bervariasi. Sering kali, jawaban-jawaban mereka tidak
lengkap.
Tes esai memiliki kualitas psikometri atau kualitas
pengukuran yang buruk meskipun populer di kalangan
guru kelas terutama mereka yang kurang terampil dalam
mengkonstruksi butir. Karenanya, seorang guru harus
mengetahui bagaimana cara mengkonstruksi atau
mengembangkan butir-butir esai, dan selanjutnya
mengetahui bagaimana melaksanakan dan cara penskoran
butir-butir untuk meningkatkan validitas dan
reliabilitasnya.
Tes esai digunakan oleh guru untuk mengukur
prestasi pembelajaran di ruang kelas dan sebagainya.
Beberapa ciri khas tes esai adalah:
(1) Siswa menjawab sejumlah kecil pertanyaan. Karena
waktu terbatas, biasanya sekitar 2 atau 3 jam ujian,
siswa diminta untuk menjawab dalam kata-kata

139 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

sendiri dan tidak lebih dari 5 atau 6 pertanyaan.


Tidak selalu semua topik yang telah dibahas tercakup
oleh tes ini.

(2) Naskah jawaban ditulis dalam gaya siswa sendiri, dan


dengan tulisan tangannya. Dalam beberapa kasus,
kesalahan ejaan dan bahasa serta tulisan tangan yang
buruk mempengaruhi hasil siswa.

(3) Para siswa cukup bebas untuk mengatur jawaban


mereka sendiri, ini menyiratkan bahwa akan ada
jawaban dengan berbagai tingkat akurasi dan
kelengkapan. Tes esai mendorong kreativitas siswa
karena membiarkan mereka bekerja sendiri. Tes esai
menghambat kerja menebak dan mendorong
kebiasaan belajar yang baik pada siswa.

Dalam menggunakan pertanyaan-pertanyaan esai


secara efektif, adalah penting untuk dimengerti kelebihan
atau kelemahan dari tes esai. Tanpa mengetahuinya, guru-
guru mungkin menggunakan pertanyaan esai pada hal
mungkin jenis tes lain lebih cocok.

2. Kelebihan Tes Esai


Beberapa kelebihan tes esai adalah sebagai berikut:
 Tes esai mengukur hasil belajar yang kompleks yang
tidak dapat diukur dengan cara-cara lain. Misalnya,
untuk mengukur keterampilan komunikasi siswa.
yaitu, kemampuan siswa untuk menghasilkan
jawaban, mensintesiskan, mengorganisir ide-ide

140 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dan menyajikannya dalam bentuk logis dan


koheren. Ini merupakan kelebihan utama.
 Tes esai memungkinkan pengukuran keterampilan
berpikir divergen dan terorganisir dengan
penekanan pada integrasi dan penerapan berpikir
serta keterampilan memecah masalah, kreativitas
dan orisinilitas.
 Tes esai dapat dipakai untuk mengukur hasil-hasil
pembelajaran ranah kognitif pada tingkat-timgkat
tujuan pendidikan yang lebih tinggi seperti
penerapan, analisis, sintesis, dan evaluasi.
 Tes esai sangat mudah dan ekonomis untuk
dilaksanakan. Dapat dengan mudah dan nyaman
ditulis di papan tulis karena terdiri dari beberapa
butir saja. Hal ini dapat menghemat bahan dan
waktu untuk menghasilkannya.
 Tes esai mudah dikonstruksi (dikembangkan) dan
tidak memerlukan banyak waktu. Keadaan ini harus
dijaga secara serius untuk menghindari konstruksi
pertanyaan-pertanyaan yang dapat menyesatkan
 Tes esai dapat digunakan untuk mengukur
pengetahuan yang mendalam terutama dalam
pokok materi sempit
 Tes esai tidak mendorong siswa untuk menebak dan
melakukan kecurangan selama testing atau
pengujian

Mehrens dan Lehmann (1984) mengemukakan


kelebihan atau keunggulan tes esai, yaitu: (1) secara relatif
lebih mudah untuk menyiapkan butir soalnya

141 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dibandingkan dengan menyusun butir soal pilihan ganda,


(2) merupakan alat yang bisa mengukur kecakapan siswa
untuk menyusun jawaban dan mengemukakannya dalam
prosa, (3) dapat membantu siswa untuk melihat kejujuran
dengan memberi tekanan pada kemampuan siswa untuk
mengisi jawaban yang benar, dan (4) dapat membantu
merangsang hasil yang baik bagi pembelajaran siswa..

3. Keterbatasan Tes Esai


Meskipun kelebihan tes esai sudah dijelaskan,
namun tes ini tidak memenuhi dua macam kualitas yang
paling penting sebagai sebuah alat ukur yang baik.
 Tes essai tidak memadai dalam pensampelan isi
materi pelajaran dan tujuan pembelajaran karena
memberikan sampel materi yang terbatas.
Penyediaan sedikit pertanyaan mengakibatkan tes
tidak valid dan cakupan tujuan- tujuan
pembelajaran dan materi menjadi sempit.
 Selain tidak validnya pengukuran, mengevaluasi
jawaban atas pertanyaan-pertanyaan yang
dikembangkan sembarang cenderung menjadi tugas
membingungkan dan memakan waktu. Hal ini
menyebabkan berkurangnya reliabilitas dalam
penskoran. Penelitian telah menunjukkan bahwa
jawaban-jawaban pertanyaan esai diskor secara
berbeda oleh guru-guru berbeda dan bahkan skor
guru-guru yang sama berbeda pada waktu berbeda.
 Seringkali sebuah pertanyaan esai menyiratkan
banyak keterampilan lain yang terukur selain

142 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

keterampilan yang dimaksudkan untuk diukur. Ini


disebabkan itu peserta tes merespon terhadap
pertanyaan-pertanyaan sama secara berbeda.
 Butir tes esai tidak mudah untuk mempelajari
secara empiris kualitas-kualitas butirnya, seperti
tingkat kesulitan dan daya beda.
Hopkins dan Stanley (1981) mengemukakan bahwa
keterbatasan tes esai adalah sebagai berikut. (1) tidak
konsistennya pembaca (reader reliability), (2) adanya efek
dari kecenderungan menilai yang dipengaruhi oleh
keadaan lain (halo effect), (3) akibat yang timbul karena
adanya pengaruh pada jawaban butir soal sebelumnya
(item-to-item carryover effects), (4) akibat yang timbul
karena pengaruh hasil tes sebelumnya (test-to-test
carryover effects), (5) akibat yang timbul karena urutan
penilaian (order effects), dan (6) akibat yang timbul karena
bentuk tulisan atau bahasa (language mechanics effects).
Sedangkan kelebihan tes esai adalah bahwa dengan tes
esai, mampu untuk mengukur tingkat berpikir lebih tinggi
dan kompleks, serta bisa mengembangkan sikap untuk
memecahkan masalah

4. Kapan Menggunakan Tes Esai


Tes esai umumnya paling cocok digunakan untuk
keadaan berikut:
 Kita harus menggunakan pertanyaan esai dalam
pengukuran prestasi kompleks ketika berbedanya
cirikhas derajat tanggapan (respons) yang
diperlukan. Siswa bebas memilih, menghubungkan
dan menyajikan ide-ide dalam kata-kata mereka

143 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

sendiri. Kebebasan ini meningkatkan nilai dari


pertanyaan esai sebagai suatu ukuran prestasi
kompleks meski menimbulkan kesulitan penskoran
yang membuat tes tidak cukup sebagai ukuran
pengetahuan nyata.
 Pertanyaan-pertanyaan esai juga harus digunakan
untuk mengukur hasil-hasil pembelajaran yang
tidak dapat diukur dengan butir-butir tes objektif.
Pertanyaan esai dapat dimanfaatkan sepenuhnya
ketika kekurangannya diimbangai oleh kebutuhan
pengukuran itu.
 Tes esai harus digunakan ketika hasil pembelajaran
yang berkaitan dengan kemampuan-kemampuan
memilih, mengatur, mengintegrasikan,
menghubungkan, dan mengevaluasi ide-ide
memerlukan kebebasan respons dan keaslian yang
disediakan oleh pertanyaan esai.

5. Klasifikasi Tes Esai


Gronlund & Linn (1990) mengelompokkan tes esai
atau tes uraian menjadi dua bentuk, yaitu tes uraian
terbatas (restricted response items) dan tes uraian bebas
(extended respons items). Kadang-kadang tes uraian
terbatas disebut uraian objektif, sedangkan tes uraian
bebas disebut uraian non-objektif.

5.1. Tes Uraian Terbatas


Pada tes uraian terbatas ini peserta tes dibatasi
pada sifat, panjang atau susunan jawaban untuk dibuat.
Butir-butir jawaban terarah pada jawaban-jawaban yang

144 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

diperlukan. Menurut Mehrens dan Lehmann (1984)


menyatakan bahwa tes esai jawaban terbatas atau
terstruktur, peserta tes atau siswa lebih dibatasi pada
bentuk dan ruang lingkup jawabannya, karena secara
khusus dinyatakan konteks jawaban yang harus diberikan
oleh peserta tes Hal ini membatasi kebebasan peserta tes
untuk memilih, mengingat, dan mensintesis semua yang
diketahui dan menyajikannya secara logis sebagaimana
yang diinginkan. Jenis tes essai ini paling berguna dalam
mengukur hasil-hasil pembelajaran pada tingkat kognitif
rendah, yaitu, tingkat pengetahuan, pemahaman dan
penerapan.
Berikut diberikan beberapa contoh tes jenis essai
terbatas :
1. Berikan tiga kelebihan dan dua kerugian tes esai
2. Jelaskan empat kegunaan tes dalam pendidikan
Tes uraian terbatas cocok untuk mata pelajaran
yang jawabannya cenderung tidak memiliki variasi
misalnya matematika dan fisika. Agar penskorannya
objektif diperlukan pedoman penskoran. Penskoran
dilakukan pada setiap langkah pengerjaan, misalnya
menuliskan rumus, menghitung hasil, menafsirkan dan
menyimpulkan hasilnya. Penskoran bersifat hirarkis sesuai
dengan langkah pengerjaan soal. Bobot skor untuk tiap
butir tes ditentukan berdasarkan tingkat kesulitan butir
tes. Soal yang sulit, bobotnya lebih besar dibandingkan
dengan soal yang mudah.
Tes uraian terbatas digunaakan untuk mengevaluasi
hasil belajar berupa kemampuan-kemampuan:
a) Menjelaskan hubungan sebab akibat

145 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

b) Menjelaskan aplikasi prinsip-prinsip


c) Mengajukan argumentasi
d) Merumuskan hipotesis
e) Merumuskan kesimpulan-kesimpulan
f) Merumuskan asumsi-asumsi
g) Menjelaskan metode dan prosedur

5.2. Tes Uraian Bebas


Dalam tes bentuk uraian bebas, peserta tes hanya
dibatasi dengan waktu dan tidak terikat dengan susunan
jawaban. Menurut Mehrens dan Lehmann (1984), pada tes
esai bentuk jawaban bebas atau terbuka, mengijinkan
peserta tes atau siswa untuk mendemonstrasikan
kecakapannya, yaitu: (1) menyebutkan atas pengetahuan
faktual, (2) menilai pengetahuan faktualnya, (3) menyusun
ide-idenya, dan (4) mengemukakan idenya secara logis dan
koheren.
Sebuah contoh pertanyaan dalam kategori ini
adalah sebagai berikut.
“Siswa diberikan seperangkat tes yang di dalamnya
terdapat kesalahan dan kekacauan pada petunjuknya, pada
butir-butirnya, dan dalam susunan butir-butirnya. Tulislah
kritikan evaluasi saudara terhadap tes ini dengan
menggunakan kriteria standar evaluatif konstruksi tes
yang digambarkan dalam buku teks. Rincikan jawaban
saudara tentang kelebihan dan kelemahan tes serta
evaluasilah keseluruhan kualitasnya”
Dalam merespon (menjawab) pertanyaan seperti
pada ujian yang menunjukkan kemampuan untuk memilih
dan mengingat fakta-fakta yang menurutnya berkaitan,

146 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

menyusun dan menyajikan ide-idenya dalam bentuk yang


logis dan jelas. Jenis tes ini memberi kebebasan untuk
memutuskan mana fakta-fakta yang menurutnya paling
relevan dan menulis sebanyak mungkin sebagai jawaban.
Tes essai jenis ini sebagian besar berguna dalam mengukur
hasil pembelajaran pada tingkat-tingkat kognitif lebih
tinggi seperti tingkat analisis, sintesis, dan evaluasi.
Meskipun demikian, tipe essai bebas juga dibatasi
oleh kelemahan, antara lain:
 Penskoran respon-respon (jawaban-jawaban)
biasanya sulit dan tak reliabel karena peserta tes
bebas dalam menyusun informasi faktual dari
berbagai-bagai tingkat kebenaran..
Bentuk tes uraian non-objektif/uraian bebas cocok
untuk bidang studi ilmu-ilmu sosial. Meskipun hasil
penskoran tes jenis ini cenderung subjektif, namun, bila
disediakan pedoman penskoran hasilnya dapat lebih
objektif. Sebaiknya setiap soal ditetapkan kata kunci.
Tes uraian bebas digunakan untuk mengevaluasi
hasil belajar yang bersifat kompleks berupa kemampuan-
kemampuan:
a) Menghasilkan, menyusun dan menyatakan ide-
ide
b) Memadukan hsil belajar dari berbagai bidang
studi
c) Merekayasa atau mendesain eksperimen
d) Menjelaskan nilai suatu ide

6. Konstruksi Tes Esai

147 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Kita menyadari akan kesulitan pertanyaan esai


sebagai sebuat alat ukur. Oleh karena itu, tes esai
merupakan alat (instrumen) pengukuran berguna hanya
sejauh konstruksi, pelaksanaan, dan penskorannya
memiliki objektivitas yang tinggi. Karenanya, butir-butir
tes esai harus terdiri dari butir-butir yang akan menjamin
pemahaman yang sama dari setiap peserta tes. Juga,
respon-respon yang diberikan oleh dua atau lebih penelaah
harus memberikan skor yang sama dan harus menarik
interpretasi yang konsisten,
Kita mengetahui bahwa hal tersebut sulit untuk
dicapai dan membutuhkan banyak usaha. Oleh karena itu
hal-hal berikut disarankan sebagai panduan untuk
mengkonstruksi butir tes esai yang baik yang sesuai
dengan perilaku yang diinginkan.

i. Membatasi penggunaan pertanyaan esai hanya untuk


hasil pembelajaran yang tidak dapat diukur dengan
dengan tes-tes objektif.

ii. Pertanyaan esai harus dirancang sedemikian rupa


sehingga hanya keterampilan yang butir maksudkan
untuk diukur saja yang terukur. Hal ini dapat dicapai
dengan mengungkapkan secara jelas dan tepat
pertanyaan sesuai dengan tujuan pembelajaran.

iii. Sebuah pertanyaan esai harus menentukan secara


tepat apa yang diperlukan dari tes esai tersebut.
Pastikan bahwa tugas peserta tes adalah jelas
ditunjukkan dengan pembatasan daerah yang
dicakup oleh butir, menggunakan kata-kata deskriptif

148 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

untuk memberikan arahan tertentu terhadap respon


atau jawaban yang diinginkan.

iv. Petunjuk batas waktu perkiraan untuk setiap


pertanyaan. Hal ini diperlukan untuk menunjukkan
waktu yang dialokasikan untuk setiap pertanyaan
guna memungkinkan peserta tes mengatur kecepatan
merekan menulis pada setiap pertanyaan dan untuk
menghilangkan kecemasan yang mungkin timbul.

v. Menghindari penggunaan pertanyaan pilihan, karena


pertanyaan pilihan mungkin mempengaruhi validitas
hasil tes.

7. Cara Mengurangi Subjektivitas Tes Esai


Seperti telah diketahui bahwa subjektivitas
merupakan keterbatasan utama dari tes esai. Namun, kita
bisa mengurangi subjektivitas ini seminimum mungkin
dengan mengikuti langkah-langkah sederhana berikut:

i. Menghindari pertanyaan-pertanyaan terbuka


ii. Membiarkan siswa menjawab pertanyaan yang
sama, untuk menghindari pilihan
iii. Menggunakan nomor siswa, bukan nama
mereka, untuk menyembunyikan identitas
mereka
iv. Menskor semua jawaban untuk setiap
pertanyaan untuk semua siswa pada suatu
waktu
v. Jangan biarkan skor pada suatu pertanyaan
mempengaruhi kita saat menskor berikutnya.

149 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Selalu mengatur ulang kertas sebelum kita


mengoreksi
vi. Jangan biarkan perasaan atau emosi kita
sehingga mempengaruhi penskoran kita
vii. Menghindari dari gangguan-gangguan ketika
mengoreksi

8. Perbandingan antara tes objektif dengan tes esai


Menurut Gronlund dan Linn (1995) perbadingan
antara tes esei dan tes objektif adalah seperti dalam Tabel
7.1 berikut

Tabel 7.1. Perbandingan antara tes objektif dengan


tes esai
Tes Objektif Tes Esei
1.Hasil Baik untuk Tidak efisien untuk
belajar mengukur hasil mengukur
yang diukur belajar pada tingkat pengetahuan tentang
pengetahuan fakta. Dapat mengukur
tentang fakta, pemahaman,
pemahaman, keterampilan berpikir,
keterampilan dan hasil belajar yang
berpikir, dan hasil kompleks lainnya
belajar yang (khususnya sangat
kompleks. Tetapi berguna jika jawaban
tidak mampu untuk orisinil yang
mengukur diinginkan).
kemampuan untuk Cocok untuk memilih
memilah dan dan menyusun ide-ide,
menyusun ide-ide, keterampilan menulis,
kecakapan menulis, dan keterampilan
dan beberapa untuk memecahkan
bentuk masalah yang

150 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

keterampilan untuk menuntut pemikiran


memecahkan yang orisinil
masalah
2.Penyiapan Banyak Hanya sedikit
butir soal memerlukan waktu pertanyaan yang
untuk menyusun diperlukan untuk
butir soal. Sukar seperangkat tes.
mempersiapkan Menyiapkan butir soal
butir relatif mudah, tetapi
soal yang baik dan lebih sulit daripada
memerlukan waktu anggapan orang
lama
3.Mengambil Dapat mewakili Tidak dapat mewakili
sampel semua materi seluruh materi
materi pelajaran dan dapat pelajaran, karena
pelajaran memuat butir soal hanya sedikit
yang banyak dalam pertanyaan yang bisa
seperangkat tes dimasukkan dalam
seperangkat tes
4.Kontrol Tinggal memilih Bebas menjawab atas
terhadap jawaban yang telah dasar kata-katanya
jawaban tersedia. sendiri, dan
peserta Menghindari gertak keterampilan menulis
didik sambal dan mempengaruhi sekor,
pengaruh berpikir menebak bisa
keterampilan dikurangi
menulis, bisa
menebak jawaban
5.Pemberian Pensekoran secara Pensekoran subjektif
skor objektif dan cepat, dan lambat, sulit, dan
mudah, dan tidak konsisten
konsisten
6.Pengaruh Biasanya Mendorong peserta
pada mendorong peserta didik untuk
proses didik untuk memusatkan pikiran
pembela- mengembangkan pada sejumlah besar
jaran pengetahuan materi pelajaran,

151 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

tentang fakta-fakta dengan


khusus dan penekanan khusus
kemampuan untuk pada
pembedaan di kemampuan untuk
antara fakta menyusun,
tersebut. Dapat mengintegrasikan, dan
mendorong mengemukakan ide-ide
pengembangan secara efektif. Dapat
pemahaman, mendorong kebiasaan
keterampilan menulis buruk jika
berpikir, dan hasil waktunya mendesak
belajar yang
kompleks lainnya
7.Reliabilitas Reliabilitas yang Reliabilitasnya lebih
tinggi mungkin rendah, terutama
dicapai, khususnya karena pensekoran
jika tes disusun yang tidak konsisten
secara baik

152 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 8
INSTRUMEN NONTES
A. Konsep Nontes
Non tes dapat diartikan sebagai teknik penilaian
yang dilakukan tanpa menggunakan tes. Teknik ini
dilakukan melalu piengamatan secara teliti dan tanpa
menguji peserta didik. Non tes biasanya dilakukan untuk
mengukur hasil belajar yang berhubungan dengan apa
yang dapat dibuat atau dikerjakan oleh siswa dari apa yang
diketahui atau dipahaminya. Menurut Widiyoko (2009)
instrumen nontes berhubungan dengan penampilan yang

153 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dapat diamati dari pada pengetahuan dan proses mental


lainnya yang tidak dapat diamati dengan panca indra.
Instrumen atau alat penilaian yang tergolong nontes
antara lain: a) kuesioner /angket, b) pedoman wawancara
(interview), 3) daftar cocok (check-list), 4) skala penilaian
(Rating Scale), 5) lembar pengamatan/ observasi, 6) jurnal,
7) inventori, 8) penilaian diri (self-assessment), dan 9)
penilaian oleh teman sejawat (peer assessment). Pada
penilaian hasil pembelajaaran, instrumen nontes biasanya
digunakan untuk mengukur pada ranah afektif dan
psikomotorik.

B. Kuesioner (Angket)
Kuesioner atau angket adalah sebuah daftar
pertanyaan yang harus diisi oleh orang yang akan diukur
(responden). Pada umumnya tujuan penggunaan
kuesioner dalam proses pembelajaran terutama adalah
untuk memperoleh data mengenai latar belakang siswa
sebagai salah satu bahan dalam menganalisis tingkah laku
dan proses belajar mereka.

1.Kelebihan Kuesioner/ angket


Terdapat beberapa kelebihan kuesioner (angket)
sebagai instrumen evaluasi, di antaranya yaitu:
1) Dengan angket kita dapat memperoleh data dari
sejumlah siswa yang banyak yang hanya
membutuhkan waktu yang singkat.
2) Setiap siswa dapat memperoleh sejumlah
pertanyaan yang sama

154 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

3) Dengan kuesioner (angket) siswa terhindar dari


pengaruh subjektif dari guru dapat dihindarkan

2. Kelemahan kuesioner atau angket


Di samping kelebihannya, kuesioner atau angket
juga memiliki beberapa kelemahan, di antaranya yaitu:
1) Pertanyaan yang diberikan melalui kuesioner atau
angket adalah terbatas, sehingga apabila ada hal-hal
yang kurang jelas maka sulit untuk diterangkan
kembali
2) Kadang-kadang pertanyaan yang diberikan dalasm
kuesioner tidak dijawab oleh semua siswa atau
mungkin dijawab tetapi tidak sesuai dengan
kenyataan yang sebenarnya,
3) Ada kemungkinan kuesioner atau angket yang
diberikan tidak dapat dikumpulkan semua, sebab
banyak siswa yang merasa kurang perlu hasil dari
kuesioner yang diterima, sehingga tidak
memberikan kembali angketnya.

3.Jenis-jenis kuesioner atau angket:


Ditinjau dari segi isi Kuesioner dibedakan atas 4
bagian yaitu:
1) Pertanyaan fakta adalah pertanyaan yang
menanyakan tentang fakta antara lain eperti
jumlah sekolah, jumlah jam belajar, jumlah siswa ,
jumlah guru, dan sebagainya..
2) Pertanyaan perilaku adalah pertanyaan jika guru
menginginkan tingkah laku seseorang siswa dalam

155 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

kegiatan di sekolah atau dalam proses belajar


mengajar.
3) Pertanyaan informasi adalah pertanyaan jika guru
menginginkan mengungkapkan berbagai informasi
atau menggunakan fakta.
4) Pertanyaan pendapat dan sikap adalah kuesioner
yang berkaitan dengan perasaan, kepercayaan
predisposisi, dan nilai-nilai yang berhubungan
dengan objek yang dinilai. Sering kuesioner atau
angket jenis ini disebut sebagai skala sikap atau skala
penilaian, padahal antara angket dan skala itu
berbeda.
Skala Sikap yaitu mengenai keadaan atau
perasaan atau penilaian yang bersangkutan, misalnya
menilai sikap siswa terhadap pembelajaran guru, yang
mengisi kuesioner skala sikap tersebut adalah siswa.
Sedangkan skala penilaian adalah mengukur mengenai
keadaan, kemampuan, penampilan, atau kinerja orang
lain. Contohnya ingin mengetahui kinerja guru di dalam
kelas, yang mengisi kuesioner skala penilaian ini adalah
siswa, bukan guru, karena karena siswa yang
mengetahui atau merasakan indikator kinerja gurunya.
Adapun perbedaan antara kuesioner dan skala
sikap (penilaian) yaitu:
1) Data yang diungkap oleh luesioner (angket)
berupa data faktual sedangkan data yang diungkap
oleh skala berupa konstrak atau konsep psikologis
yang menggambarkan kepribadian individu;
2) Pertanyaan dalam angket berupa pertanyaan
langsung terarah kepada informasi mengenai data

156 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

yang hendak diungkap. Pada skala pertanyaan


sebagai stimulus tertuju pada indikator perilaku
guna memancing jawaban yang merupakan
refleksi dari keadan diri subjek yang biasanya
tidak disadari oleh responden yang bersangkutan.
3) Pada angket responden tahu persis informasi apa
yang dikehendaki oleh pertanyaannya, sedangkan
pada skala responden biasanya tidak menyadari
arah jawaban yang dikehendaki oleh
pertanyaannya.
4) Jawaban terhadap angket tidak dapat diberi skor
melainkan diberi angka coding sebagai klasifikasi
jawaban. Pada skala psikologi dapat diberi skor
melalui proses penskalaan (scaling).
5) Satu angket dapat mengungkap informasi
mengenai banyak hal sedangkan satu skala hanya
diperuntukkan guna mengungkap satu atribut
tunggal (unidimensional)
6) Data hasil angket tidap perlu diuji lagi
reliabilitasnya secara psikometris sedangkan skala
psikologi harus teruji karena relevansi isi dan
konteks kalimat yang digunakan sebagai stimulus
pada skala psikologi lebih terbuka terhadap error.
7) Validitas angket lebih ditentukan oleh kejelasan
tujuan dan lingkup informasi yang hendak
diungkap sedangkan validitas skala psikologi lebih
ditentukan oleh kejelasan konsep psikologis yang
hendak diukur dan operasionalisasinya.

157 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Agar lebih jelas letak perbedaan antara Angket


dengan Skala maka dapat dilihat dari masing-masing
contohnya berikut..

Contoh Angket/Kuesioner untuk mengetahui


Aktivitas Guru
No Pernyataan Jumlah Jam dalam seminggu
<1 1-2 3-4 5-6 <6
1 Perencanaan dan
Persiapan Materi
2 Menyelesaikan tugas
administrasi
3 Pertemuan atau
rapat
4 Pengembangan
profesi (kursus,
seminar, lokakarya
5 Kegiatan dengan
siswa (Bimbingan
Eskul, Kelompok
belajar)
6 Lain-lain, sebutkan
..................................

Contoh Skala untuk mengetahui Kepercayaan Diri


No Pernyataan Respon
SS S N TS ST
S
1 Saya merasa orang
lain memiliki
kemampuan lebih
daripada saya
2 Saya senang
berkumpul dengan
orang banyak
karena dari sana

158 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

saya dapat
memperoleh
sesuatu yang baru
3 Saya akan
mengembangkan
kemampuan saya
secara maksimal
4 Saya sulit menjalin
kerjasama dengan
orang yang baru
saya kenal
5 Yang teroenting
adalah
kemampuan yang
saya miliki, bukan
sekedar
penampilan fisik
semata
6 Saya merasa tidak
nyaman bila
bersama orang-
orang yang baru
saya kenal

Kuesioner dibedakan juga berdasarkan jenisnya


yaitu :
1) Tertutup, kuesioner yang alternati jawabannya
sudah ditentukan terlebih dahulu. Responden
hanya memilih diantara alternative yang telah
disediakan.
2) Terbuka, kuesioner ini memberikan kesempatan
pada siswa untuk mengemukakan pendapatnya
tentang sesuatu yang ditanyakan sesuai dengan
pandangan dan kemampuannya. Alternatif jawaban

159 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

tidak disediakan. Mereka menciptakan sendiri


jawabannya dan menyusun kalimat dalam bahasa
sendiri
3) Tertutup dan terbuka, kuesioner ini merupakan
gabungan dari kedua bentuk yang telah dibicarakan.
Yang berarti bahwa dalam bentuk ini, di samping
disediakan alternative, diberi juga kesempatan
keoada siswa/mahasiswa untuk mengemukakan
alternative jawabannya sendiri, apabila alternative
yang disediakan tidak sesuai dengan keadaan yang
bersangkutan.

C. Wawancara (Interview)

Menurut Sudijono (2009) wawancara atau interview


adalah cara menghimpun bahan-bahan keterangan yang
dilaksanakan dengan melakukan Tanya jawab lisan secara
sepihak, berhadapan muka, dan dengan arah tujuan yang
terlah ditentukan. Sedangkan menurut Bahri (2008)
wawancara adalah komunikasi langsung antara yang
mewancarai dan yang diwancarai.
Wawancara (interview), dilakukan dengan cara
menentukan tanya jawab langsung antara pewawancara
dengan yang diwawancara tentang segala sesuatu yang
diketahui oleh pewawancara. Agar hasil wawancara sesuai
dengan apa yang diinginkan oleh pewawancara, maka
pewawancara harus:

160 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(1) Membuat pedoman wawancara, yaitu berupa daftar


pertanyaan yang akan ditanyakan kepada orang
yang diwawancara.
(2) Merekan pelaksanaan wawancara untuk menganalisis
jawaban dari orang yang diwawancara (responden).

1.Kelebihan dan kelemahan wawancara


Kelebihan wawancara yaitu :
1) Wawancara dapat memberikan keterangan keadan
pribadi hal ini tergantung pada hubungan baik
antara pewawancara dengan objek.
2) Wawancara dapat dilaksanakan untuk setiap umur
dan mudah dalam pelaksaannya
3) Wawancara dapat dilaksanakan serempak dengan
observasi. Data tentang keadaan individu lebih
banyak diperoleh dan lebih tepat dibandingkan
dengan observasi dan angket.
4) Wawancara dapat menimbulkan hubungan yang
baik antara si pewawancara dengan objek.

Sedangkan Kelemahan wawancara:


Keberhasilan wawancara dapat dipengaruhi oleh
kesediaan, kemampuan individu yang diwawancarai.
2) Kelancaran wawancara dapat dipengaruhi oleh keadaan
sekitar pelaksaan wawancara.
3) Wawancara menuntut penguasaan bahasa yang baik dan
sempurna dari
pewawancara.
4). Adanya pengaruh subjektif dari pewawancara dapat
mempengaruhi hasil wawancara.

161 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Keberhasilan wawancara sebagai alat penilaian


sangat dipengaruhi oleh beberapa hal :
a. Hubungan baik pewawancara dengan orang yang
diwawancarai. Dalam hal ini hendaknya pewawancara
dapat menyesuikan diri dengan orang yang
diwawancarai.
b. Keterampilan pewawancara
Keterampilan pewawancara sangat besar pengaruhnya
terhadap hasil wawancara yang dilakukan, karena guru
perlu melatih diri agar meiliki keterampilan dalam
melaksanakan wawancara.
c. Pedoman wawancara
Keberhasilan wawancara juga sangat dipengaruhi oleh
pedoman yang dibuat oleh guru. Sebelum guru
melaksanakan wawancara harus membuat pedoman-
pedoman secara terperinci, tentang pertanyaan yang
akan diajukan.

Contoh Pedoman wawancara


Tujuan: memperoleh informasi mengenai cara
belajar siswa
Bentuk : wawancara bebas
Responden : siswa yang nilainya tinggi
Nama siswa : Oktavia

Pertanyaan Jawaban Hasil


Responden wawancara

162 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

D. Daftar Cocok (check-list)

Yang dimaksud dengan daftar cek adalah sederetan


pertanyaan atau pernyataan yang dijawab oleh responden
dengan membubuhkan tanda cek (√) pada tempat yang
telah disediakan. Check list sangat bermanfaat untuk
mengukur hasil belajar, baik yang berupa produk maupun
proses yang dapat diperinci ke dalam komponen yang lebih
kecil, terdefinisi secara operasional dan sangat spesifik
Check list hanya menyatakan ada atau tidak adanya
suatu hal yang sedang diamati bukan memberikan data
peringkat atau derajat kualitas tertentu. Check list
menghendaki dicantumkannya komponen yang mungkin
diamati baik yang remeh ataupun yang penting. Mutu check
list ditentukan kemampuan menyusun komponen uji dan
kemampuan pengamat dalam menandai ada atau tidaknya
komponen yang diujikan.
Beberapa kelemahan pada checklist, yaitu (1) penilai
atau penskor hanya bisa memilih dua pilihan yang absolut,
yaitu teramati dan tidak teramati, jadi tidak ada nilai di
tengahnya, misalnya apabila sebenarnya kemampuan
siswa tersebut ada di tengahnya; (2) sukar untuk
menyimpulkan kemampuan seseorang dalam satu skor,
misalnya untuk mengurutkan kemampuan beberapa siswa.

163 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh:
Instrumen Penilaian Pidato yang menggunakan Metode
Ceklis

Nama Siswa: Chitra Dewi

Petunjuk:

Tuliskan centang (√) di belakang huruf dimana kemampuan


siswa teramati pada waktu berpidato

I. Ekspresi Fisik
____ A. Berdiri tegak melihat pada penonton
____ B. Mengubah ekspresi wajah sesuai dengan perubahan
pernyataan yang disajikan
____ C. Mata melihat kepada penonton
II. Ekspresi Suara
____ A. Berbicara dengan kata-kata yang jelas
____ B. Nada suaranya berubah-rubah sesuai pernyataan yang
ditekankan
____ C. Berbicara cukup keras untuk didengar oleh penonton
III. Ekspresi Verbal
____ A. Memilih kata-kata yang tepat untuk menegaskan arti
____ B. Tidak mengulang-ulang pernyataan
____ C. Menggunakan kalimat yang lengkap untuk mengutarakan
satu pikiran
____ D. Menyimpulkan pokok-pokok pikiran yang penting
Sumber: Setiadi, 2008

E. Skala Penilaian (Rating Scale)


Skala Penilaian atau Rating Scale merupakan alat
pengukuran/penilaian non-tes yang menggunakan suatu

164 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

prosedur terstruktur untuk memperoleh informasi tentang


sesuatu yang diobservasi yang menyatakan posisi sesuatu
dalam hubungannya dengan yang lain. Unsur rating scale,
yaitu:
(1) Adanya pernyataan tentang keberadaan atau
kualitas keberadaan dari suatu unsur atau
karakteristik tertentu
(2) Adanya petunjuk penilaian tentang pernyataan
tersebut
(3) Komponen tersebut mirip dengan tes obyektif
adanya stem dan option
Menurut Grounlund (1982) ada tiga jenis rating
scale, yaitu: (1) numerical rating scale; (2) graphic rating
scale; dan (3) descriptive rating scale.
Numerical rating scale terdiri dari deskripsi tentang
aspek kinerja yang disertai dengan angka yang
menunjukkan tingkatan kualitas kinerja yang diases.
Graphic rating scale sama dengan numerical rating scale,
hanya dalam graphic rating scale yang digunakan bukan
angka sebagai tanda kualitas kinerja, tetapi dengan
memberi tanda tertentu pada suatu kontinum baris.
Descriptive rating scale sama dengan graphic rating scale,
tetapi pada setiap skala diberi deskripsi tentang kualitas
kinerja yang diakses.

Contoh :
Instrumen berpidato menggunakan Numerical rating scale
Nama : Chitra Dewi
------------------------------------------------------------------------------

165 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Petunjuk:
Untuk setiap kemampuan berilah lingkaran pada nomor
1. bila siswa selalu melakukan
2. bila kadang-kadang
3. bila jarang, dan
4. bila tidak pernah

1. Ekspresi Fisik (Physical Expression)


A. Berdiri tegak melihat pada penonton
1 2 3 4

B. Merubah ekspresi wajah sesuai dengan perubahan


pernyataan
yang disajikan
1 2 3 4

Sumber: Setiadi, 2008

Contoh :
Instrumen berpidato menggunakan graphic rating scale

Nama: Chitra Dewi

166 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

------------------------------------------------------------------------------
Petunjuk:
Tulislah X pada garis dimana kemampuan siswa teramati
pada waktu
Berpidato

I. Ekspresi Fisik (Physical Expression)


A. Berdiri tegak melihat pada penonton
__________ ________________________________________
! ! ! !
! ! ! !
selalu kadang-kadang jarang tidak pernah

B. Merubah ekspresi wajah sesuai dengan perubahan


pernyataan yang
disajikan

__________________________________________________
! ! ! !
! ! ! !
selalu kadang-kadang jarang tidak pernah

Sumber: Setiadi, 2008

Contoh :
Instrumen berpidato menggunakan descriptive rating scale

167 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Nama: Chitra Dewi


---------------------------------------------------------------------------------
Petunjuk:
Tulislah X pada garis dimana kemampuan siswa teramati pada
waktu
Berpidato

I. Ekspresi Fisik (Physical Expression)


A. Berdiri tegak melihat pada penonton
______________________________________________________________
! ! !
! ! !
berdiri tegak, kadang-kadang berdiri tidak pernah selalu
melihat pada tegak, melihat ke langit- tegak, maka tidak
penonton langit, kadang-kadang pernah kontak dengan
melihat penonton penonton

B. Merubah ekspresi wajah sesuai dengan perubahan


pernyataan yang Disajikan
__________________________________________________________________
! ! !
! ! !
ekspresi wajah ekspresi wajah ekspresi wajah tidak
selalu berubah kadang- kadang pernah berubah
sesuai dengan berubah selama berpidato
suara

Sumber: Setiadi, 2008

F. Pengamatan/Observasi
1. Konsep Dasar

168 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Pengamatan (observasi) merupakan teknik


penilaian yang dilakukan secara berkesinambungan
dengan menggunakan indera, baik secara langsung
maupun tidak langsung dengan menggunakan pedoman
observasi yang berisi sejumlah indikator perilaku yang
diamati. Observasi langsung dilaksanakan oleh guru secara
langsung tanpa perantara orang lain. Sedangkan observasi
tidak langsung dengan bantuan orang lain, seperti guru
lain, orang tua, siswa, dan karyawan sekolah.
Observasi adalah suatu teknik penilaian non-tes
yang menginventarisasikan data tentang sikap dan
kepribadian siswa dalam kegiatan belajarnya. Observasi
dilakukan dengan mengamati kegiatan dan perilaku siswa
secara langsung. Data yang diperoleh dijadikan bahan
penilaian. Observasi sebagai alat evaluasi banyak
digunakan untuk menilai tingkah laku individu atau proses
terjadinya suatu kegiatan yang dapat diamati. Contoh
observasi utuk tujuan evaluasi adalah observasi untuk
menilai atau mengukur hasil belajar melalui pengamatan
tingkah laku siswa pada saat guru mengajar.

2.Pedoman Observasi
Bentuk instrumen yang digunakan untuk observasi
adalah pedoman observasi yang berupa daftar cek atau
skala penilaian (rating scale) yang disertai rubrik. Daftar
cek digunakan untuk mengamati ada tidaknya suatu sikap
atau perilaku. Sedangkan skala penilaian menentukan
posisi sikap atau perilaku siswa dalam suatu rentangan
sikap.

169 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Pedoman observasi secara umum memuat


pernyataan sikap atau perilaku yang diamati dan hasil
pengamatan sikap atau perilaku sesuai kenyataan.
Pernyataan memuat sikap atau perilaku yang positif atau
negatif sesuai indikator penjabaran sikap dalam
kompetensi inti dan kompetensi dasar. Rentangan skala
hasil pengamatan antara lain berupa :
1) Selalu, sering, kadang-kadang, tidak pernah
2) Baik sekali, baik, cukup baik, kurang baik
Pedoman observasi dilengkapi juga dengan rubrik
dan petunjuk pensekoran. Rubrik memuat petunjuk/uraian
dalam penilaian skala atau daftar cek. Sedangkan petunjuk
penskoran memuat cara memberikan skor dan mengolah
skor menjadi nilai akhir. Agar observasi lebih efektif dan
terarah hendaknya :
a) Dilakukan dengan tujuan jelas dan direncanakan
sebelumnya, perencanaan mencakup indikator atau
aspek apa yang akan diamati dari suatu proses.
b) Menggunakan pedoman observasi berupa daftar cek
atau skala, model lainnya.
c) Pencatatan dilakukan selekas mungking tanpa
diketahui oleh peserta didik
d) Kesimpulan dibuat setelah program observasi
selesai dilaksanakan.

Contoh 1.
Pedoman Observasi menggunakan Check list

170 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Pedoman Observasi Sikap Disiplin

Petunjuk :
Lembaran ini diisi oleh guru untuk menilai sikap sosial peserta
didik dalam kedisiplinan. Berilah tanda cek (v) pada kolom skor
sesuai sikap disiplin yang ditampilkan oleh peserta didik,
dengan kriteria sebagai berikut :
Ya = apabila siswa menunjukkan perbuatan sesuai aspek
pengamatan
Tidak = apabila siswa tidak menunjukkan perbuatan sesuai
aspek pengamatan.

Nama Peserta Didik : ………………….


Kelas : ………………….
Tanggal Pengamatan : …………………..
Materi Pokok : …………………..

No Sikap yang diamati Melakukan Keterangan


Ya Tidak
1 Masuk kelas tepat
waktu
2 Mengumpulkan
tugas tepat waktu
3 Memakai seragam
sesuai tata tertib
4 Mengerjakan tugas
yang diberikan
5 Tertib dalam
mengikuti
pembelajaran
6 Mengikuti
praktikum sesuai

171 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dengan langkah
yang ditetapkan
7 Membawa buku tulis
sesuai mata
pelajaran
8 Membawa buku teks
mata pelajaran
Jumlah

Petunjuk Penskoran :
Siswa memperoleh nilai :
Baik Sekali : apabila terdapat 7 – 8 jawaban YA
Baik : apabila terdapat 5 – 6 jawaban YA
Cukup : apabila terdapat 3 – 4 jawaban YA
Kurang : apabila terdapat 1 – 2 jawaban YA

Contoh 2
Pedoman Observasi menggunakan rating scale
Pedoman Observasi Sikap Tanggung Jawab
Petunjuk :
Lembaran ini diisi oleh guru untuk menilai sikap sosial peserta
didik dalam tanggung jawab. Berilah tanda cek (v) pada kolom
skor sesuai sikap tanggung jawab yang ditampilkan oleh
peserta didik, dengan kriteria sebagai berikut :
4 = selalu, apabila selalu melakukan sesuai pernyataan
3 = sering, apabila sering melakukan sesuai pernyataan dan
kadang-kadang
tidak melakukan
2 = kadang-kadang, apabila kadang-kadang melakukan dan
sering tidak
melakukan
1 = tidak pernah, apabila tidak pernah melakukan

172 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Nama Peserta Didik :


…………………
Kelas : …………….
Tanggal Pengamatan :
……………….
Materi Pokok : ………………
No Aspek Pengamatan Skor Keterangan
1 2 3 4
1
2
3
4
5
Jumlah Skor
Petunjuk Penskoran :
Peserta didik memperoleh nilai :
Baik Sekali : apabila memperoleh skor 16 - 20
Baik : apabila memperoleh skor 11 - 15
Cukup : apabila memperoleh skor 6 - 10
Kurang : apabila memperoleh skor 1 - 5

3. Langkah-langkah menyusun pedoman observasi


Adapun langkah-langkah menyusun pedoman
Observasi adalah:
1) Merumuskan tujuan
2) Merumuskan kegiatan
3) Menyusun langkah-langkah
4) Menyusun kisi-kisi
5) Menyusun panduan observasi
6) Menyusun alat penilaian

173 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

G. Jurnal
Jurnal merupakan catatan pendidik/guru di dalam
dan di luar kelas yang berisi informasi hasil pengamatan
tentang kekuatan dan kelemahan siswa yang berkaitan
dengan sikap dan perilaku. Jurnal dapat memuat penilaian
siswa terhadap aspek tertentu secara kronologis.
Adapun Kriteria jurnal yaitu:
 Mengukur capaian kompetensi sikap yang
penting.
 Sesuai dengan kompetensi dasar dan indikator.
 Menggunakan format yang sederhana dan
mudah diisi/digunakan.
 Dapat dibuat rekapitulasi tampilan sikap
peserta didik secara kronologis.
 Memungkinkan untuk dilakukannya pencatatan
yang sistematis, jelas dan komunikatif.
 Format pencatatan memudahkan dalam
pemaknaan terhadap tampilan sikap peserta
didik
 Menuntun guru untuk mengidentifikasi
kelemahan dan kekuatan peserta didik

H. Inventori
Inventori; merupakan skala psikologis yang dipakai
untuk mengungkap sikap, minat, dan persepsi peserta
didik terhadap sesuatu objek psikologis. Inventori antara
lain berupa skala Thurstone, skala Likert, atau skala
berdiferensiasi semantik. Penjelasan lebih lanjut ada dalam
BAB 16 pengukuran/penilaian sikap.

174 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

I. Penilaian diri (self-assessment)


Menurut Rolheiser dan Ross (2005), penilaian diri
adalah suatu cara untuk melihat ke dalam diri sendiri.
Melalui penilaian diri siswa dapat melihat kelebihan
maupun kekurangannya, untuk selanjutnya kekurangan ini
menjadi tujuan perbaikan (improvement goal). Dengan
demikian, siswa lebih bertanggungjawab terhadap proses
dan pencapaian tujuan belajarnya.
Penilaian diri merupakan teknik penilaian dengan
cara meminta siswa mengemukakan kelebihan dan
kekurangan dirinya, penguasaan kompetensi yang
ditargetkan, dan menghargai, menghayati serta
pengamalan perilaku berkepribadian Jujur. Penilaian diri
atau “self assessment” adalah penilaian yang dilakukan
sendiri oleh siswa yang bersangkutan untuk kepentingan
pengelolaan kegiatan belajar mengajar (KBM) di tingkat
kelas. Penilaian diri mampu memainkan aturan dalam
mengarahkan siklus belajar ketika penilaian diri siswa
adalah positif. Penilaian diri positif mendorong siswa
untuk merancang tujuan yang lebih tinggi dan sepakat
lebih personal terhadap sumber-sumber tugas belajar.
Penilaian diri meliputi tiga proses dimana regulasi
diri siswa mengamati dan menafsirkan prilaku dirinya
(Tola, 2008). Pertama, siswa menghasilkan observasi
sendiri yang berfokus pada aspek kinerja khusus yang
relevan dengan standar kesuksesan. Kedua, siswa membuat
pertimbangan sendiri dengan menentukan bagaimana
tujuan umum dan khusus dapat tercapai. Ketiga, siswa

175 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

melakukan reaksi diri, menafsirkan tingkat pencapaian


tujuan, dan menghayati kepuasan hasil reaksi dirinya.
Penilaian diri siswa amat penting karena diantara
hal-hal berikut ini siswa dapat:
1) membandingkan hasil pekerjaannya dari waktu ke
waktu;
2) ) mengkreasi kriteria penilaian pada suatu tugas
yang diberikan;
3) mendiskusikan strateginya untuk melaklukan
tugasnya;
4) bekerja dengan teman sejawat untuk menilai dan
merevisi tugasnya;
5) menimbang kecenderungan tugasnya, dan
menelaahnya;
6) merefleksikan tugas berikutnya.

LEMBAR PENILAIAN DIRI


SIKAP DISIPLIN

Nama Siswa : ………………….


Kelas : ………………….
Materi Pokok : ………………….
Tanggal : ………………….

Petunjuk :
Lembaran ini diisi oleh siswa untuk menilai sikap disiplin diri
peserta didik. Berilah tanda cek (√) pada kolom skor sesuai
sikap disiplin yang kamu miliki sebagai berikut :
Ya = apabila kamu menunjukkan perbuatan sesuai pernyataan
Tidak = apabila kamu tidak menunjukkan perbuatan sesuai
pernyataan.

Nama Siswa : ………………….

176 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Kelas : ………………….
Tanggal Pengamatan : …………………..
Materi Pokok : …………………..

No Sikap yang diamati Melakukan Keterangan


Ya Tidak
1 Saya masuk kelas tepat
waktu
2 Saya mengumpulkan
tugas tepat waktu
3 Saya memakai
seragam sesuai tata
tertib
4 Saya mengerjakan
tugas yang diberikan
5 Saya tertib dalam
mengikuti
pembelajaran
6 Saya mengikuti
praktikum sesuai
dengan langkah yang
ditetapkan
7 Saya membawa buku
tulis sesuai mata
pelajaran
8 Saya membawa buku
teks mata pelajaran
Jumlah

Petunjuk Penyekoran :
Peserta didik memperoleh nilai :
Baik Sekali : apabila terdapat 7 – 8 jawaban YA
Baik : apabila terdapat 5 – 6 jawaban YA
Cukup : apabila terdapat 3 – 4 jawaban YA
Kurang : apabila terdapat 1 – 2 jawaban YA

177 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

J. Penilaian oleh teman sejawat (peer


assessment).
Penilaian teman sejawat adalah proses di mana
siswa terlibat dan bertanggung jawab dalam penilaian
kerja siswa lain yang setingkat. Penilaian teman sejawat
(antar peserta didik) merupakan teknik penilaian dengan
cara meminta peserta didik untuk saling menilai terkait
dengan pencapaian kompetensi. Instrumen yang
digunakan untuk penilaian teman sejawat adalah daftar cek
dan skala penilaian (rating scale) dengan teknik sosiometri
berbasis kelas.
Penilaian teman sejawat memerlukan para siswa
untuk memberikan nilai atau umpan balik pada teman
mereka mengenai kinerja atau produk mereka berdasarkan
suatu kriteia yang telah dibuat kriteria yang telah dibuat
bersama mereka. Beberapa keuntungan penilaian teman
sejawat antara lain: 1) Dapat meningkatkan hasil belajar, 2)
Dapat meningkatkan kolaborasi belajar melalui umpan
balik dari teman sejawat, 3) Siswa dapat membantu
temanya dalam pemahaman dan belajar /Efektifitas
Penilaian Diri.

178 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 9
TEKNIK PENILAIAN
A. Penilaian Kinerja (Performance Assessment)
Menurut Trespeces (Setiadi, 2008), Performance
Assessment adalah berbagai macam tugas dan situasi di
mana peserta tes diminta untuk mendemonstrasikan
pemahaman dan mengaplikasikan pengetahuan yang
mendalam, serta keterampilan di dalam berbagai macam
konteks sesuai dengan kriteria yang diinginkan. Berk
(1986) menyatakan bahwa penilaian unjuk kerja adalah
proses mengumpulkan data dengan cara pengamatan yang
sistematik untuk membuat keputusan tentang individu.
Jadi Performance Assessment atau penilaian kinerja adalah
suatu penilaian yang meminta peserta tes untuk
mendemonstrasikan dan mengaplikasikan pengetahuan
unjuk kerja ke dalam berbagai macam konteks sesuai
dengan yang diinginkan.
Penilaian unjuk kerja merupakan penilaian yang
dilakukan dengan mengamati kegiatan peserta didik dalam
melakukan sesuatu. Penilaian unjuk kerja cocok digunakan

179 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

untuk menilai ketercapaian kompetensi yang menuntut


siswa melakukan tugas tertentu, seperti: praktek di
laboratorium, olah raga, presentasi, diskusi, bernyanyi,
membaca puisi/ deklamasi, berpidato dan sebagainya.
Penilaian unjuk kerja dapat dilakukan secara kelompok
dan juga dapat dilakukan secara individual. Pada penilaian
secara kelompok berarti guru menghadapi sekelompok
testee, sedangkan pada penilaian secara individual berarti
seorang guru seorang testee.
Menurut Maertel (1992), penilaian kinerja
mempunyai dua karakteristik dasar yaitu (1) peserta tes
diminta untuk mendemontrasikan kemampuannya dalam
mengkreasikan suatu produk atau terlibat dalam suatu
aktivitas (perbuatan), misalnya melakukan eksperimen
untuk mengetahui tingkat penyerapan dari kertas tisue, (2)
produk dari Performance Assessment lebih penting
daripada perbuatan (performance)-nya.
Hal yang terpenting dalam penilaian unjuk kerja
adalah cara mengamati dan menskor kemampuan kinerja
peserta didik. Guna meminimumkan faktor subyektifitas
keadilan dalam menilai kemampuan kinerja siswa,
biasanya penile i(rater) jumlahnya lebih dari satu orang
sehingga diharapkan hasil penilaian mereka menjadi lebih
valid dan reliabel.
Menurut Setiadi (2008) ada tujuh kriteria yang
harus diperhatikan untuk mengevaluasi apakah penilaian
kinerja sudah dapat dianggap berkualitas baik, yaitu:
a. Generability, artinya apakah kinerja siswa (students’
performance) dalam melakukan tugas yang

180 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

diberikan guru sudah memadai untuk


digeneralisasikan dengan tugas-tugas lain?
b. Authenticity, artinya apakah tugas yang diberikan
tersebut sudah sesuai dengan apa yang sering
dihadapinya dalam praktek kehidupan sehari-hari?
c. Multiple foci, artinya apakah tugas yang diberikan
kepada peserta tes sudah mengukur lebih dari satu
kemampuan-kemampuan yang diinginkan (more
than one instructional outcomes?)
d. Teachability, artinya apakah tugas yang diberikan
merupakan tugas yang hasilnya semakin baik
karena adanya usaha mengajar guru di kelas? Tugas
yang diberikan dalam penilaian keterampilan atau
penilaian kinerja adalah tugas-tugas yang relevan
dengan yang diajarkan guru di kelas penilaian
kinerja.
e. Fairness, artinya apakah tugas yang diberikan sudah
adil (fair) untuk semua peserta tes, tidak “bias”
untuk semua kelompok jenis kelamin, suku bangsa,
agama, atau status sosial ekonomi.
f. Feasibility, artinya apakah tugas-tugas yang
diberikan dalam penilaianketerampilan atau
penilaian kinerja (“Performance Assessment”)
memang relevan untuk dapat dilaksanakan
mengingat faktor-faktor seperti biaya, ruangan
(tempat), waktu, atau peralatannya?
g. Scorability, artinya apakah tugas yang diberikan
dapat diskor dengan akurat dan reliabel? Karena
memang salah satu yang sensitif dari penilaian
keterampilan atau penilaian kinerja adalah

181 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

penskorannya. Karena itu nanti pada bagian berikut


dari tulisan ini akan dibahas beberapa contoh
ponskoran dari penilaian keterampilan atau
penilaian kinerja

Dalam Penilaian Kinerja dapat digunakan 2


pendekatan, yaitu: (1) metode holistic, dan (2) metode
analytic. Metode holistic digunakan apabila para penskor
(rater) hanya memberikan satu buah skor atau nilai (single
rating) berdasarkan penilaian mereka secara keseluruhan
dari hasil kinerja peserta tes. Sedangkan pada metode
analytic para penskor (rater) memberikan penilaian (skor)
pada berbagai aspek yang berbeda yang berhubungan
dengan kinerja yang dinilai. Dalam penilaian/penskoran
kinerja (Performance Assessment) dengan metode analytic
antara lain dapat menggunakan (1) checklists; dan (2)
rating scales.

Contoh Instrumen:
Instrumen Penilaian Kinerja (Performance
Assessment) pada saat melaksanakan praktiku/kerja
kelompok.

182 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Kelompok/Nama Sswa
Tanggal:

No Aspek Kinerja SK K C B SB

1 Menunjukkan
minat/inisiatif beraktivitas

2 Terlibat aktif
melaksanakan kegiatan

3 Ketepatan melakukan
tugas/menggunakan alat
4
Menghargai hak orang lain
5 Menunjukkan kreatifitas
Nilai: SK = 0 – 3,4; K = 3,5 – 5,4; C = 5,5 – 6,4; B = 6,5 – 8,4;
SB = 8,5 – 10

B. Penilaian Produk (Hasil Kerja)


Menurut Taufina (2009) penilaian hasil kerja
(produk) adalah penilaian terhadap keterampilan siswa
dalam mengaplikasikan pengetahuan yang dimiliki ke
dalam wujud produk, dan penilaian terhadap kualitas
produk tersebut . Jadi penilaian produk adalah penilaian
terhadap keterampilan siswa dalam menggunakan alat
serta prosedur kerja dalam menghasilkan suatu produk
(karya); dan aspek kualitas teknis dan estetik produk
(karya) tersebut. Penilaian produk tidak hanya diperoleh
dari hasil akhir, namun juga proses pembuatannya.

183 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Penilaian produk merupakan salah satu teknik penilaian


yang mampu memberikan informasi kemampuan siswa
pada 3 ranah kompetensi, yaitu kognitif, psikomotor, dan
afektif.
Penilaian produk juga memungkinkan siswa
mengembangkan kreativitas, potensi, dan kecakapan yang
dimiliki. Selain itu, mereka dapat mengaplikasikan materi
yang didapat dari kegiatan pembelajaran. Siswa juga
dimungkinkan mampu mengembangkan karakter dan
watak yang diperlukan dalam berkehidupan dan
bermasyarakat.
Adapun Tujuan penilaiam produk adalah:
a. Menilai penguasaan keterampilan siswa yang diperlukan
sebelum
mempelajari keterampilan berikutnya;
b. Menilai tingkat kompetensi yang sudah dikuasai siswa
pada akhir kelas;
c. Menilai keterampilan siswa yang akan memasuki
institusi pendidikan
kejuruan.
Ada tiga cara melakukan penilaian produk, yaitu:
1) Anecdotal: metode yang cocok untuk menilai
pada tahap produk,
2) Skala Penilaian Analitis: metode yang biasa
digunakan untuk tahap perencanaan dan
tahap akhir
3) Skala Penilaian Holistik : metode penilaian
pada tahap akhir.

184 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh Instrumen Penilaian Produk:

Tahap Deskripsi Skor


Persiapan Kemampuan merencanakan: 1 - 10
 Menggali dan mengembangkan
gagasan
 Mendesain produk,
menentukan alat dan bahan
Pembuatan  Kemampuan menyeleksi dan 1-10
menggunakan bahan
 Kemampuan menyeleksi dan
menggunakan alat
 Kemampuan menyeleksi dan
menggunakan teknik
Penilaian  Kemampuan siswa membuat 1 -10
produk sesuai
kegunaan/fungsi
 Produk memenuhi kriteria
keindahan

C. Penilaian Proyek)
1. Konsep Dasar
Penilaian projek adalah penilaian terhadap tugas
yang harus diselesaikan dalam periode/waktu tertentu.
Tugas tersebut berupa suatu investigasi sejak dari
pengumpulan, pengorganisasian, pengevaluasian, hingga
penyajian data. Karena dalam pelaksanaannya projek
bersumber pada data primer/sekunder, evaluasi hasil, dan
kerjasama dengan pihak lain, projek merupakan suatu
sarana yang penting untuk menilai kemampuan umum
dalam semua bidang. Projek juga akan memberikan

185 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

informasi tentang pemahaman dan pengetahuan siswa


pada pembelajaran tertentu, kemampuan siswa dalam
mengaplikasikan pengetahuan, dan kemampuan siswa
untuk mengomunikasikan informasi.
Penilaian projek ini dilakukan sejak perencanaan,
proses selama pengerjaan tugas, sampai hasil akhir projek.
Untuk itu guru perlu menetapkan tahapan yang akan
dinilai, seperti penyusunan desain, pengumpulan data,
analisis data, menyiapkan laporan tertulis. Penilaian projek
dapat dilakukan dengan menggunakan daftar cek ataupun
skala rentang.
Adapun manfaat dari kerja projek adalah untuk
menilai kemampuan siswa pada waktu melakukan kerja
individu maupun kerja kelompok, kemampuan dalam
mengatur/ mengorganisasikan waktu dan kemampuan
untuk merancang tugas secara berurutan
Hasil belajar yang dapat dinilai pada tahap proses
pengerjaan projek, antara lain: (1) Kemampuan
merencanakan dan mengorganisasikan penelitian; (2)
Kemampuan bekerja dalam kelompok; dan (3)
Kemampuan untuk melaksanakan tugas secara mandiri.
Sedangkan hasil belajar yang dinilai pada produk suatu
projek, antara lain (1) Kemampuan mengidentifikasi dan
mengumpulkan informasi; (2) Kemampuan menganalisis
dan menginterpretasikan data; dan (3) Kemampuan
melaporkan/ menyampaikan hasil.

2. Perencanaan Penilaian Projek


Ada tiga hal yang perlu dipertimbangkan guru dalam
perencanaan penilaian projek yaitu:

186 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

a. Kemampuan pengelolaan
Jika siswa diberikan kebebasan yang luas, mereka akan
mendapatkan kesulitan dalam memilih topik yang tepat.
Mereka mungkin memilih topik yang terlalu luas
sehingga sedikit informasi yang dapat ditemukan.
Mereka mungkin juga kurang tepat untuk
memperkirakan waktu pengumpulan data dan
penulisan laporan.
b. Relevansi
Guru harus mempertimbangkan pengetahuan,
keterampilan, dan pemahaman pada pembelajaran agar
projek dapat dijadikan sebagai sumber bukti.
c. Keaslian
Guru perlu mempertimbangkan seberapa besar
petunjuk atau dukungan yang telah diberikan pada
siswa.

187 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh Instrumen Penilaian Proyek:

Mata Pelajaran : .........


Nama Proyek : ...................
Alokasi Waktu : ................

Nama Siswa: Chintami Kelas : .............


No Aspek* Skor (1 – 5)**
1 Perencanaan:
a. Persiapan
b. Rumusan Judul
2 Pelaksanaan
a. Sistematika Penulisan
b. Keakuratan Sumber
Data/Informasi
c. Kuantitas Sumber Data
d. Analisis Data
e. Penarikan Kesimpulan
3 Laporan Proyek
a. Performans
b. Presentasi / Penguasaan
Total Skor
* Aspek yang dinilai disesuaikan dengan proyek dan
kondisi siswa/sekolah
** Skor diberikan kepada peserta didik tergantung dari
ketepatan dan kelengkapan jawaban yang diberikan.
Semakin lengkap dan tepat jawaban, semakin tinggi
perolehan skor

188 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

D. Penilaian Portofolio
1. Pengertian Portofolio
Menurut Paulson dan Meyer (1991) Portofolio adalah
kumpulan pekerjaan siswa yang menunjukkan usaha,
perkembangan dan kecapakan siswa dalam satu bidang
studi atau lebih. Kumpulan inii harus mencakup partisipasi
siswa dalam seleksi isi, kriteria seleksi, kriteria penilaian
dan bukti refleksi diri. Sedangkan Gronlund (1976)
mengemukakan portofolio adalah berbagai contoh
pekerjaan siswa yang tergantung pada keluasan tujuan.
Jadi portofolio adalah kumpulan hasil karya siswa yang
didokumentasi secara baik dan teratur. Karya siswa itu
dapat berupa kliping, tugas idividual, hasil wawancara,
piagam penghargaan, karangan-karangan, dll.
Penilaian Portofolio adalah penilaian terhadap
sekumpulan karya siswa yang tersusun secara sistematis
dan terorganisasi yang diambil selama proses
pembelajaran, digunakan guru dan siswa untuk memantau
perkembangan pengetahuan, keterampilan, dan sikap
siswa dalam mata pelajaran tertentu. Dengan demikian
penilaian portofolio memberikan gambaran secara
menyeluruh tentang proses & pencapaian belajar siswa
pada kurun waktu tertentu.

2. Tujuan Portofolio
Tujuan portofolio ditetapkan berdasarkan apa yang
harus dikerjakan dan siapa yang akan menggunakan jenis
portofolio. Dalam penilaian di kelas, portofolio dapat
digunakan untuk mencapai beberapa tujuan, antara lain:

189 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

a. mengetahui perkembangan yang dialami siswa;


b. mendokumentasikan proses pembelajaran yang
berlangsung;
c. memberi perhatian pada prestasi kerja siswa
yang terbaik;
d. merefleksikan kesanggupan mengambil resiko
dan melakukan ekperimentasi
e. meningkatkan efektifitas proses pembelajaran;
f. bertukar informasi dengan orang tua.wali siswa
dan guru lain;
g. membina dan mempercepat pertumbuhan
konsep diri positif pada siswa;
h. meningkatkan kemampuan melakukan refleksi
diri; dan
i. membantu siswa dalam merumuskan tujuan.

3. Prinsip Portofolio
Menurut Surapranata dan Hatta (2004) ada
beberapa prinsip yang perlu diperhatikan dan dijadikan
sebagai pedoman dalam penggunaan penilaian portofolio
di sekolah, antara lain:

a. Saling percaya (mutual trust) antara guru dan siswa


Dalam proses penilaian portofolio guru dan siswa
harus memiliki rasa saling mempercayai. Mereka harus
merasa sebagai pihak-pihak yang saling memerlukan, dan
memiliki semangat untuk saling membantu. Oleh karena
itu, mereka harus saling terbuka dan jujur satu sama lain.
Dengan demikian, akan terwujud hubungan yang wajar dan

190 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

alami, yang memungkinkan proses pendidikan berlangsung


dengan baik.

b. Kerahasiaan bersama (confidentiality) antara guru


dan siswa
Kerahasiaan hasil pengumpulan bahan dan hasil
penilaiannya perlu dijaga dengan baik, tidak disampaikan
kepada pihak-pihak lain yang tidak berkepentingan.
Pelanggaran terhadap norma ini, selain menyangkut etika,
juga dapat memberi dampak negatif kepada proses
pendidikan anak/siswa.

c. Milik bersama (joint ownership) antara siswa dan


guru
Guru dan siswa perlu merasa memiliki bersama
berkas portofolio. Oleh karena itu, guru dan siswa perlu
menyepakati bersama di mana hasil karya yang telah
dihasilkan siswa akan disimpan, dan bahan-bahan baru
yang akandimasukkan. Dengan demikian siswa akan
merasa memiliki terhadap hasil kerjanya, dan akhirnya
akan tumbuh rasa tanggung jawab pada dirinya.

d. Kepuasan (satisfaction)
Hasil kerja portofolio seyogyanya berisi keterangan-
keterangan dan/atau buktibukti yang memuaskan bagi
guru dan siswa. Portofolio hendaknya juga merupakan
bukti prestasi cemerlang siswa dan keberhasilan
pembinaan guru.

191 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

e. Kesesuaian (relevance)
Hasil kerja yang dikumpulkan adalah hasil kerja
yang berhubungan dengan tujuan pembelajaran yang
sesuai dengan tujuan pembelajaran dalam kurikulum.

f. Penilaian proses dan hasil


Penilaian portofolio menerapkan prinsip proses dan
hasil. Proses belajar yang dinilai misalnya diperoleh dari
catatan perilaku hasian siswa (anecdot) mengenai sikapnya
dalam belajar, antusias atidaknya dalam mengikuti
pelajaran dan sebagainya. Aspek lain dari penilaian
portofolio adalah penilaiana hail, yaitu menilai hasil akhir
suatu tugas yang diberikan oleh guru.

4. Bentuk Portofolio
Fosters dan Masters (Surapranata dan Hatta, 2004)
membedakan penilaian portofolio ke dalam tiga kelompok,
yaitu: portofolio kerja (working portfolio), portofolio
dokumentasi (documentary portfolio), dan portofolio
penampilan (show portfolio).
Portofolio kerja adalah usaha mandiri yang telah
dilakukan siswa, atau usaha bersama dari kelompok siswa.
Hal-hal yang harus dilakukan siswa dan dinilai dalam
penilaian portofolio antara lain berupa draft, pekerjaan
yang belum selesai, atau pekerjaan terbaik / kerja bisa
dilakukan siswa. Hasil kerja siswa dalam penilaian
portofolio jenis ini digunakan dalam diskusi antara siswa
dan guru. Ini akan membuat guru mengetahui kemajuan
siswa, dan memungkinkan guru menolong siswa untuk

192 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

mengidentifikasi kelemahan, kelebihan serta kelayakan


dalam merancang dan meningkatkan pengajaran.
Portofolio dokumentasi adalah koleksi hasil kerja
siswa yang khusus digunakan untuk penilaian.
dokumentari portofolio adalah seleksi hasil kerja terbaik
siswa yang akan diajukan dalam penilaian. Jadi, portofolio
dokumentasi adalah koleksi dari sekumpulan hasil kerja
siswa selama kurun waktu tertentu. Portopolio
dokumentasi tidak hanya berisi hasil kerja siswa, tetapi
semua proses yang digunakan oleh siswa untuk
menghasilkan karya tertentu. Portofolio dokumentasi
misalnya dalam penilaian portofolio bahasa Inggris,
mungkin tidak hanya berisi tentang hasil akhir tulisan
siswa, tetapi juga berbagai macam draf dan komentar
siswa tentang hasil tersebut, termasuk juga proses sampai
di hasilkannya tulisan tersebut
Portofolio penampilan (show fortfolio) digunakan
untuk memilih hal-hal yang paling baik yang menunjukan
bahan/pekerjaan terbaik yang dihasilkan oleh siswa.
Berbeda darii portofolio dokumentasi, portofolio
penampilan hanya berisi pekerjaan siswa yang telah
selesai. Portofolio penampilan tidak mencakup proses
pekerjaan, perbaikan, dan penyempurnaan pekerjaan
siswa. Portofolio penampilan digunakan untuk tujuan
seperti seleksi, sertifikasi, maupun penilaian kelas. Untuk
tujuan yang lebih rumit, yang memerlukan perbandingan,
validitas perbandingan haruslah benar-benar diperhatikan
oleh beberapa penilai salah satunya reliabilitas, yaitu
apakah sektor yang berikan kepada hasil kerja siswa
konsisten.

193 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh portofolio yang paling sederhana adalah


map dengan kumpulan-kumpulan bukti yang dapat berupa
:
 artefact, yaitu dokumen yang dihasilkan selama
proses belajar seperti laporan praktikum,
pekerjaan rumah, proyek penelitian
 reproduksi, yaitu foto, film, artikel, buku, copy
 attestation, dokumen mahasiswa yang disiapkan
oleh orang lain seperti orang tua, teman, guru

5. Contoh Tugas
Berikut adalah contoh tugas dari guru kepada siswa
untuk membuat portofolio Contoh tugas untuk membuat
portofolio “karya terbaik”.
Kumpulkan dalam satu bendel, karya tulis kamu,
untuk menunjukkan karya terbaik kamu dalam pembuatan
puisi, laporan kunjungan ke objek wisata, artikel dalam
majalah dinding. Jelaskan mengapa masing-masing
merupakan karya terbaik.

194 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

6. Cara menilai portofolio


Portofolio dapat dinilaii dengan menggunakan
rubrik penilaian, misalnya sebagai berikut:

Skor Skor yang


No Aspek Yang Dinilai
Maksimal Diperoleh
1 Kelengkapan isi portofolio 3 2
2 Kemampuan siswa dalam 8 7
menjelaskan isi
portofolionya
3 Usaha siswa dalam 9 3
menyusun portofolionya
4 Perkembangan kompetensi 12 10
siswa
Jumlah 32 22

De Fina (Koyan, 2007) membandingkan ciri-ciri


asesmen portofolio dengan tes-tes baku sebagai tabel
berikut ini.

Tabel . Perbandingan antara Asesmen Portofolio dan Tes


Baku
No Asesmen Portofolio Tes Baku
1 Terjadi pada situasi Terjadi pada situasi ujian,
alamiah tidak
alamiah
2 Memberi kesempatan Menunjukkan kelemahan
kepada peserta

195 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

peserta didik untuk didik dalam suatu hal


menunjukkan tertentu
kelebihan dan
kelemahannya
3 Informasinya bersifat Tidak memberikan informasi
langsung dianostik secara langsung
pada saat proses (informasi
pembelajaran tertunda)
berlangsung
4 Asesmen dilakukan Asesmen dilakukan hanya
bersama oleh guru, orang oleh
tua peserta didik , dan pendidik dan menunjukkan
peserta didik itu sendiri peringkat
peserta didik
5 Penilaian berlangsung Kesempatan hanya sekali
terus menerus selama untuk
proses menilai kemampuan dalam
pembelajaran sehingga hal
memberikan kesempatan tertentu
untuk
menilai berbagai
kemampuan
6 Menilai hal-hal yang Menilai hal-hal yang
realistik dan artifisial, tidak
Bermakna sesuai dengan keseharian
yang ada
7 Memberi kesempatan Mengharapkan hanya ada
kepada satu
peserta didik untuk respon tentang pengetahuan
mengadakan atau
refleksi terhadap hasil kemampuannya
karyanya

196 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

8 Memberikan kesempatan Memberikan data numerik


kepada yang
orang lain yang kadangkala menakutkan dan
berkepentingan tidak
untuk mengadakan bermakna secara esensial
refleksi tentang
pengetahuan dan karya-
karya
peserta didik
9 Mendorong terwujudnya Mengharuskan pertemuan
temu antara
wicara antara pendidik pendidik dan administrator
dan peserta
didik
10 Menempatkan peserta Menempatkan peserta didik
didik sebagai
sebagai pusat proses objek proses pembelajaran
pembelajaran sehingga dan
bermanfaat untuk mendukung kurikulum
perbaikan kurikulum dan sebagai pusat
pembelajaran proses pembelajaran

197 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

198 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

UNIT IV
KUALITAS INSTRUMEN DAN
ANALISIS BUTIR
Instrumen atau tes yang digunakan untuk
mengukur kemampuan siswa haruslah sebuah tes yang
berkualitas baik. Tes yang berkualitas baik akan mampu
menjadi tolok ukur yang baik untuk mengukur kemampuan
siswa. Untuk mengetahui bagaimanakah kualitas tes, maka
dilakukan analisis kualitas tes. Dengan analisis kualitas tes
guru dapat mengetahui bagaimana kondisi soal yang
digunakan untuk tes. Setidaknya terdapat tiga karakteristik
yang harus dimiliki oleh tes hasil belajar, sehingga tes

199 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

tersebut dapat dinyatakan sebagai tes yang baik. Keempat


karakteristik tersebut adalah validitas, reliabilitas, dan
kualitas butir tes.
Kegiatan menganalisis butir soal merupakan suatu
kegiatan yang harus dilakukan guru untuk meningkatkan
mutu soal yang telah ditulis. Tujuan penelaahan adalah
untuk mengkaji dan menelaah setiap butir soal agar
diperoleh soal yang bermutu sebelum soal digunakan. Di
samping itu, tujuan analisis butir soal juga untuk
membantu meningkatkan tes melalui revisi atau
membuang soal yang tidak efektif, serta untuk mengetahui
informasi diagnostik pada siswa apakah mereka
sudah/belum memahami materi yang telah diajarkan. Soal
yang bermutu adalah soal yang dapat memberikan
informasi setepat-tepatnya sesuai dengan tujuannya di
antaranya dapat menentukan peserta didik mana yang
sudah atau belum menguasai materi yang diajarkan guru.
Dalam melaksanakan analisis butir soal, para
penulis soal dapat menganalisis secara kualitatif, dalam
kaitan dengan isi dan bentuknya, dan kuantitatif dalam
kaitan dengan ciri-ciri statistiknya atau prosedur
peningkatan secara judgment dan prosedur peningkatan
secara empirik. Analisis kualitatif mencakup pertimbangan
validitas isi dan konstruk, sedangkan analisis kuantitatif
mencakup pengukuran kesulitan butir soal dan
diskriminasi soal yang termasuk validitas soal dan
reliabilitasnya.

200 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 10
VALIDITAS TES

A.Konsep Validitas
Validitas berasal dari Bahasa Inggris dari kata
validity yang berarti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi
ukurnya. Beberapa pengertian validitas adalah sebagai
berikut.

(1) Validity is the adequacy and appropriateness of


the interpretations and uses of assessment result.
Validitas adalah kecukupan dan kelayakan
tafsiran-tafsiran dan hasil penilaian (Miller, Linn,
and Gronlund, 2009)

201 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(2) Validity is defined as the proportion of true


variance that is relevant to the purpose of the
testing. Validitas didefinisikan sebagai proporsi
varians benar yang relevan dengan tujuan dan
tes (Brown, 1976)

(3) Validity is the extent or the degree to which an


instrument measures what it purports to measure.
Validitas merupakan tingkat atau derajat dimana
suatu instrumen mengukur apa yang akan
diukur (Deblassie, 1974).

(4) Validity refers to the degree to which evidence


and theory support the interpretations of test
scores entailed by proposed uses of test .Validitas
mengacu pada derajat bukti dan teori yang
mendukung penafsiran skor-skor tes yang
diperlukan oleh maksud kegunaan tes
(Thorndike, 1997)

(5) Validity is concerned with the extent to which a


test measures what it purports to measure and is
useful for the purpose for which it was
designed,Validitas berkenaan dengan tingkat
dimana sebuah tes mengukur apa (Wiersma &
Jurs, 1990)
Jadi, validitas adalah suatu konsep yang berkaitan
dengan sejauh mana tes telah mengukur apa yang
seharusnya diukur. Sebagai contoh, jika timbangan
digunakan untuk mengukur berat badan, maka proses

202 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

pengukuran ini adalah tepat, karena itu keputusannya


adalah valid. Tetapi, jika timbangan itu digunakan untuk
mengukur tinggi badan, tingkat kevalidannya menjadi
rendah. Alasannya adalah timbangan hanya untuk
mengukur berat badan. Perlu dicamkan bahwa penekanan
validitas bukanlah pada tes itu sendiri, tetapi [ada hasil
pengetesan atau skornya.
Suatu alat ukur atau tes dapat dikatakan
mempunyai validitas apabila tes tersebut menjalankan
fungsi ukurnya, atau memberikan hasil ukur sesuai dengan
makna dan tujuan dilakukannya tes tersebut. Misalnya, jika
kita ingin mengetahui berat maka alat ukur yang tepat
adalah timbangan atau neraca, jika kita ingin mengetahui
suhu, maka alat ukur yang tepat adalah termometer. Dapat
dikatakan bahwa timbangan atau neraca merupakan alat
ukur yang valid mengukur berat, termometer adalah alat
ukur yang valid mengukur sihu, dan sebagainya.
Semakin tinggi validitas suatu alat tes maka tes
tersebut semakin mengenai pada sasarannya (sahih), atau
semakin menunjukkan apa yang seharusnya diukur. Tes
yang valid adalah tes yang mampu membantu guru
membuat keputusan yang berguna tentang pengajaran dan
pembelajaran.
Tes yang tidak valid dapat diibaratkan dengan
contoh tembakan seperti pada gambar 7.1.di bawah.
Gambar 10.1 memperlihatkan suatu tembakan yang tidak
mengenai sasaran dari seorang penembak. Demikian juga
skor tes yang tidak mengukur apa yang seharusnya diukur.

203 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Gambar 10.1. Tembakan yang tidak mengenai


sasaran

Validitas tidak berlaku secara umum bagi semua


pengukuran. Suatu tes mempunyai hasil ukuran yang baik
(valid) untuk suatu tujuan tertentu yang sepesifik tetapi
tidak valid untuk tujuan yang lain atau bahkan untuk
tujuan yang sama pada kelompok yang lain.
Cohen‐Swerdlik (2009) menyatakan “validity, as
applied to a test, is a judgment or estimate of how well a test
measures what it purports to measure in a particular
context. Maksudnya, validitas dalam sebuah tes menjadi hal
yang sangat penting karena akan mengukur kemampuan
peserta didik secara tepat. Tes yang menghasilkan data
yang tidak relevan dengan tujuan pengukuran dikatakan
sebagai tes yang memiliki validitas rendah (Azwar, 2000).
Uji validitas berguna untuk mengetahui valid atau
tidaknya butir-butir pertanyaan dalam alat tes hasil
belajar. Proses pengujian dilakukan dengan cara

204 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

menganalisis setiap pertanyaan di dalam alat tes hasil


belajar tersebut. Uji validitas digunakan untuk mengetahui
kelayakan butir-butir dalam suatu tes. Menurut Kapplan
dan Saccuzzo (1995), tahap validitas sesuatu pengujian
bergantung kepada ketepatan antara tujuan pengukuran
dengan informasi yang dihasilkan oleh proses pengujian
tersebut.

B. Macam-Macam Validitas
Secara garis besar ada dua macam validitas, yaitu
validitas tes dan validitas butir (Sudijono, 2006). Validitas
tes dikelompokkan atas dua macam, yaitu validitas logis
dan validitas empiris. Secara ilustrasi pembagian validitas
ditunjukkan pada gambar 8.2 .

Validitas
Validitas
Isi

Validitas
Logis
Validitas
Konstruk
Validitas
Tes
Validitas
Konkurensi

Validitas
Empiris

Validitas Validitas
Butir Prediktif

205 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Gambar 8.2:Ilustrasi macam-macam validitas

1. Validitas Logis
Validitas logis menunjuk pada kondisi sebuah alat
ukur valid berdasarkan hasil penalaran. Validitas logis
disebut juga sebagai validitas yang dipertimbangkan secara
rasional. Ada dua macam validitas logis yang dapat dicapai
oleh sebuah alat ukur, yaitu: validitas isi (content validity)
dan validitas konstruk (construct validity).

1) Validitas Isi (Content Validity)


Wiersma dan Jurs (1990) menyatakan bahwa ”
content validity is concerned with the extent to which the
test is reprentative of a defined body of content consisting of
topics and processes. Validitas isi berkaitan dengan
sejuhmana tes ini mewakili dari keseluruhan isi yang
terdiri dari topic dan proses.
Gay (1987) menyatakan bahwa validitas isi (content
validity) adalah derajat pengukuran yang mencerminkan
domain isi yang diharapkan. Validitas isi penting untuk tes
hasil belajar (achievement test)
Validitas isi mencerminkan sejauh mana butir-butir dalam
tes memerupakan materi yang disajikan dalam kurikulum.
Menurut Azwar (2012) validitas isi berarti sejauh mana
suatu perangkat tes mencerminkan keseluruhan
kemampuan yang hendak diukur. Sebuah tes dikatakan
memiliki validitas isi jika butir - butir tes bersifat
representatif terhadap isi materi dalam kurikulum

206 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

tersebut. Jadi, Suatu tes hasil belajar dapat dikatakan valid


jika materi tes tersebut benar-benar bahan yang
representatif terhadap bahan-bahan pelajaran yang
diberikan.
Validitas isi mencakup dua aspek: (1) relevansi isi,
dan (2) liputan isi (Messick, 1989). Lazimnya, dalam
sejumlah literatur, relevansi isi disebut sebagai face validity
(validitas muka) dan liputan isi disebut sebagai logical
validity (validitas logis).

a. Face Validity (Validitas Muka)


Validitas muka adalah validitas yang menilai
keabsahan susunan kalimat atau kata-kata dalam
soal/pernyataan/pertanyaan sehingga jelas pengertiannya
atau tidak menimbulkan tafsiran lain. Apabila isi alat ukur
telah tampak sesuai dengan apa yang ingin diukur, maka
dapat dikatakan validitas muka telah terpenuhi.

b. Logical Validity (Validitas Logis)


Validitas logis atau validitas sampling adalah
validitas yang menunjuk pada sejauhmana isi tes
merupakan representasi dari aspek yang hendak diukur.
Untuk memperoleh validitas logis yang tinggi suatu tes
harus dirancang sedemikian rupa sehingga benar-benar
berisi hanya butir yang relevan dan perlu menjadi bagian
alat ukur secara keseluruhan.

2). Validitas Konstruk (Construct Validity)

207 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Morris & Gibbon (1986) menyatakan the construct


validity of a test is the extent to which you can be sure it
represent the construct whose name appears in its tittle.
Artinya, validitas konstruk sebuah tes adalah sejauh mana
Anda dapat yakin itu merupakan konstruk yang namanya
muncul dalam judul nya .
Menurut Suryabrata (2000), validitas konstruk
(construct validity) menyatakan sejauh mana skor-skor
hasil pengukuran dengan suatu instrumen itu
merefleksikan konstruk teoretik yang mendasari
penyusunan instrumen tersebut. Sebuah tes dikatakan
mempunyai validitas konstruk apabila butir-butir soal yang
disusun dalam tes mengukur setiap aspek berpikir dari
sebuah variabel yang akan diukur melalui tes tersebut.
Pada suatu instrumen non tes dikatakan mempunyai
validitas konstruk, jika instrumen tersebut dapat
digunakan untuk mengukur variabel sesuai dengan yang
didefinisikan. Misalnya untuk mengukur minat siswa, maka
perlu didefinisikan terlebih dahulu apa itu minat siswa,
demikian juga variabel motivasi atau minat misalnya.

2. Validitas Empiris
Validitas empiris menunjuk pada kondisi instrumen
valid berdasarkan hasil uji secara empiris (pengalaman).
Validitas empiris sama dengan validitas kriteria yang
berarti bahwa validitas ditentukan berdasarkan kriteria,
baik kriteria internal maupun kriteria eksternal. Menurut
Djaali (2008) kriteria internal berarti tes atau instrumen
itu sendiri yang menjadi kriteria, sedangkan kriteria

208 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

eksternal adalah hasil ukur instrumen atau tes lain diluar


instrumen itu sendiri yang menjadi kriteria.
Validitas empiris dapat dibagi menjadi dua, yaitu
validitas bandingan (concurrent validity) dan validitas
ramalan (predictive validity).

a) Validitas Bandingan ( concurent validity )


Validitas bandingan (concurrent validity) adalah
pengujian validitas yang menggunakan kriteria eksternal di
mana kriteria yang digunakan telah ada pada saat
pengujian tes dilakukan. Sebagai contoh, tes akhir semester
dapat diuji validitasnya menggunakan nilai ulangan harian
sebagai kriteria.

b) Validitas ramalan ( predictive validity)


Validitas ramalan (predictive validity) adalah
pengujian validitas yang menggunakan kriteria eksternal di
mana kriteria pembandingnya belum ada pada saat tes
dikembangkan. Kriteria yang digunakan sebagai
pembanding untuk menguji validitas masih harus
diramalkan menggunakan skor hasil pengukuran tes.
Ringkasan informadi tentang validitas isi, validitas
konkuren, validitas prediktif, dan validitas konstruk, adalah
seperti yang ditunjukkan dalam Tabel 10.1 berikut:

Tabel.10.1 .Ringkasan informasi tentang Validitas-


Validitas isi, konstruks, konkuren dan prediktif
Jenis Tujuan Bagaimana
menentukan
Validitas Isi Untuk menentukan Melalui suatu analisis

209 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

tingkat mana butir- logis yang memerlukan


butir tes mewakili isi kesamaan di antara
butir-butir tes dan isi
Validitas Untuk menentukan Analisis korelasi, skor-
Konkurensi tingkat mana satu alat skor dari alat ukur yang
ukur ingin diuji validitasnya
dikorelasi dengan skor-
skor yang diperoleh
dari kriteria pada saat
yang sama
Validitas Analisis korelasi, skor-
Prediktif skor dari alat ukur yang
ingin diuji validitasnya
dikorelasi dengan skor-
skor yang diperoleh
pada waktu yang akan
datang
Validitas Untuk menentukan Analisis logis dan
Konstruk sejauh mana alat ukur melalui prosedur
dapat dikatakan korelasional, seperti
mengukur sebuah analisis faktor
konstruk atau sifat
teoritisnya

3. Validitas Butir
Validitas butir disebut pula sebagai validitas
internal. Validitas butir memperlihatkan seberapa jauh
hasil ukur butir tersebut konsisten dengan hasil ukur
instrumen secara keseluruhan.
Validitas butir (Internal) adalah validitas yang ditinjau
berdasarkan hubungannya dengan kategori tertentu. Bryman
(2001) menyatakan bahwa “internal validity is common to

210 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

refer to the factor that has a causal impact as the


independent variable and the effect as the dependent
variable.” maksudnya, validitas internal pada umumnya
merujuk pada faktor yang memiliki pengaruh sebab
sebagai variabel bebas dan akibat sebagai variabel terikat.
Menurut Sudijono (2003) yang dimaksud dengan validitas
butir dari suatu tes adalah, ketepatan mengukur yang
dimiliki oleh sebutir soal (yang merupakan bagian tak
terpisahkan dari tes sabagai suatu totalitas), dalam
mengukur apa yang seharusnya diukur lewat butir soal
tersebut.
Validitas butir atau internal memperlihatkan
seberapa jauh hasil ukur butir tersebut konsisten dengan
hasil ukur alat ukur secara keseluruhan (Djaali dan
Muljono, 2008). Validitas butir tercermin pada besaran
koefisien korelasi antara skor butir dan skor total alat ukur.
Jika koefisien korelasi antara skor butir dengan skor total
instrumen positif dan signifikan, maka butir tersebut dapat
dianggap valid berdasarkan ukuran validitas internal.
Sebutir soal dapat dikatakan telah memiliki validitas yang
tinggi atau dapat dikatakan valid, jika skor-skor pada butir
soal yang bersangkutan memiliki kesesuaian atau
kesajajaran arah dengan skor totalnya; atau dengan bahasa
statistik : Ada korelasi positif yang signifikan antara skor
butir dengan skor totalnya (Sudijono, 2003)
Untuk menghitung koefisien korelasi validitas
antara skor butir dan skor total pada skor butir kontinum,
maka rumus yang digunakan adalah Pearson Product
Moment sebagai berikut:

211 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

( )( )
√* ( ) +* ( ) +

dengan : koefisien korelasi product moment


X : skor tiap pertanyaan/ item
Y : skor total
N : jumlah responden

Contoh:Dari hasil ujicoba 5 butir soal esai yang dijawab 10


orang siswa didapat distribusi skor jawaban siswa
adalah seperti yang ditunjukkan dalam Tabel
10.2. Tentukan validitas butir soal nomor 1.

Tabel 10.2. Perhitungan korelasi product moment


Nomor butir Skor
No Siswa
1 2 3 4 5 total
1 A 5 7 3 5 7 27
2 B 8 8 6 8 9 39
3 C 4 4 4 3 7 22
4 D 7 6 7 4 7 31
5 E 5 6 5 6 8 30
6 F 8 5 7 7 7 34
7 G 6 5 6 7 7 31
8 H 4 3 5 4 5 21
9 I 8 7 7 8 7 37
10 J 5 6 4 5 7 27

Untuk menentukan valid tidaknya butir No.1 yang


menggunakan korelasi product moment, maka dibuatkan
terlebih dahulu tabel 10.3 yang memuat soal No.1 (X), skor
totalnya (Y) dan menghitung ∑ X2, ∑Y2, dan ∑XY.

212 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Tabel 10.3 Analisis untuk mencari validitas butir 1


Skor
Butir 1
No Siswa total X2 Y2 XY
(X)
(Y)
1 A 5 27 25 729 135
2 B 8 39 64 1521 312
3 C 4 22 16 464 88
4 D 7 31 49 961 217
5 E 5 30 25 900 150
6 F 8 34 64 1156 272
7 G 6 31 36 961 186
8 H 4 21 16 441 84
9 I 8 37 64 1369 296
10 J 5 27 25 729 135
∑ 60 299 384 9251 1875

Dari Tabel 10.3 diketahui ∑ X =60, ∑Y = 299, ∑ =384,


∑ = 9251, dan ∑ XY = 1875. Nilainilai ini disubtitusikan
ke dalam persmaan

( )( )
√* ( ) +* ( ) +

( )( ) ( )( )
√* ( ) +* ( ) +

√* +* +

= = 1,92
√* +* + √

213 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Jika item-item memberikan alternatif jawaban


dikotomi (1,0), maka korelasi antara skor butir dengan
skor total dihitung dengan korelasi titik-biserial (point-
biserial correlation) (Klein, 1986 dikutip Streiner dan
Norman, 2000). Bentuk rumusnya adalah sebagai berikut:

= x√

dengan:
rpbi = koefisien korelasi point biserial
Mp = rerata skor dari subjek yang menjawab betul
bagi butir yang dicari validitasnya
Mt = rerata skor total
st = standar deviasi dari skor total
p = proporsi peserta didik yang menjawab betul
(banyaknya peserta didik yang menjawab
betul dibagi dengan jumlah seluruh siswa)
q = proporsi peserta didik yang menjawab salah
(q = 1 – p)

Contoh: Hasil ujicoba 10 butir soal pilihan ganda yang


dijawab 10 orang siswa iperoleh distribusi skor
jawaban mereka adalah seperti yang ditunjukkan
dalam Tabel 10.4. Tentukan validitas butir soal
nomor 1.

Tabel 10.4. Perhitungan korelasi point biserial


N Sisw Skor siswa Skor
o a 1 2 3 4 5 6 7 8 9 10 total
1 A 1 1 1 1 1 1 0 1 1 0 8
2 B 1 1 1 1 1 1 1 0 1 0 8

214 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

3 C 1 1 0 1 1 1 0 1 1 0 7
4 D 1 1 1 1 1 0 1 0 1 0 7
5 E 1 1 1 1 1 0 0 1 1 0 7
6 F 1 0 1 0 0 1 1 0 0 1 5
7 G 1 1 0 0 1 1 0 1 0 1 6
8 H 0 0 1 1 1 0 1 0 0 1 5
9 I 0 1 1 1 0 0 0 1 0 1 5
10 J 1 0 1 0 0 0 1 0 0 1 4
∑X 8 7 8 7 7 5 5 5 5 5 62
p 0,8 0. 0,8 0 0 0, 0, 0, 0,5 0,5
7 , , 5 5 5
7 7
q 0,2 0, 0,2 0 0 0, 0, 0, 0,5 0,5
3 , , 5 5 5
3 3

Untuk menentukan validitas soal No.1 yang


menggunakan korelasi poin biserial, makadi buatkan
terlebih dahulu tabel 10.5 yang memuat soal nomor 1 dan
totalnya.

Tabel 10.5 Analisis untuk mencari validitas butir 1

No Siswa Soal 1 Total (X)


1 A 1 8
2 B 1 8
3 C 1 7
4 D 1 7
5 E 1 7
6 F 1 5
7 G 1 6
8 H 0 5
9 I 0 5
10 J 1 4
∑X 8 62
P 0,8

215 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Q 0,2

Tentukan proporsi menjawab benar (p) dengan persamaan

P= = = 0,8

Tentukan nilai q dengan cara


q=1–p
q = 1 – 0,8 = 0,2

Tentukan rerata skor total dengan persamaan


Mt = = 6,2

Tentukan rerata skor siswa yang menjawab benar, yaitu


( )
= = 6,5

Tentukan Standar Deviasi dengan persamaan


∑ = +

= 64+64+49+49+49+25+36+25+25+16 = 402

( )

SD = = = 1,76
Menentukan korelasi point biserial dengan rumus

= x√ x√ = 0,17 x 2 = 0,34

216 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Untuk menentukan kategori dari validitas alat ukur


dapat dilakukan dengan dua cara, yaitu:
1) membandingkan nilai koefisien validitas yang diuji
(r-hitung) dengan tabel Pearson ( r-tabel) pada
signifikansi α (biasanya dipilih 0,05) dan n =
banyaknya data yang sesuai. Jika r-hitung ≥ r-tabel,
maka instrumen atau item-item pertanyaan
berkolerasi signifikan terhadap skor total (dinyatakan
valid). Jika r-hitung < r-tabel, maka instrumen atau
item-item pertanyaan tidak berkorelasi signifikan
terhadap skor total (dinyatakan tidak valid),
2) melihat pengklasifikasian validitas seperti yang
dikemukakan oleh Guilford (1956) sebagai berikut:

0,80 < rxy 1,00 validitas sangat tinggi (sangat baik)


0,60 < rxy 0,80 validitas tinggi (baik)
0,40 < rxy 0,60 validitas sedang (cukup)
0,20 < rxy 0,40 validitas rendah (kurang)
0,00 < rxy 0,20 validitas sangat rendah (jelek)
rxy 0,00 tidak valid

C. Pengujian Validitas Tes


1. Validitas Isi
Menurut Wiersma dan Jurs (1990), pengujian
validitas isi hanya mendasarkan pada analisis logika.
Artinya, validitas isi suatu tes tidak mempunyai besaran
tertentu yang dihitung secara statistika, tetapi dipahami
bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes.
Untuk menilai apakah suatu tes memiliki validitas isi atau
tidak, dilakukan dengan cara membandingkan kesesuaian

217 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

antara isi tes tersebut dengan indikator-indikator yang


telah ditetapkan pada setiap topik. Apabila materi/isi tes
tersebut cocok dengan indikator berdasarkan penilaian
para pakar, berarti tes tersebut sudah valid isi, sebaliknya
jika materi/isi tes tersebut menyimpang dari indikator-
indikator, berarti tes tersebut tidak valid. Menurut Skinner
(t.t) salah satu metode penentuan kevalidan tes prestasi
yaitu mempelajari isi tes.
Ada beberapa teknik yang dapat dilakukan untuk
menganalisis validitas isi tes hasil belajar, antara lain:
1) Persentase butir yang cocok dengan indikator
Di sini validitas isi ditentukan dengan cara
menghitung berapa besarnya persentase kecocokan antara
suatu butir dengan indikatornya berdasarkan penilaian
pakar. Butir tes dinyatakaan valid jika kecocokannya
dengan indikator mencapai lebih besar dari 50% (Susetyo,
2011). Rumus yang digunakan adalah:

Persentase = x 100%
dengan: f = frekuensi cocok menurut penilai

Sebagai contoh cara menghitung kecocokan butir tes


dengan indikator adalah seperti Tabel 10.6 berikut:

Tabel 10.6. Kecocokan antar penilai


Butir
Penilai
1 2 3 4 5
1 1 0 I 1 0

218 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

2 1 0 I 0 0
3 1 0 I 1 0
4 0 0 I 1 0
5 0 0 0 1 1
Jl. Cocok 3 2 4 4 1
Jl. tidak cocok 2 3 1 1 4

Dari Tabel di atas dapat dilihat bahwa:


Persentase butir 1 = x 100% = 60% (valid)
Persentase butir 2 = x 1005 = 40% (tidak valid)

1) Perhitungan Rasio validitas isi dari Lawshe


Perhitungan validitas isi juga berdasarkan kecocokan para
ahli yang mendasarkan pada penting atau tidak penting.
Butir dinayatakan valid isi jika terdapat keococokan di
antara penilai di atas 0,50. Rumus yang digunakan adalah
(Susetyo, 2011):

CVR = = –1

dengan: jumlah ahli yang menyatakan penting


M = jumlah ahli yang memvalidasi
Indeks rasio berkisar : -1 ≤ CVR ≤ + 1

Mp < M CVR < 0


Mp = M CVR = 0
Mp > M CVR > 0

219 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Untuk contoh perhitungan lihat Tabel 10.7 berikut:

Tabel 10.7. Kecocokan antar penilai


Butir
Penilai
1 2 3 4 5
1 1 0 I 1 0
2 1 0 I 0 0
3 1 0 I 1 0
4 0 0 I 1 0
5 0 0 1 1 1
Penting 3 2 5 4 1
Tidak Penting 2 3 0 1 4

Perhitungan butir 1:
Mp = 3, M = 5
CVR = (2 )–1
CVR =( ) – 1 = ( ) – 1 = 0,20, butir 1 tidak valid

Perhitungan butir 4:
Mp = 4, M = 5
CVR = (2 )–1
CVR =( )–1= ( )–1= 0,60 ,butir 2 valid

2) Perhitungan validitas isi untuk seluruh butir


Untuk mengetahui validitas isi seluruh butir tes
(bukan butir per butir) dapat dilakukan dengan cara
mengecek alat ukur oleh dua orang penilai (ahli). Indek

220 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

validitas ditentukan oleh kecocokan hasil penilaian di


antara dua ahli tersebut terhadap keseluruhan butir tes.
Rumus yang digunakan yaitu:
Koefisien validitas isi = (Gregory dalam
Retnawati, 2015)
Perangkat tes dinyatakan valid jika diperoleh harga
diatas 0,50 (Susetyo, 2011). Adapun bentuk Tabel
kecocokan antar panilai adalah sebagai berikut.

Tabel 10.8. Kecocokan antar penilai

Penilai 1
Penilai/Kategori
Kurang
Penting
Penting

Kurang
A B
Penting
Penilai
2
Penting C D

Sebagai contoh, jika hasil penilaian perangkat ukur


oleh dua orang ahli, hasilnya sebagai berikut.

Penilai 1
Penilai/Kategori
Kurang
Penting
Penting

Penilai Kurang
5 3
2 Penting

221 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Penting 2 15

Koefisien validitas isi = = = 0,60


Koefisien validitas isi sebesar 0,6 menunjukkan bahwa
validitas isi tes tersebut berada dalam kategori sedang.

2.Validitas Konstruks
Pengujian validitas konstruk merupakan gabungan
dari pendekatan logis dan empiris. Menurut Kerlinger
(2003) ada tiga cara yang dapat digunakan untuk
menentukan validitas konstruk, yaitu (a) konvergensi dan
diskriminabilitas, (b) metode matrik multitrait-multi
method, dan (c) metode analisis faktor. Pendekatan
yang banyak dilakukan dalam pengujian validitas
konstruk sekarang adalah pendekatan analisis faktor.
Analisis faktor adalah kajian tentang
kesalingtergantungan antara variabel-variabel, dengan
tujuan untuk menemukan himpunan variabel-variabel
baru, yang lebih sedikit jumlahnya dari pada variabel
semula, dan menunjukkan yang mana di antara variabel-
variabel semula itu yang merupakan faktor-faktor
persekutuan (Suyanto, 1977). Melalui analisis faktor dapat
melihat apakah spesifikasi konstruk yang dikembangkan
secara teoritik telah sesuai dengan konsep konstruk yang
mendasarinya setelah dilakukan ujicoba di lapangan.
Teknik ini menganalisis butir-butir alat ukur yang
terdapat dalam sejumlah faktor tertentu, butir-butir yang

222 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

memiliki unsur kebersamaan (common factor) digabung


menjadi suatu faktor baru.
Salah satu prosedur pengujian validitas konstruk
yang tidak terlalu kompleks dapat dilakukan dengan
pendekatan validitas internal atau validitas butir.

3.Validitas Konkurensi
Tuckman (1975) mengemukakan “concurrent
validity tells wheather the degree to which persons show
evidence of a quality on a given test is reflected in or
paralled by their scores on another test of presumably the
same characteristic” maksudnya validitas konkuren
menjelaskan sejauh mana orang menunjukkan bukti dari
kualitas pada tes yang diberikan itu tercermin atau
terhubung dengan skor pada tes lain yang karakteristiknya
sama.

Contoh: Ibu Sari mengembangkan sebuah tes dan dia ingin


mengetahui apakah tesnya itu valid. Ibu Sari
mengambil tes lain yang tersedia yang diketahui
valid dan menggunakan tes itu sebagai kriteria. Dia
memberikan kedua set tes tersebut: tes yang
dikembangkan dan tes sebagai kriteria kepada
kelompok siswa berjumlah 10 orang. Skor-skor
mereka ditunjukkan di bawah. Tentukan validitas
tes ibu Sari tersebut.

223 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Tes yang Tes yang


dikem dijadikan XY X2 Y2
bangkan Kriteria (Y)
ibu Sari (X)
34 30 1020 1156 900
40 37 1480 1600 1369
35 25 875 1225 625
49 37 1813 2401 1369
50 45 2250 2500 2025
38 29 1102 1444 841
37 35 1295 1369 1225
47 40 1880 2209 1600
38 35 1330 1444 1225
43 39 1677 1849 1521
411 352 14722 17197 12700

( )( )
√* ( ) +* ( ) +

( )( ) ( )( )
√*( )( ) ( ) +*( )( ) ( ) +

( ) ( )
√*( ) ( )+ *( ) ( )+

= = 0,83
√( )( )

224 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Suatu koefisien korelasi sebesar 0,83 menunjukkan


bahwa tes yang dikembangkan ibu Sari memiliki validitas
konkurensi

4. Validitas Prediktif
Tuckman (1975) menyatakan “Predictive validity
indicates the degree of correspondence between scores on
the test in question and future outcomes that are expected to
be related to characteristic measured by the test.
Maksudnya, validitas ramalan menunjukkan tingkat
kesesuaian di antara skor-skor pada tes dalam soal dan
hasil mendatang yang diharapkan berkaitan dengan ciri-
ciri yang diukur oleh tes.
Menurut Nurkancana dan Sunartana (1986), cara
yang dipergunakan untuk menilai tinggi rendahnya
validitas prediktif ialah dengan jalan mencari korelasi
antara nilai-nilai yang dicapai oleh oleh siswa dalam tes
tersebut dengan nilai-nilai yang dicapainya kemudian.
Sebagai contoh, untuk menguji validitas tes masuk
Perguruan Tinggi Negeri, Perguruan Tinggi belum memiliki
data tentang prestasi mahasiswa, sehingga kriteria yang
akan dibandingkan belum tersedia. Kriteria pembanding
yang diramalkan oleh tes masuk adalah nilai hasil belajar
mahasiswa setelah diterima dan mengikuti pembelajaran
selama waktu tertentu.

Contoh: Pak Budi ingin mengetahui validitas prediktif


tesnya yang dilaksanakan setahun sebelumnya
melalui korelasi skor-skor dengan peringkat dari
siswa yang sama Skor-skor dan peringkat

225 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

ditunjukkan di bawah. Tentukan validitas tes pak


Budi.

Peringkat Tes (Y)


XY X2 Y2
(X)
89 40 3560 7921 1600
85 37 3145 7225 1369
90 45 4050 8100 2025
79 25 1975 6241 625
80 27 2160 6400 729
82 35 2870 6724 1225
92 41 3772 8464 1681
87 38 3306 7569 1444
81 29 2349 6561 841
84 37 3108 7056 841
849 354 30295 72261 12908

( )( )
√* ( ) +* ( ) +

( )( ) ( )( )
√*( )( ) ( ) +*( )( ) ( ) +

( ) ( )
√*( ) ( )+ *( ) ( )+
= = 0,76
√( )( )

226 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Suatu koefisien korelasi sebesar 0,76 menunjukkan


bahwa tes pak Budi memiliki validitas prediktif.

D. Faktor-faktor yang mempengaruhi Validitas


Beberapa aktor yang dapat mempengaruhi validitas
tes adalah:
1. Faktor dari dalam tes itu sendiri, seperti:
(a) petunjuk yang tidak jelas,
(b) Penggunaan kosa kata dan struktur kalimat yang
sulit,
(c) ambiguitas.
(d) alokasi waktu yang tidak cukup,
(e) Penekanan yang berlebihan terhadap aspek
tertentu, menyebabkan mudah ditebak,
(f) Kualitas butir tes yang tidak memadai untuk
mengukur hasil belajar.
(g) Susunan tes yang jelek.,
(h) Tes terlalu pendek,
(i) Penyusunan butir tes yang tidak runtut .
(j) Pola jawaban yang mudah ditebak,
2. Faktor berfungsinya tes dan prosedur mengajar .
3. Faktor administrasi dan penskoran .
4. Faktor tanggapan siswa.
5. Hakikat kelompok dan kriteria.

227 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

228 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 11
RELIABILITAS TES
A.Pengertian Reliabilitas
Dari segi bahasa, reliabilitas berasal dari kata
reliability yang mempunyai asal kata rely dan ability yang
berarti hal yang dapat dipercaya. Sebuah tes dikatakan
mempunyai reliabilitas berarti tes tersebut dapat
dipercaya karena memberikan data yang tetap atau
konsisten, dan menjadi sandaran pengambilan keputusan.
Beberapa pengertian reliabilitas adalah sebagai berikut:
(1) Reliability refers to the degree to which a
particular test or instrument providee

229 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

trustworthy or consistent measures of whatever


it does measure. Maksudnya reliabilitas
mengacu pada derjat dimana suatu tes atau alat
ukur tertentu memberikan kepercayaan atau
konsisten dalam mengukur apa yang diukur
(Erickson and Tim,1976)

(2) Reliabilty refers to consistency of measurement-


that is, how consistent test scores or others
evaluation results are from one measurement to
another. Maksudnya reliabilitas mengacu pada
kekonsistenan dari pengukuran, yaitu berapa
konsistenya skor-skor tes atau hasil-hasil
evaluasi lain dari suatu pengukuran untuk
pengukuran lainnya(Gronlund and Linn, 1990)

(3) Reliability is as the extent to which a test measures


consistently what it purports to measure. Artinya,
reliabilitas sebagai derajat dimana suatu tes
mengukur secara konsisten apa yang seharusnya
diukur (Deblassie, 1974)

(4) Reliability refers to the extent to which


measurement results are free of unpredictable
kinds of error. Reliabilitas mengacu pada tingkat
dimana hasil-hasil pengukuran bebas dari
kesalahan-kesalahan yang tidak disangka (Morris
& Gibbon, 1986)

230 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(5) Reliability refer to the degree to which test scores


are free from errors of measurement .Reliabilitas
mengacu pada derjat dimana skor-skor tes bebas
dari ke kekeliruan pengukuran ( Pedhazur dan
Schmelkin, 1991
Jadi reliabilitas (keandalan) suatu alat ukur adalah
keajegan (konsistensi) hasil pengukurannya seandainya
alat ukur tersebut digunakan oleh orang yang sama dalam
waktu yang berlainan atau digunakan oleh orang yang
berlainan dalam waktu yang sama.
Deblassie (1974) menyatakan bahwa “ A test is
reliable if it provides consistent information about
examinees”. Jadi, suatu tes yang reliabel adalah jika tes itu
memberikan informasi yang konsisten atau tetap (ajeg)
tentang peserta tes. Secara singkat reliabilitas dapat
dinyatakan sebagai” sejauhmana alat ukur itu dapat
menghasilkan ukuran yang konsisten”. Konsisten atau
tetap (ajeg) disini tidak berarti harus memiliki skor yang
selalu sama ketika diujikan berkali-kali pada siswa yang
sama, tetapi mengikuti perubahan secara ajeg. Sebagai
contoh, jika skor si A dalam sebuah tes mula-mula lebih
rendah dibandingkan dengan skor si B, maka jika diadakan
pengukuran ulang, si A juga mendapat skor lebih rendah
dari si B. Itulah yang dikatakan tes itu ajeg atau tetap, atau
tes itu reliabel.

B. Jenis-Jenis Reliabilitas
Menurut Djaali dab Muljono (2008) reliabilitas
dibedakan atas dua macam, yaitu reliabilitas konsistensi
tanggapan, dan reliabilitas konsistensi gabungan item.

231 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Reliabilitas konsistensi tanggapan berkaitan dengan


kemantapan tes apabila diujikan beberapa kali akan
memberikan hasil pengukuran (tanggapan) yang relatif
konsisten. Reliabilitas konsistensi tanggapan, kadang-
kadang disebut sebagai external stability. Ada dua metode
untuk mengestimasi reliabilitas tanggapan, yaitu: (1).
metode “test retest” atau tes ulang, dan (2) metode
“alternate forms” atau tes paralel.
Reliabilitas konsistensi gabungan item adalah
berkaitan dengan kemantapan atau konsistensi antara item-
item suatu tes. Reliabilitas ini juga disebut sebagai reliabilitan
konsisten internal. Koefisien reliabilitas konsistensi
gabungan item dapat dihitung dengan dua teknik, (1) kalau
jumlah butir tesnya genap dapat digunakan metode “split-
half” atau belah dua, yang menggunakan formula:
Spearman-Brown, Flanagan, atau Rulon. (2) Jika jumlah
butir tesnya ganjil, maka koefisien reliabilitasnya dihitung
dengan menggunkan formula atau (a) rumus Kuder-
Richardson, yang dikenal dengan nama KR-20 dan KR-21,
(b). Rumus koefisien Alpha Cronbach , dan (c). Rumus
reliabilitas Hoyt. Gambar11.1 memperlihatkan klasifikasi
reliabilitas.

232 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Reliabilitas

Konsisten
Stabilitas
si
Ekternal
Internal

Tes Butir Butir


Tes
Ulang Genap Ganjil
Parale
l

Metode Rumus
Belah Dua KR-20

Rumus
KR-21

Spearma Rumus Rumus Alpha


n Brown Fl a na ga n Rulon Cronbac

Gambar 11.1: Ilustrasi jenis-jenis reliabillits

C.Mengestimasi Koefisien Reliabilitas


Menurut Suryabrata (2000) reliabilitas alat ukur
yang menunjukkan derajad kekeliruan pengukuran tidak
dapat ditentukan dengan pasti melainkan hanya dapat
diestimasi. Untuk mengestimasi koefisien reliabilitas alat
ukur dapat dihitung dengan menggunakan empat metode.
Keempat metode tersebut adalah, metode “test retest” atau

233 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

tes ulang, metode “alternate forms” atau tes paralel, metode


“split-half” atau belah dua, dan metode “internal
consistency” atau konsistensi internal (Anderson, 1981).

1. Metode Tes Ulang (Test Retest Method)


Test-retest is an obvious to estimate the reliability of
a test is to the same group of individuals on two occasions
and correlate the two sets of scores (Bryman, 2001).
Maksudnya, test-retest ialah suatu kejelasan untuk
memperkirakan tingkat reliabilitas sebuah tes untuk
kelompok yang sama anggota pada dua kesempatan dan
mengkorelasikan dua set skor.
Metode tes ulang maksudnya sebuah tes yang sama
diberikan dua kali kepada responden yang sama dengan
jarak waktu tertentu. Estimasi koefisien reliabilitas
diperoleh dengan mengkorelasikan skor pengetesan
pertama dengan skor pengetetesan kedua. Koefisien
korelasi yang diperoleh menunjukkan koefisien reliabilitas
tes tersebut Koefisien atau Indeks reliabilitas berkisar
antara 0 - 1. Semakin tinggi koefisien reliabilitas suatu tes
(mendekati 1), makin tinggi pula keajegan/ ketepatannya.
Untuk mengkorelasi kedua skor hasil pengetesan
dapat rumus menggunakan korelasi Pearson atau
Spearman jika skor kontinu. Bentuk rumus korelasi
Pearson Product Moment adalah sebagai berikut:

234 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

( )( )
√* ( ) +* ( ) +

dengan : koefisien korelasi product moment


X : skor hasil pengetesan pertama
Y : skor hasil pengetesan kedua
N : jumlah responden
Kelemahan metode tes ulang adalah dalam
penentuan selang waktunya. Jika selang waktu tes terlalu
singkat, kemungkinan besar responden masih mengingat
materi yang diteskan pertama kali, sehingga
berkemungkinan besar skor tes yang kedua lebih baik
daripada skor tes pertama. Sebaliknya jika selang waktu
tes pertama dengan tes kedua terlalu lama dikhawatirkan
banyak faktor serta situasi dan kondisi sudah banyak
berubah dan mempengaruhi skor tes yang kedua.

Contoh: Ibu Eva melaksanakan ujicoba tes Bahasa Inggris


yang dikembangkannya pada 10 orang
mahasiswa semester pertama. Setelah dua
minggu, tes yang sama diberikan lagi pada
mahasiswa yang sama. Skor-skor mereka pada
tes pertama dan tes kedua ditunjukkan di
bawah Hitung reliabilitas tes Bahasa Inggris
yang dikembangkan ibu Eva.

235 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Tes Tes
Siswa Pertama Kedua XY X2 Y2
(X) (Y)
A 40 41 1640 1600 1681
B 35 40 1400 1225 1600
C 30 25 750 900 625
D 20 20 400 400 400
E 19 20 380 361 400
F 20 23 460 400 529
G 37 34 1258 1369 1156
H 38 35 1330 1444 1225
I 40 40 1600 1600 1600
J 25 25 625 625 625
∑ 304 303 9843 9924 9841

( )( )
√* ( ) +* ( ) +

( )( ) ( )( )
√*( )( ) ( ) +*( )( ) ( )+

( ) ( )
√*( ) ( )+ *( ) ( )+

= = 0,94
√( )( )

Dari perhitungan didapat koefisien reliabilitas 0,94,


karena itu dapat disimpulkan tes Bahasa Inggris memiliki
reliabilitas tinggi.

236 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

2. Metode Tes Sejajar (Equivalent Test Method)


Metode tes sejajar maksudnya dua buah tes yang
mempunyai kesamaan tujuan, bobot soal, tingkat
kesukaran, susunan soal yang sama (kecuali butir–butir
soalnya saja yang berbeda) diberikan serentak pada
responden yang sama. Estimasi koefisien relibilitas
diperoleh dengan mengkorelasikan skor tes pertama
dengan skor tes kedua.
Kelemahan metode ini adalah sulitnya
mengkonstruksi dua buah tes yang sama, namun metode
sejajar ini dapat memperbaiki kelemahan pada metode
pertama yaitu terhindarnya dari kondisi siswa masih
mengingat materi tes pertama.
Estimasi koefisien reliabilitas dengan metode tes
ulang dan metode tes sejajar adalah untuk melihat stabil
atau tidak stabilnya skor. Skor disebut stabil bila skor yang
didapat pada suatu waktu dan pada waktu yang lain atau
skor yang didapat dari dua buah tes yang ssejajar hasilnya
relatif sama. Makna lain reliabilitas dalam pengertian
stabilitas adalah subjek yang dikenai pengukuran akan
menempati ranking yang relatif sama pada testing yang
terpisah dengan alat tes yang ekuivalen (Singh, 1986).
Contoh: Pak Iwan melaksanakan ujicoba tes Matematika
yang dikembangkannya pada 10 mahasiswa
semester tiga dengan cara membuat dua macam
bentuk soal yang setara (ekivalen). Soal bentuk
pertama diberikan pagi dan soal bentuk kedua
diberikan satu jam kemudian. Skor-skor bentuk
pertama dan bentuk kedua disajikan di bawah.

237 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Tentukan reliabilitas tes Matematika yang


dikembangkan Pak Iwan tersebut.

Ter Tes
Bentuk Bentuk
XY X2 Y2
Pertama Kedua
(X) (Y)
60 48 2880 3600 2304
84 82 6888 7056 6724
40 37 1480 1600 1369
65 72 4680 4225 5184
70 89 6230 4900 7921
33 40 1320 1089 1600
42 37 1554 1764 1369
50 60 3000 2500 3600
70 80 5600 4900 6400
90 74 6660 8100 6400
604 619 40292 39734 41947

( )( )
√* ( ) +* ( ) +

( )( ) ( )( )
√*( )( ) ( ) +*( )( ) ( ) +

( ) ( )
√*( ) ( )+ *( ) ( )+

= = 0,84
√( )( )

238 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Nilai rxy yang diperoleh adalah 0,84, yang


menunjukkan hubungan yang sedang. Karena itu, skor-
skor tes dalam kedua bentuk tes matematika adalah
reliabel.

3. Metode Belah Dua (Split-Half Methodl)


Metode belah dua dilakukan dengan cara
memberikan satu bentuk tes yang hanya diberikan sekali
kepada sekelompok subjek dengan tujuan untuk
menghindari kelemahan pada metode tes ulang dan
metode tes sejajar.
Metode belah dua dilakukan bila jumlah butir alat
ukur genap. Pembelahannya dapat dilakukan atas dasar
nomor butir butir ganjil – genap atau nomor butir awal –
akhir. Perhitungan r, menggunakan skor mentah untuk
mengestimasi hubungan butir-butir ganjil (belahan
pertama) dan butir-butir genap (belahan kedua),
digunakan rumus Pearson Product Moment .
Untuk estimasi koefisien reliabilitas belah dua
(Split-Half) ada tiga buah rumus atau formula yang dapat
digunakan, masing-masing yaitu ((1) formula Spearman-
Brown, (2) formula Rulon, dan (3) formula Flanagan.

1) Menggunakan Rumus Spearman-Brown:


Estimasi koefisien reliabilitasnya belah dua dengan
menggunakan rumus Spearman-Brown adalah sebagai
berikut (Streiner dan Norman, 2000):
= ( )

239 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dengan k adalah jumlah bagian (belahan) butir-


butir r adalah korelasi semula, yaitu korelasi antara skor
belahan 1 dan skor belahan 2
Bentuk khusus rumus Spearman-Brown ketika
diterapkan pada reliabilitas belah dua adalah sebagai
berikut (Pedhazur dan Schmelkin, 1991):

dengan adalah reliabilitas, dan adalah korelasi


diantara dua belahan
Langkah-langkah estimasi koefisien belah dua
Spearman-Brown adalah:
a. Membagi skor-skor siswa menjadi dua bagian,
misalnya satu bagian butir-butir yang bernomor
ganjil, dan satu bagian lagi butir-butir yang
bernomor genap
b. Menjumlahkan skor-skor dari butir-butir yang
bernomor ganjil yang dimiliki masing-masing
siswa
c. Menjumlahkan skor-skor dari butir-butir yang
bernomor genap yang dimiliki masing-masing
siswa
d. Menghitung koefisien korelasi menggunakan
rumus product-momen, diperoleh (korelasi
paruh antara belahan ganjil-genap)
( )( )
√* ( ) +* ( ) +

240 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

e. Menghitung (korelasi penuh) menggunakan


rumus Spearman -Brown

f. Menginterpretasi

Contoh: Ibu Dian membuat 10 butir tes Sains bagi


siswanya di kelas 3. Untuk menentukan
reliabilitas tesnya, ibu Dian menggunakan
metode belah dua Sperman-Brown. Skor-skor
siswa dari nomor butir ganjil dan nomor butir
genap disajikan di bawah. Berapa besar koefisien
reliabilitas tes yang dikembangkan bu Dian itu?.

Ganjil Genap
XY X2 Y2
(X) (Y)
5 5 25 25 25
4 3 12 16 9
5 4 20 25 16
3 2 6 9 4
3 3 9 9 9
4 0 0 16 0
4 3 12 16 9
3 5 15 9 25
∑X = 31 ∑Y= 25 ∑= 99 ∑ = 125 ∑ = 97

Dari Tabel diatas diketahui : N = 8; = 31; = 25;


= 99 , = 125 dan = 25,

241 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Subtitusikan nilai-nilai di atas ke dalam rumus


product moment

( )( )
√* ( ) +* ( ) +

( )( ) ( )( )
√*( )( ) ( ) +*( )( ) ( ) +

( ) ( )
√*( ) ( )+ *( ) ( )+

= = 0,221
√( )( )

Menggunakan rumus Spearman-Brown, reliabilitas


seluruh tes dihitung sebagai berikut:

( )
= 0,361

Koefisien reliabilitas diperoleh adalah sebesar


0,361. Ini berarti bahwa tes yang dikembangkan ibu Dian
itu tidak reliabel.

2) Menggunakan Rumus Rulon


Rumus lain untuk estimasi reliabilitas belah dua
adalah dikembangkan oleh Rulon (1939). Menurut Rulon

242 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

reliabilitas dapat dipandang dari adanya selisih skor yang


diperoleh pada belahan pertama dengan belahan kedua.
Selisih tersebut yang menjadi sumber variasi eror sehingga
bila dibandingkan dengan variasi skor akan dapat menjadi
dasar untuk melakukan estimasi reliabilitas tes. Rumus
Rulon adalah sebagai berikut:

dengan adalah koefisien reliabilitas


adalah varians perbedaan skor belahan
adalah varians skor total
1 adalah bilangan konstan
Untuk mencari (varians perbedaan skor belahan)
digunakan rumus:
( )
=
Untuk mencari (varians skor total) digunakan rumus:
( )
=
Langkah-langkah estimasi koefisien reliabilitas belah dua
menggunakan
Rumus Rulon adalah:
a. Membagi skor-skor siswa menjadi dua bagian,
misalnya satu bagian butir-butir yang nomor urut
ganjil, dan satu bagian lagi butir-butir yang nomor
urut genap
b. Menghitung perbedaan skor d = X – Y

243 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

c. Menjumlahkan d, sehingga diperoleh


d. Mengkuadratkan d dan menjumlahkannya, sehingga
diperoleh
e. Menghitung koefisien reliabilitas dengan rumus
Rulon yaitu:

f. Menginterpretasi

Contoh: Ibu Rini membuat 10 butir tes Sains bagi


siswanya di kelas 3. Untuk menentukan
reliabilitas tesnya, ibu Rini menggunakan metode
belah dua Rulon. Skor-skor siswa dari nomor
butir ganjil dan nomor butir genap disajikan di
bawah. Berapa koefisien reliabilitas tes yang
disusun oleh bu Rini tersebut?.

Ganjil Genap d
= X+Y
(X) (Y) (X-Y)
5 5 0 0 10 100
4 3 1 1 7 49
5 4 1 1 9 81
3 2 1 1 5 25
3 3 0 0 6 36
4 0 4 16 4 16
4 3 1 1 7 49
3 5 -2 4 8 64
∑X =31 ∑Y=25 ∑= 6 ∑= ∑= 56 ∑= 420
24

244 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Dari Tabel di aatas diketahui :

N = 8; = 31; =25, ∑d= 6,


∑d2 = 24, ∑X t= 56 dan ∑ = 420

Mencari varian perbedaan skor:

( ) ( )
= = = = 2,437

Mencari varian skor total:


( ) ( )
= = = = 3,50

=1- =1- 0,67 = 0, 329


Koefisien reliabilitas yang adalah diperoleh sebesar
0,329. Ini berarti bahwa tes yang dikembangkan ibu Rini
itu tidak reliabel.

3) Menggunakan Rumus Flanagan:


Selain metode Spearman-Brown dan Rulon, estimasi
reliabilitas belah dua juga dapat digunakan rumus
Flanagan, yaitu
 s2  s2 
r11  21  1 2 2 
 st 
Keterangan :
r11 = koefisien reliabilitas

245 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

s12 = varians skor butir belahan pertama


s22 = varians skor butir belahan kedua.
St2 = varians skor total

Untuk mencari (varians belahan pertama) digunakan


rumus:
( )
=
Untuk mencari (varians belahan kedua) digunakan
rumus:
( )
=
Untuk mencari (varians total) digunakan rumus:
( )
=
Langkah-langkah estimasi koefisien reliabilitas belah dua
menggunnakan
Rumus Flanagan adalah:
a. Membagi skor-skor siswa menjadi dua bagian,
misalnya satu bagian butir-butir yang nomor urut
ganjil, dan satu bagian lagi butir-butir yang nomor
urut genap
b. Menghitung (varians belahan pertama)
c. Menghitung (varians belahan kedua)
d. Menghitung (varians belahan total)
e. Menghitung koefisien reliabilitas dengan rumus
Flanagan yaitu:

246 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

= 2( )
f. Menginterpretasi

Contoh: Ibu Ayu membuat 10 butir tes IPA bagi siswanya


di kelas 3. Untuk menentukan reliabilitas tesnya,
ibu Ayu menggunakan metode belah dua
Flanagan. Skor-skor siswa dari nomor butir ganjil
dan nomor butir genap disajikan di bawah.
Berapa besar koefisien reliabilitas tes yang
disusun bu Ayu itu?.

Ganjil Genap =
(X1) (X2) X1+X2
5 5 25 25 10 100
4 3 16 9 7 49
5 4 25 16 9 81
3 2 9 4 5 25
3 3 9 9 6 36
4 0 16 0 4 16
4 3 16 9 7 49
3 5 9 25 8 64
∑X =31 ∑Y=25 ∑= ∑= 97 ∑= 56 ∑= 420
125

Dari Tabel di aatas diketahui :

N = 8; = 31; =25, ∑ = 125,


∑ = 97, ∑X t= 56 dan ∑ = 420

247 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Mencari varian belahan pertama:


( ) ( )
= = = = 0,609

Mencari varian belahan kedua:

( ) ( )
= = = = 2,359

Menc ri varians total:

( ) ( )
= = = = 3,50

Selanjutnya nilai-nilai varians dari kedua belahan dan nilai


varian total disubtitusikan ke dalam rumus Flanagan
diperoleh

= 2( ) = 2( ) =2(1-
)
= 2(0,152) = 0,304

Koefisien reliabilitas diperoleh sebesar 0,304. Ini


berarti bahwa tes yang dikembangkan ibu Ayu itu tidak
reliabel.

248 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

4. Metode Konsistensi Internal (Consistency Internal


Methodl)
Metode konsistensi internal atau kadang-kadang
disebut metode tes tunggal dilakukan dengan cara
memberikan satu bentuk tes yang hanya diberikan sekali
kepada sekelompok subjek. Untuk estimasi koefisien
reliabilitas metode konsistensi internal dapat digunakan
formula-formula Kuder-Richardson (KR-20 dan KR-21)
dan alpha Cronbach.

1) Rumus Kuder Richardson 20 (KR-20)


Untuk mengetahui koefisien reliabilitas tes atau alat
ukur yang yang mempunyai skor dikotomi (0,1)
seperti bentuk pilihan ganda digunakan rumus
Kuder Richadson 20 (KR-20) seperti berikut
(Wiersma dan Jurs, 1990):
= ( )
dengan: n adalah jumlah butir tes, p adalah proporsi
yang menjawab benar satu butir q adalah proporsi yang
menjawab salah satu butir, dan adalah varians skor
total.
Hasil perhitungan dengan rumus KR 20 lebih teliti,
tetapi perhitungan lebih rumit.
Langkah-langkah estimasi koefisien reliabilitas
menggunnakan rumus KR-20 adalah:
a. Mendistribusikan skor-skor dalam tabel kerja
b. Menghitung ∑ pq
c. Menghitung (varians total) dengan rumus:

249 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

( )
=
d. Menghitung koefisien reliabilitas dengan rumus KR-
20 yaitu:

= ( )

e. Menginterpretasi

Contoh:Ibu Eva membuat 10 butir tes pilihan ganda dalam


mata pelajaran Sains bagi siswanya di kelas 3.
Untuk menentukan reliabilitas tesnya, ibu Eva
menggunakan metode konsistensi internal dengan
rumus KR-20. Berapa besar koefisien reliabilitas
tes yang disusun bu Eva ?

250 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

R Butir
es 1 2 3 4 5 6 7 8 9 1 X X2
0
A 1 1 1 1 1 1 1 1 1 1 10 10
0
B 1 1 1 1 1 1 1 1 0 1 9 81
C 1 1 1 1 1 1 1 0 1 1 9 81
D 1 1 1 1 1 1 0 0 0 0 6 36
E 1 1 1 1 1 1 1 1 1 0 9 81
F 1 1 1 1 1 0 0 0 0 0 5 25
G 1 1 1 1 0 0 0 0 1 0 4 16
H 1 1 1 0 0 0 1 0 0 0 4 16
I 1 1 0 0 0 0 0 0 0 0 2 4
J 1 0 0 0 0 0 0 0 0 0 1 1
p 1 0, 0, 0, 0, 0, 0, 0, 0, 0, 59 44
9 8 7 6 5 3 3 4 3 1
q 0 0, 0, 0, 0, 0., 0, 0, 0, 0.
1 2 3 4 5 7 7 6 7
p 0 0, 0, 0, 0, 0, 0, 0, 0, 0, 1,
q 09 16 21 24 25 21 21 24 21 82

Dari Tabel di atas dapat diketahu:∑ pq = 1,82. ∑X =


59, ∑ = 441

Varian total menjadi:


( ) ( )
= = = = 9,25
Selanjutnya nilai-nila tersebut disubtitusika ke
dalam rumusKR-20

= ( )

251 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

= ( ) =( )(1 – 0,196) =
0,892
Koefisien reliabilitas yang diperoleh sebesar 0,802
termasuk dalam kategori tinggi

2) Rumus Kuder Richardson 21(KR-21)


Apabila Indeks Kesukaran Butir (IKB) bersifat
homogen, yang berarti bahwa p relatif konstan
untuk keseluruhan butir, maka indeks reliabilitas
tes dihitung dengan metode KR21. Rumusnya adalah
sebagai berikut (Wiersma dan Jurs, 1990):

( )
: = ( )

dengan n adalah jumlah butir pada tes


adalah skor rata-rata tes, dan
adalah varians skor total.

Rumus KR21 lebih sederhana dalam


perhitungannya. Kelemahannya adalah kurang teliti
dibandingkan dengan KR20.
Langkah-langkah estimasi koefisien reliabilitas
menggunnakan rumus KR-21 adalah:
a. Mendistribusikan skor-skor dalam tabel kerja
b. Menghitung (varians total) dengan rumus:
( )
=

252 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

c. Menghitung skor rata-rata tes ( )


d. Menghitung koefisien reliabilitas dengan rumus
KR-21 yaitu:

( )
= ( )
e. Menginterpretasi

Contoh:Ibu Eli membuat 10 butir tes pilihan ganda dalam


mata pelajaran Biologi bagi siswanya di kelas 3.
Untuk menentukan reliabilitas tesnya, ibu Eli
menggunakan metode konsistensi internal dengan
rumus KR-21. Tentukan koefisien reliabilitas tes
yang dikonstruksi ibu Eli tersebut?

Res Butir
X X2
1 2 3 4 5 6 7 8 9 10
A 1 1 1 1 1 1 1 1 1 1 10 100
B 1 1 1 1 1 1 1 1 0 1 9 81
C 1 1 1 1 1 1 1 0 1 1 9 81
D 1 1 1 1 1 1 0 0 0 0 6 36
E 1 1 1 1 1 1 1 1 1 0 9 81
F 1 1 1 1 1 0 0 0 0 0 5 25
G 1 1 1 1 0 0 0 0 1 0 4 16
H 1 1 1 0 0 0 1 0 0 0 4 16
I 1 1 0 0 0 0 0 0 0 0 2 4
J 1 0 0 0 0 0 0 0 0 0 1 1
10 9 8 7 6 5 3 3 4 3 59 441

253 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Menghitung vaarian total


( ) ( )
= = = = 9,25

= 59/10 = 5,9
Menghitung reliabilitas dengan rumus :

( )
= ( )= (
( )
)
( )

=( )( ) = 0,82
Koefisien reliabilitas yang diperoleh sebesar 0,82
termasuk dalam kategori tingi

3) Rumus Alpha (α)


Rumus alpha (α) Cronbach merupakan koefisien
konsistensi internal yang paling sering digunakan
untuk analisis reliabilitas. Alpha Cronbach dapat
digunakan untuk item-item dengan respons
kontinum. Bentuk rumus alpha Cronbach yaitu :

( )

dengan : n adalah jumlah butir,


adalah jumlah varian butir, dan
adalah varian dari skor total

254 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Pedhazur dan Schmelkin (1991) memperluas rumus


alpha khusus untuk skor dikotomi, yang bentuknya sebagai
beriku:

( )

dengan p adalah proporsi yang mempunyai skor 1, dan q =


1- p, yaitu proporsi yang mempunyai skor 0.
Langkah-langkah estimasi koefisien reliabilitas
menggunnakan rumus alpha Cronbach adalah:
a. Mendistribusikan skor-skor dalam tabel kerja
b. Menghitung (varians butir) dari setiap butir
dengan rumus:
( )
=
c. Menjumlahkan semua varian butir sehingga
diperoleh
d. Menghitung (varians total) dengan rumus:
( )
=
e. Menghitung koefisien reliabilitas dengan rumus
alpha Cronbach yaitu:
( )

f. Menginterpretasi
Contoh: Ibu Aini membuat 5 butir tes esei pelajaran
Bahasa Indonesia bagi siswanya di kelas 3. Untuk

255 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

menentukan reliabilitas tesnya, ibu Aini


menggunakan rumus alpha Cronbach. Skor-skor
siswa disajikan dalam Tabel di bawah. Tentukan
koefisien reliabilitas tes itu ?

Siswa Butir
1 2 3 4 5
A 15 20 17 18 20 90 8100
B 10 7 12 9 10 48 2304
C 5 7 5 8 5 30 900
D 20 20 17 20 18 95 9025
E 15 17 15 18 17 82 6724
F 7 8 7 5 9 36 1296
G 15 17 14 15 15 76 5776
H 20 19 17 20 17 93 8649
I 15 15 16 14 15 75 5625
J 4 3 4 4 3 18 324
∑ 643 48723
∑ 126 133 124 131 129
∑ 1890 2135 1778 2055 1967
Keterangan:
N = Jumlah responden (siswa)
a. Menghitung varians butir dengan rumus:

( )
=
( )
= = = 30,24

( )
= = = 36,61

256 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

( )
= = = 24,04

( )
= = = 30,29
( )
= = = 33,89
∑ =

∑ = 30,24 36,61

b. Menghitung varians total dengan rumus:

( )
=
( )
= = = 737,81

c. Menghitung reliabilitas dengan rumus alpha Cronbach:

( )

( ) = 0,99

257 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Dapat dilihat bahwa koefisien reliabilitas yang


diperoleh adalah 0,99, yang berada dalam kategori sangat
tinggi.

4) Rumus Hoyt
Selain metode atau rumus-rumus di atas, untuk
menghitung koefisien reliabilitas dapat juga diperoleh
dengan teknik analisis varian yang menggunakan rumus
Hoyt yang bentuknya sebagai berikut.

r = 1 --
dengan : MKbs = varians siswa
MKs = varians responden
r = reliabiltas tes
Langkah-langkah estimasi koefisien reliabilitas jika
menggunakan Rumus Hoyt adalah:
a. Membuat tabel penyebara skor-skor jawaban siswa
b. Menjumlahkan skor-skor butir tes yang betul, juga
menjumlahkan skor –skor tiap siswa ( ) sehingga
diperoleh ∑ ,
c. Mencari jumlah kuadrat total (J ) dengan rumus:
( )
J ) =∑ -
d. Hitung jumlah kuadrat antar butir ( ), dengan
rumus
( ) ( )

e. Hitung jumlah kuadrat antar siswa ( ) dengan
rumus:

258 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

( ) ( )
JKs = –
f. Hitung jumlah kuadrat antar responden-butir ( )

JKbs= JKt – JKb - JKs

g. Hitung rata-rata jumlah kuadrat antar butir (MKb)


dengan rumus:
MKb =
h. Hitung rata-rata jumlah kuadrat antar responden
( ), dengan rumus:
=
i. Hitung rata-rata jumlah kuadrat antar butir-
responden ( )
M =
j. Menghitung ( ) menggunakan rumus
Hoyt, yaitu
r =
k. Menginterpretasi r

Contoh: Pak Fendi membuat 10 butir tes pilihan ganda dalam


mata pelajaran fisika bagi 10 orang siswanya. Untuk
menentukan reliabilitas tesnya, pak Fendi
menggunakan rumus Hoyt. Tentukan reliabilitas
tesnya.

259 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Res Butir
Xt
1 2 3 4 5 6 7 8 9 10
A 1 1 1 1 1 1 1 1 1 1 10 100
B 1 1 1 1 1 1 1 1 0 1 9 81
C 1 1 1 1 1 1 1 0 1 1 9 81
D 1 1 1 1 1 1 0 0 0 0 6 36
E 1 1 1 1 1 1 1 1 1 0 9 81
F 1 1 1 1 1 0 0 0 0 0 5 25
G 1 1 1 1 0 0 0 0 0 0 4 16
H 1 1 1 0 0 0 1 0 0 0 4 16
I 1 1 0 0 0 0 0 0 0 0 2 4
J 1 0 0 0 0 0 0 0 0 0 1 1
B 10 9 8 7 6 5 5 3 3 3 59 441

Dari tabel di atas dapat diketahui:


∑X =59, ∑ = 441, ∑ = 10, ∑ = 9, ∑ = 8, ∑ = 7,
∑ = 6,
∑ = 5, ∑ = 3,∑ = 3, ∑ = 4, ∑ = 3,
N = 100 yaitu: 10 (banyaknya siswa) x 10 (banyaknya
butir)

Menghitung jumlah kuadrat total (J ))


( ) ( )
J ) = - = 59 = 59- = 24,19

Menghitung jumlah kuadrat antar butir ( )

( ) ( )

=( + + + + + + + + + )-
( )

260 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

= 10 + 8,1 +6,4 + 4,9 + 3,6 + 2,5 + 2,5 + 0,9 +1,6 + 0,9 –


34,81

= 41,1 – 34,81 = 6,29

Menghitung jumlah kuadrat antar siswa ( )

( ) ( )
JKs = –

=( + + + + + + + + + )-
( )

= (10 +8,1 + 8,1 + 3,6 +8,1 +2,5+ 1,6 +1,6 +0,4 + 0,10) -
- 34,81
= 44,1 – 34,81 = 9,29

Menghitung jumlah kuadrat antar responden-butir ( )

JKbs= JKt – JKb - JKs


JKbs = 24,19 – 6,29 – 9,29
JKbs = 8,61

Menghitung rata-rata jumlah kuadrat antar butir (MKb)

MKb = = 0,698

261 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Menghitung rata-rata jumlah kuadrat antar responden


( )

= = = = 1,03
Menghitung rata-rata jumlah kuadrat antar butir-
responden ( )

M = = -= = = 0,106
( )( )

Mensubtitusikan data tersebut di atas ke dalam rumus


Hoyt

r = = 1 -- = 0,897

Dapat dilihat bahwa koefisien reliabilitas yang diperoleh


adalah 0,897, yang berada dalam kategori sangat tinggi.

Tabel 11.2 Hasil Perhitungan Reliabilitas Analisis Varians


Koefisien
SumberVarians JK db MK
Reliabilitas
Butir 6,29 10 – 1
=9
0,698
Responden 9,29 10 – 1 =
=9 0,807
1,03
Keliru (Butir- 8,61 9 x 9 =
Responden) = 81
0,106

262 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Ringkasan dari jenis-jenis reliabilitas dan cara


mengestimasinya dapat dilihat dalam Tabel 11.2 berikut.

Tabel 11.2 Metode Estimasi Reliabilitas


Bentuk Cara estimasi
Reliabilitas
1.Tes Ulang  memberikan tes yang sama sebanyak
(stabilitas) dua kali kepada peserta tes yang
• Product moment sama dalam waktu yang berbeda,
dan korelasional skor-skornya dikorelasikan untuk
mencari koefisien reliabilitas
2. Paralel  memberikan dua tes yang sama
(ekuivalen) kepada peserta tes yang sama
• Product moment dalam waktu yang relatif sama,
dan korelasi kedua skor dikorelasikan untuk
mencari koefisien reliabilitas
Intrakelas
3. Split-half  memberikan satu kali tes lalu dibelah
methods dua, kemudian mengkorelasikan
(metode belah kedua belahan dengan rumus
dua) korelasi product moment,
• Persamaan split-
half Spearman
Brown Rumus
Flanagan
Rumus Rulon
3.Internal  Berikan sekali tes, kemudian
consistency menggunakan rumus KR-20
• Kuder  Berikan sekali tes, kemudian
Richardson(KR- menggunakan rumus KR-21
20)  Berikan sekali tes, kemudian
menggunakan rumus
• Kuder

263 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Richardson(KR- alpha Cronbach


21)
• Koefisien alpha
Cronbach
• Rumus Hoyt  Berikan sekali tes, kemudian
menggunakan rumus Hoyt

D. Kesalahan Pengukuran Standar


Kesalahan Pengukuran Standar (Standard Error of
Measurement, atau SEM) adalah ukuran yang
mencerminkan tidak akuratnya skor dari tes yang
digunakan untuk mengukur (Purwanto, 2009). Semakin
tinggi koefisien reliabilitas maka semakin akurat dan
makin rendah kesalahan standar pengukuran. Sebaliknya,
semakin rendah koefisien reliabilitas maka makin tinggi
kesalahan standar pengukuran dan makin tidak cermatnya
pengukuran menggunakan tes. Dalam pengumpulan data
hasil belajar di mana skor-skor akan dibandingkan secara
individual sangat penting untuk memperhitungkan
kesalahan standar pengukuran.
Kesalahan standar pengukuran dihitung menggunakan
rumus sebagai berikut :
SEM = SD √
di mana :
SEM = standard error of measurement
SD = standar diviasi
r = koefisien reliabilitas.

Misalnya, Rossa seorang siswa memperoleh skor 50


pada suatu Tes yang mempunyai koefisien reliabilitas

264 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

sebesar 0,977 yang diperoleh dari kelompok siswa yang


mempunyai standar deviasi 13,51. Bila taraf kepercayaan
yang ditentukan 90 % (atau taraf signifikansi p = 0,10),
berapakah interval kepercayaan terhadap skor murni
Rossa ?
Menggunakan rumus kesalahan standar pengukuran
(SEM) di atas, maka

SEM = SD √ = 13,5 √ = 2,049

Jika koefisien reliabilitasnya rendah, misalnya r = 0,64,


maka
SEM = SD √ = 13,5 √ = 8,1, artinya kesalahan
standar menjad besar.

E. Faktor-Faktor yang mempengaruhi


Reliabiltas
1. Panjang tes
Secara umum semakin panjang suatu tes maka akan
semakin tinggi pula reliabilitas tes tersebut. Panjang atau
pendeknya suatu tes ditunjukkan oleh banyak atau
sedikitnya jumlah butir. Alasannya, berdasarkan fakta
bahwa tes yang panjang atau butir-butir tes yang banyak
akan memberikan sampel soal yang mencukupi terhadap
perilaku yang diukur. Selain itu, tes yang panjang,
cenderung untuk mengurangi pengaruh terkaan.

265 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Untuk menghitung besarnya reliabilitas tes setelah


ada penambahan banyak butir soal dapat digunakan rumus
Spearman-Brown berikut :
= ( )
dimana:
rn = besarnya koefisien reliabilitas sesudah tes tersebut
ditambah butir soal baru.
n = berapa kali butir-butir soal tersebut ditambah.
r1 = besarnya koefisien reliabilitas sebelum butir-butir soal
ditambah
Sebagai contoh, suatu tes yang mempunyai 20 butir
dan koefisien reliabilitasnya (r 1) sebesar 0,6. Berapakah
koefisien reliabilitasnya (r 2) tes ini jika jumlah butirnya
diperbanyak menjadi 40 ?.
Tes yang mempunyai 40 butir artinya tes ini
ditambah butirnya menjadi 2 kali jumlah butir dari
sebelumnya, yaitu 20 butir.
Menggunakan rumus Spearman-Brown di atas
maka:

r2 = ( )

r2 = = 0,75
Kalau tes tersebut ditambah lagi butirnya menjadi 3
kali lipat dari semula, maka koefisien reliabilitasnya
menjadi:

266 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

r3 =
( )

r3 = = 0,87

2. Penyebaran skor
Koefisien reliabilitas secara langsung dipengaruhi
oleh penyebaran skor dalam kelompok yang diukur.
Semakin besar penyebaran skor maka semakin besar pula
koefisien reliabilitas yang diperoleh.

3. Objektivitas
Objektivitas sebuah alat ukur menyatakan derajad
untuk pemberi skor kompeten yang sama mendapatkan
hasil yang sama. Skor butir-butir tes objektif seperti
pilihan ganda, skor yang dihasilkan tidak dipengaruhi oleh
keputusan dan pendapat pemberi skor. Semakin tinggi
tingkat objektivitas tes semakin tinggi pula tingkat
reliabilitasnya.

4. Metode estimasi reliabilitas


Secara umum, besarnya koefisien reliabilitas
berkaitan erat dengan metode yang digunakan untuk
estimasi reliabilitas. Misalnya, mengestimasi koefeisien
reliabillitas menggunakan metode tes ulang (Test Retest
Method): mungkin hasilnya lebih besar dibandingkan
dengan metode belah dua jika interval waktunya pendek.

F. Hubungan Antara Reliabilitas dan Validitas

267 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Menurut Anderson (1981) persyaratan bagi suatu


tes adalah validitas dan reliabilitas, dalam hal ini validitas
lebih penting dan reliabilitas ini perlu karena menyokong
terbentuknya validitas. Sebuah tes mungkin reliabel tetapi
tidak valid. Sedangkan sebuah tes yang valid biasanya
reliabel

Gambar: Hubungan antara validitas dan reliabilitas

Keterangan:
 Gambar a) hasil tembakan yang valid dan reliabel,
karena hasilnya tepat pada sasaran dan masih
dalam luasan konsisten
 Gambar b) hasil tembakan yang tidak valid dan
tidak reliabel, karena sasaran gerak labil dan merata
ke semua luasan target
 Gambar c) hasil tembakan yang reliabel tetapi tidak
valid karena hasil tembakan pada luasan konsisten
di luar ketepatan target yang telah ditetapkan.

268 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 12
ANALISIS BUTIR TES
A.Pengertian Analisis Butir Tes
Analisis butir soal didefinisikan sebagai suatu
proses sistematik untuk mengkaji kualitas butir-butir soal
tes terutama tes obyektif. Analisis butir es adalah salah
satu kegiatan yang perlu dilakukan dalam rangka
meningkatkan mutu suatu tes, khususnya mutu tiap butir
soal yang menjadi bagian dari tes itu. Kegiatan
menganalisis butir soal merupakan suatu kegiatan yang
harus dilakukan guru untuk meningkatkan mutu soal yang
telah ditulis. Tujuannya adalah untuk mengkaji dan

269 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

menelaah setiap butir soal agar diperoleh soal yang


bermutu sebelum soal digunakan. Soal yang bermutu
adalah soal yang dapat memberikan informasi setepat-
tepatnya sesuai dengan tujuannya di antaranya dapat
menentukan peserta didik mana yang sudah atau belum
menguasai materi yang diajarkan guru.

B. Manfaat Analisis ButirTes


Anastasi dan Urbina (1997) mengemukakan bahwa
manfaat dilakukannya analisis butir antara lain adalah: (1)
dapat membantu para pengguna tes dalam evaluasi atas tes
yang digunakan, (2) sangat relevan bagi penyusunan tes
informal dan lokal seperti tes yang disiapkan guru untuk
siswa di kelas, (3) mendukung penulisan butir soal yang
efektif, (4) secara materi dapat memperbaiki tes di kelas,
dan (5) dapat meningkatkan validitas soal dan reliabilitas
Linn dan Gronlund (1995) menyatakan bahwa
pelaksanaan kegiatan analisis butir soal didesain untuk
menjawab pertanyaan-pertanyaan sebagai berikut.
1) Apakah fungsi soal sudah tepat?
2) Apakah soal ini memiliki tingkat kesukaran yang
tepat?
3) Apakah soal bebas dari hal-hal yang tidak relevan?
4) Apakah pilihan jawabannya efektif?

Analisis pada umumnya dilakukan melalui dua cara


yaitu (1) analisis butir soal tes secara kualitatif dan (2)
analisis butir soal tes secara kuantitatif. Dalam analisis
butir soal secara kualitatif, aspek yang diperhatikan adalah

270 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

setiap soal ditelaah dari segi materi, konstruksi, bahasa,


dan kunci jawaban/pedoman penskorannya. Analisis
kualitatif sering pula dinamakan sebagai analisis teoritik
yang dilakukan sebelum soal digunakan untuk melihat
berfungsi tidaknya sebuah soal. Sedangkan analiis butir
soal secara kuantitatif adalah penelaahan butir soal
didasarkan pada data empirik dari butir soal yang
bersangkutan. Data empirik ini diperoleh dari soal yang
telah diujikan. Analisis secara teoritis adalah telaah soal
yang difokuskan pada aspek materi, konstruksi, dan
bahasa. Aspek materi berkaitan dengan substansi keilmuan
yang ditanyakan serta tingkat berpikir yang terlibat, aspek
konstruksi berkaitan dengan teknik penulisan soal, dan
aspek bahasa berkaitan dengan kekomunikatifan
/kejelasan hal yang ditanyakan (Mardapi, 2004).

1. Analisis Butir Tes Secara Kualitatif

Analisis soal secara teoritik atau analisis kualitatif


dilakukan sebelum diadakan ujicoba, yakni dengan cara
mencermati butir. Telaah soal atau penilaian butir soal
secara kualitatif merupakan analisis teoritis. Menurut
Kartowagiran (2011), dalam analisis soal tes secara teoritik
yang dikaji adalah kesesuaian antara butir-butir soal
dengan tujuan atau indikator dan apakah soal tes sudah
memenuhi validitas isinya. Soal tes juga dicermati
penggunaan bahasa, kejelasan dan kesingkatannya, juga
dilihat kejelasan dan kefungsian tabel dan atau gambar.
Pilihan jawaban juga dicermati homogenitas dan
kejelasannya.

271 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Caranya adalah kepada beberapa penelaah


diberikan: butir-butir soal yang akan ditelaah, format
penelaahan, dan pedoman penilaian/penelaahannya.

2. Analisis Butir Tes Secara Kuantitatif

Ada dua pendekatan dalam analisis secara


kuantitatif, yaitu pendekatan secara klasik dan modern.
Analisis butir soal secara klasik adalah proses
penelaahan butir soal melalui informasi dari jawaban
peserta didik guna meningkatkan mutu butir soal yang
bersangkutan dengan menggunakan teori tes klasik.
Analisis butir soal secara modern yaitu penelaahan butir
soal dengan menggunakan Item Response Theory (IRT) atau
teori jawaban butir soal. Teori ini merupakan suatu teori
yang menggunakan fungsi matematika untuk
menghubungkan antara peluang menjawab benar suatu
scal dengan kemampuan siswa.
Dalam buku ini yang dibahas adalah analisis butir
menggunakan teori tes klasik. Kualitas butir dalam analisis
butir soal secara teori tes klasik adalah setiap butir soal
direpresentasi oleh tingkat kesukaran butir, daya beda
butir, dan khusus untuk tes pilihan ganda adalah
keefektifan pengecoh (Mehrens & Lehmann, 1984) Ketiga
tahapan tersebut diuraikan sebagai berikut

a. Tingkat Kesukaran
Tingkat kesukaran soal adalah peluang untuk
menjawab benar suatu soal pada tingkat kemampuan

272 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

tertentu yang biasanya dinyatakan dalam bentuk indeks.


Indeks tingkat kesukaran merupakan rasio antara
penjawab item dengan benar dan banyaknya penjawab
butir (Gronlund, 1982). Indeks tingkat kesukaran ini pada
umumnya dinyatakan dalam bentuk proporsi yang
besarnya berkisar 0,00 - 1,00 (Aiken, 1994). Semakin besar
indeks tingkat kesukaran yang diperoleh dari hasil
hitungan, berarti semakin mudah soal itu. Soal dengan
indeks kesukaran 0,00 menunjukkan soal tersebut terlalu
sukar, sebaliknya soal dengan indeks kesukaran 1,00
menunjukkan soal tersebut terlalu mudah. Allen dan Yen
(1979) menyatakan bahwa secara umum indeks kesukaran
suatu butir sebaiknya terletak pada interval 0,3 – 0,7. Pada
interval ini, informasi tentang kemampuan siswa akan
diperoleh secara maksimal. Sedangkan Thomas dan
Dawson (1972) menjelaskan bahwa butir soal yang
memiliki tingkat kesukaran 0,25 - 0,75 sudah dikatakan
baik.
Rumus yang dipergunakan untuk soal obyektif
menurut Nitko (1996). adalah

p =
dengan :
p = Proporsi menjawab benar atau Indeks tingkat
kesukaran
∑ B = banyaknya peserta tes yang menjawab benar.
N = jumlah peserta tes yang menjawab.

273 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Cara lain menghitung indek kesukaran butir adalah


dengan menggunakan rumus berikut (Gronlund, 1982).
p = x 100 %
dengan P = Indeks kesukaran butir, R = jumlah jawaban
butir yang betul, dan T = jumlah total butir yang di tes.
Sebagai contoh: Misalkan hanya 30 dari 50 orang
siswa dapat menjawab soal dengan betul, maka indeks
kesukaran soal tersebut adalah:
p= x 100 = 60 %
Untuk mengetahui tingkat kesukaran soal bentuk
uraian digunakan rumus (Depdiknas, 2008) berikut ini.

TingkatKesukaran =

Mean =

Butir soal yang terlalu sukar sehingga hampir tidak


terjawab oleh semua siswa atau terlalu mudah sehingga
dapat dijawab oleh hampir semua siswa, sebaiknya
dibuang karena tidak bermanfaat. Biasanya indeks
kesukaran (p) diklasifikasikan menurut Asaad & Hailaya
(2004) menjadi sebagai berikut :

274 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Tabel I. Indeks Kesukaran Butir


Jarak Indeks Tingkat Kesukaran
0,00 – 0,20 Terlalu sukar
0,21 - 0,40 Sukar
0,41 – 0,60 Sedang
0,61 – 0,80 Mudah
0,81 – 1,00 Terlalui mudah

Tingkat kesukaran butir soal sangat penting karena


dapat: (1) mempengaruhi karakteristik distribusi skor
(mempengaruhi bentuk dan penyebaran skor tes atau
jumlah soal dan korelasi antar soal), (2) berhubungan
dengan reliabilitas.

b.Daya Pembeda (D)


Daya pembeda soal adalah kemampuan suatu butir
soal dapat membedakan antara siswa yang telah
menguasai materi yang ditanyakan dan siswa yang
tidak/kurang/belum menguasai materi yang ditanyakan.
Atau dengan kata lain, merupakan indeks perbedaan
antara kelompok berkemampuan tinggi dengan
berkemampuan rendah.
Indeks daya pembeda setiap butir soal biasanya
juga dinyatakan dalam bentuk proporsi. Semakin tinggi
indeks daya pembeda soal berarti semakin mampu soal
yang bersangkutan membedakan siswa yang telah
memahami materi dengan siswa yang belum memahami
materi. Indeks daya pembeda berkisar antara -1,00 sampai
dengan +1,00. Semakin tinggi daya pembeda suatu soal,
maka semakin kuat/baik soal itu. Jika daya pembeda

275 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

negatif (< 0) berarti lebih banyak kelompok bawah (siswa


yang tidak memahami materi) menjawab benar soal
dibanding dengan kelompok atas (siswa yang memahami
materi yang diajarkan guru). Butir soal yang daya
pembedanya rendah, tidak ada manfaatnya, malahan dapat
merugikan siswa yang belajar sunguh- sungguh. Karena
indeks daya pembeda suatu butir yang kecil nilainya akan
menyebabkan butir tersebut tidak dapat membedakan
siswa yang kemampuannya tinggi dan siswa yang
kemampuannya rendah
Daya pembeda butir soal bentuk pilihan ganda
adalah dengan menggunakan rumus berikut (Gronlund dan
Linn, 1995).

D =

dengan
D = indeks Diskriminasi
= jumlah jawaban benar kelompok atas
= jumlah jawaban benar kelompok bawah
T=: jumlah siswa kelompok atas atau bawah

Rumus di atas adalah identik dengan rumus Depdiknas


(2008).

( )
D= atau D = atau D =

276 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Karena P = , maka dapat rumus daya beda dapat ditulis


dalam bentuk:
D = PA - PB
dengan
D = daya pembeda soal
BA = jumlah jawaban benar pada kelompok atas
BB = jumlah jawaban benar pada kelompok
bawah
N = jumlah siswa yang mengerjakan tes

2. Langkah-Langkah Menghitung Daya Pembeda

1. Susunlah urutan peserta berdasarkan skor yang


diperolehnya, mulai skor tertinggi sampai skor
terendah
2. Bagilah peserta tes tersebut menjadi 2 (dua)
kelompok yaitu :
* Kelompok A: 27% sebagai kelompok atas
* Kelompok B: 27% sebagai kelompok bawah

3. Hitung jumlah kelompok atas yang menjawab benar


terhadap butir soal yang yang akan dihitung daya
bedanya ( )
4. Hitung jumlah kelompok bawah yang menjawab
benar terhadap butir soal yang yang akan dihitung
daya bedanya ( )
5. Hitung proporsi peserta yang menjawab benar
terhadap butir soal tersebut untuk kelompok atas
dan kelompok bawah

277 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

6. Menghitung Indeks Daya Pembeda menggunakan


rumus di atas

Menurut Glass and Stanley (1970) selain rumus di


atas, untuk mengetahui daya pembeda soal tes bentuk
pilihan ganda dapat juga digunakan rumus korelasi point
biserial (r pbis) seperti berikut.


keterangan
Xb = rata-rata skor siswa yang menjawab benar
Xs = rata-rata skor siswa yang menjawab salah
SD = simpangan baku skor total
p = adalah proporsi jawaban benar terhadap
semua jawaban siswa, q = I –p

Contoh:
Hasil uji coba 10 butir soal pilihan ganda pada 10
orang siswa, adalah sebagai berikut:
Nomor Butir
N
Total

Siswa 1 2 3 4 5 6 7 8 9 1
skor

o
0
1 A 1 1 1 1 1 1 0 1 1 0 8
2 B 1 1 1 1 1 1 1 0 1 0 8
3 C 1 1 0 1 1 1 0 1 1 0 7
4 D 1 1 1 1 1 0 1 0 1 0 7
5 E 1 1 1 1 1 0 0 1 1 0 7
6 F 1 0 1 0 0 1 1 0 0 1 5
7 G 1 1 0 0 1 1 0 1 0 1 6
8 H 0 0 1 1 1 0 1 0 0 1 5
9 I 0 1 1 1 0 0 0 1 0 1 5

278 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

1 J 1 0 1 0 0 0 1 0 0 1 4
0
∑X 8 7 8 7 7 5 5 5 5 5 62
P

0,8

0,7

0,8

0,7

0,7

0,5

0,5

0,5

0,5

0,5
Q
0,2

0,3

0,2

0,3

0,3

0,5

0,5

0,5

0,5

0,5
Ingin dihitung daya beda butir 1, Maka langkah
perhitungannya adalah sebagai berikut:

(1) Menentukan proporsi menjawab benar (p)


dengan rumus
p = ∑ X/N = 8/10 = 0,8
(2) Menentukan nilai q, dengan rumus:
q = 1- p
q = 1-0,8 = 0,2
(3) Menentukan rata-rata skor total dengan
rumus
Mt = (62)/10 = 6,2
(4) Menentukan rata-rata skor siswa yang
menjawab benar, yaitu 8 orang (kecuali H
dan I)
Mp = (8 + 6 +7 + 7 + 7 + 5 + 6 + 4)/8 = 6,50
(5) Menentukan standar deviasi dengan rumus
( ) ( )
SD = √ ( )
=√ =
( )

√ =√ = 1,398

279 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

∑ = +
+
∑ = 402

(6) Menentukan korelasi dengan persamaan

√ =
√ = 0,496
Angka 0,496 itu disebut indeks diskriminasi
(Suryabrata, 2000), yang menunjukkan derajat kecermatan
soal tersebut dalam membedakan siswa yang tinggi
kemampuannya dari siswa yang rendah kemampuannya.
Demikian dengan cara yang sama, maka indeks
diskriminasi butir-butir 2, 3, 4, 5, 6, 7, 8, 9, 10 dapat
dihitung.
Untuk mengetahui daya pembeda soal bentuk
uraian adalah dengan menggunakan rumus (Tim
Puspendik, 2008) berikut ini.
D=
keterangan
D = daya pembeda soal uraian
Mean A = rata-rata skor siswa pada kelompok atas
Mean B = rata-rata skor siswa pada kelompok bawah
Skor Maks = skor maksmum yang ada pada pedoman
penskoran

280 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Adapun klasifikasi indeks daya pembeda adalah


seperti Tabel 2 berikut ini (Asaad & Hailaya, 2004).

Tabel 2. Indek Diskriminasi Butir


Jarak Indeks Tingkat Pembeda
Di bawah 0,10 Butir diragukan
0,11 – 0,20 Tidak membeda
0,21 – 0,30 Sedang
0,31 – 0,40 Membeda
0,41 – 1,00 Sangat membeda

Menurut Ebel & Frisbie (1991), pada analisis butir


tes dengan Content‐Referenced Measures, indeks daya
diskriminasi (pembeda) butir tidak terlalu perlu menjadi
perhatian, asalkan tidak negatif

c. Analisis distraktor (pengecoh)


Selain menghitung indeks kesukaran dan daya
pembeda dalam analisis butir soal pilihan ganda juga perlu
diketahui apakah distraktor atau pengecoh yang
disediakan itu tepat atau tidak. Pada soal tes bentuk pilihan
ganda, Option atau pilihan itu jumlahnya berkisar antara 3
sampai dengan 5 buah, dan dari kemungkinan‐
kemungkinan jawaban yang terpasang pada setiap butir
itu, salah satu adalah merupakan jawaban betul (kunci
jawaban), sedangkan sisanya adalah merupakan jawaban
salah yang biasa dikenal dengan istilah distractor
(pengecoh). Menurut Muhson,dkk (2012) menganalisis
fungsi distraktor sering dikenal dengan istilah lain, yaitu:
menganalisis pola penyebaran jawaban item. Suatu

281 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

kemungkinan dapat terjadi, bahwa dari keseluruhan


alternatif yang ditetapkan pada butir tertentu, sama sekali
tidak dipilih oleh peserta tes. Artinya peserta tes
membiarkan kosong “blangko”. Pernyataan blangko ini
sering dikenal dengan istilah omiet dan biasa diberi
lambang dengan huruf O.
Distraktor dinyatakan telah dapat menjalankan
fungsinya dengan baik apabila distraktor tersebut
sekurang‐kurangnya sudah dipilih oleh 5 % dari seluruh
peserta tes. Menurut Fernandes (1984) distraktor
dikatakan baik apabila paling tidak dipilih oleh 2 % dari
seluruh peserta. Nitko (1996) menyatakan bahwa
distraktor atau pengecoh dikatakan berfungsi apabila
paling tidak dipilih oleh seorang peserta tes dari kelompok
rendah.
Untuk mengetahui berfungsi tidaknya sebuah
pengecoh dapat digunakan rumus:

%= x 100 %

Pertimbangan terhadap analisis pengecoh:


a. Diterima, karena sudah baik
b. Ditolak, karena tidak baik
c. Ditulis kembali, karena kurang baik

282 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh:
Pilihan
A B C D E O jumlah
Jawaban
Kelompok
5 7 15 3 3 0 33
Atas
Kelompok
8 8 6 5 7 3 37
Bawah
Jumlah
13 15 21 8 10 3 70

O = Omitted (tidak menjawab), C* = kunci jawaban


Pengecoh
A : 13/70 x 100% > 5% , berfungsi
B : 15/70 x 100% > 5% , berfungsi
D : 8/70 x 100% > 5% , berfungsi
E : 10/70 x 100% > 5% . berfungsi
Menurut Arifin (2009), untuk menentukan indek
pengecoh dapat juga dengan cara menggunakan rumus

IP = ( ) ( )
x 100 %
Keterangan:
IP = Indek pengecoh
P = jumlah siswa yang memilih pengecoh
N = jumlah siswa yang ikut tes
B = jumlah siswa yang menjawab betul pada setiap soal
n = jumlah alternatif jawaban

Adapun cara menafsirkan indeks pengecoh tersebut


(Arifin, 2009) yaitu:
Sangat Baik IP = 76 % - 125 %

283 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Baik IP = 51 % - 75 % atau 126 % - 150 %


Jurang Baik IP = 26 % - 50 % atau 151 % -175 %
Jelek IP = 0 % - 25 % atau 176 % - 200 %
Sangat Jelek IP = lebih dari 200 %n

Cara lain untuk menentukan indeks pengecoh


adalah dengan menggunakan rumus

Ip = Np ( )

Keterangan:
Np = jumlah siswa yang memilih pengecoh
N = banyak option (pilihan)
N = jumlah siswa yang ikut tes
NB = jumlah siswa yang menjawab benar butir soal yang
bersangkutan
Untuk menafsirkannya adalah berdasarkan ketentuan
berikut.
Kriteria:
> 200% : sangat buruk
0 – 25% atau 176-200% : buruk
26%-50% atau 151-175% : kurang baik
51%-75% atau 126-150% : baik
76%-125% : sangat baik

3. Analisis soal acuan patokan


Tingkat kesukaran soal tes acuan patokan
didasarkan atas berapa jauh tingkat prestasi belajar yang
akan diukur. Apabila tingkat prestasi belajar yang harus

284 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dicapai siswa tinggi, soal tes disusun dengan tingkat


kesukaran yang tinggi pula. Daya beda soal pada acuan
patokan tidak diperlukan, karena tes acuan patokan bukan
untuk menentukan perbedaan siswa atas dasar prestasi
belajarnya, tetapi untuk menentukan berapa persen
mereka telah menguasai pelajaran yang telah diberikan.
Yang dianalisis pada tes acuan patokan adalah
mengukur efektivitas pengajaran, yaitu apakah pengajaran
yang diberikan betul-betul efektif,atau sudah berapa
persen siswa telah menguasai bahan pelajaran yang
diberikan? Jadi, yang dianalisis pada tes acuan patokan
adalah membandingkan hasil pengukuran antara pretes
dan postes, yang disebut sebagai Indeks Efektivitas
Pengajaran (Sensitivity to Instructional Effect)
Untuk mengukur Indeks Efektivitas Pengajaran
digunakan rumus berikut:
E=

dimana : E = indeks efektivitas pengajaran


Ba = jumlah siswa yang menjawab betul sesudah menerima
pengajaran
Bb = jumlah siswa yang menjawab betul sebelum
menerima pengajaran T = Total jumlah seluruh
peserta tes
Satu contoh analisis efektivitas pengajaran adalah sebagai
berikut;

285 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Soal 1 2 3 4 5
Pretes P PT PR PT PR PT PR PT PR PT
(PR) R
Postes
(PT)
1. A - + + + - - + - - +
2. B - + + + - - + - + +
3. C - + + + - - + - - +
4. D - + + + - - + - - +
5. E - + + + - - + - + +
6. F - + + + - - + - - -
Adopsi dari Joesmani, 1988-

+ = jawaban betul,
- = jawaban salah
Kesimpulan analisinya:
Soal 1 :adalah soal yang ideal, sebelum diajar semua siswa
menjawab salah, tetapi setelah diajar semua siswa
menjawab betul
Indeks Efektivitas Pengajaran adalah:

E= = 100

Soal 2: adalah terlalu mudah untuk mengukur hasil


pengajaran, karena sebelum dan sesudah diajar siswa telah
memberi jawaban betul
Indeks Efektivitas Pengajaran adalah:

E= = 0,00

Soal 3 :adalah terlalu sukar dan tidak berhasil mengukur


pengajaran, seakan-akan pengajaran yang telah diberikan

286 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

tidak ada gunanya, sebab sebelum diajarkan jawaban


semua siswa salah, demikiasn pula sesudah diajar.

Indeks Efektivitas Pengajaran adalah:

E= = 0, 00

Soal 4: adalah soal yang salah atau pengajaran yang salah,


sebab sebelum diajar semua siswa telah memberi jawaban
betul,tetapi setelah diajar semua siswa menjawab salah

Indeks Efektivitas Pengajaran adalah:

E= = -1, 00

Soal 5 :adalah soal yang efektif, sebab proposisi siswa yang


memberi jawaban betul pada postes lebih banyak daripada
sebelum pretes

Indeks Efektivitas Pengajaran adalah: E = = 0,50

287 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

288 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

UNIT V
PENYUSUNAN SOAL DAN
PENSKORAN
Keberhasilan pengukuran hasil belajar bukan pada bentuk
/tipe soal, tetapi pada mutu soal; Tes baru akan berarti bila
terdiri dari butir soal yang menguji tujuan yang penting
dan mewakili ranah yang diperlukan; Penyusunan soal
perlu pengetahuan dasar dan latihan; Tes harus
direncanakan dan dipertanggungjawabkan, karena itu
penyusunan soal sagat perlu dan penting dilakukan.

Setelah kita melakukan kegiatan tes terhadap siswa,


kegiatan berikutnya adalah memberikan skor pada setiap
lembar jawaban siswa. Kegiatan ini harus dilakukan
dengan cermat karena menjadi dasar bagi kegiatan

289 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

pengolahan hasil tes sampai menjadi nilai prestasi.


Sebelum melakukan tes, sebaiknya kita sudah menyusun
teknik pemberian skor (penskoran). Bahkan sebaiknya kita
sudah berpikir strategi pemberian skor sejak perumusan
kalimat pada setiap butir soal. Pada Bab berikut ini akan
disajikan pemberian skor pada tes domain kognitif.
Membuat pedoman penskoran sangat diperlukan, terutama
untuk soal bentuk uraian dalam tes domain kognitif supaya
subjektivitas kita dalam memberikan skor dapat diperkecil.
Salah satu aspek yang mempengaruhi keakuratan dan
keadilan hasil penilaian adalah ketepatan guru dalam
mengoreksi hasil jawaban siswa. Koreksi yang dilakukan
tanpa hati-hati dan cermat berpotensi menghasilkan skor
penilaian yang tidak tepat. Hal ini akan menyebabkan
kurang tepatnya penilaian yang diberikan guru pada siswa.
Dalam konteks inilah pedoman penskoran penting dan
mutlak harus disiapkan sebaik-baiknya oleh guru.
Pedoman penskoran merupakan pedoman menentukan
skor terhadap hasil pekerjaan siswa. Dengan pedoman
penskoran yang baik, guru memiliki pijakan yang jelas
dalam memberikan skor terhadap jawaban siswa.

290 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 13
PENYUSUNAN DAN
PENULISAN SOAL TES
A.Penyusunan Tes
1. Langkah Penyusunan
Pengembangan instrumen tes sebagai alat ukur
ranah kognitif perlu menempuh langkah-langkah tertentu.
Ada sejumlah langkah yang harus ditempuh untuk dapat
mengembangkan tes hasil belajar dengan baik. Brennan (2006)
mengemukakan langkah-langkah umum pengembangan tes
sebagai berikut: 1) penentuan tujuan tes, 2) penyusunan
kisi-kisi tes, 3) penulisan soal, 4) penelaahan soal, 5) uji
coba soal termasuk analisisnya, 6) perakitan soal menjadi

291 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

perangkat tes, 7) penyajian tes, 8) penskoran, 9) pelaporan


hasil tes, dan 10) pemanfaatan hasil tes.

1). Penentuan tujuan


Tujuan tes harus dirumuskan secara jelas sehingga
dapat memberikan arah dan lingkup pengembangan tes
selanjutnya. Tujuan tes sangat penting karena setiap tujuan
memiliki penekanan yang berbeda-beda. Misalnya, tujuan
tes prestasi belajar, diagnostik, atau seleksi. Tujuan
pemberian tes adalah untuk mengetahui sejauh mana
siswa memahami atau menguasai materi tertentu setelah
diajarkan/dibahas guru di ruang kelas

2). Penyusunan kisi-kisi tes


Setelah tujuan tes dirumuskan, kita perlu membuat
kisi-kisi tes (test blue-print/ table of specification). Tujuan
penyusunan kisi-kisi adalah untuk menentukan ruang
lingkup dan sebagai petunjuk dalam penulisan soal. Kisi-
kisi dapat berupa format atau matriks. Kisi-kisi tes adalah
deskripsi mengenai ruang lingkup dan isi dari apa yang
akan diujikan, serta memberikan rincian mengenai soal-
soal yang diperlukan oleh tes tersebut. Kisi-kisi pada
umumnya berisi (1) rincian materi pembelajaran /aspek
yang akan dievaluasi, (2) tingkah laku yang akan diukur
berikut deskripsi indikatornya, (3) proporsi dan jumlah
soal, serta (4) bentuk soal.
Ada sejumlah langkah yang harus ditempuh untuk
menyusun kisi-kisi tes. Langkah itu adalah: (1).Penentuan
indikator-indikator (2). Pemilihan bentuk tes, dan (3).
Penentuan panjang tes. Butir-butir tes hendaknya dapat

292 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

mengukur indikator, dan indikator-indikator dapat


mengukur kompetensi dasar. Penentuan bentuk tes yang
tepat ditentukan oleh tujuan tes dan jumlah peserta tes.

Contoh kisi-kisi tes


Mata Pelajaran :
Semester :
Tahun Ujian :
Tipe Tes :
Jumlah Butir Tes :

No Pokok Jenjang Kemampuan Jumlah


Bahasan C1 C2 C3 C4 C5 C6 butir
soal
1
2
3

dst

Jumlah
Butir Soal
Persentase 100

3). Penulisan butir soal


Penulisan butir adalah fase yang berat dalam
proses pengembangan tes. Menulis butir-butir dalam suatu
tes atau alat ukur merupakan suatu seni menuangkan
gagasan. Penulisan butir-butir soal merupakan langkah
penting dalam upaya pengembangan alat ukur atau sebuah
tes yang baik Dalam penulisan butir soal, penulis harus
memperhatikan kaidah penulisan soal. Menulis soal adalah
penjabaran indikator kompetensi yang hendak diukur
menjadi pertanyaan-pertanyaan yang karakteristiknya

293 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

sesuai dengan kisi-kisi. Setiap butir soal yang dibuat harus


jelas apa yang ditanyakan dan jelas pula apa yang dituntut.
Mutu setiap butir soal akan menentukan mutu soal tes
secara keseluruhan.

4). Penelaahan soal


Penelaahan soal adalah mengkaji secara teoritik
soal tes yang telah disusun. Penelaahan ini dilakukan
dengan memperhatikan tiga aspek, yaitu aspek materi,
aspek konstruksi, dan aspek bahasa. Biasanya pada
penelaahan soal dilakukan review dan revisi oleh orang
lain.

5). Uji coba soal dan analisis.


Soal yang sudah dibuat dan sudsah direproduksi
atau diperbanyak itu diujicobakan kepada sejumlah sampel
yang telah ditentukan. Sampel uji-coba harus mempunyai
karakteristik yang kurag lebih sama dengan karakteristik
peserta tes sesungguhnya. Berdasarkan data hasil uji-coba
dilakukan analisis, terutama analisis butir soal yang
meliputi tingkat kesukaran, validita butir, dan fungsi
pengecoh. Soal-soal yang tidak valid akan didrop dan soal-
soal yang valid akan ditetapkan untuk dipakai atau dirakit
menjadi suatu tes yang valid.

6). Perakitan soal menjadi perangkat tes


Dalam perakitan tes perlu mengelompokkan butir
soal itu menurut bentuknya, bukan menurut jenis
materinya atau menurut jenjang pengetahuan yang hendak
diukur. Dengan demikian ada kelompok soal pilihan ganda,

294 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

ada kelompok soal menjodohkan dan sebagainya. Di


samping pengaturan menurut bentuk itemnya, soal itu
hendaknya diatur pula menurut taraf kesukarannya. jadi,
ada baiknya soal tes disajikan mulai dari butir mudah ke
yang sukar, pengelompokan rapi, tata letak bagus dan tidak
terpotong-potong kalimatnya, dan kemasannya menarik.
Untuk merakit soal menjadi suatu paket tes yang
tepat, para guru perlu memperhatikan langkah-langkah
perakitan soal sebagai berikut:
a) Mengelompokkan soal-soal yang mengukur
kompetensi dan materi yang sama, kemudian soal
soal itu ditempatkan dalam urutan yang sama.
b) Memberi nomor urut soal didasarkan nomor urut
soal dalam kisi-kisi.
c) Mengecek setiap soal dalam satu paket tes apakah
soal-soalnya sudah bebas dari kaidah “Setiap soal
tidak boleh memberi petunjuk jawaban terhadap
soal yang lain”.
d) Membuat petunjuk umum dan khusus untuk
mengerjakan soal.
e) Membuat format lembar jawaban.
f) Membuat lembar kunci jawaban dan petunjuk
penilaiannya.
g) Menentukan/menghitung penyebaran kunci
jawaban (untuk bentuk pilihan ganda), dengan
menggunakan rumus berikut.

Penyebaran kunci jawaban = ±3

295 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

h) Menentukan soal inti (anchor items) sebanyak 10 %


dari jumlah soal dalam satu paket
i) Menentukan besarnya bobot setiap soal (untuk soal
bentuk uraian)

7). Penyajian tes,


Setelah diperoleh tes terstandar, naskah tes siap
diberikan atau disajikan kepada peserta tes. Hal-hal yang
perlu diperhatikan dalam penyajian tes adalah waktu
penyajian, petunjuk yang jelas mengenai cara menjawab
atau mengerjakan tes, ruangan dan tempat duduk peserta
tes. Pada prinsipnya, hal-hal yang menyangkut segi
administratif penyajian tes harus diperhatikan sehingga
pengujian dapat terselenggara dengan lancar dan baik.

8). Penskoran
Penskoran adalah proses menentukan angka
melalui:

(a) Kunci Jawaban (menentukan jawaban benar)


(b) Kunci Skoring (menyeleksi jawaban benar dan salah)
(c) Pedoman Penilaian (menentukan angka)

Penskoran dilakukan menurut bentuk tes atau soal.


Untuk butir-butir soal bentuk esai, terdapat dua metoda
penskorannya. Yang pertama adalah point method, dan
kedua adalah rating method. Pada point method setiap
jawaban dibandingkan dengan jawaban ideal yang telah
ditetapkan dalam kunci jawaban dan skor yang diberikan
kepada setiap jawaban akan tergantung pada derajat

296 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

kepadanannya dengan kunci jawaban. Soal esei dengan


jawaban terbatas penskoran dilakukan dengan point
method, maka perlu menggunakan rambu-rambu jawaban
Sedangkan dalam rating method, setiap jawaban
siswa ditetapkan dalam salah satu kelompok yang sudah
berdasarkan mutunya selagi jawaban tersebut dibaca. Soal
esei dengan jawaban terbuka, penskoran dengan rating
method, maka perlu menggunakan kriteria/rubric
penilaian
Dalam memeriksa dan menilai jawaban siswa dilakukan
dengan cara soal demi soal, bukan bukan siswa demi siswa,
untuk menghindari halo effect. Selanjutnya, dalam
mengevaluasi jawaban soal esei, adalah tanpa mengetahui
identitas siswa yang mengerjakan.

9). Pelaporan Hasil Tes


Setelah pelaksanaan tes dan penskorannya, maka
hasil tes tersebut perlu dilaporkan, Laporan tersebut
misalnya kepada siswa yang bersangkutan, kepada orang
tua/wali siswa, kepada Kepala Sekolah, dan sebagainya.
Laporan hasl tes tersebut menjadi informasi yang berguna
dan penting guna penentuan kebijakan selanjutnya.

10). Pemanfaatan Hasil Tes


Hasil tes yang tidak lain adalah hasil pengukuran
dapat dimanfaatkan untuk perbaikan sistem, metode, atau
strategi belajar mengajar, di samping dapat dimanfaatkan
untuk penentuan kebijakan.

297 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

B. Kaidah Penulisan Soal


1. Tes Pilihan Ganda
Menurut Depdiknas (2007) kaidah penulisan soal
pilihan ganda adalah sebagai berikut.

a. Materi
Soal harus sesuai dengan indikator (artinya soal
harus menanyakan perilaku dan materi yang hendak
diukur sesuai dengan rumusan indikator dalam kisi-kisi),
pengecoh harus berfungsi, dan setiap soal harus
mempunyai satu jawaban yang benar (artinya, satu soal
hanya mempunyai satu kunci jawaban).

b. Konstruksi
a) Pokok soal harus dirumuskan secara jelas dan tegas.
Artinya, kemampuan/ materi yang hendak
diukur/ditanyakan harus jelas, tidak menimbulkan
pengertian atau penafsiran yang berbeda dari yang
dimaksudkan penulis. Setiap butir soal hanya
mengandung satu persoalan/gagasan
b) Rumusan pokok soal dan pilihan jawaban harus
merupakan pernyataan yang diperlukan saja.
Artinya apabila terdapat rumusan atau pernyataan
yang sebetulnya tidak diperlukan, maka rumusan
atau pernyataan itu dihilangkan saja.
c) Pokok soal jangan memberi petunjuk ke arah
jawaban yang benar. Artinya, pada pokok soal
jangan sampai terdapat kata, kelompok kata, atau

298 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

ungkapan yang dapat memberikan petunjuk ke arah


jawaban yang benar.
d) Pokok soal jangan mengandung pernyataan yang
bersifat negatif ganda. Artinya, pada pokok soal
jangan sampai terdapat dua kata atau lebih yang
mengandung arti negatif. Hal ini untuk mencegah
terjadinya kesalahan penafsiran peserta didik
terhadap arti pernyataan yang dimaksud. Untuk
keterampilan bahasa, penggunaan negatif ganda
diperbolehkan bila aspek yang akan diukur justru
pengertian tentang negatif ganda itu sendiri.
e) Pilihan jawaban harus homogen dan logis ditinjau
dari segi materi. Artinya, semua pilihan jawaban
harus berasal dari materi yang sama seperti yang
ditanyakan oleh pokok soal, penulisannya harus
setara, dan semua pilihan jawaban harus berfungsi.
f) Pilihan jawaban jangan mengandung pernyataan
“Semua pilihan jawaban di atas salah" atau "Semua
pilihan jawaban di atas benar". Artinya dengan
adanya pilihan jawaban seperti ini, maka secara
materi pilihan jawaban berkurang satu karena
pernyataan itu bukan merupakan materi yang
ditanyakan dan pernyataan itu menjadi tidak
homogen.
g) Panjang rumusan pilihan jawaban harus relatif
sama. Kaidah ini diperlukan karena adanya
kecenderungan peserta didik memilih jawaban yang
paling panjang karena seringkali jawaban yang lebih
panjang itu lebih lengkap dan merupakan kunci
jawaban.

299 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

h) Pilihan jawaban yang berbentuk angka atau waktu


harus disusun berdasarkan urutan besar kecilnya
nilai angka atau kronologis. Artinya pilihan jawaban
yang berbentuk angka harus disusun dari nilai
angka paling kecil berurutan sampai nilai angka
yang paling besar, dan sebaliknya. Demikian juga
pilihan jawaban yang menunjukkan waktu harus
disusun secara kronologis. Penyusunan secara unit
dimaksudkan untuk memudahkan peserta didik
melihat pilihan jawaban.
i) Gambar, grafik, tabel, diagram, wacana, dan
sejenisnya yang terdapat pada soal harus jelas dan
berfungsi. Artinya, apa saja yang menyertai suatu
soal yang ditanyakan harus jelas, terbaca, dapat
dimengerti oleh peserta didik. Apabila soal bisa
dijawab tanpa melihat gambar, grafik, tabel atau
sejenisnya yang terdapat pada soal, berarti gambar,
grafik, atau tabel itu tidak berfungsi.
j) Rumusan pokok soal tidak menggunakan ungkapan
atau kata yang bermakna tidak pasti seperti:
sebaiknya, umumnya, kadang-kadang.
k) Butir soal jangan bergantung pada jawaban soal
sebelumnya. Ketergantungan pada soal sebelumnya
menyebabkan peserta didik yang tidak dapat
menjawab benar soal pertama tidak akan dapat
menjawab benar soal berikutnya.

c. Bahasa/budaya
Setiap soal harus menggunakan bahasa yang sesuai
dengan kaidah bahasa Indonesia. Kaidah bahasa Indonesia

300 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dalam penulisan soal di antaranya meliputi: a) pemakaian


kalimat: (1) unsur subjek, (2) unsur predikat, (3) anak
kalimat; b) pemakaian kata: (1) pilihan kata, (2) penulisan
kata, dan c) pemakaian ejaan; (1) penulisan huruf, (2)
penggunaan tanda baca. Bahasa yang digunakan harus
komunikatif, sehingga pernyataannya mudah dimengerti
peserta didik. Pilihan jawaban jangan mengulang
kata/frase yang bukan merupakan satu kesatuan
pengertian. Letakkan kata/frase pada pokok soal.
Hopkin dan Antes (1990) juga memberikan
petunjuk yang lebih rinci dan praktis dalam menyusun tes
pilihan ganda, yaitu: (1) definisikan tugas-tugas dalam
stem secara jelas, (2) tulis alternatif jawaban pada akhir
pertanyaan, (3) tempatkan sebanyak mungkin kata-kata
dalam stem, (4) hindari penggunaan kata-kata negatif, (5)
hindari stem yang mengarah pada alternatif jawaban yang
salah atau benar, (6) buat alternatif jawaban yang paralel,
(7) tulis alternatif jawaban secara vertikal, (8) hindari
jawaban “semua di atas”, (9) buat alternatif jawaban sama
panjang, (10) hilangkan petunjuk ke arah jawaban benar,
(11) buat pengecoh yang masuk akal, (12) usahakan
stemnya dalam bentuk pertanyaan, (13) kontrol tingkat
kesulitan soal sehingga persentase jawaban benar kira-kira
separuhnya, (14) hindari kemungkinan menebak, (15)
gunakan jawaban “tidak ada jawaban benar” hanya kalau
tidak ada jawaban lain, (16) susun alternatif jawaban
sesuai dengan abjad . 19 atau urutan lainnya, (17) letakkan
jawaban benar secara acak, dan (18) usahakan memiliki
empat sampai lima alternatif jawaban

301 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Dengan memperhatikan petunjuk tersebut,


diharapkan para guru dapat menyusun butir tes pilihan
ganda yang baik

2. Tes Dua Pilihan Jawaban (Benar-Salah, Ya-Tidak)


Menurut Tim Puspendik (2008) Kaidah penulisan
soal bentuk dua pilihan jawaban perlu adalah sebagai
berikut.
a) Hindari penggunaan kata: terpenting, selalu, tidak
pernah, hanya, sebagian besar, dan kata-kata lain
yang sejenis, karena dapat membingungkan peserta
tes dalam menjawab. Rumusan butir soal harus
jelas, dan pasti benar atau pasti salah.
b) Jumlah rumusan butir soal yang jawabannya benar
dan salah hendaknya seimbang.
c) Panjang rumusan pernyataan butir soal hendaknya
relatif sama.
d) Susunan pernyataan benar dan pernyataan salah
secara random, tidak sistematis mengikuti pola
tertentu. Misalnya: B B S S, atau B S B S, dan
sebagainya. Susunan yang terpola sistematis seperti
itu dapat memberi petunjuk kepada jawaban yang
benar.
e) Hindari pengambilan kalimat langsung dari buku
teks. Pengambilan kalimat langsung dari buku teks
lebih mendorong siswa untuk menghafal daripada
memahami dan menguasai konsep dengan baik.

302 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

3. Tes Menjodohkan
Kaidah penulisan soal bentuk menjodohkan (Tim
Puspendik, 2008) adalah seperti berikut:
a. Tulislah seluruh pernyataan dalam lajur kiri sejenis,
dan pernyataan dalam lajur kanan juga sejenis.
Dengan kata lain: pernyataan dalam lajur sebelah
kiri isinya homogen, demikian juga pernyataan
dalam lajur sebelah kanan isinya harus homogen.
b. Tulislah pernyataan jawaban lebih banyak dari
pernyataan soal. Hal ini penting, untuk memperkecil
probabilitas peserta tes menjawab soal secara
menebak dengan benar. Seperti contoh berikut,
pernyataan soal yang ada di lajur kiri adalah lima
butir, pernyataan jawaban yang ada di lajur kanan
adalah enam butir.
c. Susunlah jawaban yang berbentuk angka secara
berurutan dari besar ke kecil atau sebaliknya.
Apabila alternatif jawabannya berupa tanggal dan
tahun terjadinya peristiwa, maka susunlah tanggal
dan tahun tersebut berurutan secara kronologis,
seperti dalam penulisan soal pilihan ganda.
d. Tulislah petunjuk mengerjakan tes yang jelas dan
mudah dipahami oleh peserta tes. Oleh karena itu,
dalam perumusan kalimat dan penggunaan
kosakata perlu memperhatikan perkembangan
kemampuan bahasa peserta tes.

4. Tes Isian
Kaidah penulisan soal bentuk isian adalah seperti
berikut (Tim Puspendik, 2008):

303 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

a. Soal harus sesuai dengan indikator


b. Soal harus menggunakan bahasa yang baik dan
benar, serta kalimat singkat dan jelas, sehingga
peserta tes dapat memahami dengan muda.
c. Jawaban yang dituntut oleh soal harus singkat dan
pasti yaitu berupa kata, frase, angka, simbol, tempat,
atau waktu.
d. Soal tidak merupakan kalimat yang dikutip langsung
dari buku.
e. Soal tidak memberi petunjuk ke kunci jawaban.
f. Bagian kalimat yang harus dilengkapi sebaiknya
hanya satu bagian dalam ratio butir soal, dan paling
banyak dua bagian, supaya tidak membingungkan
siswa.

5.Tes Esai atau Uraian


Kaidah penulisan soal uraian menurut Depdiknas
(2008) sebagai berikut.

a. Materi
Soal harus sesuai dengan indikator, setiap pertanyaan
harus diberikan batasan jawaban yang diharapkan, materi
yang ditanyakan harus sesuai dengan tujuan pengukuran,
dan materi yang ditanyakan harus sesuai dengan jenjang
dan jenis sekolah atau tingkat kelas.

b. Konstruksi
Soal menggunakan kata tanya/perintah yang menuntut
jawaban terurai, ada petunjuk yang jelas tentang cara
mengerjakan soal, setiap soal harus ada pedoman

304 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

penskorannya, dan tabel, gambar, grafik, peta, atau yang


sejenisnya disajikan dengan jelas, terbaca, dan berfungsi

c. Bahasa

Rumusan kalimat soal harus komunikatif,


menggunakan bahasa Indonesia yang baik dan benar
(baku), tidak menimbulkan penafsiran ganda, tidak
menggunakan bahasa yang berlaku setempat/tabu, dan
tidak mengandung kata/ungkapan yang menyinggung
perasaan peserta didik.

6. Tes Jawaban Singkat


Kaidah penulisan bentuk soal jawaban singkat
adalah seperti berikut:
a. Menggunakan kalimat pertanyaan langsung atau
kalimat perintah.
b. Pertanyaan atau perintah harus jelas, agar
mendapat jawaban yang singkat.
c. Panjang kata atau kalimat yang harus dijawab oleh
siswa pada semua soal diusahakan relatif sama.
d. Hindari penggunaan kata, kalimat, atau frase yang
diambil langsung dari buku teks, sebab akan
mendorong siswa untuk sekedar mengingat atau
menghafal apa yang tertulis dibuku.
e. Buatlah pedoman penskoran untuk digunakan pada
waktu menskor.
B
C. Penulisan Soal Penalaran Tinggi
Taksonomi Bloom dianggap merupakan dasar bagi
berpikir tingkat tinggi. Pemikiran ini didasarkan bahwa

305 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

beberapa jenis pembelajaran memerlukan proses kognisi


yang lebih daripada yang lain, tetapi memiliki manfaat-
manfaat lebih umum. Dalam Taksonomi Bloom sebagai
contoh, kemampuan melibatkan analisis, evaluasi dan
mengkreasi dianggap berpikir tingkat tinggi (Pohl, 2000).
Stein dan Lane (1996) menyatakan bahwa berpikir tingkat
tinggi adalah the use of complex, nonalgorithmic thinking to
solve a task in which there is not a predictable, well-
rehearsed approach or pathway explicitly suggested by the
task, task instruction, or a worked out example, artinya
berpikir tingkat tinggi menggunakan pemikiran yang
kompleks, non algorithmic untuk menyelesaikan suatu
tugas, ada yang tidak dapat diprediksi, menggunakan
pendekatan yang berbeda dengan tugas yang telah ada dan
berbeda dengan contoh.
Karakteristik berpikir tingkat tinggi adalah sebagai
: solving tasks where no algorithm has been taught, where
justification or explanation are required, and where more
than one solution may be possible. Jadi berpikir tingkat
tinggi adalah kemampuan untuk menyelesaikan tugas-
tugas dimana tidak ada algoritma yang telah diajarkan,
yang membutuhkan justifikasi atau penjelasan dan
mungkin mempunyai lebih dari satu solusi yang mungkin
(Lewy, Zulkardi, dan Aisyah, 2009).

Adapun indikator soal untuk mengukur kemampuan


berpikir tingkat tinggi adalah: (1) non algorithmic, (2)
cenderung kompleks (3) memiliki solusi yang mungkin
lebih dari satu (open ended approach), (4) membutuhkan
usaha untuk menemukan struktur dalam ketidakteraturan

306 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(Lewy, Zulkardi, dan Aisyah, 2009). Sedangkan Krathwohl


(2002) menyatakan bahwa indikator untuk mengukur
kemampuan berpikir tingkat tinggi meliputi:
(1) Menganalisis: yaitu (a) menganalisis informasi yang
masuk dan membagi-bagi atau menstrukturkan informasi
ke dalam bagian yang lebih kecil untuk mengenali pola atau
hubungannya, (b) mampu mengenali serta membedakan
faktor penyebab dan akibat dari sebua skenario yang
rumit, (c)mengidentifikasi/merumuskan pertanyaan
(2) Mengevaluasi: yaitu (a) memberikan penilaian
terhadap solusi, gagasan, dan metodologi dengan
menggunakan kriteria yang cocok atau standar yang ada
untuk memastikan nilai efektivitas atau manfaatnya. (b)
membuat hipotesis, mengkritik dan melakukan pengujian,
(c) menerima atau menolak suatu pernyataan berdasarkan
kriteria yang telah ditetapkan (3) Mengkreasi: yaitu
(a)membuat generalisasi suatu ide atau cara pandang
terhadap sesuatu, (b) merancang suatu cara untuk
menyelesaikan masalah, (c) mengorganisasikan unsur-
unsur atau bagian-bagian menjadi struktur baru yang
belum pernah ada sebelumnya
Penulisan atau penyusunan soal yang menuntut
penalaran tinggi dapat dibedakan atas: (1) mengukur
kemampuan berpikir kritis, dan (2) mengukur
keterampilan pemecahan masalah.
Menurut Depdiknas (2008) untuk menuliskan butir
soal yang menuntut penalaran tinggi, perlu memperhatikan
pedoman berikut:
a. Materi yang akan ditanyakan diukur dengan perilaku:
C2/pemahaman, C3/penerapan, C4/sintesis,C5/analisis,

307 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

atau C6/evaluasi (bukan hanya C1/ingatan saja). Ingat


Taksonomi Bloom.
b. Setiap pertanyaan diberikan dasar pertanyaan
(stimulus).
Agar butir soal yang ditulis dapat menuntut penalaran
tinggi, maka setiap butir soal selalu diberikan dasar
pertanyaan (stimulus) yang berbentuk sumber/bahan
bacaan seperti: teks bacaan, paragrap, teks drama,
penggalan novel/cerita/dongeng, puisi, kasus, gambar,
grafik, foto, rumus, tabel, daftar kata/simbol, contoh,
peta, film, atau suara yang direkam.

1. Mengukur kemampuan berpikir kritis.


Ada 11 kemampuan berpikir kritis yang dapat
dijadikan dasar dalam menulis butir soal yang menuntut
penalaran tinggi (Depdiknas, 2008).

1) Menfokuskan pada pertanyaan


Contoh indikator soal:
Disajikan sebuah masalah/problem, aturan, kartun, atau
eksperimen dan hasilnya, peserta didik dapat
menentukan masalah utama, kriteria yang digunakan
untuk mengevaluasi kualitas, kebenaran argumen atau
kesimpulan.

2) Menganalisis argumen
Contoh indikator soal:
Disajikan deskripsi sebuah situasi atau satu/dua
argumentasi, peserta didik dapat: (1) menyimpulkan
argumentasi secara cepat, (2) memberikan alasan yang

308 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

mendukung argumen yang disajikan, (3) memberikan


alasan tidak mendukung argumen yang disajikan.

3) Mempertimbangkan yang dapat dipercaya


Contoh indikator soal:
Disajikan sebuah teks argumentasi, iklan, atau
eksperimen dan interpretasinya, peserta didik
menentukan bagian yang dapat dipertimbangan untuk
dapat dipercaya (atau tidak dapat dipercaya), serta
memberikan alasannya.

4) Mempertimbangkan laporan observasi


Contoh indikator soalnya:
Disajikan deskripsi konteks, laporan observasi, atau
laporan observer/reporter, peserta didik dapat
mempercayai atau tidak terhadap laporan itu dan
memberikan alasannya.

5) Membandingkan kesimpulan
Contoh indikator soal:
Disajikan sebuah pernyataan yang diasumsikan kepada
peserta didik adalah benar dan pilihannya terdiri dari:
(1) satu kesimpulan yang benar dan logis, (2) dua atau
lebihkesimpulan yang benar dan logis, peserta didik
dapat membandingkan kesimpulan yang sesuai dengan
pernyataan yang disajikan atau kesimpulan yang harus
diikuti.

6) Menentukan kesimpulan
Contoh indikator soal:

309 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Disajikan sebuah pernyataan yang diasumsikan kepada


peserta didik adalah benar dan satukemungkinan
kesimpulan, peserta didik dapat menentukan
kesimpulan yang ada itu benar atau tidak, dan
memberikan alasannya.

7) Mempertimbangkan kemampuan induksi


Contoh indikator soal:
Disajikan sebuah pernyataan, informasi/data, dan
beberapa kemungkinan kesimpulan,peserta didik dapat
menentukan sebuah kesimpulan yang tepat dan
memberikan alasannya.

8) Menilai
Contoh indikatornya:
Disajikan deskripsi sebuah situasi, pernyataan masalah,
dan kemungkinan penyelesaianmasalahnya, peserta
didik dapat menentukan: (1) solusi yang positif dan
negatif, (2) solusi mana yang paling tepat untuk
memecahkan masalah yang disajikan, dan dapat
memberikan alasannya.

9) Mendefinisikan Konsep
Contoh indikator soal:
Disajikan pernyataan situasi dan argumentasi/naskah,
peserta didik dapat mendefinisikan konsep yang
dinyatakan.

10) Mendefinisikan asumsi


Contoh indikator soal

310 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Disajikan sebuah argumentasi, beberapa pilihan yang


implisit di dalam asumsi, peserta didik dapat
menentukan sebuah pilihan yang tepat sesuai dengan
asumsi.

11) Mendeskripsikan
Contoh indikator soal:
Disajikan sebuah teks persuasif, percakapan, iklan,
segmen dari video klip, peserta didik dapat
mendeskripsikan pernyataan yang dihilangkan
Menurut Linn dan Gronlund Keterampilan Berpikir Kritis
adalah:

1). Membandingkan
 Jelaskan persamaan dan perbedaan antara ... dan ....
 Bandingkan dua cara berikut tentang ....

2). Hubungan sebab-akibat


 Apa penyebab utama ....
 Apa akibat ....

3). Memberi alasan (justifying)


 Manakah pilihan berikut yang kamu pilih, mengapa?
 Jelaskan mengapa kamu setuju/tidak setuju dengan
pernyataan tentang

4). Meringkas
 Tuliskan pernyataan penting yang termasuk ....
 Ringkaslah dengan tepat isi ....

311 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

5). Menyimpulkan
 Susunlah beberapa kesimpulan yang bersasal dari
data ....
 Tulislah sebuah pernyataan yang dapat menjelaskan
peristiwa berikut ..

6). Berpendapat (inferring)


 Berdasarkan ..., apa yang akan terjadi bila ....
 Apa reaksi A terhadap ....

7). Mengelompokkan
 Kelompokkan hal berikut berdasarkan ....
 Apakah hal berikut memiliki ....

8). Menciptakan
 Tuliskan beberapa cara sesuai dengan ide Anda
tentang ....
 Lengkapilah cerita ... tentang apa yang akan terjadi
bila ....

9). Menerapkan
 Selesaikan hal berikut dengan menggunakan kaidah
....
 Tuliskan ... dengan menggunakan pedoman ....

10). Analisis
 Manakah penulisan yang salah pada paragraf ....
 Daftar dan beri alasan singkat tentang ciri utama ....

312 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

11). Sintesis
 Tuliskan satu rencana untuk pembuktian ....
 Tuliskan sebuah laporan ....

12). Evaluasi
 Apakah kelebihan dan kelemahan ....
 Berdasarkan kriteria ..., tuliskanlah evaluasi tentang
....

2 Mengukur keterampilan pemecahan masalah.


Ada 17 keterampilan pemecahan masalah yang
dapat dijadikan dasar dalam menulis butir soal yang
menuntut penalaran tinggi.
1). Mengidentifikasi masalah
Contoh indikator soal:
Disajikan deskripsi suatu situasi/masalah, peserta
didik dapat mengidentifikasi masalah yang nyata atau
masalah apa yang harus dipecahkan.

2) . Merumuskan masalah dalam bentuk pertanyaan


Contoh indikator soal:
Disajikan sebuah pernyataan yang berisi sebuah
masalah, peserta didik dapat merumuskanmasalah
dalam bentuk pertanyaan.

3). Memahami kata dalam konteks


Contoh indikator soal:

313 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Disajikan beberapa masalah yang konteks kata atau


kelompok katanya digarisbawahi, peserta didik dapat
menjelaskan makna yang berhubungan dengan
masalah itu dengan kata‐katanya sendiri.

4). Mengidentifikasi masalah yang tidak sesuai


Contoh indikator masalah:
Disajikan beberapa informasi yang relevan dan tidak
relevan terhadap masalah, peserta didik dapat
mengidentifikasi semua informasi yang tidak relevan.

5). Memilih masalah sendiri


Contoh indikator soal:
Disajikan beberapa masalah, peserta didik dapat
memberikan alasan satu masalah yang dipilih sendiri,
dan menjelaskan cara penyelesaiannya.

6) . Mendeskripsikan berbagai strategi


Contoh indikator soal:
Disajikan sebuah pernyataan masalah, peserta didik
dapat memecahkan masalah ke dalam dua cara atau
lebih, kemudian menunjukkan solusinya ke dalam
gambar, diagram, atau grafik.

7). Mengidentifikasi asumsi


Contoh indikator soal:
Disajikan sebuah pernyataan masalah, peserta didik
dapat memberikan solusinya berdasarkan
pertimbangan asumsi untuk saat ini dan yang akan
datang.

314 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

8) Mendeskripsikan masalah
Contoh indikator soal:
Disajikan sebuah pernyataan masalah, peserta didik
dapat menggambarkan sebuah diagram atau gambar
yang menunjukkan situasi masalah.

9) . Memberi alasan masalah yang sulit


Contoh indikator soal:
Disajikan sebuah masalah yang sukar dipecahkan atau
informasi pentingnya dihilangkan, peserta didik dapat
menjelaskan mengapa masalah ini sulit dipecahkan
atau melengkapi informasi pentingnya dihilangkan.

10) Memberi alasan solusi


Contoh indikator soal:
Disajikan sebuah pernyataan masalah dengan dua atau
lebih kemungkinan solusinya, peserta didik dapat
memilih satu solusi yang paling tepat dan memberikan
alasannya.

11) Memberi alasan strategi yang digunakan


Contoh indikator soal:
Disajikan sebuah pernyataan masalah dengan dua atau
lebih strategi untuk menyelesikan masalah, peserta
didik dapat memilih satu strategi yang tepat untuk
menyelesaikan masalah itu dan memberikan
alasannya.

315 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

12) Memecahkan masalah berdasarkan data dan


masalah
Contoh indikator soal:
Disajikan sebuah cerita, kartun, grafik atau tabel dan
sebuah pernyataan masalah, peserta didik dapat
memecahkan masalah dan menjelaskan prosedur yang
digunakan untuk menyelesaikan masalah.

13) Membuat strategi lain


Contoh indikator soal:
Disajikan sebuah pernyataan masalah dan satu strategi
untuk menyelesaikan masalahnya, peserta didik dapat
menyelesaikan masalah itu dengan menggunakan
strategi lain.

14) Menggunakan analogi


Contoh indikator soal:
Disajikan sebuah pernyataan masalah dan strategi
penyelesaiannya, peserta didik dapat: (1)
mendeskripsikan masalah lain (analog dengan masalah
ini) yang dapat diselesaikan dengan menggunakan
strategi itu, (2) memberikan alasannya.

15) Menyelesaikan secara terencana


Contoh indikator soal:
Disajikan sebuah situasi masalah yang kompleks,
peserta didik dapat menyelesaikan masalah secara
terencana mulai dari input, proses, output, dan
outcomenya.

316 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

16) Mengevaluasi kualitas solusi


Contoh indikator soal:
Disajikan sebuah pernyataan masalah dan beberapa
strategi untuk menyelesaikan masalah, peserta didik
dapat: (1) menjelaskan dengan menerapkan strategi
itu, (2) mengevaluasinya, (3) menentukan strategi
mana yang tepat, (4) memberi alasan mengapa strategi
itu paling tepat dibandingkan dengan strategi lainnya.

17) Mengevaluasi strategi sistematika


Contoh indikator soal:
Disajikan sebuah pernyataan masalah, beberapa
strategi pemecahan masalah dan prosedur, peserta
didik dapat mengevaluasi strategi pemecahannya
berdasarkan prosedur yang disajikan (Depdiknas,
2008).

317 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

318 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 14
PENSKORAN HASIL TES
A.Penskoran Hasil Tes
Penskoran (skoring) atau pemberian skor adalah
proses pengubahan atau jawaban – jawaban soal tes
menjadi angka-angka yang pasti.

1. Penskoran Tes Objektif


a. Soal Bentuk Pilihan Ganda
Dalam penskoran untuk soal bentuk pilihan ganda
ragam biasa, ada 2 macam yaitu dengan hukuman dan
tanpa hukuman.

(1) Pemberian skor tanpa hukuman dengan rumus


berikut:

S = ∑R dengan : S = Score , ∑R = Right, W = Wrong

319 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Skor yang diperoleh sebanyak jumlah soal yang


benar.

(2) Pemberian skor dengan hukuman menggunakan


rumus, yaitu :

S = ∑R -

dengan: S = skor yang dicari

∑R = jumlah jawaban benar


∑W = jumlah jawaban salah
k = jumlah pilihan jawaban (option)

Contoh:
- Banyaknya soal = 10 buah (T)
- Banyaknya yang betul = 8 buah (R)
- Banyaknya yang salah = 2 buah (W)
- Banyaknya pilihan = 4 buah (k)
- Maka skornya menjadi : 8 - {2 / (4 - 1)} = 8 - (2 /
3) = 7,33

Untuk penskoran (pemberian skor) soal pilihan


ganda selain ragam biasa (ragam-ragam: analisis antar hal,
analisis kasus, komolek, dan membaca diagram) adalah
menggunakan rumus pilihan ganda yang dikalikan bobot.
jadi

(1) Pemberian skor tanpa hukuman dengan rumus


menjadi:

320 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

S = ∑R x Wt dengan S = Score , ∑R = Right, Wt =


bobot yang diberikan guru pada setiap soal

(2) Pemberian skor dengan hukuman dengan rumus :

S = ∑R - ( ) x Wt

b. Soal Bentuk Dua Pilihan


Untuk penskoran soal yang hanya pilihan
jawabannya dua, dapat digunakan rumus:
Jika pemberian skor tanpa hukuman/denda
(1) S = ∑R – ∑W
Keterangan: S = skor yang dicari
∑R = jumlah jawaban betul
∑W = jumlah jawaban salah
Contoh:
- Banyaknya soal = 10 buah (T)
- Banyaknya yang betul = 8 buah (R)
- Banyaknya yang salah = 2 buah (W)
- Skornya menjadi (S) : 8 - 2 = 6
Jika pemberian skor dengan hukuman/denda
(2) S = T - 2W (T singkatan dari total, artinya jumlah
soal dalam tes)
Contoh .
- Banyaknya soal = 10 buah (T)
- Banyaknya yang betul = 8 buah (R)
- Banyaknya yang salah = 2 buah (W)

321 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

- Skornya menjadi 10 - (2x2) = 10 - 4 = 6


c. Soal Bentuk Menjodohkan
Untuk penskoran soal menjodohkan dapat digunakan
rumus berikut:

S= R-( )( )

dengan : S = skor yang dicari


W = jumlah jawaban yang salah
= jumlah butir pada lajur kiri
(soal)
= jumlah butir pada lajur kanan
(jawaban)
Selain itu sering juga penskoran dengan cara

d. Soal Bentuk Jawaban Singkat


Untuk pemberian skor soal jawaban singkat
sebaiknya tiap soal diberi skor 2 (dua).
Dapat juga skornya itu sama dengan skor pada bentuk
betul salah atau pilihan ganda jika memang jawaban yang
diharapkannya ringan atau mudah. Tetapi sebaliknya
apabila jawabarmya bervariasi rnisalnva lengkap sekali,
lengkap dan kurang lengkap, maka angkanya dapat dibuat
bervariasi pula misalnya 2; 1,5; dan 1.

2. Penskoran Tes Essei


Ada dua metode yang sering digunakan untuk penskoran
soal Esei,yaitu: a) Metode Analitik, dan b) Metode Rating
(Silverius, 1991)

322 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

a) Metode Analitik
Langkah-langkah pelaksanaan cara analitik adalah:
(1) Tulislah/buatlah jawaban sempurna dari tiap soal, yaitu
jawaban yang dapat diberikan skor tertinggi
(2) Analisislah dan tetapkan bagian-bagiannya
(3) Skor tertinggi yang hendak diberikan kepada jawaban
sempurna itu dibagi-bagi kepada tiap bagian
(4) Baca jawaban tiap siswa dan berikan skor pada tiap
bagian
(5) Jumlahkan skor tiap bagian itu, dan ini merupakan skor
jawaban siswa untuk soal tersebut.

b) Metode Rating
Dalam metode rating, jawaban sempurna tidak
dibagi-bagi kepada bagian-bagian. Guru yang melakukan
penskoran membaca dengan sekasama setiap soal, dan
menangkap ruang lingkup yang ada dalam jawaban.
Langkah-langkah penskorannya adalah:
(1) Membaca jawaban siswa
(3) Mengelompokkan jawaban siswa ke dalam salah
satu kategori yang menunjukkan tingkat kualitas
jawaban (sangat baik, baik, sedang, kurang, sangat
kurang)
(4) Membandingkan jawaban dengan kategori yang
diberikan pada jawaban
(3) Skor yang diberikan sesuai dengan kategori itu
merupakan skor akhir jawaban siswa dari soal
tersebut.

323 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

B. Konversi Skor
Konversi skor adalah proses transformasi skor mentah
yang dicapai peserta didik (siswa) ke dalam skor terjabar
atau skor standar untuk menetapkan nilai hasil belajar
yang diperoleh (Arifin, 2009)
Untuk melakukan konversi skor (pengolahan dan
pengubahan skor mentah hasil tes) menjadi nilai dapat
menggunakan berbagai macam skala, di antaranya :
1) Skala lima (stanfive)
2) Skala sembilan (stannine)
3) Skala seratus
4) Skala sebelas (eleven points standard)
5) Skala Z (Z score)
6) Skala T (T score)

Gronlund dan Linn (1995) mengemukakan bahwa


hasil tes dapat diinterpretasikan dengan dua cara
(metode), yaitu berdasarkan standar absolut (criterion-
referenced interpretation) yang kita kenal dengan PAP
(Penilaian Acuan Patokan), dan standar relatif (norm-
referenced interpretation) yang kita kenal dengan PAN
(Penilaian Acuan Norma)
PAP pada dasarnya adalah penilaian yang
membandingkan hasil pembelajaran peserta didik dengan
Patokan (Batas Lulus) yang telah ditetapkan sebelumnya.
Batas lulus itu tidak diambil dari hasil pengukuran
kelompok (kelas), melainkan atas dasar Tingkat
Penguasaan (Kompetensi) Minimal yang telah ditetapkan
sebelumnya.Yang lulus adalah mereka yang nilainya
melampaui Batas Lulus. Pendekatan PAP adalah

324 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

pendekatan yang menggunakan Standard Mutlak. Rumus


yang digunakan untuk menghitung nilai adalah sebagai
berikut.

Nilai = x skala

Pendekatan PAN (Penilaian Acuan Norma ) adalah


penilaian yang menggunakan Norma Kelompok (Kelas)
sebagai Norma Pembanding (Batas Lulus). Pendekatan
PAN adalah pendekatan ” apa adanya ”. Batas lulus-nya
diambil dari kenyataan yang diperoleh dari pengukuran
dan penilaian yang sedang berlangsung. PAN pada
dasarnya menggunakan kurve normal dan hasil-hasil
penghitungannya sebagai dasar penilaian. Sebagai norma
pembanding adalah nilai rata–rata (Mean) dan simpang–
baku (standar–deviasi). Dapat dimengerti bahwa norma
penilaian atas dasar kurve normal ini bersifat relative,
dapat bergeser ke atas atau ke bawah, sesuai dengan kurve
normal yang satu ke kurve normal lainnya. PAN adalah
pendekatan yang menggunakan Standard Relatif. Rumus
yang digunakan untuk menghitung nilai adalah sebagai
berikut.

Nilai = x skala

1. Penilaian Acuan Patokan


a. Konversi dengan Skala lima
Skala lima adalah suatu pembagian tingkatan yang
terbagi atas lima kategori. Misalnya masing-masing
tingkatan itu adalah A, B, C, D, dan E. Langkah yang

325 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

ditempuh untuk mengkonversikan skor mentah menjadi


skor standar skala lima adalah sebagai berikut:
1) Mencari skor maksimal ideal (SMI) dari tes.
Skor maksimal ideal adalah skor yang mungkin
dicapai siswa apabila semua butir soal dapat
dijawb dengan benar. Cara mencari skor
maksimal ideal adalah menghitung jumlah butir
serta bobot dari masing-masing butir.
2) Membuat pedoman konversi.
Pedoman konversi skor ini didasarkan pada
tingkat penguasaan terhadap materi yang
diberikan. Pedoman yang lazim digunakan
untuk skala lima adalah:
Tingkat Penguasaan Skor standar
90% - 100% A
80% - 89% B
65% - 79% C
55% - 64% D
0% - 54% E
Contoh: Misalkan skor maksimal ideal (SMI) suatu tes
hasil belajar 90, maka :
Penguasaan 90% skor mentahnya = 90/100 x 90 = 81
Penguasaan 80% skor mentahnya = 80/100 x 90 = 72
Penguasaan 65% skor mentahnya = 65/100 x 90 = 58,5
Penguasaan 55% skor mentahnya = 55/100 x 90 = 49,5
Berdasarkan batas-batas tersebut, dapat dibuat tabel
konversi, yaitu;

326 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Skor Mentah Skor Standar


81 – 90 A
72 – 80 B
58,5 - 71 C
49,5 – 57,5 D
0 – 48,5 E

Berdasarkan pedoman konversi tersebut, dapatlah


diberikan nilai kepada siswa, misalnya siswa yanag
memperoleh skor mentah 72 akan mendapat skor standar
B, dan bagi siswa yang memperoleh skor mentahnya 71
maka akan mendapat skor standar C, dan seterusnya.

b. Konversi dengan Skala Sembilan


Skala sembilan adalah suatu pembagian tingkatan
yang terbagi atas sembilan kategori. Untuk mengubah skor
mentah menjadi skor standar pada skala sembilan adalah
sama seperti pada langkah skala lima. Jadi skor siswa dapat
dikonversi dengan pedoman berikut;

Tingkat Penguasaan Skor standar


85% - 100% 9
75% - 84% 8
65% - 74% 7
55% - 64% 6
45% - 54% 5
35% - 44% 4
25% - 34% 3
15% - 24% 2

327 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

0% - 14% 1
Untuk mencari tingkat penguasaan adalah sama seperti
pada skala lima. Misalkan Skor Maksimal Idealnya adalah
90, maka;

Penguasaan 85% skor mentahnya = 85/100 x 90 = 76,5


Penguasaan 75% skor mentahnya = 75/100 x 90 = 67,5
Penguasaan 65% skor mentahnya = 65/100 x 90 = 58,5
Penguasaan 55% skor mentahnya = 55/100 x 90 = 49,5
Penguasaan 45% skor mentahnya = 45/100 x 90 = 40,5
Penguasaan 35% skor mentahnya = 35/100 x 90 = 31,5
Penguasaan 25% skor mentahnya = 25/100 x 90 = 22,5
Penguasaan 15% skor mentahnya = 15/100 x 90 = 13,5

Untuk mengubah skor mentah menjadi skor standar


pada skala sembilan adalah sama seperti pada langkah
skala lima. Jadi skor siswa dapat dikonversi dengan
pedoman berikut.
Skor mentah Skor standar
76,5 – 90 9
67,5 – 75,5 8
58,5 – 66,5 7
49,5 –57,5 6
40,5 – 48,5 5
31,5 – 39,5 4
22,5 – 30,5 3
13,5 – 21,5 2
0,0 - 12,5 1

328 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Berdasarkan konversi skor mentah menjadi skor


standar tersebut, maka sisw yang mendapat skor mentah
45 akan mendat skor standar 5, dan siswa yang mendapat
skor mentah 52 mndapat skor standar 6, demikian
seterusnya.

c.Konversi dengan Skala Sebelas


Untuk membuaat pedoman konversi skala sebelas
adalah sama seperti konversi pada skala sepuluh, jadi
pedoman konversi skala sebelas adalah:

Tingkat Penguasaan Skor standar


95 % - 100 % 10
85 % - 94 % 9
75 % - 44 % 8
65 % - 74 % 7
55 % - 64 % 6
45 % - 54 % 5
35 % - 44 % 4
25 % - 34 % 3
15 % - 24 % 2
5 % - 14 % 1
0% - 4% 0

Untuk mencari tingkat penguasaan adalah sama


seperti pada skala sembilan. Misalkan Skor Maksimal
Idealnya adalah 90, maka
Penguasaan 95% skor mentahnya = 95/100 x 90 = 85,5
Penguasaan 85% skor mentahnya = 85/100 x 90 = 76,5
Penguasaan 75% skor mentahnya =75/100 x 90 = 67,5

329 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Penguasaan 55% skor mentahnya =65/100 x 90 = 58,5


Penguasaan 55% skor mentahnya = 55/100 x 90 = 49,5
Penguasaan 45% skor mentahnya = 45/100 x 90 = 40,5
Penguasaan 35% skor mentahnya =35/100 x 90 = 31,5
Penguasaan 25% skor mentahnya =25/100 x 90 = 22,5
Penguasaan 15% skor mentahnya =15/100 x 90 = 13,5
Penguasaan 5% skor mentahnya = 5/100 x 90 = 4,5

Untuk mengubah skor mentah menjadi skor standar


pada skala sebelas adalah sama seperti pada langkah skala
sepuluh. Jadi skor siswa dapat dikonversi dengan pedoman
berikut.
Skor mentah Skor standar
85,5 – 90 10
76,5 – 84,5 9
67,5 – 75,5 8
58,5 –66,5 7
49,5 – 57,5 6
40,5 – 48,5 5
31,5 – 39,5 4
22,5 – 30,5 2
4,5 - 12,5 1
0,0 - 3,5 0

d. Konversi skor dengan Skala Seratus


Skala seratus (skala persentil) adalah skala yang
bergerak antara nol sampai seratus. Untuk
mengkonversikan skor mentah menjadi skor
standardigunakan rumus berikut.

330 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

P= x 100
dengan:
P = persentil
X = skor yang dicapai

Contoh: Misalkan Skor Maksimal Ideal adalah 90. Jika


seorang siswa memperoleh skor mentah 75, maka skor
standar siswa tersebut adalah:

P= x 100 = 83,33

e. Konversi dengan Z skor


Skala Z skor adalah suatu ukuran yang
menunjukkan berapa besarnya penyimpangan standar
seseorang berada di bawah atau di atas rata-rata dalam
kelompok tersebut . Adapun rumus Z skor adalah:

̅
Z=
dengan: ̅ = Skor rata-rata ideal

Langkah-langkah yang ditempuh untuk


mengkonversikan skor mentah menjadi skor standar
dengan Z skor adalah sebagai berikut

a) Mencari skor maksimal ideal (SMI)


b) Mencari angka rata-rata ideal dengan menggunakan
rumus:
̅ = ½ x skor maksimal ideal (SMI)

331 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

c) Mencari standar deviasi ideal dengan rumus:


= 1/3 x ̅
d) Mengkonversikan skor mentah menjai skor standar,
dengan rumus Z skor.

Contoh . Misalkan Skor Maksimal Ideal adalah 90. Jika


seorang siswa memperoleh skor mentah 40, maka skor
standar siswa tersebut dihitung sebagai berikut:
SMI = 90
̅ = ½ x 90 = 45
, maka
̅
Z= = = - 0,33

f.Konversi dengan T skor


Yang dimaksud dengan T skor adalah suatu skor
terjabar yang
mempunyai rata-rata (M atau ̅) = 50 dan besar standar
deviasi (SD) = 10.
Rumusnya adalah:
̅
T = 50 + x 10 atau T = 50 + 10 Z
Keterangan:
X = skor mentah yang diperoleh siswa
̅ = rata-rata ideal
= standar deviasi ideal

332 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh: Kita ambil contoh soal di atas, jika siswa


memperoleh skor mentah 40, maka skor standarnya (T
skor) adalah;
̅
T = 50 + x 10

= 50 + x 10
= 50 + x 10
= 50 – 3,3 = 46,7 (dibulatkan 47)

Kelebihan Penilaian Acuan Patokan


Adapun kelebihan menggunakan konversi skor acuan
patokan, yaitu:

a) Dapat membantu guru merancang program remidial


b) Tidak membutuhkan perhitungan statistik yang
rumit
c) Dapat mengukur ketercapaian tujuan pembelajaran
d) Nilainya bersifat tetap selama standar yang
digunakan sama.
e) Hasil penilaian dapat digunakan untuk umpan balik
atau untuk mengetahui apakah tujuan pembelajaran
sudah tercapai atau belum.
f) Banyak digunakan untuk kelas dengan materi
pembelajaran berupa konsep.
g) Mudah menilai karena ada patokan

2. Penilaian Acuan Norma


Dalam Penilaian Acuan Norma (PAN), makna skor
seorang siswa ditentukan dengan cara membandingkan

333 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

hasil belajarnya dengan hasil belajar siswa lainnya dalam


satu kelompok kelasnya. Soal-soal tes dalam PAP harus
dibuat dengan tingkat kesukaran yang bervariasi, mulai
dari yang mudah sampai dengan yang sukar, sehingga
memungkinkan penyebaran jawaban siswa bervariasi,
sehingga dapat dibandingkan siswa yang satu dengan siwa
lainnya.
Sama seperti halnya pada pendekatan PAP,
pendekatan PAN juga dilakukan konversi skala lima, skala
100, skala sembilan, dan skala sebelas.
a. Konversi dengan Skala lima
Adapun langkah yang ditempuh untuk
mengkonversi skor mentah menjadi skor standar pada
skala lima adalah:
a) Menghitung angka rata-rata (M atau ̅) skor yang
diperoleh siswa, dengan rumus:

̅= atau ̅ =
dengan: x = skor peserta tes/siswa
f = frekwensi skor peserta tes/siswa
N = Jumlah peserta tes
b) Mencari Standar Deviasi (SD) dari skor yang
diperoleh siswa dengan rumus:
( ) ( )
SD = atau SD = --
c) Membuat pedoman konversi skala lima.
Pedoman konversi skala lima berarti membagi nilai
standar menjadi lima skala, atau lima kualifikasi.
Cara menyusun skala lima adalah dengan membagi

334 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

wilayah di bawah lengkung kurva normal menjadi


lima daerah, lihat gambar 14.1 berikut.

C
E D B A

𝑥
𝑥- 𝑥- 𝑥 𝑥

Gambar 14.1. Kurva normal skala lima

Kurva normal di atas terbagi menjadi lima daerah dan


setiap daerah menunjukkan nilai/angka dari kanan ke kiri
A, B, B, C, D dan E. Berdasarkan pembagian itu, pedoman
konversi skala lima dapat disusun sebagai berikut.
A
̅̅̅+ 1,5 SD
̅ + 0,5 SD B
C
̅ - 0,5 SD
D
̅ - 1,5 SD
E
Contoh: Misalkan skor hasil tes yang dikerjakan oleh
siswa adalah sebagai berikut (Nurkancana &Sunartana,
1990).

335 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

46 39 32 31 43 32 44
37 24 38 58 17 48 38
51 49 40 45 41 25
42 30 35 36 35 20
34 11 28 27 33 53

Dengan menggunakan langkah-langkah di atas


diperoleh:
a) Mean (M atau ̅ ) skor siswa = 36,37
b) Standar Deviasi (SD) skor yang diperoleh siswa
=10,15
c) Berdasarkan pedoman konversi skor skala lima
acuan norma maka dapat disusun pedoman
konversi sebagai berikut:
A
̅ + 1,5 SD = 36,37 + 1,5 x 10,15 =50,60
B
̅ + 0,5 SD = 36,37 + 0,5 x 10,15 = 41,35
C
̅ -+ 0,5 SD = 36,37 - 0,5 x 10,15 = 31,20
D
̅ - 1,5 SD = 36,37 – 1,5 x 10,15= 21,05
E

Dengan menggunakan pedoman konversi tersebut, maka


siswa yang memperoleh skor mentahnya 52, skor
standarnya menjadi A.

b. Konversi dengan Skala sembilan


Adapun langkah yang ditempuh untuk
mengkonversi skor mentah menjadi skor standar pada
skala sembilan adalah sama seperti langkah pada skor

336 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

lima (point: a, dan b), kecuali pada pedoman konversinya.


Pedoman konversi skala sembilan berarti membagi nilai
standar menjadi sembilan skala atau sembilan angka.Cara
menyusun skala sembilan adalah sama dengan skala lima
yaitu dengan membagi wilayah di bawah lengkung kurva
normal menjadi sembilan daerah, lihat gambar 14.2
berikut.

5
1 2 3 4 6 7 8 9
𝑥
𝑥- 𝑥
𝑥- 𝑥
𝑥- 𝑥
𝑥- 𝑥

Gambar 14.2. Kurva normal skala sembilan

Kurva normal tersebut terbagi menjadi sembilan daerah


dan setiap daerah menunjukkan nilai/angka dari kiri ke
kanan 1, 2, 3, 4, 5, 6, 7, 8, dan 9. Berdasarkan pembagian
itu, pedoman konversi skala sembilan dapat disusun
sebagai berikut.
9
̅ + 1,75 SD
8
337 | Pengukuran & Evaluasi
7 Hasil Dan Proses Belajar
Prof. Dr. Yusrizal, M.Pd

̅ + 1,25 SD
̅ + 0,75 SD
6
̅ + 0,25 SD
5
̅ - 0,25 SD
̅ - 0,75 SD 4
̅ - 1,25 SD 3
2
̅ - 1,75 SD
1
Contoh: Misalkan skor hasil tes adalah seperti yang ada
pada contoh di atas, dengan: Mean ( ̅ ) skor siswa = 36,37,
dan Standar Deviasi (SD) skor =10,15. Menggunakan
pedoman konversi skala sembilan,diperoleh sebagai
berikut.

9
̅ + 1,75 SD = 36,37 + 1,75 x 10,15 = 54,13
8
̅ + 1,25 SD = 36,37 + 1,25 x 10,15 = 49,06
7
̅ + 0,75 SD = 36,37 + 0,75 x 10,15 = 43,98
6
̅ + 0,25 SD = 36,37 + 0,25 x 10,15 = 38,91
5
̅ - 0,25 SD = 36,37 – 0,25 x 10,15 = 33,83
4
̅ - 0,75 SD = 36,37 – 0,75 x 10,15 = 28,76
3
̅ - 1,25 SD = 36,37 – 1,25 x 10,15 = 23,68
2
̅ - 1,75 SD = 36,37 – 1,75 x 10,15 = 18,61
1

338 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Dengan pedoman konversi skala sembilan di atas, maka


siswa yang skor mentahnya 30 akan mendapat skor
standarnya 4, sedangkan bagi siswa yang skor mentahnya
40, akan mendapat skor standarnya 6.

b. Konversi dengan Skala sebelas


Untuk mengkonversi skor mentah menjadi skor
standar pada skala sebelas hanya menambah satu interval
lagi ke atas dan satu interval lagi ke bawah pada pedoman
konversi skor sembilan, sehingga ada sebelas interval.
Langkah yang ditempuh untuk mengkonversi skor mentah
menjadi skor standar pada skala sebelas adalah sama
seperti langkah pada skor sembilan (point: a, dan b),
kecuali pada pedoman konversinya. Pedoman konversi
skor sebelas berarti membagi nilai standar menjadi sebelas
skala. Cara menyusun skala sebelas sama dengan skala lima
dan sembilan yaitu dengan membagi wilayah di bawah
lengkung kurva normal menjadi sebelas daerah, perhatikan
gambar 14.3 berikut.

5
0 1 2 3 4 6 7 8 9 10
𝑥
𝑥- 𝑥
𝑥- 𝑥
𝑥- 𝑥
𝑥- 𝑥
𝑥- 𝑥

339 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Gambar 14.3 Kurva normal skala sebelas

Kurva normal tersebut terbagi menjadi sebelas daerah dan


setiap daerah menunjukkan 10 nilai/angka dari kanan ke kiri
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, dan 10. Berdasarkan pembagian itu,
pedoman konversi skala sebelas dapat disusun sebagai
berikut.
̅ + 2,25 SD
9
̅ + 1,75 SD
8
̅ + 1,25 SD
7
̅ + 0,75 SD
6
̅ + 0,25 SD
5
̅ - 0,25 SD
̅ - 0,75 SD 4
3
̅ - 1,25 SD
2
̅ - 1,75 SD
1
̅ - 2,25 SD
0
Contoh: Misalkan skor hasil tes adalah seperti yang ada
pada contoh di atas, dengan: Mean ( ̅ ) skor siswa = 36,37,
dan Standar Deviasi (SD) =10,15. Menggunakan pedoman
konversi skala sebelas diperoleh sebagai berikut.
10
̅ + 2,25 SD = 36,37 + 2,25 x 10,15 = 59,21
9
̅ + 1,75 SD = 36,37 + 1,75 x 10,15 = 54,13
8
̅ + 1,25 SD = 36,37 + 1,25 x 10,15 = 49,06
7

340 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

̅ + 0,75 SD = 36,37 + 0,75 x 10,15 = 43,98


6
̅ + 0,25 SD = 36,37 + 0,25 x 10,15 = 38,91
5
̅ - 0,25 SD = 36,37 - 0,25 x 10,15 = 33,83
4
̅ - 0,75 SD = 36,37 - 0,75 x 10,15 = 28,76
3
̅ - 1,25 SD = 36,37 - 1,25 x 10,15 = 23,68
2
̅ - 1,75 SD = 36,37 – 1,75 x 10,15 = 18,61
1
̅ - 2,25 SD = 36,37 – 2,25 x 10,15 =13,53
0

Jadi menggunakan pedoman konversi skala sebelas, siswa


yang memperoleh skor mentahnya 40 akan mendapat skor
standarnya 5, sedangkan bagi siswa yang skor mentahnya
50, akan mendapat skor standarnya 8.

d. Konversi dengan Skala Z skor


Rumus Z skor acuan norma adalah sama saja
dengan rumus Z skor acuan patokan. Letak perbedaannya
adalah dalam mencari angka rata-rata (M atau ̅) dan
Standar Deviasi (SD)nya saja. Kalau pada rumus Z skor acuan
patokan M atau ̅ berdasarkan Skor
Maksimal Ideal (SMI), sedangkan pada rumus Z skor acuan
norma M atau ̅ berdasarkan distribusi
skor yang ril dicapai oleh peserta tes (Nurkancana dan
Sunartana,1990).
Adapun rumus Z skor untuk acuan norma adalah:
̅
Z=

341 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

dengan: x = skor
̅ = rata-rata

Jadi kalau diketahui Mean ( ̅ ) skor siswa = 36,37,


dan Standar Deviasi (SD) =10,15 maka konversi skor
mentah menjadi skor standar (Z skor) adalah sebagai yang
terlihat dalam Tabel berikut:

Contoh: Tabel Konversi skor mentah menjadi skor standar


(Z skor)
Nama Skor Skor standar
Siswa mentah (Z skor)
Aini 70 (70 – 36,37)/10,15 = 3,31
Budi. 60 (60 – 36,37)/10,15 = 2,32
Dian 55 (55 – 36,37)/10,15 = 1,86
Eka 50 (50 – 36,37)/10,15 = 1,34
Fitri 45 (45 – 36,37)/10,15 = 0,85
Leli 35 (35 – 36,37)/10,15 = -0,13
Sari 30 (30 – 36,37)/10,15 = -0,62

e.Konversi dengan Skala T skor


Rumus T skor untuk acuan norma juga sama dengan
rumus T skor untuk acuan patokan. Juga yang berbeda
hanya dalam cara mencari M atau ̅ . Rumus T
skor untuk acuan norma adalah:

̅
T = 50 + x 10 atau T = 50 + 10 Z

342 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Keterangan:
x = skor mentah yang diperoleh siswa
̅ = rata-rata skor siswa
= Standar Deviasi
Contoh: Konversi skor mentah menjadi skor standar (T
skor) adalah sebagai yang terlihat pada Tabel berikut.

Tabel konversi skor mentah menjadi skor standar (T


skor)
Nama Siswa Skor Skor standar
mentah (T skor)
Aini 70 50 + 10 x 3,31 = 63,30
Budi. 60 50 + 10 x 2,32 = 62,32
Dian 55 50 + 10 x 1,86 = 61,86
Eka 50 50 + 10 x 1,34 = 61,34
Fitri 45 50 + 10 x 0,85 = 60,85
Leli 35 50 + 10 x -0,13 = 59,87
Sari 30 50 + 10 x -0,62 = 59,38

Kelebihan Penilaian Acuan Norma


a) Dapat digunakan untuk menetapkan nilai secara
maksimal
b) Dapat membedakan kemampuan peserta didik yang
pintar dan kurang pintar. Membedakan kelompok atas
dan bawah.
c) Fleksibel: dapat menyesuaikan dengan kondisi yang
berbeda-beda
d) Mudah menilai karena tidak ada patokan
e) Dapat digunakan untuk menilai ranah kognitif, afektif
dan psikomotor .

343 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

344 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

UNIT VI
PENGUKURAN DAN
PENILAIAN AFEKTIF

Keberhasilan pembelajaran pada ranah kognitif dan


psikomotor dipengaruhi oleh kondisi afektif siswa. Siswa
yang memiliki minat belajar dan sikap positif terhadap
pelajaran akan merasa senang mempelajari mata pelajaran
tertentu, sehingga dapat mencapai hasil pembelajaran yang
optimal. Ranah afektif menentukan keberhasilan belajar
seseorang. Oleh karena itu semua guru atau pendidik harus
mampu membangkitkan minat semua siswa untuk
mencapai kompetensi yang telah ditentukan. Untuk itu
semua guru dalam merancang program pembelajaran,

345 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

harus memperhatikan ranah afektif. Pencapai hasil belajar


yang optimal, dalam mencapai program pembelajaran dan
kegiatan pembelajaran bagi peserta didik, pendidik harus
memperhatikan karakteristik afektif siswa. Aderson (1981)
berpendapat bahwa karakteristk manusia meliputi cara
yang tipikal dari berpikir, berbuat, dan perasaan. Tipikal
perasaan berkaitan dengan ranah afektif. Penilaian afektif
dilakukan oleh guru melalui pengamatan terhadap
perkembangan afeksi siswa.
Ada dua hal yang berhubungan dengan penilaian
afektif yang harus dinilai. Pertama, kompetensi afektif yang
ingin dicapai dalam pembelajaran meliputi tingkatan
pemberian respons, apresiasi, penilaian dan internalisasi.
Kedua, sikap dan minat siswa terhadap mata pelajaran dan
proses pembelajaran. Dalam proses pembelajaran terdapat
lima tipe karakteristik afektif yang penting yaitu sikap,
minat, konsep diri dan nilai dan moral. Seorang guru atau
pendidik sebaiknya mengetahui afektif siswa sehingga
dapat diketahui status afektif siswanya. Jika afektif tinggi
maka perlu mempertahankannya, jika rendah perlu upaya
untuk meningkatkannya.

346 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 15
BENTUK-BENTUK SKALA
PENGUKURAN
A.Skala Pengukuran
Skala adalah alat untuk mengukur nilai, sikap, minat
dan perhatian dan lain-lain yang disusun dalam bentuk
pernyataan untuk dinilai oleh responden dan hasilnya
dalam bentuk rentangan nilai sesuai dengan kriteria yang
ditentukan (Sudjana (2009). Skala terbagi tiga, yaitu: skala
penilaian, skala sikap, dan skala minat. Skala terdiri atas
daftar pernyataan/pertanyaan yang disampaikan kepada
responden untuk dijawab secara tertulis.
Ada beberapa model atau bentuk skala yang
dikembangkan oleh para pakar untuk mengukur sikap.

347 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Beberapa bentuk skala sikap antara lain adalah (1) Skala


Likert (2) Skala Semantik Diferensiasi (3) Skala Guttman,
dan (4) Skala Thrustone.

1.Skala Likert

Skala Likert dikembangkan


oleh Rensis Likert pada tahun 1932
dalam mengukur sikap masyarakat.
Dalam skala ini hanya menggunakan
item yang secara pasti baik dan
secara pasti buruk. Item yang pasti
disenangi, disukai, yang baik, diberi
Gambar 15.1. Rensis tanda negatif (-). Total skor
Likert
merupakan penjumlahan skor
responsi dari responden yang hasilnya ditafsirkan sebagai
posisi responden.
Skala Likert tersusun atas beberapa pernyataan
positif (favorable statements) dan pernyataan negatif
(unfavorable statements) yang mempunyai lima
kemungkinan jawaban (option) dengan kategori yang
continuum, dari mulai jawaban sangat setuju (strongly
agree) sampai sangat tidak setuju (strongly disagree).
Item-item Likert menyediakan respon dengan
kategori yang berjenjang. Biasanya banyaknya jenjang
adalah lima, yaitu : sangat setuju, setuju, ragu-ragu, tidak
setuju dan sangat tidak setuju. Setiap kategori respon,

348 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

selanjutnya diberi skor. Penskoran untuk skala sikap Likert


dapat dilakukan sebagai berikut.

Pernyataan Positif Pernyataan Negatif


Sangat Setuju (SS) 5 Sangat Setuju (SS) 1
Setuju (S) 4 Setuju (S) 2
Netral (N) 3 Netral (N) 3
Tidak Setuju (TS) 2 Tidak Setuju (TS) 4
Sangat Tidak Setuju 1 Sangat Tidak Setuju 5
(STS) (STS)

a. Langkah-langkah penyusunan:
Adapun langkah-langkah penyusunan Skala Likert
(Likert Scales) dapat dirinci sebagai berikut.
1. Menentukan objek sikap --- misalnya sikap
terhadap pelajaran fisika.
2. Menyusun kisi-kisi atau konstruk skala sikap berisi
rincian aspek sikap berikut jumlah dan jenis
pernyataan (positif atau negatif).
3. Menulis pernyataan (statement) secara tepat
dengan memperhatikan kaedah sebagai berikut.
a. menghindari kalimat yang mengandung
banyak interpretasi;
b. rumusan pernyataan hendaknya singkat;
c. satu pernyataan hendaknya hanya
mengandung satu pikiran yang lengkap;
d. sedapat mungkin, pernyataan hendaknya
dirumuskan dalam kalimat yang sederhana;
e. menghindari penggunaan kata-kata: semua,
selalu, tidak pernah, dan sejenisnya;

349 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

4. Mengkaji/menganalisis setiap pernyataan secara


rasional (isi telah mewakili aspek/objek sikap dan
struktur kalimat benar)
5. Menganalisis tingkat kebaikan skala sikap
(reliabilitas, validitas, ketepatan skala
6. Antara pernyataan positif dan pernyataan negatif
hendaknya relatif berimbang.
7. Setiap pernyataan diikuti dengan skala sikap (bisa
genap, misanya 4 atau ganjil, misalnya 5).

b. Penskoran dan Interpretasi


Untuk menghitung total skor tiap responden adalah
dengan cara menjumlahkan skor-skor item yang diperoleh
responden. Oleh karena itu, prosedur penskalaan Likert
sering disebut sebagai : Likert’s Summeted Rating.
Skor yang dicapai oleh siswa adalah jumlah dari
seluruh angka untuk seluruh penyataan yang direspon atau
diberi tanda cek (√). Perbedaan jumlah angka yang dicapai
oleh para siswa dapat ditafsirkan sebagai perbedaan sikap,
positif atau negatif, terhadap objek sikap.
Untuk menilai sikap individu atau kelompok (skor
rata-rata), yaitu dengan cara membanding skor yang
diperoleh dengan kriteria tertentu. Caranya adalah sebagai
berikut. Jika jumlah butir skala sikap 5, maka:
a. Menentukan skor maksimal, yaitu skor jawaban
terbesar di kali banyak item 5 x 5 = 25
b. Menentukan skor minimal, yaitu skor jawaban
terkecil dikali banyak item 1 x 5 = 5

350 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

c. Menentukan nilai median, yaitu hasil penjumlahan


skor maximal dengan skor minimal dibagi dua (25 +
5) : 2 = 15
d. Menentukan nilai kuartil 1, yaitu hasil penjumlahan
skor minimal dengan median dibagi dua (5 + 15): 2
= 10
e. Menentukan kuartil 3, yaitu hasil penjumlahan skor
maksimal dengan median dibagi dua (25 + 15): 2 =
20
Selanjutnya berdasarkan angka-angka
tersebut dibuatkan skalanya, sebagai berikut.

5 10 15 20 30

Minimal Kuartil 1 Median Kuartil 3 Maksimal

Gambar 15.2. Skala

Berdasarkan gambar skala di atas maka skor dari keempat


kategori
adalah :
Sikap sangat setuju : (kuartil 3  x  skor maksimal)
Sikap setuju : (median  x < kuartil 3)
Sikap tidak setuju : (kuartil 1  x < median)
Sikap sangat tidak setuju : (skor minimal  x kuartil
1)

351 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

c. Kelebihan skala likert:


1) Dalam menyusun skala, item-item yang tidak jelas
korelasinya masih dapat dimasukkan dalam skala.
2) Lebih mudah membuatnya dari pada skala
thurstone.
3) Mempunyai reliabilitas yang relatif tinggi dibanding
skala thurstone untuk jumlah item yang sama. Juga
dapat memperlihatkan item yang dinyatakan dalam
beberapa responsi alternatif.
4) Dapat memberikan keterangan yang lebih nyata
tentang pendapatan atau sikap responden.

d. Kelemahan skala likert:


1) Hanya dapat mengurutkan individu dalam skala,
tetapi tidak dapat membandingkan berapakali
individu lebih baik dari individu lainya.
2) Kadang kala total skor dari individu tidak
memberikan arti yang jelas, banyak pola responsi
terhadap beberapa item akan memberikan skor
yang sama.
3) Validitas dari skala likert masih memerlukan
penelitian empirik.

2. Skala Semantik Diferensial


Teknik Pengukuran semantik differensial
idiperkenalkan oleh Charles Osgood (1957) yang
menekankan pada aspek semantik sebuah kata. Skala ini
merupakan salah satu teknik self report untuk pengukuran
sikap dimana subjek diminta memilih satu kata sifat atau

352 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

frase dari sekelompok pasangan kata sifat atau pasangan


frase yang disediakan yang paling mampu menggambarkan
perasaan mereka terhadap suatu objek. Teknik semantik
differensial merupakan penyempurnaan dari skala Likert
yang tidak mampu menjangkau respon yang bersifat
multidimensi, misalnya sikap terhadap standar nilai UAN
Skala Diferensiasi Semantik memiliki dua kelebihan
dibandingkan dengan berbagai teknik yang lain. Pertama,
teknik ini dapat digunakan dalam berbagai bidang. Kedua,
teknik ini sederhana dan mudah diimplementasikan dalam
pengukuran dan penilaian sikap, termasuk dalam
pengukuran dan penilaian sikap siswa di kelas.

a.Langkah-langkah pengembangan
Langkah-langkah pengembangan skala Diferensial
Semantik ini adalah sebagai berikut.
1) Menentukan objek sikap yang akan dikembangkan
skalanya, misalnya "Sikap terhadap Mata Pelajaran
Fisika".
2) Memilih dan membuat daftar dari konsep dan kata
sifat yang relevan dengan objek penilaian sikap.
Misalnya: menarik; penting; menyenangkan; mudah
dipelajari; dan sebagainya.
3) Memilih kata sifat yang tepat dan akan digunakan
dalam skala.
4) Menentukan rentang skala pasangan bipolar dan
penskorannya.

b. Penskoran dan interpretasi

353 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Penskoran untuk skala ini dapat dilakukan dalam


rentang 1 sampai dengan 7. Arah paling kiri adalah paling
besar, yakni diskor 7, karena menunjukkan sikap paling
positif terhadap objek sikap, mata pelajaran Fisika. Arah
paling kanan adalah paling kecil, karena menunjukkan
sikap paling negatif terhadap mata pelajaran tersebut.
Andaikan jumlah pernyataan sikap ada 5 maka:

Skor maksimum adalah: 5 x 7 = 35


Skor minimum adalah: 1 x 7 = 7

Jika siswa memperoleh skor semakin mendekati


angka 7 (skor terendah), dapat diinterpretasikan semakin
negatif sikap siswa terhadap mata pelajaran Fisika.
Sebaliknya, jika siswa memperoleh skor semakin
mendekati angka 35 (skor tertinggi), dapat
diinterpretasikan semakin positif sikap siswa terhadap
mata pelajaran Fisika.
Jika siswa memilih sikap netral terhadap mata
pelajaran Fisika, siswa akan memberi tanda cek pada
interval skala tengah. Pada interval skala ini skor yang
diberikan adalah 3. Dengan demikian, apabila siswa
memilih sikap netral untuk semua pernyataan sikap
(andaikan jumlah pernyataan sikap ada 5), maka siswa
akan memperoleh skor 15. Dengan demikian skor yang
diperoleh siswa dengan skala tersebut dapat
diinterpretasikan sebagai berikut.

354 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Skor 15 = Sikap siswa adalah netral.


Skor > 15 = Sikap siswa adalah positif.
Skor < 15 = Sikap siswa adalah negatif.

3. Skala Thrustone
Skala Thurstone, skala ini mula-mula dikembangkan
oleh L.L Thurstone dari metoda psikofisikal yang bertujuan
untuk mengurutkan responden berdasarkan ciri atau
kriteria tertentu. Skala Thurstone, digunakan untuk
mengukur tentang sikap, persepsi seseorang atau
sekelompok orang tentang fenomena tertentu yang ingin
diketahui. Skala Thurstone memuat jumlah pernyataan
yang harus dipilih oleh responden, yang masing-masing
telah diberi skor (bobot) tertentu.

a. Langkah-langkah penyusunan
1) Pembuat skala menyusun
sebanyak-banyaknya pernyataan yang
berhubungan dengan masalah yang
dinilai ,kira-kira 100-300 butir.

Gambar 15. 3. L.L 2) Pernyataan yang disajikan


Thurstone dengan menggunakan skala Thurstone
ini biasanya dibuat sebanyak 9 atau 11
butir.
3) Misalkan pembuat skala menentukan bahwa skor yang
akan dipakai untuk pernyataan yang kontribusinya

355 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

paling tinggi adalah 9 dan untuk yang paling rendah


diberi skor 1, sehingga skor tengahnya sama dengan 5
4) Berdasarkan hasil pertimbangannya, ia menetapkan
bahwa pernyataan yang paling tinggi kontribusinya
terhadap sikap positif (misalnya terhadap Fisika) adalah
pernyataan nomor 2 sehingga ia memberi bobot skor 9.
5) Agar hasil pertimbangan itu lebih objektif, ia meminta
bantuan kepada teman seprofesinya yang dianggap
mampu atau lebih mampu daripada dirinya sendiri.
Misalkan ada 4 orang yang diminta pertimbangan itu,
hasil pertimbangan untuk butir nomor 2 dari keempat
orang itu masing-masing 8, 8, 9 dan 9. Dengan demikian
skor untuk butir soal nomor 2 itu adalah =
8,6
6) Untuk butir nomor 8 pembuat skala memberi skor 2
karena ia menganggap kontribusinya rendah terhadap
sikap siswa Keempat teman lainnya masing-masing
memberi skor 3, 4, 1, 2 sehingga skor untuk butir nomor
8 adalah = 2,4
Begitulah seterusnya cara pemberian skor untuk setiap
butir pernyataan.
7) Misalkan skor untuk setiap butir soal, berturut-turut
dari butir soal nomor 1
sampai dengan nomor 9 adalah sebagai berikut :
9,0; 8,6; 8,2; 7,6; 4,5; 6,0; 7,6; 2,4; 4,0; 5,3
Setelah skala diberikan kepada responden (siswa),
misalkan Eva memilih butir-butir nomor 1, 4, 6, 7 dan
10. Rerata skor dari Eva adalah
9,0 + 7,6 + 6,0 + 7,6 + 5,3 = 7,1

356 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

8) Ini berarti sikap Eva terhadap fisika positif, karena


skornya lebih dari skor tengah (= 5).

4. Skala Guttman

Skala Guttman dikembangkan


oleh Louis Guttman. Skala ini
mempunyai ciri penting, yaitu (1)
merupakan skala kumulatif, artinya jika
seseorang mengiakan pernyataan yang
berbobot lebih berat, maka ia juga akan
Gambar 15.4. Louis
Guttman mengiakan pernyataan yang kurang
berbobot lainnya, (2) dan mengukur
satu dimensi saja dari satu variabel yang multi dimensi,
sehingga skala ini termasuk mempunyai sifat
undimensional.
Skala Guttman ialah skala yang digunakan untuk
jawaban yang bersifat jelas (tegas dan konsisten. Misalnya
yakin-tidak yakin ;ya – tidak; benar-salah; positif – negatif;
pernah-belum pernah ; setuju – tidak setuju; dan
sebagainya.
Pengukuran dengan menggunakan skala Guttman
apabila ingin mendapatkan jawaban jelas (tegas) dan
konsisten terhadap suatu permasalahan yang ditanyakan.

Contoh:
a. Yakin atau tidakkah anda, pergantian Kurikulum
akan dapat meningkatkan mutu pendidikan ?

357 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

1. Yakin
2. Tidak

b. Pernahkah atasan saudara mengajak rembuk


bersama?
1. Pernah
2. Tidak Pernah

Skala Guttman yang disebut juga metode scalogram


atau analisa skala (scale analysis) sangat baik untuk
menyakinkan peneliti tentang kesatuan dimensi dari sikap
atau sifat yang diteliti, yang sering disebut isi universal
(universe of content) atau atribut universal (universe
attribute). Dalam prosedur Guttman, suatu atribut
universal mempunyai dimensi satu jika menghasilkan
suatu skala kumulatif yang sempurna,yaitu semua responsi
diatur sebagai berikut (Nazir,1983):
Pernyataan-pernyataan dalam skala Guttman
disusun sedemikian rupa hingga jika responden menjawab
YA pada butir pernyataan nomor 1, 2, dan 3 kemudian
menjawab TIDAK pada butir nomor 4, untuk butir
berikutnya ia menjawab TIDAK. Jadi diharapkan responden
menjawab YA pada butir-butir awal, sekali ia menjawab
TIDAK pada suatu butir pernyataan maka ia akan
menjawab TIDAK pada butir selanjutnya. Dengan demikian
penilaian cukup dengan mempertimbangkan atau
menghitung batas jawaban YA yang diberikan responden.
Interpretasi untuk menentukan sikap responden bisa
dilakukan dengan cara menghitung persentase banyaknya
jawaban YA dari seluruh butir pernyataan yang disajikan.

358 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

YA TIDAK
Skor 4 3 2 4 3 2 1
1
4 x
3 x x x x x
2 x x x x
1 x x x x x x
0 x
x
x

a. Langkah-langkah penyusunan
1. Susunlah sejumlah pertanyaan yang relevan dengan
masalah yang ingin diselidiki.
2. Lakukan penelitiaan permulaan pada sejumlah
responden dari populasi yang akan diselidiki,
sampel yang diselidiki minimal besarnya 50.
3. Jawaban yang diperoleh dianalisis, dan jawaban
yang ekstrim dibuang. Jawaban yang ekstrim adalah
jawaban yang disetujui atau tidak disetujui oleh
lebih dari 80% responden.
4. Susunlah jawaban pada tabel Guttman.
5. Hitunglah koefisien reprodusibilitas dan koefisien
skalabilitas.

359 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Koefisien Reprodusibilitas, yang mengukur derajat


ketepatan alat ukur yang telah dibuat (yaitu daftar
pertanyaan) dihitung dengan menggunakan rumus:
Kr = 1-
dengan:
n = total kemungkinan jawaban, yaitu jumlah
pertanyaan x jumlah responden.
e = jumlah error.
Kr = koefisien reprodusibilitas

Sedangkan Koefisien Skalabilitas ditentukan dengan rumus

Ks 1-
dengan:
e = jumlah error.
P = jumlah kesalahan yang diharapkan.
Ks = koefisien skalabilitas.

b . Kelemahan Skala Guttman, yaitu:


1. Skala ini bisa jadi tidak mungkin menjadi dasar yang
efektif baik intuk mengukur sikap terhadap objek yang
kompleks atau pun untuk membuat prediksi tentang
perilaku objek tersebut.
2. Satu skala bisa saja mempunyai dimensi tunggal untuk
satu kelompok tetapi ganda untuk kelompok lain,
ataupun berdimensi satu untuk satu waktu dan
mempunyai dimensi ganda untuk waktu yang lain.

360 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

B. Pengukuran dan Penilaian Sikap


1.Pengertian Sikap
Edward (1957) mengemukakan “Attitude as the
degree of positive or negative affect associated with some
psychological object “Artinya Sikap adalah afeksi positif
atau negatif yang berhubungan dengan beberapa objek
psikologis. Menurut Thrustone (1970) Sikap adalah
penilaian tentang suka atau tidak suka, tanggapan
positif/negatif terhadap suatu objek psikologis. Anastasi
(Depdiknas, 2007) mendefinisikan sikap sebagai
kecenderungan untuk bertindak secara suka atau tidak
suka terhadap sesuatu objek. Sedangkan menurut Birrent,
et all (1981) mendefinisikan sikap sebagai kumpulan hasil
evaluasi seseorang terhadap objek, orang, atau masalah
tertentu. Jadi sikap adalah suatu bentuk dari perasaan,
yaitu perasaan mendukung atau memihak (favourable)
maupun perasaan tidak mendukung (Unfavourable) pada
suatu objek. Sikap belum merupakan tindakan/aktivitas,
melainkan berupa kecenderungan (tendency) atau
predisposisi tingkah laku. Sikap lebih merupakan
”stereotype” seseorang. Melalui sikap seseorang, kita dapat
mengenal siapa orang itu yang sebenarnya.
Menurut Mouly (1967) sikap memiliki tiga
komponen yaitu (1). Komponen afektif- kehidupan
emosional individu, yakni perasaan tertentu (positif atau
negatif) yang mempengaruhi penerimaan atau penolakan
terhadap objek sikap, sehingga timbul rasa senang-tidak
senang, takun-tidak takut. (2) Komponen kognitif yaitu
aspek intelektual yang berhubungan dengan bilief, idea

361 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

atau konsep terhadap objek sikap, dan (3). Komponen


behavioral, yakni kecenderungan individu untuk
bertingkah laku tententu terhadap objek sikap.
Menurut Mar’at (1984): (1) Komponen kognisi
berhubungan dengan belief (kepercayaan atau keyakinan),
ide, konsep, persepsi, stereotipe, opini yang dimiliki
individu mengenai sesuatu. (2) Komponen Afeksi
berhubungan dengan kehidupan emosional seseorang,
menyangkut perasaan individu terhadap objek sikap dan
menyangkut masalah emosi, dan (3) Komponen Kognisi
yang merupakan kecenderungan bertingkah laku .
Sikap adalah salah satu tipe karakteristik afektif
yang penting. Tipe karakteristik penting lainnya yaitu :
minat, konsep diri, nilai, dan moral.

2. Sikap dan Objek Sikap yang Perlu Dinilai


Penilaian sikap dalam berbagai mata pelajaran
secara umum dapat dilkakukan dalam berkaitan dengan
berbagai objek sikap sebagai berikut.

a) Sikap terhadap mata pelajaran. Siswa perlu


memiliki sikap positif terhadap mata pelajaran.
Dengan sikap positif dalam diri siswa akan tumbuh
dan berkembang minat belajar, akan lebih mudah
diberi motivasi, dan akan lebih mudah menyerap
materi pelajaran yang diajarkan. Oleh karena itu,
guru perlu menilai tentang sikap siswa terhadap
mata pelajaran yang diajarkannya.
b) Sikap terhadap guru mata pelajaran. Siswa perlu
memiliki sikap positif terhadap guru, yang mengajar

362 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

suatu mata pelajaran. Siswa yang tidak memiliki


sikap positif terhadap guru, akan cenderung
mengabaikan halhal yang diajarkan. Dengan
demikian, siswa yang memiliki sikap negatif
terhadap guru pengajar akan sukar menyerap
materi pelajaran yang diajarkan oleh guru tersebut.

c) Sikap terhadap proses pembelajaran. Siswa juga


perlu memiliki sikap positif terhadap proses
pembelajaran yang berlangsung. Proses
pembelajaran disini mencakup: suasana
pembelajaran, strategi, metodologi, dan teknik
pembelajaran yang digunakan. Tidak sedikit siswa
yang merasa kecewa atau tidak puas dengan proses
pembelajaran yang berlangsung, namun mereka
tidak mempunyai keberanian untuk menyatakan.
Akibatnya mereka terpaksa mengikuti proses
pembelajaran yang berlangsung dengan perasaan
yang kurang nyaman. Hal ini dapat mempengaruhi
terhadap penyerapan materi pelajarannya.

d) Sikap terhadap materi dari pokok-pokok


bahasan. Siswa juga perlus memiliki sikap positif
terhadap materi pelajaran yang diajarkan, sebagai
kunci keberhasilan proses pembelajaran.

C. Metode Pengukuran Sikap


Menurut Zakaria (2008), pengukuran sikap dapat
dilakukan dengan beberapa cara. Cara-cara tersebut antara

363 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

lain: observasi perilaku, pertanyaan langsung, laporan


pribadi, dan penggunaan skala sikap.

1. Observasi perilaku
Observasi merupakan teknik penilaian yang
dilakukan secara berkesinambungan dengan menggunakan
indera, baik secara langsung maupun tidak langsung
dengan menggunakan pedoman observasi yang berisi
sejumlah indikator perilaku yang diamati. Observasi
langsung dilaksanakan oleh guru secara langsung tanpa
perantara orang lain. Sedangkan observasi tidak langsung
dengan bantuan orang lain, seperti guru lain, orang tua,
siswa, dan karyawan sekolah. Oleh karena itu guru dapat
melakukan observasi terhadap siswa, bisa menggunakan
daftar cek (checklists), kemudian hasil observasi dapat
dijadikan sebagai umpan balik dalam pembinaan.
Observasi dilakukan dengan menggunakan buku catatan
Bentuk instrumen yang digunakan untuk observasi
adalah pedoman observasi yang berupa daftar cek atau
skala penilaian (rating scale) yang disertai rubrik. Daftar
cek digunakan untuk mengamati ada tidaknya suatu sikap
atau perilaku. Sedangkan skala penilaian menentukan
posisi sikap atau perilaku siswa dalam suatu rentangan
sikap. Observasi perilaku di Sekolah dapat dilakukan
dengan Buku Catatan Harian.

364 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Contoh : Buku Catatan Harian dapat berisi sebagai


berikut :
No Hari/tanggal Nama Kejadian Tindak
Siswa (positif/negatif) Lanjut

2. Pertanyaan langsung
Guru juga dapat menanyakan secara langsung
tentang sikap siswa berkaitan dengan sesuatu hal.
Berdasarkan jawaban dan reaksi lain dari siswa dalam
memberi jawaban dapat dipahami sikapnya terhadap objek
sikap tersebut.
Jika guru ingin mengetahui sikap siswa terhadap
materi pelajaran yang diampunya dengan cara
menanyakan langsung, maka guru tersebut dapat
menggunakan instrumen penilaian sikap seperti berikut

3. Laporan pribadi
Penggunaan teknik ini di sekolah, misalnya: siswa
diminta membuat ulasan yang berisi pandangan atau
tanggapannya tentang suatu masalah, keadaan, atau hal,
yang menjadi objek sikap. Dari ulasan yang dibuat oleh

365 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

siswa tersebut dapat dibaca dan pahami kecenderungan


sikap yang dimilikinya.

4. Skala Sikap
Menggunakan skala-skala sikap sebagaimana yang
telah diuraikan di atas, kita dapat menilai sikap siswa. Kita
boleh menggunakan skala Likert atau skala diferensial
semantik. Yang perlu diperhatikan adalah konstruksi butir-
butirnya harus berpedoman pada indikator dari variabel
yang ingin dinilai. Sebagai contoh di bawah, ingin dinilai
sikap siswa terhadap pelajaran fisika.

Contoh sikap siswa terhadap pelajaran fisika


a) Menggunakan skala Likert
No Sikap siswa STS TS R S SS
1 Pelajaran fisika
bermanfaat
2 Pelajaran fisika sulit
3 Tidak semua siswa
harus
Belajar fisika
4 Pelajaran fisika
harus dibuat mudah
5 Harus banyak
latihan pada
Pelajaran fisika

366 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

b) Menggunakan skala Semantik Differensial


Menarik !------!------!------!-------!------!-------!-------! Membosankan

Bermanfaat !------!------!-------! ------!-------!-------!-------! Sia-sia

Banyak !------!------!-------!-------!------!-------!-------! Banyak


Pemahaman Hafalan

Mudah !-------!------!------!------!-------!-------!-------! Sukar

367 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

368 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 16
PENGEMBANGAN I
NSTRUMEN AFEKTIF
A. Prosedur Pengembangan Instrumen
Gable (1986) memberikan secara garis besar 15
langkah kerja yang harus ditempuh dalam
mengembangkan instrumen, yaitu sebagai berikut: (1)
mengembangkan definisi konseptual, (2)
mengembang- kan definisi operasional, (3) memilih
teknik pemberian skala, (4) melakukan review
justifikasi butir, yang berkaitan dengan teknik pemberian
skala yang telah ditetapkan, (5) memilih format respons
atau ukuran sampel, (6) penyusunan petunjuk untuk
respons, (7) menyiapkan draf instrumen, (8)
menyiapkan instrumen akhir, (9) pengumpulan data
ujicoba awal, (10) analisis data ujicoba dengan

369 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

menggunakan teknik analisis faktor, analisis butir dan


reliabilitas, (11) revisi instrumen, (2) melakukan ujicoba
final, (13) menghasilkan instrumen, (14) melakukan
analisis validitas dan reliabilitas tambahan, dan (15)
menyiapkan manual tes.
Menurut Djaali dan Muljono (2008) langkah-
langkah pengem- bangan instrumen adalah sebagai
berikut: (1) merumuskan konstruk berdasarkan sintesis
dari teori-teori yang dikaji, (2) dari konstruk
dikembangkan dimensi dan indikator variabel yang
hendak diukur, (3) membuat kisi-kisi instrumen dalam
bentuk tabel spesifikasi yang memuat dimensi, indikator,
nomor butir dan jumlah butir, (4) menetapkan besaran
atau parameter dalam suatu rentangan kontinum,
(5) menulis butir-butir instrumen dalam bentuk
pernyataan atau pertanyaan, (6) melakukan proses
validasi, (7) melakukan validasi teoritik, (8) merevisi
berdasarkan hasil panel, (9) melakukan penggandaan
instrumen untuk ujicoba, (10) ujicoba di lapangan
yang merupakan validasi empirik, (11) pengujian validitas
empiris dengan menggunakan kriteria internal
maupun eksternal, (12) berdasarkan kriteria diperoleh
kesimpulan mengenai valid atau tidaknya sebuah butir
atau perangkat instrumen, (13) berdasarkan hasil analisis
butir, butir-butir yang tidak valid dikeluarkan atau
diperbaiki, butir-butir yang valid dirakit kembali, (14)
menghitung koefisien reliabilitas, dan (15) perakitan
kembali butir-butir instrumen yang valid untuk
dijadikan instrumen.

370 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Dari uraian di atas dapat diimpulkan bahwa dalam


upaya pengembangan instrumen, pertama-tama harus
ditetapkan konstruk variabel yang merupakan sintesis
dari teori-teori yang telah dibahas dan dianalisis.
Kemudian konstruk tersebut dijelaskan dalam
definisi konseptual dan definisi operasional yang
mencakup dimensi/sub dimensi dan indikator dari
variabel yang hendak diukur. Baru kemudian dibuat kisi-
kisi instrumen dan butir-butir instrumen untuk mengukur
indikator-indikator yang telah ditetapkan.
Alur tahapan penyusunan dan pengembangan
instrumen tersebut dapat dilihat pada gambar 16.1
berikut.

Variabel Teori Penulisan Butir

Konstruk Ujicoba Instrumen

Definisi Konseptual
Analisis Hasil Ujicoba

Definisi Operasional
Revisi Instrumen

Penetapan Instrumen
Finalisasi

Kisi-Kisi Instrumen
Perbanyakan Instrumen

Gambar 16.1. Alur Penyusunan dan Pengembangan Instrumen

371 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

B. Penulisan Butir Instrumen


Terkait dengan penulisannya, Edwards (1957)
memberikan kriteria informal yang dapat digunakan dalam
penulisan pernyataan sikap, adalah sebagai berikut:
(1) menghindari menulis pernyataan yang membicarakan
kejadian yang telah lewat kecuali kalau objek sikapnya
berkaitan dengam masa lalu, (2) menghindari menulis
pernyataan yang berupa fakta atau dapat ditafsirkan
sebagai fakta, (3) menghindari menulis pernyataan yang
dapat menimbulkan lebih dari satu penafsiran, (4)
menghindari menulis pernyataan yang tidak relevan
dengan objek psikologisnya, (5) menghindari menulis
pernyataan yang sangat besar kemungkinannya akan
disetujui oleh hampir semua orang atau hampir tak
seorangpun yang akan menyetujuinya, (6) memilih
pernyataan-pernyataan yang diperkirakan akan mencakup
keseluruhan liputan skala afektif yang diinginkan, (7)
mengusahakan agar setiap pernyataan ditulis dalam
bahasa yang sederhana, jelas, dan langsung, (8) pernyataan
sebaiknya pendek, tidak melebihi dari 20 kata, (9) setiap
pernyataan harus berisi hanya satu ide yang lengkap,
(10) pernyataan yang berisi unsur universal seperti “tidak
pernah, “semuanya”, “selalu”,”tak seorangpun, dan tak
pernah, seringkali menimbulkan penafsiran yang
berbeda-beda, karenanya sedapat mungkin dihindari, (11)
kata-kata seperti “hanya”, “sekedar”, “semata-mata”
dan sejenisnya harus digunakan seperlunya saja, (12)
jika memungkinkan, pernyataan sebaiknya menggunakan
bentuk kalimat sederhana, bukan kalimat umum dan

372 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

komplek, (13) menghindari kata atau istilah yang


berkemungkinan tidak dimengerti oleh para responden,
(14) menghindari pernyataan yang berisi kata negatif
ganda.

373 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

374 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

BAB 17
CONTOH PENGEMBANGAN
INSTRUMEN: KINERJA GURU
A.Instrumen Kinerja Guru
Misakan kita ingin mengembangkan instrumen untuk
mengukur kinerja guru, jadi variable disini adalah kinerja
guru. Berdasarkan teori pengembangan pada BAB 16 di
atas, maka langkah pertama adalah membaca sejumlah
literatur untuk mengetahui apa itu kinerja guru, dan apa
indicator-indikatornya.

1. Mencari pengertian kinerja guru dan indikatornya.


Misalkan Rowland (1960) mengemukakan bahwa
kinerja merupakan terjemahan dari kata performance yang
berarti tindakan untuk melakukan suatu pekerjaan.

375 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Whitmore (1997) mengemukakan pengertian kinerja


sebagai suatu perbuatan, suatu prestasi atau apa yang
diperlihatkan seseorang melalui keterampilannya yang
nyata. Dan Lase (2003) mengemukakan definisi
konseptual kinerja sebagai penilaian seseorang tentang
potensi dan tingkat pemenuhan kerja yang terdiri dari
perbuatan, prestasi, keterampilan di depan umum,
kompetensi, dan juga tuntutan mengemban
tanggungjawab.
Pandangan lain seperti yang dikemukakan King
(1984) menyatakan bahwa kinerja adalah aktivitas
seseorang melaksanakan tugas pokok yang dibebankan
kepadanya. Mengacu pada pandangan ini, dapat
diinterpretasikan bahwa kinerja seseorang dihubungkan
dengan tugas-tugas rutin yang dikerjakannya. Sebagai
guru, misalnya tugas rutinnya adalah mengajar. Hasil yang
dicapai secara optimal dari tugas tersebut merupakan
kinerja guru.
Shackelford dan Henak dalam Soekartawi (1995)
memberikan sepuluh kriteria dalam upaya mendefinisikan
ciri-ciri pengajar yang efektif, yaitu (a) mempunyai
intusiastik, (b) mempunyai keterampilan berkomunikasi,
(c) dapat menjelaskan persoalan atau topik secara jelas, (d)
menguasai bahan ajar, (e) mampu membuat suasana kelas
menjadi hidup, (f) fleksibel, (g) memberikan bahan ajar
terorganisasi secara rapi sesuai dengan silabus, (h) adil
dalam memberi nilai, (i) mau menerima umpan balik, dan
(j) akrab dengan situasi kelas.
Menurut Riyanto (2003) komponen-komponen
mengajar adalah meliputi (1) tujuan, (2) bahan, (3)

376 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

metode, (4) guru, (5) siswa, (6) fasilitas, (7) interaksi, dan
(8) evaluasi. Sumiyati (2005) mengemukakan bahwa
kinerja guru adalah aktivitas guru dalam melaksanakan
pembelajaran dan yang dapat diamati oleh siswa yang
mencakup: (1) pengelolaan kelas, (2) kualitas personal, (3)
hubungan guru siswa, (4) teknik mengajar, dan (5)
perilaku. Selanjutnya masih terkait dengan proses belajar
mengajar, Mcbeath (1992) mengemukakan bahwa dalam
menyiapkan pembelajaran guru harus: (1) memilih materi,
(2) mengorganisir materi, (3) memilih contoh-contoh
dan sumber-sumber, (4) menyeleksi format penyajian, (5)
membuat kondisi untuk kesuksesan pembelajaran, (6)
melakukan evaluasi keefektifan pembelajaran, (7)
membuat ringkasan, dan (8) memberikan tugas.
Guru adalah sebuah jabatan yang mempunyai tugas
pokok mendidik, mengajar dan melatih. Mendidik berarti
meneruskan dan mengembangkan nilai-nilai hidup,
mengajar berarti meneruskan dan mengembangkan
pemahaman siswa terhadap ilmu pengetahuan dan
teknologi, sedangkan melatih berarti mengembangkan
keterampilan-keterampilan pada siswa. Kinerja guru
adalah kemampuan guru untuk menampilkan atau
mengerjakan tugas guru. Berdasarkan uraian dalam kajian
pustaka di atas, maka dapat disimpulkan bahwa enam
indikator kinerja guru di dalam kelas. Keenam indikator
tersebut masing-masing yaitu: (1) Strategi Pembelajaran,
(2) Penguasaan Materi, (3) Pengelolaan Kelas, (4)
Komunikasi dengan Siswa, (5) Teknik Mengajar, dan (6)
Penilaian Hasil Belajar Siswa.

377 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

2. Konstruk Instrumen
Konstruk kinerja adalah variabel yang merupakan
sintesis dari teori-teori kinerja yang telah dibahas di atas.
Konstruk tersebut dijelaskan dalam definisi konseptual dan
definisi operasional yang di dalamnya tercakup dimensi,
dan indikator dari variabel kinerja guru yang hendak
diukur.

Definisi Konseptual kinerja guru


Kinerja guru adalah capaian yang diperoleh guru
dalam melaksanakan tugas profesinya sebagai pengajar
yang meliputi antara lain: (1) Strategi Pembelajaran, (2)
Penguasaan Materi, (3) Pengelolaan Kelas, (4) Komunikasi
dengan Siswa, (5) Teknik Mengajar, dan (6) Penilaian Hasil
Belajar Siswa.

Definisi Operasional kinerja guru


Kinerja ukuran satuan kinerja yang dinyatakan
dalam skor yang diperoleh guru atas pelaksanaan tugas
profesinya sebagai pengajar yang ditunjukkan melalui
kegiatan antara lain (1) Strategi Pembelajaran, (2)
Penguasaan Materi, (3) Pengelolaan Kelas, (4) Komunikasi
dengan Siswa, (5) Teknik Mengajar, dan (6) Penilaian Hasil
Belajar Siswa yang diukur berdasarkan penilaian oleh
siswa
.
Pengembangan Dimensi dan Indikator
a. Pengembangan Dimensi (kalau ada)
Dari variabel kinerja guru yang diukur tercakup di
dalamnya dimensi

378 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

(tidak ada) dan indikator-indikator.


b. Pengembangan Indikator
Adapun indikator yang dikembangkan adalah: (1)
Strategi Pembelajaran, (2) Penguasaan Materi, (3)
Pengelolaan Kelas, (4) Komunikasi dengan Siswa, (5)
Teknik Mengajar, dan (6) Penilaian Hasil Belajar Siswa.

Penetapan Instrumen
Kita misalkan untuk mengembangkan instrument kinerja
guru ini digunakan skala semantic diferensial

Kisi-Kisi Instrumen
Rancangan awal kisi-kisi dan penyebaran nomor
butir instrumen penilaian kinerja guru adalah seperti
terlihat pada Tabel 17. 1 berikut.

Tabel 17.1 Kisi-Kisi Instrumen Penilaian Kinerja Guru

Variabel Indikator No.Butir Jlh.Butir


Kinerja 1. Strategi 1, 2, 3, 4, 5, 9
Guru 6, 7,8, 9
Pembelajaran
2.Penguasaan 10, 11, 12, 9
Materi 13, 14, 15,
16, 17, 18,
3.Pengelolaan 19, 20, 21, 11
Kelas 22, 23, 24,
25, 26, 27,
28, 29
4.Komunikasi 30, 31, 32, 6
Guru dengan 33, 34, 35,
Siswa

379 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

5.Teknik 36, 37, 38, 7


Mengajar 39, 40, 41,
42
6.Penilaian 43, 44, 45, 5
hasil belajar 46, 47
siswa
Jumlah 47

3. Penulisan Butir
Butir instrumen dibuat untuk setiap indikator.
Setiap indikator dikembangkan menjadi beberapa butir
pernyataan. Dari enam indikator dikembangkan sebanyak
47 butir pernyataan, dengan rincian sebagai berikut. Untuk
indikator strategi pembelajaran ada 9 butir, indikator
penguasaan materi 9 butir, indikator pengelolaan kelas 11
butir, komunikasi dengan siswa 6 butir, teknik mengajar
ada 7 butir, dan indikator penilaian hasil belajar siswa ada
5 butir. Adapun rincian butir-butir instrumen penilaian
kinerja guru.

Indikator: Strategi Pembelajaran


1. Guru mengaitkan materi pembelajaran dengan
realita kehidupan
2. Guru memberikan aplikasi konsep pada
perkembangan kehidupan
3. Dalam mengajar, guru mengaitkan hubungan materi
yang satu dengan materi yang lainnya
4. Guru mengawali pelajaran dengan hal-hal yang
menarik

380 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

5. Guru mengajukan pertanyaan kepada siswa pada


waktu memulai kegiatan pembelajaran
6. Guru mengecek apakah siswa membawa buku
pelajaran atau tidak pada waktu kegiatan
pembelajaran
7. Guru mengulangi pertanyaan kepada siswa yang
tidak dapat menjawab pertanyaan sebelumnya
8. Guru menggunakan metode pembelajaran yang
bervariasi
9. Prosedur penilaian guru diberitahukan kepada
semua siswa

Indikator Penguasaan Materi


1. Guru menjelaskan pentingnya suatu topik bahasan
pada awal mengajar
2. Guru menjelaskan pokok - pokok bahasan yang
harus dipelajari siswa
3. Guru menjelaskan materi pelajaran dengan lancar
4. Materi yang disajikan guru dapat /mudah dipahami
siswa
5. Guru dapat menjawab pertanyaan-pertanyaan
siswa
6. Guru menjelaskan materi pelajaran secara
berurutan
7. Guru mengulangi materi pelajaran yang kurang
dipahami siswa
8. Di dalam menyajikan materi pelajaran guru
memberikan contoh serta aplikasi yang memadai
9. Guru merangkum materi pelajaran sebelum
kegiatan pembelajaran

381 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

berakhir

Indikator Pengelolaan Kelas


1. Guru memiliki kesiapan dalam menyajikan materi
pelajaran
2. Guru terbuka terhadap pendapat siswa yang
bersumber dari buku/sumber lain
3. Guru memberi respon terhadap pertanyaan siswa
4. Guru memperhatikan tanggapansiswa terhadap
materi yang disampaikan dalam pembelajaran
5. Guru memberi perhatian secara merata kepada
semua siswa
6. Guru tanggap terhadap masalah yang dihadapi oleh
siswa pada saat berlangsung proses belajar
mengajar
7. Guru mengakhiri pembelajarannya sesuai dengan
waktu yang telah ditentukan
8. Guru bersikap ramah terhadap setiap siswa
9. Guru peduli terhadap siswa yang mengalami
kesulitan pada waktu kegiatan pembelajaran
berlangsung
10. Guru memperhatikan siswa pada waktu kegiatan
pembelajaran berlangsung
11. Guru menghargai gagasan siswa yang berkaitan
dengan usulan untuk menyelesaikan tugas-tugas

382 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Indikator Komunikasi Guru dengan Siswa


1. Guru memperkuat penyajian materi dengan
memberikan tugas-tugas kepada siswa
2. Guru mengecek siswa apakah telah mengerjakan
tugas-tugas atau belum
3. Guru memberikan soal-soal PR/kuis sesuai dengan
materi pembelajaran yang disajikan
4. Guru mau menjawab pertanyaan - pertanyaan siswa
di luar jam mengajar
5. Guru memberikan balikan kepada siswa dengan
menyerahkan kembali hasil pemeriksaan jawaban
siswa
6. Guru memuji siswa yang dapat menjawab
pertanyaan dengan benar

Indikator Teknik Mengajar

1. Guru memberikan waktu yang cukup kepada siswa


untuk menjawab pertanyaan yang diajukannya.
2. Guru memberikan contoh yang cukup untuk
menanamkan pengertian dalam penjelasannya
3. Guru memberi catatan mengenai hal-hal yang
penting di papan tulis
4. Guru mengelompokkan siswa ke dalam kelompok
belajar untuk mendiskusikan materi
pelajarannya
5. Guru menggunakan metode diskusi pada pokok
bahasan yang menghendaki pemahaman yang
lebih mendalam.

383 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

6. Guru mendorong siswa untuk menyatakan hal -hal


yang tidak jelas dari penyajian materi ajarnya
7. Guru mendorong siswa untuk berperan aktif
selama proses belajar mengajar

Indikator Penilaian Hasil Belajar Siswa

1. Guru mengumumkan hasil pekerjaan terbaik ketika


melakukan penilaian terhadap kegiatan kerja
kelompok
2. Guru memberitahukan hasil PR/ kuis/ tugas-tugas
siswa
3. Bentuk soal ujian yang dibuat guru hanya satu
macam saja
4. Selainujian melalui tes tertulis, guru juga memberi
ujian secara lisan
5. Guru memberi nilai kepada siswa hanya
berdasarkan hasil ujian saja

4. Uji coba pakar


Setelah draft instrumen selesai dibuat, dilakukan uji
kesesuaian konstruk secara teoritik. Uji ini dilakukan
dengan menanyakan kesesuaian antara butir-butir
pernyataan dengan indikator kinerja guru. Untuk kegiatan
penilaian ini diminta pada pakar-pakar evaluasi. Beberapa
komentar/masukan pakar yaitu: (a) butir 13: materi yang
disajikan guru dapat dipahami siswa, butir ini perlu dibuat
lebih jelas, (b) butir 15: sistematis itu hanya bisa
dijustifikasi oleh orang yang paham, kata sistematis diganti
saja dengan berurutan. Selanjutnya draf instrumen direvisi

384 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

berdasarkan masukan-masukan dari pakar tersebut,


kemudian diperbanyak guna dilakukan ujicoba lapangan.

5. Uji coba lapangan


Pada pelaksanaan uji coba lapangan (empiris)
instrumen yang digunakan adalah instrumen yang telah
direvisi berdasarkan masukan pakar yang terdiri atas 47
butir pernyataan. Menurut Gabel (1986) jumlah reponden
uji coba instrumen non kognitif adalah: 5, 6, 7, 8, 9 , 10 kali
jumlah butir soal. Karenanya Instrumen ini diujicobakan
kepada 300-an siswa .
` Untuk ujicoba lapangan ini, maka instrumen sudah
dalam format yang lengkap dengan skalanya. Karena yang
digunakan adalah skala semantic dferensial, maka bentuk
instrumen ujicoba adalah seperti berikut

N
Pernyataan 1 2 3 4 5 6 7
o
Strategi
Pembelajaran
Guru mengaitkan
materi
Tidak Sela
1 pembelajaran
Pernah lu
dengan realita
kehidupan
Guru memberikan
aplikasi konsep
Tidak Sela
2 pada
Pernah lu
perkembangan
kehidupan
Dalam mengajar,
Tidak Sela
3 guru mengaitkan
Pernah lu
hubungan materi

385 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

yang satu dengan


materi yang
lainnya
Guru mengawali
pelajaran dengan Tidak Sela
4
hal-hal yang Pernah lu
menarik
Guru mengajukan
pertanyaan
kepada siswa Tidak Sela
5
pada waktu Pernah lu
memulai kegiatan
pembelajaran
Guru mengecek
apakah siswa
membawa buku
Tidak Sela
6 pelajaran atau
Pernah lu
tidak pada waktu
kegiatan
pembelajaran
dan seterusnya

Guru mendorong
siswa untuk Tidak
Sela
42 berperan aktif Perna
lu
selama proses h
belajar mengajar
Penilaian Hasil
Belajar Siswa
Guru
mengumumkan
hasil pekerjaan Tidak
Sela
43 terbaik ketika Perna
lu
melakukan h
penilaian terhadap
kegiatan kerja

386 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

kelompok

Guru
Tidak
memberitahukan Sela
44 Perna
hasil PR/ kuis/ lu
h
tugas-tugas siswa
Bentuk soal ujian
Tidak
yang dibuat guru Sela
45 Perna
hanya satu macam lu
h
saja
Selain ujian melalui
Tidak
tes tertulis, guru Sela
46 Perna
juga memberi ujian lu
h
secara lisan
Guru memberi nilai
Tidak
kepada siswa hanya Sela
47 Perna
berdasarkan hasil lu
h
ujian saja

B. Analisis Hasil Ujicoba


Ada dua cara yang dilakukan untuk menguji
validitas konstruk instrumen afektif (non kognitif) yaitu
(1) korelasi butir dengan totalnya menggunakan rumus
korelasi product moment, dan (2) menggunakan teknik
analisis faktor dengan bantuan program SPSS. Pengujian
validitas konstruk instrumen kinerja guru ini
menggunakan teknik análisis faktor.

387 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Analisis faktor adalah kajian tentang


kesalingtergantungan antara variabel-variabel, dengan tujuan
untuk menemukan himpunan variabel-variabel baru, yang lebih
sedikit jumlahnya dari pada variabel semula, dan menunjukkan
yang mana di antara variabel-variabel semula itu yang
merupakan faktor-faktor persekutuan (Suyanto, 1988). Adapun
langkah-langkah dalam analisis faktor menurut De Vaus
(Hidayati dan Listyani, 2010:89) adalah (1) memilih variabel
yang akan dianalisis, (2) ekstraksi awal seperangkat faktor, (3)
ekstraksi akhir seperangkat faktor dengan rotasi, dan (4)
menyusun skala untuk digunakan analisis lanjut.
Menurut Gorsuch (1995:82) tujuan penggunaan analisis
faktor yaitu meringkas saling hubungan antar variabel–variabel
yang ada, tetapi dengan arti yang tepat, sebagai suatu
penolong dalam membuat sejumlah pengertian. Metode
tersebut dilakukan dengan bantuan komputer untuk menilai
apakah butir-butir yang beragam dalam suatu survei memiliki
kebersamaan dalam suatu faktor atau skala (Litwin, 1995).
Untuk mengembangkan suatu tes yang sifatnya psikologis,
maka analisis faktor sangat relevan untuk menguji
kesahihan konstruk. Teknik ini dilakukan dengan cara
menganalisis butir-butir instrumen yang terdapat dalam
sejumlah faktor tertentu. Butir-butir yang memiliki unsur
kebersamaan (common factor) digabung menjadi suatu faktor
baru.
Sebagai uji persyaratan untuk menentukan ukuran
kecukupan sampel digunakan rumus Kaiser-Meyer-Olkin (KMO),
yang merupakan suatu indeks untuk membandingkan nilai
koefisien korelasi observasi dengan nilai koefisien korelasi
parsial (Norusis, 1993). Ukuran KMO menyatakan sesuai
tidaknya digunakan analisis faktor terhadap ubahan-ubahan
(butir-butir instrumen). Menurut Kaiser (1974) dalam Jae-On

388 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Kim dan Charles W. Mueller (1978:54) jika nilai KMO 0,90


termasuk kategori sempurna, 0,80 termasuk baik, 0,70 termasuk
sedang, 0,60 termasuk cukup, 0,50 termasuk kurang, dan di
bawah 0,50 tidak dapat diterima. Jadi untuk dapat melakukan
analisis faktor, persyaratan pokok yang harus dipenuhi ialah
angka KMO Measure of Sampling Adequacy harus di atas 0,50.
Untuk menguji apakah matrik korelasi berasal dari
matrik identitas atau bukan digunakan Bartlett test of spherity (
 2 ) . Suatu ketentuan bahwa bila matrik korelasi merupakan
matrik identitas (matrik berdiagonal 1, sedang yang lainnya
0) maka tidak dapat digunakan analisis faktor, demikian
sebaliknya bila matrik korelasi bukan matrik identitas maka
dapat digunakan analisis faktor. Sarwono (2006)
mengemukakan jika probabilitas (sig) < 0,05 maka variabel
dapat dianalisis lebih lanjut, dan jika probabilitas (sig) > 0,05
maka variabel tidak dapat dianalisis lebih lanjut.
Banyaknya faktor ditetapkan berdasarkan aturan yang
dikemukakan oleh Jae-On Kim dan Charles W. Mueller (1985:56)
bahwa jumlah faktor diekstraksi harus sama dengan jumlah
faktor yang mempunyai variansi (eigen value) sama atau lebih
besar dari 1,0. Selanjutnya muatan faktor (factor loading)
diseleksi setelah melalui ekstraksi komponen utama dengan
rotasi orthogonal. Butir pernyataan yang akan dipertahankan
bila pada rotasi muatan faktor di atas 0,30, sesuai dengan
aturan bahwa muatan faktor yang lebih dari 0,30 cenderung
signifikan, dan kurang dari 0,30 tidak dapat memberikan
konstribusi yang signifikansi terhadap suatu faktor. Comrey
(1973) yang dikutip Barbara dan Linda S. Fidell menjelaskan
bahwa muatan faktor melebihi 0,71 dianggap istimewa, 0,63
sangat baik, 0,55 baik, 0,45 cukup, dan 0,32 kurang
(Tabachnick and Linda S, 1989).

389 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Hasil pengujian validitas konstruk instrumen


dengan menggunakan analisis faktor, didapatkan nilai KMO
instrumen sebesar 0,908. Nilai ini lebih besar dari 0,50
berarti analisis faktor dapat dilanjutkan untuk
menganalisis data dalam bentuk matriks korelasi (Santoso,
2003). Di samping itu nilai Bartlett’s test of Sphericity
sebesar 7617,499 pada derajat kebebasan 948 dengan
taraf signifikansi 0,000 < 0,05), dengan demikian matriks
korelasi yang terbentuk bukan matriks identitas, jadi
analisis faktor bisa dilanjutkan.

Tabel 17.2. Hasil Analisis untuk KMO MSA


KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling
Adequacy. .908

Bartlett's Test of Approx. Chi-Square


7617.499
Sphericity
Df .948
Sig. .000

Pada Tabel Total Variance Explained dari 47 butir


yang dimasukkan dalam analisis faktor didapatkan nilai
akar karakteristik (eigen value) di atas 1 (  1) ada
sebanyak 7 faktor. Hasil rotated component matrix yang
dilakukan 8 putaran atau iterasi, menunjukkan ada butir
yang melewati muatan faktor “ cut off point” lebih kecil dari
0,30 (< 0,30). Dari jumlah butir 47 yang dianalisis ada 6
butir yang muatan faktornya lebih kecil dari 0,30 sehingga
didrop. Butir-butir yang didrop yaitu butir-butir nomor: 2,
17, 19, 20, 22, dan 46, sehingga butir yang terpilih untuk
instrumen tinggal 41 butir. Distribusi butir yang tinggal

390 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

hasil analisis yaitu Indikator Strategi Pembelajaran tinggal


8 butir, Penguasaan Materi tinggal 8 butir, Pengelolaan
Kelas tinggal 8 butir, Komunikasi Guru dengan Siswa
tinggal 6 butir, Teknik Mengajar tinggal 7 butir, dan
Penilaian Hasil Belajar Siswa tinggal 4 butir.
Butir yang terpilih untuk instrumen tinggal 41
butir. Distribusi butir hasil analisis yaitu:

Tabel 17.3. Distribusi Butir Instrumen Kinerja Guru


No Komponen Kinerja Guru Nomor Butir
1 Strategi Pembelajaran 1, 2, 3, 4, 5, 6, 7, 8
2 Penguasaan Materi 9, 10, 11, 12, 13, 14, 15, 16,
3 Pengelolaan Kelas 17, 18, 19, 20, 21, 22, 23,
24,
4 Komunikasi Guru dengan 25, 26, 27, 28, 29, 30,
Siswa
5 Teknik Mengajar 31, 32, 33, 34, 35, 36, 37,
6 Penilaian Hasil Belajar 38, 39, 40, 41
Siswa

Perhitungan reliabilitas terhadap 41 butir


instrumen yang dilakukan dengan menggunakan bantuan
program SPSS 391 versión 12.0 Windows diperoleh
koefisien sebesar 0,944. Sebagaimana telah dikemukakan
di atas bahwa koefisien reliabilitas 0,60 ke atas untuk
instrumen dikategorikan baik. Dengan demikian dapat
dinyatakan bahwa instrumen penilaian kinerja guru yang
dikembangkan ini memiliki validitas konstruk yang baik
dan mempunyai reliabilitas yang sangat tinggi. Adapun
instrumen penilaian kinerja guru hasil analisis adalah
seperti berikut.

391 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

No Pernyataan 1 2 3 4 5 6 7

Guru mengaitkan
materi
Tidak
1 pembelajaran Selalu
Pernah
dengan realita
kehidupan
Dalam mengajar,
guru mengaitkan
hubungan materi Tidak
2 Selalu
yang satu dengan Pernah
materi yang
lainnya
Guru mengawali
pelajaran dengan Tidak
3 Selalu
hal-hal yang Pernah
menarik
Guru mengajukan
pertanyaan
kepada siswa Tidak
4 Selalu
pada waktu Pernah
memulai kegiatan
pembelajaran
Guru mengecek
apakah siswa
membawa buku
Tidak
5 pelajaran atau Selalu
Pernah
tidak pada waktu
kegiatan
pembelajaran
Guru mengulangi
pertanyaan
kepada siswa
Tidak
6 yang tidak dapat Selalu
Pernah
menjawab
pertanyaan
sebelumnya
Guru
Tidak
7 menggunakan Selalu
Pernah
metode

392 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

pembelajaran
yang bervariasi
Prosedur
penilaian guru
Tidak
8 diberitahukan Selalu
Pernah
kepada semua
siswa
Guru menjelaskan
pentingnya suatu
Tidak
9 topik bahasan
Pernah
pada awal
mengajar
Guru menjelaskan
pokok - pokok
Tidak
10 bahasan yang
Pernah
harus dipelajari
siswa
Guru menjelaskan
Tidak
11 materi pelajaran Selalu
Pernah
dengan lancar
Materi yang
disajikan guru Tidak
12 Selalu
dapat /mudah Pernah
dipahami siswa
Guru dapat
menjawab Tidak
13 Selalu
pertanyaan- Pernah
pertanyaan siswa
Guru menjelaskan
Tidak
14 materi pelajaran Selalu
Pernah
secara berurutan
Guru mengulangi
materi pelajaran Tidak
15 Selalu
yang kurang Pernah
dipahami siswa
Guru merangkum
materi pelajaran
Tidak
16 sebelum kegiatan Selalu
Pernah
pembelajaran
berakhir

393 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Guru memberi
Tidak
17 respon terhadap Selalu
Pernah
pertanyaan siswa
Guru memberi
perhatian secara Tidak
18 Selalu
merata kepada Pernah
semua siswa
Guru tanggap
terhadap masalah
yang dihadapi
Tidak
19 oleh siswa pada Selalu
Pernah
saat berlangsung
proses belajar
mengajar
Guru mengakhiri
pembelajarannya
Tidak
20 sesuai dengan Selalu
Pernah
waktu yang telah
ditentukan
Guru bersikap
Tidak
21 ramah terhadap Selalu
Pernah
setiap siswa
Guru peduli
terhadap siswa
yang mengalami
Tidak
22 kesulitan pada Selalu
Pernah
waktu kegiatan
pembelajaran
berlangsung
Guru
memperhatikan
siswa pada waktu Tidak
23 Selalu
kegiatan Pernah
pembelajaran
berlangsung
Guru menghargai
gagasan siswa
Tidak
24 yang berkaitan Selalu
Pernah
dengan usulan
untuk

394 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

menyelesaikan
tugas-tugas

Guru
memperkuat
penyajian materi
Tidak
25 dengan Selalu
Pernah
memberikan
tugas-tugas
kepada siswa
Guru mengecek
siswa apakah
telah Tidak
26 Selalu
mengerjakan Pernah
tugas-tugas atau
belum
Guru memberikan
soal-soal PR/kuis
sesuai dengan Tidak
27 Selalu
materi Pernah
pembelajaran
yang disajikan
Guru mau
menjawab
pertanyaan - Tidak
28 Selalu
pertanyaan siswa Pernah
di luar jam
mengajar
Guru memberikan
balikan kepada
siswa dengan
Tidak
29 menyerahkan Selalu
Pernah
kembali hasil
pemeriksaan
jawaban siswa
Guru memuji
siswa yang dapat
Tidak
menjawab Selalu
30 Pernah
pertanyaan
dengan benar

395 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Guru memberikan
waktu yang cukup
kepada siswa Tidak
31 Selalu
untuk menjawab Pernah
pertanyaan yang
diajukannya.
Guru memberikan
contoh yang
cukup untuk Tidak
32 Selalu
menanamkan Pernah
pengertian dalam
penjelasannya
Guru memberi
catatan mengenai
Tidak
33 hal-hal yang Selalu
Pernah
penting di papan
tulis
Guru
mengelompokkan
siswa ke dalam
kelompok belajar Tidak
34 Selalu
untuk Pernah
mendiskusikan
materi
pelajarannya
Guru
menggunakan
metode diskusi
pada pokok Tidak
35 Selalu
bahasan yang Pernah
menghendaki
pemahaman yang
lebih mendalam.
Guru mendorong
siswa untuk
menyatakan hal -
Tidak
36 hal yang tidak Selalu
Pernah
jelas dari
penyajian materi
ajarnya

396 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Guru mendorong
siswa untuk
Tidak
37 berperan aktif Selalu
Pernah
selama proses
belajar mengajar
Guru
mengumumkan
hasil pekerjaan
terbaik ketika Tidak
38 Selalu
melakukan Pernah
penilaian
terhadap kegiatan
kerja kelompok
Guru
memberitahukan Tidak
39 Selalu
hasil PR/ kuis/ Pernah
tugas-tugas siswa
Bentuk soal ujian
yang dibuat guru Tidak
40 Selalu
hanya satu Pernah
macam saja
Guru memberi
nilai kepada siswa
Tidak
41 hanya Selalu
Pernah
berdasarkan hasil
ujian saja

397 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

398 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

DAFTAR PUSTAKA
Aiken, Lewis R. (1994). Psychological Testing an
Assessment,(Eight Edition), Boston: Allyn and Bacon.

Alexander, P., Schallert, D., Hare, V. 1991. Coming to Terms:


How Researcher in Learning and Literacy Talk about
Knowledge. Review of Educational Research, 61: 315
– 343.

Allen, M.J. & Yen, W.M. (1979). Introduction to measurement


theory. Monterey, CA: Brooks/Cole Publishing
Company.

Anastasi. Anne and Urbina, Susana. (1997). Psicoholological


Testing. (Seventh Edition). New Jersey: Prentice-
Hall, Inc.

399 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Anderson, Scarvia.B, at.all (1981), Encyclopedia Of


Education Evaluation, San Francisco: Jossey-Bass,
Inc Publishers.

Anderson, L.W and D.R. Krathwohl (Eds). (2001). A


Taxonomy for Learning Teaching and Assessing.

Airasian, P. W. (1994). Classroom assessment. New York:


McGraw-Hill.

Arifin, Zaenal. (2009). Evaluasi Pembelajaran,. Bandung: PT


remaja Rosdakarya.

Asaad, Abubakas,S and Hailaya, Wilham, M (2004).


Measurement And Evaluation, Manila: Rex Nbook
Store.

Azwar, Syaifuddin (2010). Tes Prestasi: Fungsi dan


Pengembangan Pengukuran Prestasi Belajar, edisi II,
cetakan ke 4 :Pustaka Pelajar.

Azwar, Syaifuddin (2012). Reliabilitas dan Validitas,


Yogyakarta: Pustaka Pelajar.

Bahri, Djamarah, Saiful (2008). Psikologi Belajar. Jakarta :


PT Rineka Cipta.

Basuki, Ismet dan Hariyanto (2014). Asesmen


Pembelajaran, Bandung: PT Remaja Rosdakarya.

Berk, R.A. (1986). Performance assessment. London: The


Johns Hopkins Press Ltd.

400 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Bloom, B.S., (Ed.). (1956). Taxonomy of educational


objectives: The classification of educational goals:
Handbook I, cognitive domain. New York: Longman.

Bodgard & Seaborne, 2001. Perfect Empowerment (Edisi


terjemahan) Jakarta : Gramedia

Brennan, Robert L (2006). Educational Measurement.


Fourth Editon. Road West, Westport CT: Praeger
Publishers.

Butler and McMunn (2006). A Teacher’s Guide to


ClassroomAssessment, San Francisco:Jossey Bass

Brown, Frederick G (1981). Measuring Classroom


Achievement, New York: Holt, Rinehart and Winston.

Brown, Frederick G (1976). Principles of Educational and


Psychological Testing, New York: Holt, Rinehart and
Winston.

Brown, Douglas H. (2004). Language Assessment Principles


and Classroom Practices. New York: Longman.

Brown. W. and Thornton. J.W. Jr (1971). College teaching: A


s~\lenirrlic approach (2nd 4.). New York: McGraw-
Hill.

Bryman, Alan (2001). Social Research Methods. New York:


Oxford University Press Inc.

Cangelosi James S.(1995). Merancang Tes Untuk Menilai


Prestasi Siswa. Bandung: Institut Teknologi
Bandung.

401 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Cohen, R. J., & Swerdlik, M. (Eds.). (2009). Psychological


testing and assessment: An introduction to tests and
measurement (7th ed.). Washington DC: McGraw-
Hill.

Crocker, L. & Algina, J. (1986). Introduction to Classical and


Modern Test Theory_. New York: Holt, Rinehart and
Winston, Inc.

Cronbach, L.I (1990), Essentials of psychological testing,


New York: Harper Collins.

Cronbach, L., J., and others. (1980). Toward reform of


program evaluation: aims, methods, and institutional
arrangements. San Fransisco: Jossey-Bass.

Dave, R.H. (1967). Taxonomy of educational objectives and


achievement testing. London: University of London
Press.

Deblassie, Richard .R (1974). Measuring And Evaluating


Pupil Progress, New York: MSS Information
Corporation.

Depdiknas (2008). Pandiuan Penulisdan Butir Soal, Jakarta:


Dirjen Manajemen Pendidikan Dasar dan
Menengah.

Depdiknas (2008). Panduan Analisis Butir Soal, Jakarta:


Direktorat Pembinaan SMA.

Depdiknas (2007). Panduan Penulisan Soal Pilihan Ganda,


Jakarta: Pusat Penilaian Pendidikan.

402 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Desmita.(2006).Psikologi Perkembangan. Bandung : PT.


Remaja Rosdakarya.

Ditjen Dikti. (2005). Pedoman sistem asesmen berbasis


kompetensi. Jakarta : Depdiknas.

Dizney, Henry (1971). Classroom Evaluation for Teachers,


Dubuque, Iowa: Wm. C. Brown Company Publisher.

Djaali & Mulyono, Pudji (2007). Pengukuran dalam Bidang


Pendidikan, Jakarta: Grasindo.

Djamarah (1994). Prestasi Belajar dan Kompetensi Guru.


Surabaya : Usaha Nasional.

Ebel, Robert L. & David A. Frisbie (1991) Essential Of


Educational Measurement (5th Edition). New Delhi:
Prentice‐Hall, Inc.

Echols, John M dan Shadily, Hassan (1989). Kamus Inggris


Indonesia, Jakarta: PT Gramedia.

Edwards, Allen L (1957). Techniques of Attitude Scale


Construction. New York: Appleton-Century-Croffs,
Inc.

Erickson, Richard. C & Tim L.Wentling (1976). Measuring


Student Growth, Boston : Allyn and Bacon, Inc.

Fernandes,H.J.X (1984). Testing And Measurement, Jakarta:


National Education Planning, Evaluation and
Curriculum Development.

403 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Gabel, D.L. (1993). Handbook of Research on Science


Teaching and Learning.New York: Maccmillan
Company.

Gable, Robert K (1986). Instrumen Development in Affective


Domain. Boston: Kluwer-Nijhoff Publishing.

Gay, L.R. (1976). Educational research: Competencies for


analysis and application. Columbus, OH: Bell &
Howell Company. Gerst.

Glass, Gene V. and Stanley, Julian C. (1970). Statistical


Methods in Education and Psychology. New Jersey:
Prentice Hall, Inc.

Gorsuch, Richard L (1983). Factor Analysis. Hillsdale:


Lawrence Erlbaum Associates Publisher.

Griffin, P. & Nix, P. (1991). Educational Assessment and


Reporting. Sydney: Harcout Brace Javanovich,
Publisher.
Gronlund, N.E. (1982). Constructing Achievement Test, 3rd
edition. Eaglewood Cliffs, N.J: prentice–Hall inc.

Gronlund, Norman E. and Linn, Robert L. (1995).


Measurement and Assessment in teaching (Seventh
Edition). Ohio: Merrill, an immprint of Prentice Hall.

Gronlund, N.E. (1976). Measurement and evaluation in


teaching. New York: Macmillan Publishing Company.

Gronlund, N.E & R.L Linn (1990). Measurement and


Evaluation in Teaching. 6th. Ed. New York:
MacMillan Publishing Company.

404 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Guilford, J. P. (1954). Pychometric Methods. New Delhi: Tata


Mc-Graw Hill Publishing Co.Ltd.

Haladyna, Thomas M. (1994). Developing and Multiple-


Choice Test Items. New Jersey: Lawrence Erlbaum
Associates, Publishers.

Hamalik, Omar (1983). Strategi Belajar dan Pembelajaran,


Jakarta ; Sinar Utama

Habeyb. (1983). Supervisi Pendidikan, Jakarta: P2LPTK

Harrow, A. J. (1972). A taxonomy of the psychomotor


domain: A guided fordeveloping behavioral objective.
New York: David Mc Key Company.

Heer, R. 2012. A Model of Learning Objectives (Online).


(www.celt.iastate.edu/teaching/RevisedBlooms1.html,)

Heaton, J.B. (1988). Writing English Language Tests. 2nd


Edition, 21.
New York: Longman Inc.

Herman, J. L. (1997). Large-scale assessment in support of


school reform: Lessons learned in the search for
alternative measures. International Journal of
Educational Research, 27, 395-413.

Hopkins, Kenneth D. and Julian C. Stanley. (1981).


Educational and Psychological Measurement and
Evaluation. Englewood Cliffs, NJ: Prentice-Hall, Inc.

405 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Hopkins, Charles D. dan Richard L. Antes (1989). Classroom


Testing Construction. Illinois: F. E. Peacock.

Jae-On Kim and Charles W. Muller (1978). Factor Analysis:


Statistical Methods and Practical Issues. London:
Sage Publication.

Jihat, Asep dan Haris, Abdul (2008). Evaluasi Pembelajaran,


Yogyakarta: Multi Pressindo

Joesmani (1988). Pengukuran dan Evaluasi Dalam


Pengajaran, Jakarta: Departemen Pendidikan dan
Kebudayaan.

Kapplan, Robert M & Saccuzzo, Dennis P (2001).


Psychological Testing (5th ed). Singapore:
Wordworth Thomson Learning.

Kartowagiran, Badrun (2009). Makalah disampaikan pada


Pelatihan penulisan analisis butir dengan
pendekatan TTK dan TRB tanggal 11 – 12 April
2009 di Lemlit UNY.

Kemdikbud (2010). Panduan Pengembangan Penulisan


Soal, Jakarta: Direktorat Ketenagaan Dirjen
Pendidikan Tinggi.

Kerlinger, Fred N (2003). Azas-Azas.Penelitian Behavioral.


Yogyakarta: Gajah Mada Press.

King, Patricia (1984). Performance Planning & Appraisal.


New York: Mc Graw Hill Book Company.

406 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Koyan, I Wayan (2012). Konstruksi Tes, Singaraja:


Universitas Pendidikan Ganesha Press.

Krathwohl, D. R. (2002). A Revision of Bloom’s Taxonomy:


An Review. Theory Into Practice. Volume 41, Number
4. College Education. The Ohio State University.
.
Krathwohl, D. R. et.all (1964).Taxanomy of Educational
Objectives, Handbook II; Affective Domain, New
York; McKay.

Kumano, Y (2001). Authentic Assessment and Portfolio


Assessment-Its Theory and Practice, Japan: Shizuoka
University

Lase, Jason.(2003).Motivasi Berprestasi, Kecerdasan


Emosional, Percaya Diri dan Kinerja. Jakarta: PPs
FKIP UKI.

Lewy, Zulkardi, Aisyah (2009). Pengembangan Soal Untuk


Mengukur Kemampuan Berpikir Tingkat Tinggi
Pokok Bahasan Barisan dan Deret Bilangan di Kelas
IX Akselerasi SMP Xaverius Maria Palembang,
Jurnal Pendidikan Matematika, Vol. 3.No.2,
Desember 2009

Litwin, Mark S (1995). How To Measure Survey Reliability


and Validity. London: Sage Publications.

Lord, F.M. and Novick, M.R. (1974). Statistical Theories of


Mental Test Scores. Reading, MA: Addison-Wesley.

Mar’at, (1984). Sikap Manusia :Perubahan Serta


Pengukurannya. Jakarta: Ghalia Indonesia.

407 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Mardapi, Djemari (2004). Penyusunan tes hasil belajar.


Yogyakarta: Program Pascasarjana Universitas
Negeri Yogyakarta.

Mardapi, Djemari (2008). Teknik Penyusunan Instrumen Tes


dan Nontes, Jogyakarta: Mitra Cendekia Press.

Maskul (1998). Pembelajaran Remaja, Jakarta ; Raja


Grafindo Persada.

McBeath, Ron J (1992). Instructing And Evaluating In


Higher Education. New Jersey: Educational Technology
Publications Englewood Cliffs,

Mehrens, W. A. & Lehmann, I. J. (1984). Measurement and


evaluation in education and psychology, Third edition. New
York: Holt, Rinehart and Winston.

Messick, S. (1989). “Validity” dalam Linn, R. L. (Eds.),


Educational measurement third edition. (pp. 13-
103). New York: McMillan.

Miller, M.David, Robert l.Linn and Norman E. Gronlund


(2009). Measurement and Assessment in Teaching,
New Jersey: Pearson Education International.

Morris, L.L. & Fitz Gibbon. C. T. (1978). How to Measure


Achievement. Los Angeles, CA: Sage Publication.

Mouly, George J. (1967), Training of Research Center


Personnel, U. S. Department of Health,

408 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Education,and Welfare, Final Report Project No. 6-


2562 , Office of Education Bureau of Research

Mueller, John. (2008). Authentic Assessment Toolbox. North


Central Collegehttp://www.noctrl.edu/,

Mueller, D. J. (1986). Measuring social attitudes. New York:


Teachers College,Columbia University.

Muhamad (1999). Bimbingan Belajar di Perguruan Tinggi,


Jakarta; Depdikbud.

Muhson, Ali, dkk (2012). Analisis Butir Soal dengan


Anbuso, Makalah yang disampaikan pada Pelatihan
Analisis Butir Soal dan Program Remidial dengan
Software AnBuso ,di FE UNY pada tanggal 12‐13 Juli
2012.

Nawawi. (2001). Dasar – Dasar Perencanaan Pengajaran.


Jakarta Raja Grafindo Persada.

Nasoetion, Noehi (2006). Tes, Pengukuran dan Evaluasi,


Jakarta:Universitas Terbuka

Nazir, M. (1983). Metode Penelitian. Penerbit Ghalia


Indonesia. Nelson, Clarence.H (1970). Measurement
and Evaluation in the Classroom, London: The
Macillan Company.

Nitko, Anthony J. (1996). Educational Assessment of


Students, Second Edition. Ohio: Merrill an imprint of
Prentice Hall Englewood Cliffs.

409 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Nitko, Anthony J,. & Brookhart, Susan M. (2007).


Educational assessment of Student. Pearson
Education Inc., Upper Saddle River, New Jersey.

Nitko, Anthony J.(1996). Educational Assessment of


Students. Englewood Cliffs,New Jersey: Prentice-
Hall, Inc.

Norusis, Marija J (1993). SPSS for Windows Professional


Statistics Release 6,0 , Chicago: Marketing
Department SPSS Inc.

Nurkancana, Wayan & Sumartana (1990). Evaluasi Hasil


Belajar, Surabaya: Usaha Nasional.

Paulson, F.Leon, Parsl R & Meyer, Carol A. (1991).What


makes a portofolio? Eight thoughtful guidelines will
help educator encourage self-directed lerning.
Educatonal Leardership, February 1991

Pedhazur, Elazar J and Liora Pedhazur Schmelkin (1991).


Measurement, Design and Analysis: An Integrated
Approach. New Jersey: Lawrence Erlbaum
Associates Publishers, 1991.

Pohl . (2000). Learning to Think, Thinking to Learn: tersedia


di www.purdue.edu/geri

Popham,W James (1995). Classroom Assessment: What


Teacher Need to Know. Boston: Allyn and Bacon.

Purwanto (2009), Evaluasi Hasil Belajar, yogyakarta:


PustakaPelajar.

410 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Purwanto, Ngalim (1992), Evaluasi Pengajaran, Jakarta


Rineka Cipta.

Reynolds, Cecil.R, at.all (2009). Measurement and


Assessment in Education, New Jersey: Upper Saddle
River.

Retnawati, Heri (2015). Validitas, Reliabilitas &


Karakteristik Butir, Yogyakarta: Parama Publishing
Riyanto, Astin (2003). Proses Belajar Mengajar
Efektif di Perguruan Tinggi. Bandung: Yapemdo.

Rolheiser, C. & Ross, J. A. (2005). Student Self-Evaluation:


What Research Says and What Practice Shows.
Internet download.

Rowland, Virgil K (1960). Managerial Performance


Standards. New York: Craffsmen,Inc.

Sax, Gilbert. (1980). Principles of Educational and


Psychological Measurement and Evaluation.
nd
(2 ed.). California : Wadsworth Publishing
Company.

Salvia, J. & Ysseldyke, J.E. (1996). Assessment. 6th Edition.


Boston:Houghton Mifflin Company.

Setiadi, Hari (2008). Penilaian Kinerja, Jakarta: Pusat


Penilaian Pendidikan, Departemen Pendidikan
Nasional.

Silverius, Suke (1991). Evaluasi Hasil Belajar dan Umpan


Balik, Jakarta: PT.Grasindo.

411 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Singer,R.N (1972). The psychomotor domain: Movement


behavior. London: Henry Kimton Publisher.

Simpson, E.J (1972). The Classification of Educational


Objectives, Psychomotor Domain, Ilinois: Teacher of
Home Economic.

Singh, Arun Kumar. (1986). Tests, Measurement and


Research Methods in Behavioral Sciences. New Delhi:
Tata McGraw Hill.

Skinner, Charles E. (ed.) (t.t), Essentials of Educational


Psichology, (Englewood Cliffs :Prentice-Hall,
Inc.Stalnaker, J. M. (1951). The Essay Type of
Examination. In E. F. Lindquist (Ed.), Educational
Measurement (pp. 495-530). Menasha, Wisconsin:
George Banta.

Streiner DL, Norman GR (2000). Health measurement


scales: A practical guide to their development and
use. Oxford: Oxford University Press.

Sudjana (2005). Dasar-Dasar dalam Proses Belajar


Mengajar. Bandung: Sinar Baru Algesindo.

Sudjana, Nana (2009). Perencanaan Pengajaran. Jakarta.


P2LPTK.

Sudjana, Nana, (2004). Penilaian Hasil Proses Belajar


Mengajar, Bandung:Remaja Rosdakarya.

Soekartawi, dkk. (1995). Meningkatkan Rancangan


Instruksional, Jakarta: PT Raja Grafindo Persada.

412 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Suyanto (1988). Metode Statistika Multivariat. Jakarta:


Departemen Pendidikan dan Kebudayaan.

Suryabrata, Sumadi. (2000). Pengembangan Alat Ukur


Psikologis. Yogyakarta: Penerbit Andi.

Susetyo, Budi (2011). Menyusun Tes Hasil Belajar, Bandung:


CV Cakra. Suyanto (1977). Metode Statistika
Multivariat, Jakarta: Departemen Pendidikan dan
kebudayaan.

Sudijono (2006). Pengantar Evaluasi Pendidikan, Jakarta:


PT Raja Grafindo Persada.

Surapranata, Sumarna dan Muhammad Hatta (2006).


Penilaian Portofolio: Implementasi Kurikulum 2004.
Bandung: PT Remaja Rosdakarya.

Surapranata, Sumarna. (2005). Analisis, Validitas,


Reliabilitas, dan Interpretasi Hasil Tes. Bandung: PT
Remaja Rosdakarya Offset.

Stufflebeam, Daniel L., (l974). Evaluation models. Boston:


Kluwer-nijhoff Publishing.

Tabachnick, Barbara G and Linda S. Fidell (1989). Using


Multivariate Statistics. California: Harper Collins
Publishers..

Taufina. (2009). Authentic Assesment dalam Pembelajaran


Bahasa Indonesia di Kelas Rendah SD. Pedagogi,
IX(1) 113-120. Diperoleh 20 Juni, dari
http://www.google.com/url?

413 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Thomas, G.H & Dawson, J.B. & (1972). Item analysis and
examination statics. Birmingham: The Union of
Educational Institutions.

Thorndike, Robert M. (1997). Measurement and Evaluation


in Pschology and Education, Sixth Edition. Ohio:
Merrill, an imprint of Prentice Hall.

Thorndike, Robert, L., & Hagen, Elizabeth. P. (1977).


Measurement and Evaluation in Psychology and
Education. New York: John Wiley & Sons.

Tim Puspendik. (2008). Tes Tertulis. Puspendik Balitbang


Depdiknas. Jakarta.

Tola, Burhanuddin (2008). Penilaian Diri, Jakarta: Pusat


Penilaian Pendidikan, Departemen Pendidikan
Nasional.

Tuckman, B. W (1975). Measuring Educational Outcomes


Fundamentals of Testing. New York: Harcourt Brace
Javanovich Inc. Wandt, Edwin and Brown, Gerald, W
(1957). Essentials of Educational Evaluation, New
York: Holt Rinehart and Winston.

Wiersma, W and Jurs (1990). Educational Measurement And


Testing, Boston: Allyn and Bacon.

Widoyoko, S. Eko Putra (2014). Penilaian Hasil


Pembelajaran di Sekolah, Yigyakarta: Pustaka
Pelajar.

414 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Widoyoko, S. Eko Putra (2009). Evaluasi Program


Pembelajaran: Panduan Praktis Bagi Pendidik dan
Calon Didik, Yogyakarta: Pustaka Belajar.

Wind, Edwind and Brown, Gerald W.(1975). Essential of


Educational Evaluation, New York: Holt Rinehart
and Winston

Winkel, W.S.(1983). Psikologi Pendidikan dan Evaluasi


Belajar, Jakarta : PT. Gramedia.

Whitmore, John (1997). Coaching For Performace: Seni


Mangarahkan Untuk Mendongkrak Kinerja.
terjemahan Y. Dwi Helly Purnomo, Jakarta:Gramedia
Pustaka Utama.

Zainul, Asmawi dan Noehi Nasution (2005). Penilaian Hasil


Belajar. Pusat Antar Universitas, Direktorat Jenderal
Pendidikan Tinggi: Departemen Pendidikan Dan
kebudayaan.

Zakaria, Ramli (2006). Pedoman Penilaian Sikap. Jakarta:


Puspendik Balitbang Depdiknas

415 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

416 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Prof. Dr. Yusrizal, M.Pd dilahirkan di


Pidie, Aceh pada 31 Desember 1952.
Setelah lulus Sarjana Pendidikan Fisika
dari FKIE-IKIP Yogyakarta pada 1981,
langsung diangkat menjadi staf pengajar
pada Jurusan Fisika FKIP Universitas
Syiah Kuala, Darussalam-Banda Aceh.
Gelar Magister Pendidikan (bidang
Pendidikan Sains) diperolehnya dari PPs
Universitas Negeri Surabaya (UNESA)
TENTANG PENULIS

pada tahun 2000. Gelar

Doktor diperolehnya dari PPs Universitas


Negeri Jakarta (UNJ) pada tahun 2008
dalam Bidang Penelitian dan Evaluasi
Pendidikan. Pada thun 2011 diangkat
menjadi Guru Besar bidang ilmu Evaluasi
pendidikan Unsyiah.

Selain mengajar mata kuliah Evaluasi


pengajaran Fisika di FKIP Unsyiah, juga
mengajar mata kuliah Tes dan Pengukuran
pada Program Studi Pendidikan
Keolahragaan, mengajar Language Testing
and Evaluation pada Program Studi
Pendidikan Bahasa Inggris, mengajar

417 | Pengukuran & Evaluasi Hasil Dan Proses Belajar


Prof. Dr. Yusrizal, M.Pd

Evaluasi Pendidikan di Program Studi-


Program Studi: Pendidikan IPA,

Pendidikan Matematika, Pendidikan


Bahasa dan Sastra Indonesia serta di
Program Studi Magister Administrasi
Pendidikan PPs Unsyiah. Bercita-cita
untuk dapat menerbitkan sejumlah buku
mengenai Evaluasi Pendidikan /
Pembelajaran, Buku Pengukuran &
Evaluasi Proses dan Hasil Belajar ini
merupakan buku kedua dari cita-citanya
tersebut.

418 | Pengukuran & Evaluasi Hasil Dan Proses Belajar

Anda mungkin juga menyukai