net/publication/326671246
Evaluasi Pendidikan
CITATIONS READS
0 3,738
1 author:
Muhammad Basir
STKIP Puangriamaggalatung Sengkang
11 PUBLICATIONS 0 CITATIONS
SEE PROFILE
All content following this page was uploaded by Muhammad Basir on 28 July 2018.
EVALUASI
PENDIDIKAN
LAMPENA INTIMEDIA
Sengkang
2015
iii
EVALUASI PENDIDIKAN
Diterbitkan oleh :
LAMPENA INTIMEDIA
Anggota IKAPI (Ikatan Penerbit Indonesia)
Nomor : 010/SSL/08
ISBN : 978-602-8151-51-1
B.109.1115
iv
SAMBUTAN
KETUA YP. PUANGRIMAGGALATUNG SENGKANG
YP Puangrimaggalatung Sengkang
v
KATA PENGANTAR
Hormat Penyusun
vi
Daftar Isi
vii
Bab V Jenis dan Pengembangan Tes ................................. 77
A Jenis Alat Penilaian .............................................. 77
B Pengertian Tes ..................................................... 78
C Bentuk Tes ............................................................ 79
D Ciri-ciri Tes yang Baik ........................................... 84
E Langkah-langkah Pengembangan Tes ................. 84
F Menganalisis Tes .................................................. 86
viii
Daftar Gambar
ix
x
Daftar Tabel
xi
16. Pengolahan data hasil wawancara ………………………. 176
xii
1
BAB I
KONSEP DASAR EVALUASI PEMBELAJARAN
A. Pengertian Evaluasi
1. Evaluasi adalah suatu proses merencanakan, memperoleh
dan menyediakan informasi yang sangant diperlukan untuk
membuat alternatif-alternatif keputusan (Mehrens &
Lehmann, 1978:5). Sesuai dengan pengertian tersebut
maka setiap kegiatan evaluasi atau penilaian merupakan
suatu proses yang sengaja direncanakan untuk
memperoleh informasi atau data; berdasarkan data tersebut
kemudian dicoba membuat suatu keputusan. Sudah barang
tentu informasi atau data yang dikumpulkan itu haruslah
data yang sesuai dan mendukung tujuan evaluasi yang
direncanakan.
2. Evaluasi adalah suatu proses yang sistematis untuk
menentukan atau membuat keputusan sampai sejauh mana
tujuan-tujuan pembelajaran telah dicapai oleh siswa.
2
Dalam hubungannya dengan keseluruahan proses
pembelajaran, tujuan pembelajaran dan proses belajar-
mengajar serta prosedur evaluasi saling berkaitan dan tidak
dapat dipisahkan satu dari yang lain. Secara bagan dapat
digambarkan sebagai berikut:
BAB II
PROSEDUR DAN KEDUDUKAN EVALUASI
A. Prosedur Evaluasi
Prosedur dalam mengadakan evaluasi dapat dibagi atas
beberapa langkah atau beberapa step. Mengenai pembagian
langkah-langkah evaluasi ini ada beberapa pendapat. Yulien
Stanley mengatakan bahwa : “Langkah-langkah evaluasi itu
terdiri dari : menetapkan tujuan program, memilih alat yang
layak pelaksanaan pengukuran, memberikan skor,
menganalisa dan menginterpretasikan skor, membuat catatan
yang baik, dan menggunakan hasil-hasil pengukuran (Yulien-
Stanley, 1964, hal. 299).
Menurut Mochtar Buchari M. Ed, “langkah-langkah pokok
dalam evaluasi terdiri dari perencanaan, pengumpulan data,
verifikasi data, analisa data dan penafsiran data (Mochtar
Buchari M.Ed, 1972, hal. 24)
Dalam buku ini penulis akan mempergunakan sistematik
dari Mochtar Buchari M. Ed, yang membagi procedure evaluasi
atas lima langkah pokok.
14
- Masalah pertama yang harus dilakukan dalam langkah
perencanaan ialah merumuskan tujuan evaluasi yang hendak
dilaksanakan dalam suatu proses pendidikan didasarkan atas
tujuan yang hendak dicapai dalam program pendidikan
tersebut.
Perumusan yang lebih khusus dari pada tujuan-tujuan
evaluasi ditentukan oleh jenis tugas yang kita hadapi. Tujuan
evaluasi yang dilaksanakan oleh seorang konselor pendidikan
akan berbeda dengan tujuan evaluasi yang dilaksanakan oleh
sebuah panitia seleksi, yang akan berbeda pula dengan tujuan-
tujuan evaluasi yang dilaksanakan oleh seorang guru yang
mengajarkan suatu mata pelajaran tertentu.
Seorang konselor pendidikan bertujuan untuk
mendapatkan informasi yang selengkap-lengkapnya tentang
anak didik agar dapat memberikan bimbingan yang sebaik-
baiknya. Sebuah panitia seleksi bertujuan untuk mengetahui
potensi-potensi yang ada pada para calon untuk dapat memilih
calon yang paling tepat untuk jenis pendidikan atau jenis
jabatan tertentu. Seorang guru yang mengajar suatu mata
pelajaran tertentu akan bertujuan untuk mengetahui apakah
bahan-bahan pelajaran yang disampaikan kepada peserta didik
sudah dikuasainya atau belum.
15
4. Menumt Gelder
1. Merumuskan tujuan instruksional.
2. Analisis situasi.
3. Menentukan aktivitas guru, aktivitas pembelajar,
mata pembelajaran dan alat bantu pembelajaran.
4. Evaluasi
2) Komparatif
Prinsip ini menyatakan bahwa dalam mengadakan
evaluasi harus dilaksanakan secara bekerjasama
dengan semua orang. Sebagai contoh dalam
mengevaluasi keberhasilan guru dalam mengajar,
harus bekerjasama antara pengawas, kepala sekolah,
guru itu sendiri, dan bahkan, dengan pihak murid.
Dengan melibatkan semua pihak diharapkan dapat
mencapai keobyektifan dalam mengevaluasi.
3) Kontinyu
Evaluasi hendaknya dilakukan secara terus-menerus
selama proses pelaksanaan program. Evaluasi tidak
hanya dilakukan terhadap hasil yang telah dicapai,
tetapi sejak pembuatan rencana sampai dengan tahap
laporan. Hal ini penting dimaksudkan untuk selalu
dapat memonitor setiap saat atas keberhasilan yang
telah dicapai dalam periode waktu tertentu. Aktivitas
yang berhasil diusahakan terjadi peningkatan,
sedangkan aktivi-tas yang gagal dicari jalan lain untuk
mencapai keberhasilan.
36
4) Obyektif
Mengadakan evaluasi harus menilai sesuai dengan
kenya¬taan yang ada. Katakanlah yang hijau itu hijau
dan yang merah itu merah. Jangan sampai
mengatakan yang hijau itu kuning, dan yang kuning itu
hijau. Sebagai contoh, apabila seorang guru itu sukses
dalam menga¬jar, maka katakanlah bahwa guru ini
sukses, dan sebaliknya apabila jika guru itu kurang
berhasil dalam mengajar, maka katakanlah bahwa guru
itu kurang berhasil. Untuk mencapai keobyektifan
dalam evaluasi perlu adanya data dan fakta. Dari data
dan fakta inilah dapat mengolah untuk kemudian
diambil suatu kesimpulan. Makin lengkap data dan
fakta yang dapat dikumpulkan maka makin obyektiflah
evaluasi yang dilakukan.
5) Berdasarkan Kriteria yang Valid
Selain perlu adanya data dan fakta, juga perlu adanya
kriteria-kriteria tertentu. Kriteria yang digunakan dalam
evaluasi harus konsisten dengan tujuan yang telah
dirumuskan. Kriteria ini digunakan agar memiliki
standar yang jelas apabila menilai suatu aktivitas
supervisi pendidikan. Kekonsistenan kriteria evaluasi
37
dengan tujuan berarti kriteria yang dibuat harus
mempertimbangkan hakikat substansi supervisi
pendidikan.
6) Fungsional
Evaluasi memiliki nilai guna baik secara langsung
maupun tidak langsung. Kegunaan langsungnya
adalah dapatnya hasil evaluasi digunakan untuk
perbaikan apa yang dievaluasi, sedangkan kegunaan
tidak langsungnya adalah hasil evaluasi itu
dimanfaatkan untuk penelitian atau keperluan lainnya.
7) Diagnostik
Setiap hasil evaluasi harus didokumentasikan. Bahan-
bahan dokumentasi hasil evaluasi inilah yang dapat
dijadikan dasar penemuan kelemahan-kelemahan atau
kekurangan - kekurangan yang kemudian harus
diusahakan jalan pemecahannya.
a. Kesahihan
Untuk memperoleh hasil evaluasi yang sahih,
dibutuhkan instrumen yang memiliki atau memenuhi
syarat kesahihan suatu instrumen evaluasi. Kesahihan
instrumen evaluasi diperoleh melalui hasil pemikiran dan
dari hasil pengalaman.
BAB III
PERENCANAAN EVALUASI PEMBELAJARAN
.
A. Perencanaan umum
Di dalam sistem pengaturan pemberian pelajaran di
sekolah-sekolah kita dewasa ini, khususnya disekolah menengah
digunakan sistem guru vak. Dalam sistem tersebut seorang guru
tidak mengajar satu kelas untuk pelajaran dikelas itu. Seorang
guru hanya berkewajiban mengajarkan satu atau beberapa mata
pelajaran untuk beberapa kelas tertentu. Atau dengan kata lain,
seorang atau sekelompok murid tidak menerima pelajaran hanya
dari seorang guru untuk semua mata pelajaran. Seorang atau
sekelompok murid menerima pelajaran dari sejumlah guru yang
amsing-masing memegang satu mata pelajaran atau lebih.
Dengan demikian pencapaian tujuan pendidikan untuk seorang
dan sekelompok murid bukan merupakan tanggung jawab
seorang guru saja, melainkan merupakan tanggung
jawabsejumlah guru yang bersama-sama ikut mendidik murid-
murid tersebut.
43
Sehubungan dengan sistem pengaturan pemberian
pembelajaran seperti tersebut di atas, maka ada dua hal penting
yang harus diperhatikan oleh setiap pengajar di sekolah tersebut,
yaitu :
a. Ia harus memahami lebih dahulu apa tujuan pendidikan itu,
baik yang menyangkut tujuan umum pendidikan maupun
tujuan-tujuan khusus yang harus dicapai oleh suatu jenis
pendidikan dimana ia bertugas.
b. Ia harus menyadari apa sumbangan yang dapat
diberikannya dalam mencapai tujuan-tujuan pendidikan
tersebut, melalui mata pelajaran yang diajarkannya.
Sesuai dengan sistem pengaturan pemberian pembelajaran
yang telah disebutkan diatas, maka gambaran yang lengkap
tentang kemajuan belajar seorang murid hanya dari hasil
evaluasi seorang guru saja. Gambaran yang lengkap
tentang kemajuan belajar murid baru akan dilihat
berdasarkan hasil evaluasi dari sejumlah guru yang ikut
memberikan pelajaran kepada murid tersebut.
Oleh karena evaluasi hasil belajar di suatu sekolah
akan dilakukan oleh sejumlah tenaga pengajar sekolah
tersebut, maka supaya tidak terjadi kesimpang-siuran dalam
pelaksanaan evaluasi antar guru satu dengan guru yang
44
lainnya, perlu ada suatu pedoman bersama yang dapat
dijadikan pegangan oleh para guru dalam mengadakan
evaluasi hasil belajar untuk vaknya masing-masing.
Pedoman bersama tersebut hendaknya disusun dalam
suatu program bersama tentang kegiatan evaluasi yang
dilaksanakan disekolah tersebut. Program semacam ini
disebut program evaluasi.
Program evaluasi tersebut dapat disusun dalam
jangka waktu satu tahun, tetapi dapat juga disusun untuk
jangka waktu yang lebih panjang, misalnya untuk jangka
waktu yang meliputi seluruh masa pendidikan dari suatu
sekolah . jadi untuk suatu program SMP atau SMA misalnya
dapat disusun program evaluasi untuk jangka waktu tiga
tahun.
Mengenai ketentuan-ketentuan yang perlu
dicantumkan dalam program evaluasi tergantung kepada
berbagai faktor. Mengenai faktor-faktor yang perlu
dipertimbangkan untuk menentukan pokok-pokok yang
perlu dicantumkan dalam program evaluasi untuk suatu
sekolah meliputi.
45
a. Kecakapan serta pengalaman yang dimiliki oleh para guru
dalam soal evaluasi. Apabila korp pengajar disuatu sekolah
pada umumnya terdiri atas tenaga-tenaga muda yang
belum berpengalaman, serta kurang memahami tekhnik-
tekhnik evaluasi, maka program evaluasi ini harus memuat
petunjuk-petunjuk yang elementer tentang pelaksanaan
evaluasi. Sebaiknya apabila korp pengajar itu pada
umumnya terdiri dari pengajar-pengajar yang
berpengalaman dan telah memproleh pendidikan tentang
dasar-dasar evaluasi, maka program evaluasi itu cukup
terdiri dari beberapa petunjuk-petunjuk singkat saja.
b. Jelas tidaknya, terperinci tidaknya rumusan tentang tujuan-
tujuan pendidikan, amupun rumusan tentang tujuan-tujuan
pelajaran yang tercantum dalam rencana pelajaran. Kalau
rumusan tentang tujuan-tujuan tersebut sudah jelas dan
terperinci, maka tidak perlu lagi diuraikan dalam program
evaluasi. Kalau tujuan-tujuan tersebut belum jelas dan
belum terperinci, maka perlu diuraikan dalam program
evaluasi.
c. Tersedia tidaknya alat-alat evaluasi yang akan
dipergunakan. Apabila alat-alat evaluasi yang akan
digunakan telah cukup tersedia, maka dalam program
46
evaluasi cukup disebutkan bahwa pada waktu tertentu,
diadakan evaluasi terhadap aspek tertentu dengan alat
tertentu. Tetapi kalau alat-alat evaluasi belum tersedia,
maka perlu sebutkan cara-cara sebaiknya ditempuh oleg
seorang petugas dalam mengadakan evaluasi.
Program evaluasi harus bersifat singkat dan cukup jelas
bagi setiap orang yang mempergunakannya. Program evaluasi
sekali-kali tidaklah boleh menyerupai suatu texbook tentang
evaluasi.
Program evaluasi untuk suatu sekolah hendaknya memuat
hal-hal sebagai berikut :
a. Perincian terhadap tujuan evaluasi dalam lembaga
pendidikan tersebut, dan pendidikan evaluasi setiap mata
pelajaran.
b. Perincian mengenai aspek pertumbuhan yang harus
diperhatikan dalam setiap tindakan evaluasi.
c. Metode evaluasi yang dapat dipergunakan
d. Masalah alat evaluasi yang dapat dipergunakan.
e. Kriterium dan skala yang dipergunakan
f. Jadwal evaluasi.
47
Kalau setiap ketentuan yang dicantumkan diatas tadi
diuraikan secara singkat dalam suatu bab maka model program
evaluasi itu dapat berupa suatu buku kecil yang tidak terlampau
tebal dan merupakan pegangan yang cukup berguna dari para
pengajar disekolah tersebut. Program evaluasi hendaknya
ditentukan bersama-sama untuk seluruh anggota korp pengajar
sekolah. Program evaluasi tidak boleh menimbulkan perasaan
pada para pengajar bahwa segenap kebebasan dan inisiatif
mereka terampas sama sekali. Jadi bagaimanapun juga susunan
suatu program evaluasi di suatu sekolah setiap pengajar masih
mempunyai kebebasan dan kewajiaban untuk mempersiapkan
setiap tindakan evaluasi yang akan dilakukannya.
B. Perencanaan khusus
Di atas telah disebutkan, bahwa program evaluasi
merupakan pedoman umum bagi setiap guru dalam
melaksanakan kegiatan evaluasi sekolah tersebut. Di samping
berpedoman pada program evaluasi, setiap guru hendaknya
membuat persiapan-persiapan khusus setiap kali ia akan
mengadakan kegiatan evaluasi.
48
Program evaluasi dan persiapan khusus merupakan dua
hal yang tidak bisa dipisah-pisahkan. Kedua hal tersebut saling
lengkap melengkapi. Banyak sedikitnya hal-hal yang perlu
dilakukan dalam persiapan khusus ini terperinci tidaknya
ketentuan-ketentuan yang yang dicantumkan dalam program
evaluasi. Misalnya apabila dalam program evaluasi telah
dicantumkan tentang tujuan-tujuan evaluasi secara terperinci
maka dalam persiapan khusus tentu hal itu tidak perlu dilakukan
lagi. Sebaliknya apabila dalam program evaluasi tersebut baru
dicantumkan tujuan umumnya saja, maka tujuan yang secara
terperinci harus dilakukan oleh guru dalam persiapan khusus.
Persiapan-persiapan khusus untuk suatu tindakan
evaluasi dapat kita bagi-bagi lagi dalam beberapa step yaitu :
a. Merumuskan tujuan
b. Menetapkan aspek-aspek yang dinilai
c. Menetapkan metode
d. Menyiapkan alat-alat
Di bawah ini akan kami uraikan lebih lanjut keempat step
tersebut.
49
a. Merumuskan tujuan.
Dalam setiap mempersiapkan suatu tindakan evaluasi,
pertama-tama yang harus dilakukan ialahmerumuskan tujuan
evaluasi yang hendak dicapai dalam tindakan evaluasi terleih
dahulu perlu mempertanyakan : “ Apakah tujuan evaluasi
yang akan saya lakukan ini?.” Terhadap pertanyaan tersebut
hendaknya diberikan jawaban secara terperinci. Artinya tidak
cukup kalau jawaban tersebut bersifat umum. Misalnya
seorang guru dalam mata pelajaran IPA pada suatu ketika
akan mengadakan evaluasi tentang IPA, dan bahan pelajaran
yang akan digunakanya sebagai bahan evaluasi adalah soal
makhluk hidup. Maka rumusan tujuan evaluasi yang hendak
dilaksanakan tidaklah cukup kalau hanya dirumuskan sebagai
berikut : “tujuan evaluasi yang hendak saya laksanakan ialah
untuk mengetahui pengetahuan murid-murid tentang soal
makhluk hidup.” Rumusan tujuan seperti tersebut masih
terlalu umum, sehingga tidak menuntun guru dalam
menyusun soalan-soalan tes. Oleh karena itu rumusan itu
harus diperinci lebih lanjut. Tentang apa saja makhluk hidup
yang ingin diketahui. Dan seberapa dalam proses mental
yang ingin diukur dalam hubunganya dengan pengetahuan
makhluk hidup tersebut.
50
Perumusan yang terperinci tentang tujuan-tujuan yang
ingin dicapai dalam suatu tindakan evaluasi dapat dilakukan
melalui dua hal. Pertma adalah dengan mengadakan
perincian tentang ruang lingkup daripada pengetahuan yang
hendak diukur sehubungan dengan pengetahuan tersebut.
Yang pertama menyangkut tentang luas pengetahuan dan
yang kedua menyangkut tentang jenjang pengetahuan.
Perincian tentang luas pengetahuan yang hendak
diukur, hendaknya berpedoman tentang ruang lingkup ilmu
pengetahuan tersebut, sesuai dengan luas pengetahuan yang
ditetapkan dalam kurikulum sekolah yang bersangkutan.
Dalam kurikulum dapat diketahu aspek-aspek apa saja dari
makhluk hidup yang diketahui oleh murid-murid.
Perincian tentang jenjang pengetahuan yang hendak
diukur dapat dilakukan dengan berpedoman dengan salah
satu sistematika tentang jenjang pengetahuan.
c. Menetapkan metode
Setelah kita selesai merumuskan tujuan dan
menetapkan aspek yang akan dinilai dari suatu tindakan
evaluasi yang akan kita lakukan, maka soal ketiga yang harus
kita lakukan ialah: menentukan metode yang sebaik-baiknya
yang dapat kita pergunakan.
Yang harus kita perhatikan dalam menetapkan metode
yang akan dipergunakan dalam suatu tindakan evaluasi ialah
bahwa kita lebih dahulu harus mengenal bentuk-bentuk
manifestasi apa yang kita hendak nilai pada anak-anak tadi
dan baru kemudian menetapkan metode yang hendak kita
pergunakan. Kalau aspek yang kita nilai mempunyai
bermacam-macam bentuk manifestasi, maka sedapat
mungkin kita pilih manifestasi yang paling langsung dari
aspek tadi.
52
Misalnya tujuan mata pelajaran ilmu kesehatan
antara lain adalah “mengajarkan kepada anak-anak
cara-cara yang ditempuh dalam memproleh dan
menyiapkan makanan serta menanamkan kesadaran
akan perlunya memilih makanan yang sehat. ”Untuk
menilai pengetahuan anak-anak tentang cara-cara
memproleh dan menyiapkan makanan apat kita
lakukan dengan mempergunakan metode tes.
Sedangkn untuk menilai kesadaran anak-anak
tentang pemilihan makanan yang sehat dapat kita
lakukan dengan mempergunakan metode observasi.
Kita perhatikan misalnya ada atau tidaknya
kebiasaan pada para murid untuk membeli makanan
yang tidak cukup terjaga kebersihannya pada waktu
istirahat dan sebagainya.
d. Menyiapkan alat-alat
Soal selanjutnya yang harus kita lakukan
setelah kita selesai menetapkan metode yang akan
kita pergunakan untuk melakukan suatu tinakan
evaluasi ialah mempersiapkan alat-alat yang akan
kita pergunakan pada evaluasi tersebut. Kalau
evaluasi yang kita gunakan berupa tes tertulis maka
alat yang dipergunakan adalah berupa soalan tes.
53
3. Ranah Psikomotor
- Gerakan refleks (keterampilan pada gerakan yang
tidak sadar);
- Keterampilan (gerakan dasar)
- Persipektual
Kemampuan spektakuler, termasuk di dalamnya
membedakan visual, membedakan auditif, motoris, dan
lain-lain;
- Kemampuan dibidang fisik, misalnya kekuatan,
keharmonisan, dan ketepatan.
- Gerakan skill, mulai dari keterampilan sederhana
sampai pada keterampilan kompleks;
- Ekspresif dan Interpretatif
Kemampuan yang berkenaan dengan komunikasi non-
decursive seperti gerakan ekspresif dan interpretatif.
67
BAB IV
MODEL-MODEL EVALUASI
Model-Model Evaluasi
Dalam studi tentang evaluasi, banyak sekali dijumpai model-
model evaluasi dengan format atau sistematika yang berbeda,
sekalipun dalam beberapa model ada juga yang sama. Misalnya saja,
Said Hamid Hasan (1988) mengelompokkan model evaluasi sebagai
berikut :
1. Model evaluasi kuantitatif, yang meliputi : Model Tyler, Model
Teoretik Taylor dan Maguire, model pendekatan sistem Alkin,
model Countnance Stake, model CIPP, model ekonomi mikro.
2. Model evaluasi kualitatif, yang meliputi : Model studi kasus, Model
Iluminatif, dan Model Responsif.
Sementara itu, Kaufman dan Thomas dalam Suharsimi Ali
Kunto dan Cepi Syafruddin AJ (2007) membedakan model evaluasi
menjadi 8 yaitu :
1. Goal Oriented Evaluation Model, dikembangkan oleh Tyler
2. Goal Free Evaluation Model dikembangkan oleh Scriven
3. Formatif Summatif Evaluation Model, dikembangkan oleh Scriven
4. Countenance Evaluation Model, dikembangkan oleh Stake
68
5. Responsive Evaluation Model, dikembangkan oleh Stake
6. CSE-UCLA Evaluation Model, menekankan pada kapan evaluasi
dilakukan
7. CIPP Evaluation Model, yang dikembangkan oleh Stufflebeam
8. Discrepancy Model, yang dkembangkan oleh Provus
Ada juga model evaluasi yang dikelompokkan oleh Nana
Sudjana, sebagai berikut:
A. Model Tyler
Nama model ini diambil dari nama pengembannya yaitu
Tyler. Dalam buku Basic Principle Of Curriculum and
Instruction, Tyler banyak mengemukakan ide dan gagasanya
tentang evaluasi. Penggunaan model Tyler memerlukan
informasi perubahan tingkah laku terutama pada saat sebelum
dan sesudah terjadi pembelajaran. Model ini dibangun atas dua
dasar pemikiran, pertama, evaluasi ditujukan pada tingkah laku
peserta didik. Kedua, evaluasi harus dilakukan pada tingkah laku
awal peserta didik sebelum melaksanakan kegiatan
pembelajaran dan sesudah melaksanakan kegiatan
pembelajaran (hasil). Dasar pemikiran yang kedua ini
menunjukkan bahwa seorang evaluator harus dapat menentukan
perubahan tingkah laku apa yang terjadi setelah peserta didik
mengikuti pengalaman belajar tertentu dan menegaskan bahwa
69
perubahan yang terjadi merupakan perubahan yang disebabkan
oleh pembelajaran. Menurut Tyler ada tiga langkah pokok yang
harus dilakukan, yaitu :
1. Menentukan tujuan pembelajaran yang akan dievaluasi
2. Menentukan situasi dimana peserta didik memperoleh
kesempatan untuk menunjukkan tingkah laku yang
berhunbungan dengan tujuan.
3. Menentukan alat evaluasi yang akan dipergunakan untuk
mengukur tingkah laku peserta didik.
B. Model yang berorientasi pada tujuan
Dalam pembelajaran kita mengenal adanya tujuan
pembelajaran umum dan tujuan pembelajaran khusus. Model
evaluasi ini menggunakan kedua tujuan tersebut sebagai kriteria
untuk menentukan keberhasilan. Evaluasi diartikan sebagai
proses pengukuran untuk mengetahui sejauh mana tujuan
pembelajaran telah tercapai. Model ini diangap lebih praktis
karena menentukan hasil yang diinginkan dengan rumusan yang
dapat diukur. Dengan demikian, dapat dikatakan bahwa terdapat
hubungan yang logis antara kegiatan, hasil dan prosedur
pengukuran hasil. Tujuan model ini adalah membantu guru
merumuskan tujuan dan menjelaskan hubungan antara tujuan
dengan kegiatan. Jika rumusan tujuan pembelajaran dapat
70
diobservasi dan dapat diukur, maka kegiatan evaluasi
pembelajaran akan lebih praktis dan simpel. Disamping itu model
ini dapat membantu guru menjelaskan rencana pelaksanaan
kegiatan pembelajaran dengan proses pencapaian tujuan. Hasil
evalusai akan menggambarkan tingkat keberhasilan tujuan
program pembelajaran berdasarkan kriteria program khusus.
Kelebihan model ini terletak pada hubungan antara tujuan
dengan kegiatan dan menekankan pada peserta didik sebagai
aspek penting dalam program pembelajaran. Kekurangannya
adalah memungkinkan terjadinya proses evaluasi melebihi
konsekuensi yang tidak diharapkan.
C. Model pengukuran
Model pengukuran (Measurement model) banyak
mengemukakan pemikiran-pemikiran dari R. Thorndike dan
R.L. Ebel. Sesuai dengan namanya model ini sangat menitip
beratkan pada kegiatan pengukuran. Pengukuran digunakan
untuk menentukan kuantitas suatu sifat (Atribute) tertentu yang
dimiliki oleh objek, orang maupun peristiwa, dalam bentuk unit
ukuran tertentu. Dalam bidang pendidikan, model ini telah
diterapkan untuk mengungkap perbedaan-perbedaan individual
maupun kelompok dalam hal kemampuan, minat, dan sikap.
Hasil evaluasi digunakan untuk keperluan seleksi peserta didik,
71
bimbingan dan perencanaan pendidikan. Objek evaluasi dalam
model ini adalah tingkah laku peserta didik, mengcakup hasil
belajar (Kognitif), pembawaan, sikap, minat, bakat, dan juga
aspek-aspek kepribadian peserta didik. Instrumen yang
digunakan pada umumnya adalah tes tertulis dalam bentuk tes
obkektif yang cenderung dibakukan. Oleh sebab itu dalam
menganalisis soal sangat memperhatikan diffculty indeks dan
indeks of discrimination. Model ini menggunakan pendekatan
penilaian acuan norma (norm-referenced assessment).
D. Model Kesesuaian
Menurut model ini evaluasi adalah suatu kegiatan untuk
melihat kesesuaian (Congruence) antara tujuan dengan hasil
belajar yang telah dicapai. Hasil evaluasi digunakan untuk
menyempurnakan sistem bimbingan peserta didik dan untuk
memberikan informasi kepada pihak-pihak yang memerlukan.
Objek evaluasi adalah tingkah laku peserta didik, yaitu
perubahan tingkah laku yang diinginkan (intended bihaviour)
pada akhir kegiatan pendidikan, baik yang menyangkut aspek
kognitif, afektif maupun psikomotor. Untuk itu, tehnik evaluasi
yang digunakan tidak hanya tes (tulisan, lisan, dan perbuatan)
tetapi juga non-tes (observasi, wawancara, skala sikap dan
sebagainya). Model evaluasi ini memerlukan informasi
72
perubahan tingkah laku pada dua tahap, yaitu sebelum dan
sesudah kegiatan pembelajaran. Adapun langkah-langkah yang
harus ditempuh dalam model evaluasi ini adalah merumuskan
tujuan tingkah laku, menentukan situasi dimana peserta didik
dapat memperlihatkan tingkah laku yang dievaluasi, menyusun
alat evaluasi dan menggunakan alat evaluasi. Oleh sebab itu
model ini menekankan pada pendekatan penilaian acuan
patokan (Criterion Referenced Assessment).
E. Educational System Evaluation Model (Daniel
L.Stufflebeam,michael Scriven, Robert E. Stake, dan
Malcolm M.Provus)
Tokoh model ini antara lain Daniel L. Stufflebeam,Michael
Scriven,Robert E. Stake dan Malcolm M. Provus. Menurut model
ini,evaluasi berarti membandingkan performance dari berbagi
dimensi (tidak hanya dimensi hasil saja) dengan sejumlah
kriteria, baik yang bersifat mutlak/intern maupun relatif/ekstern.
Model ini menekankan sistem sebagai suatu keseluruhan ini dan
merupakan penggabungan dari beberapa model, yaitu:
a. Model countenance dari Stake,yang meliputi keadaan
sebelum kegiatan berlangsung (antecedents), kegiatan
yang terjadi dan saling memengaruhi (transaction),hasil
yang diperoleh (outcomes).
73
b. Model CIPP dan CDPP dari Sufflebeam. CIPP yaitu
Context, Input, Process, dan Product. CDPP yaitu, Context,
design, process, product
c. Model Scriven yang meliputi Instrumental Evaluation and
Consequential Evaluation
d. Model Provus yang meliputi design, operation program,
interim product dan terminal products.
e. Model EPIC (Evaluative Innovative curriculum) model ini
mengevaluasi:
1. Prilaku yang meliputi kognitif, afektif dan psikomotor
2. Pembelajaran yang meliputi organisasi, isi, metode,
fasilitas dan biaya
3. Institusi yang meliputi peserta didik, guru, administrator,
spesialis pendidikan, keluaraga dan masyarakat
f. Model CEMREL (central midwestern regional educational
laboratory). Model ini dikembangkan oleh Howard Russell
dan Louis Smith dengan penekanan pada tiga segi yaitu :
1. fokus evaluasi yang menekankan pada pserta
didik,mediator dalam material
2. peranan evaluasi adalah untuk avaluasi kegiatan yang
sedang berjalan dan evaluasi pada akhir kegiatan
74
3. data evaluasi bersumber dari pengukuran skala,jawaban
angket dan observasi.
g. Model Atkinson, yang mengemukakan tiga domain tujuan,
yaitu:
1. struktur yang mencakup perencanaan sekolah dan
organisasi sekolah
2. proses,yang mencakup proses pembelajaran
3. produk,yang mencakup prilaku sebagai hasil belajar.
F. Model Alkin
Model ini dari nama pengembangnya yaitu, Marvin Alkin
(1969). Menurut Alkin Evaluasi adalah suatu proses untuk
meyakinkan keputusan,mengumpulkan informasi,memilih
informasi yang tepat,dan menganalisis informasi sehingga dapat
disusun laporan bagi pembuat keputusan dalam memeilih
beberapa alternatif.
Alkin mengemukakan ada lima jenis evaluasi,yaitu:
a. sistem assesment,yaitu,untuk memberikan informasi
tentang keadaan atau posisi dari suatu sistem
b. program planning,yaitu, untuk membantu pemilihan
program tertentu yang mungkin akan berhasil
memenuhi kebutuhan program.
75
c. program implementation,yaitu untuk menyiapkan
informasi apakah suatu program sudah diperkenalkan
kepada kelompok tertentu yang tepat sebagaimana
yang direncanakan
d. program improvement yaitu, memberikan informasi
tentang bagaimana suatu program dapat berfungsi
,bekerja atau berjalan.Apakah sesuai dengan
pencapaian? Adakah hal-hal atau masalah-masalah
baru yang muncul secara tiba-tiba
e. program certification,yaitu memberikan informasi
tentang nilai atau manfaat suatu program.
G. Model Brinkerhoff
Robert O.Brinkerhoff (1987) mengemukakan jenis evaluasi
yang disusun berdasarkan penggabungan elemen-elemen yang
sama, yaitu Fixed vs emergent evaluation design desain evaluasi
fixed (tetap) harus direncanakan dan disusun secara sistematik-
terstruktur sebelum program dilaksanakan, meskipun demikian,
desain fixed dapat juga disesuaikan dengan kebutuhan yang
sewaktu-waktu dapat berubah. Desain evaluasi ini
dikembangkan berdasarkan tujuan program,kemudian disusun
pertanyaan-pertanyaan untuk mengumpulkan informasi yang
diperoleh dari sumber-sumber tertentu.Begitu juga dwengan
76
model analisis yang akan digunakan harus dibuat sebelum
program dilaksanakan. Pihak pemakai(user) akan menerima
informasi sebagai hasil evaluasi sesuai dengan tujuan yang telah
ditetapkan. Pada umumnya evaluasi formal yang dibuat secara
individual menggunakan desain fixed, karena tujuan program
sudah ditetapkan sebelumnya. Begitu juga dengan anggaran
biaya dan organisasi pelaksana, yang semuanya dituangkan
dalam proposal evaluasi.
77
BAB V
JENIS DAN PENGEMBANGAN TES
B. Pengertian Tes
Tes merupakan alat atau prosedur yang digunakan untuk
mengetahui atau mengukur sesuatu dalam suasana, dengan
cara dan aturan-aturan yang sudah ditentukan. Tes hasil belajar
adalah sekelompok pertanyaan atau tugas-tugas yang harus
dijawab atau diselesaikan oleh siswa dengan tujuan untuk
mengukur kemajuan belajar siswa.
79
C. Bentuk Tes
1. Dari segi bentuk pelaksanaannya
a. Tes Tertulis ( paper and pencil test)
Tes tertulis dalam pelaksanaannya lebih menekankan
pada penggunaan kertas dan pencil sebagai instrumen
utamanya, sehingga tes mengerjakan soal atau jawaban
ujian pada kertas ujian secara tertulis, baik dengan tulisan
tangan maupun menggunakan komputer.
b. Tes Lisan ( oral test)
Tes lisan dilakukan dengan pembicaraan atau wawancara
tatap muka antara guru dan murid.
c. Tes Perbuatan (performance test)
Tes perbuatan mengacu pada proses penampilan
seseorang dalam melakukan sesuatu unit kerja. Tes
perbuatan mengutamakan pelaksanaan perbuatan peserta
didik.
F. Menganalisis Tes
Menganalisis instrument (alat evaluasi) bertujuan untuk
mengetahui apakah alat ukur yang digunakan atau yang akan
digunakan sudah memenuhi syarat-syarat sebagai alat ukur
yang baik, tepat mengukur sesuatu sesuai tujuan yang telah
dirumuskan. Sebuah instrument dikatakan baik jika memenuhi
syarat validitas, reliabelitas dan bersifat praktis.
87
Validitas Tes
Suatu tes dikatakan valid jika tes itu dapat mengukur apa
yang seharusnya diukur. Valid disebut juga sahih, terandalkan
atau tepat. Tes hasil belajar yang valid, harus dapat
menggambarkan hasil belajar yang di ukur
Macam-macam validitas :
1) Validitas isi (content validity)
Validitas isi sering juga disebut validitas logis atau validitas
rasional. Validitas isi dapat dianalisis dengan bantuan kisi-kisi tes
dan pedoman penelaahan butir soal.
Penelaahan butir soal secara umum ditinjau dari tiga
aspek yaitu:
1. Aspek materi
2. Aspek bahasa
3. Aspek konstruksi
2) Validitas ramalan (predictive validity)
Suatu tes dikatakan memiliki validitas ramalan, apabila
hasil pengukuran yang dilakukan dengan tes itu dapat digunakan
untuk meramalkan, atau tes itu mempunyai daya prediksi yang
cukup kuat. Untuk mengetahui apakah suatu tes hasil belajar
dapat dinyatakan sebagai tes yang memiliki validitas ramalan
dapat dilakukan dengan mengkorelasikan tes hasil belajar yang
sedang diuji dengan kriterium yang ada.
88
3) Validitas bandingan (concurent validity)
Suatu tes dikatakan memiliki validitas concurrent,
apabila tes tersebut mempunyai kesesuaian dengan hasil
pengukuran lain yang dilaksanakan saat itu. Misalnya,
membandingkan hasil tes dari soal yang sedang dicari
validitasnya dengan hasil tes dari soal standar. Jika terdapat
korelasi yang positif antara kedua tes tersbut, berarti soal tes
yang dibuat mempunyai validitas concurrent.
4) Construct validity (validitas konstruk)
Validitas konstruk artinya butir-butir soal dalam tes
tersebut membangun setiap aspek berpikir seperti yang
tercantum dalam tujuan pembelajaran yang telah dirumuskan.
Penganalisisan validitas ini dapat dilakukan dengan jalan
melakukan pencocokan antara aspek berpikir yang
dikehendaki diungkapkan oleh tujuan pembelajaran, yaitu
melalui penelaahan butir-butir soal.
Meski terdapat beberapa jenis validitas, dalam periode
terakhir validitas dianggap sebagai suatu konsep utuh, tidak
dipilah-pilah sebagai jenis validitas.
89
BAB VI
PENILAIAN DALAM PEMBELAJARAN
Meningkatkan Kemampuan
Refleksi diri
Sebagai Self-Assessment
Bagi peserta didik
Gambar 6.3 Fungsi Penilaian Portofolio
a. Portofolio Proses
Jenis portofolio proses menunjukkan tahapan belajar
dan menyajikan catatan perkembangan peserta didik dari
waktu ke waktu. Portofolio proses menunjukkan kegiatan
pembelajaran untuk mencapai standar kompetensi,
kompetensi dasar dan sekumpulan indikator yang telah
142
b. Portofolio Produk
Jenis penilaian portofolio ini hanya menekankan pada
penguasaan (masteri) dari tugas yang dituntut dalam standar
kompetensi, kompetensi dasar dan sekumpulan indikator
pencapaian hasil belajar, serta hanya menunjukkan evidence
yang paling baik, tanpa memperhatikan bagaimana dan
kapan evidence tersebut diperoleh. Tujuan portofolio produk
adalah untuk mendokumentasikan dan merefleksikan kualitas
145
prestasi yang telah dicapai. Contoh portofolio produk adalah
portofolio tampilan (show portofolio) dan portofolio
dokumentasi (documentary portofolio).
1. Portofolio Tampilan
Portofolio bentuk ini merupakan sekumpulan hasil karya
peserta didik atau dokumen terseleksi yang dipersiapkan
untuk ditampilkan kepada umum. Misalnya,
mempertanggungjawabkan suatu proyek,
menyelenggarakan pameran, atau mempertahankan suatu
konsep. Portofolio ini sangat bermanfaat jika guru ingin
mengetahui kemampuan peserta didik yang
sesungguhnya dan hingga mana ketepatan isi portofolio
mengacu pada kompetensi yang telah ditetapkan. Bentuk
ini biasanya digunakan untuk tujuan pertanggung jawaban
(accountability). Syarat pokok yang harus dipenuhi oleh
peserta didik dalam portofolio tampilan adalah keaslian
evidence. Untuk itu, ada beberapa hal yang harus
diperhatikan oleh peserta didik dan guru. Pertama, peserta
didik harus menandatangani lembar pernyataan keaslian.
Kedua, peserta didik memberikan penghargaan kepada
semua sumber yang telah membantu, termasuk
identitasnya serta bentuk bantuan yang diberikan. Ketiga,
146
guru harus melihat perencanaan, draft pekerjaan peserta
didik, dan catatan selama proses berlnagsung. Keempat,
guru harus betul-betul mengamati bagaimana peserta
didik menampilkan hasil pekerjaan mereka.
Aspek yang dinilai dalam bentuk portofolio tampilan
adalah sebagai berikut :
a. Signifikansi materi, yaitu apakah materi yang dipilih
benar-benar merupakan materi yang penting dan
bermakna untuk diketahui dan dipecahkan ? atau
seberapa besar tingkat kebermaknaan informasi yang
dipilih berkaitan dengan topik yang dibahasnya ?
apakah materi yang dipilih sesuai dengan standar
kompetensi, kompetensi dasar dan indikator
pencapaian hasil belajar ?
b. Pemahaman, yaitu seberapa baik tingkat pemahaman
peserta didik terhadap hakikat dan lingkup masalah,
kebijakan atau langkah-langkah yang telah
dirumuskan.
c. Argumentasi, yaitu apakah peserta didik dalam
mempertahankan argumentasinya sudah cukup
memadai, sistematis dan relevan?
147
d. Responsifness (kemampuan memberikan respon),
yaitu seberapa besar tingkat kesesuaian antara
respons yang diberikan dengan pertanyaan? Dalam
memberikan respons, adakah bukti-bukti fisik yang
ditunjukkan?
e. Kerja sama kelompok, yaitu apakah anggota kelompok
turut berpartisipasi secara aktif dalam penyajian?
Adakah bukti-bukti yang menunjukkan tanggung jawab
anggota dalam kelompok? Apakah para penyaji
menghargai pendapat orang lain? Adakah kekompakan
kerja di antara para anggota kelompok?
Contoh :
Judul Penampilan :
Kelas / kelompok :
Petunjuk Penilaian :
1. Setiap kriteria diberi skor dalam skala 5 ( 1 – 5 )
2. Skor 1 = rendah; 2 = cukup; 3 = rata-rata; 4 = baik; 5 = istimewa
Penilai,
.........................................
149
2. Portofolio Dokumen
Portofolio dokumen menyediakan informasi baik proses
maupun produk yang dihasilkan oleh peserta didik.
Portofolio ini digunakan untuk memilih koleksi evidence
peserta didik yang sesuai dengan kompetensi dan akan
dijadikan dasar penilaian. Evidence peserta didik yang
telah digunakan dalam portofolio dokumentasi dapat
berasal dari catatan guru atau kombinasi antara catatan
guru dengan kegiatan peserta didik. Model portofolio ini
bermanfaat bagi peserta didik dan orang tua untuk
mengetahui kemajuan hasil belajar, kelebihan dan
kekurangan peserta didik dalam belajar secara
perseorangan. Berdasarkan dokumen ini, baik peserta
didik, orang tua maupun guru dapat melihat :
1) Proses apa yang telah diikuti?
2) Kerja apa yang telah dilakukan?
3) Dokumen apa yang telah dihasilkan?
4) Apakah hal-hal pokok telah terdokumentasikan?
5) Apakah dokumen disusun berdasarkan sumber-
sumber data masing-masing?
6) Apakah dokumen berkaitan dengan apa yang akan
disajikan?
150
7) Standar kompetensi mana yang telah dikuasai
sampai pada pekerjaan terakhir?
Indikator untuk penilaian dokumen itu, antara lain :
kelengkapan, kejelasan, akurasi informasi yang didapat,
dukungan data, kebermaknaan data grafis, dan
kualifikasi dokumen. Untuk menilai suatu dokumen dapat
dibuatkan model format penilaiannya.
Contoh :
LEMBAR PENILAIAN DOKUMEN
Judul Penampilan :
Kelas / kelompok :
Petunjuk Penilaian :
1. Setiap kriteria diberi skor dalam skala 5 ( 1 – 5 )
2. Skor 1 = rendah; 2 = cukup; 3 = rata-rata; 4 = baik; 5 = istimewa
Penilai
........................................
152
BAB VII
PENGOLAHAN HASIL PENILAIAN
Kelompok skor F cf
20 – 24 1 30
25 – 29 2 29
30 – 34 4 27
35 – 39 6 23
40 – 44 8 17
45 – 49 5 9
50 – 54 2 4
55 – 59 1 2
60 – 64 1 1
Keterangan :
cf adalah frekuensi kumulatif, diperoleh dengan
menjumlahkan frekuensi dari bawah ke atas
159
1+1=2
2+2=4
4 + 5 =9 dst
Kelas Median ada pada kelompok skor 40-44 sebab setengah
dari n, yakni ni ½ (30) = 15, ada pada cf 17. L1 dihitung dari
batas bawah kelompok skor 40-44, yakni 39,5. Interval adalah
5. Frekuensi median adalah 8 (∑f1) adalah 9.
Xi X‾ (Xi-X‾)2
7 7–7=0 0
8 8–7=1 1
9 9–7=2 4
6 6 – 7 = -1 1
5 5 – 7 = -2 4
∑ = 35 ∑ = 10
160
S2 = ∑( Xi - X‾ )2
n-1
= 10/5-1 = 10/4 = 2,5
S = √2,5 = 1,58
= 8,75
Skor baku (skor z dan skor T)
161
Skor z dapat dihitung dengan membagi selisih skor dan nilai
rata-ratanya dengan simpangan bakunya.
z=X–X
S
Contoh :
Martina memperoleh skor 75 dari skor maksimum 100.
Rata-rata kelas atau mean adalah 60 dan simpangan
bakunya 10.
Skor z Martina adalah 75 – 60 = 1,5
10
Martina memperoleh skor matematika 6,5 dalam standar 0-
10 Rata-rata kelas adalah 6. simpangan bakunya adalah
0,8.
Lanjutan ……
Sedangkan skor bahasa Indonesia sebesar 80 dari
rentangan 0-100. rata-rata kelas untuk bahasa Indonesia
adalah 75 dengan simpangan baku 10.
Pertanyaannya : Dalam pelajaran manakah Martina lebih
unggul ?
Untuk menjawab pertanyaan tersebut kita gunakan skor z.
162
Skor z untuk Matematika adalah 6,5 – 6 = 0,625
0,8
Skor z untuk bahasa Indonesia 80 – 75 = 0,50
10
Lanjutan ……
Skor T diperoleh dengan mengalihkan skor z kepada
bilangan 10, kemudian ditambah dengan bilangan 50
sehingga diperoleh skor dalam rentang 0-100.
Contoh di atas adalah mengenai skor z Martina dalam
Matematika dan bahasa Inggris jika digunakan skor T, skor
Martina menjadi :
Skor T Matematika adalah (0,625 x 10) + 50 = 56,25
Skor T Bahasa Inggris adalah (0,5x10) + 50 = 55
B. Konversi nilai
Standar yang sering digunakan dalam menilai hasil
belajar dapat dibedakan ke dalam beberapa kategori
yakni :
a. standar seratus (0-100)
b. standar sepuluh (0-10)
c. standar empat (1-4) atau dalam huruf (A-B-C-D)
163
Dalam konversi nilai digunakan 2 cara, yakni :
a. menggunakan rata-rata dan simpangan baku
b. tidak menggunakan rata-rata dan simpangan baku
c. Konversi tanpa menggunakan nilai rata-rata dan
simpangan baku.
Tabel : Kriteria nilai konversi
Persentase jawaban Nilai konversi
(%) Huruf Standar 10 Standar 4
(90 – 99) A 9 4
(80 – 89) B 8 3
(70 – 79) C 7 2
(60 – 69) D 6 1
Contoh Penggunaannya:
Misalkan kepada siswa diberikan tes IPS dalam bentuk tes
objektif pilihan berganda sebanyak 60 soal. Jawaban yang
benar diberi skor satu sehingga skor maksimal yang dicapai
siswa adalah 60. berdasarkan kriteria di atas, konversi nilai
dalam standar huruf, standar sepuluh, dan standar empat
adalah sebagai berikut :
164
Contoh:
Tes diberikan kepada siswa dalam bentuk tes objektif
sebanyak 90 soal. Setiap soal yang dijawab benar diberi
skor satu sehingga skor maksimum yang dapat dicapai
siswa adalah 90. Setelah diperiksa, ternyata skor yang
paling tinggi mencapai 50 dan skor terendah 30. Nilai rata-
rata (setelah dihitung) adalah 40 dan simpangan bakunya
4,0.
Dengan menggunakan rumus atau kriteria di atas diperoleh
nilai dalam standar sepuluh sebagai berikut:
166
Skor mentah Standar 10
40 + (2,25) (4,0) = 49 10
40 + (1,75) (4,0) = 47 9
40 + (1,25) (4,0) = 45 8
40 + (0,75) (4,0) = 43 7
40 + (0,25) (4,0) = 41 6 (batas lulusnya)
40 - (0,25) (4,0) = 39 5
40 - (0,75) (4,0) = 37 4
40 - (1,25) (4,0) = 35 3
40 - (1,75) (4,0) = 33 2
40 - (2,25) (4,0) = 31 1
Lanjutan . . . . .
Konversi lainnya adalah konversi skor mentah ke dalam
standar huruf (A-B-C-D) dan standar empat (4-3-2-1).
Dalam standar ini huruf A setara dengan 4, artinya
istimewa; huruf B setara dengan 3 artinya memuaskan;
huruf C setara dengan 2, artinya cukup; huruf D setara
dengan 1, artinya kurang.
Ukuran atau kriterianya adalah sebagai berikut:
168
Lanjutan . . . .
Pertanyaan 2:
a. Konversi dengan menggunakan persen
Tabel : Kriteria konversi nilai
Skor Kelompok skor Standar Standar Standar
presentase dari maksimum 10 huruf 4
(%) Skor = 90
90 – 99 81 – 89 9 A 4
80 – 89 72 – 80 8 B 3
70 – 79 63 – 71 7 C 2
60 – 69 54 – 62 6 D 1
Kurang dari Kurang dari 54 Gagal Gagal Gagal
60%
Nilai 10 diberikan pada skor 90
(betul semua)
174
Dari kriteria di atas, nilai yang dinyatakan lulus adalah
siswa yang mendapat skor di atas 54, yakni ada enam orang
b. Konversi nilai ke dalam standar 10
Berdasarkan batas lulus ideal, nilai rata-rata idealnya
adalah setengah dari skor maksimum, yakni ½ (90) = 45.
Simpangan baku (S) ideal adalah sepertiga dari rata-rata
ideal, yakni 1/3 (45) = 15. Dengan demikian maka nilai dalam
standar 10 menjadi sbb:
Skor mentah Standar 10
45 + (2,25) (15) = 78,75 (79)
dibulatkan 10
45 + (1,75) (15) = 71,25 (71) 9
45 + (1,25) (15) = 63,75 (64) 8
45 + (0,75) (15) = 56,25 (56) 7
45 + (0,25) (15) = 48,75 (49) 6
45 - (0,25) (15) = 41,25 (41) 5
45 - (0,75) (15) = 33,75 (34) 4
45 - (1,25) (15) = 26,25 (26) 3
45 - (1,75) (15) = 18,75 (18) 2
45 - (2,25) (15) = 11,25 (11) 1
175
c. Konversi nilai ke dalam standar huruf dan standar 4
Batas bawah Kategori skor Standar Standar 4
huruf
45 – 1,5 (15) = 22,5 22,5 – 37,0 D 1
45 – 0,5 (15) = 37,5 37,5 – 52,0 C 2
45 + 0,5 (15) = 52,5 52,5 – 67,0 B 3
45 + 1,5 (15) = 67,5 67,5 – 90,0 A 4
Dari kriteria di atas maka nilai dari 20 orang siswa adalah sbb:
69 = A (4) 49 = C (2)
68 = A (4) 48 = C (2)
62 = B (3) 46 = C (2)
60 = B (3) 45 = C (2)
56 = B (3) 43 = C (2)
55 = B (3) 41 = C (2)
53 = B (3) 40 = C (2)
52 = C (2) 39 = C (2)
51 = C (2) 37 = D (1)
50 = C (2) 30 = D (1)
176
B. Pengolahan data hasil nontes
a. Pengolahan data hasil wawancara dan kuesioner
Masalah yang diungkapkan F % Peringkat
jawaban
1. Kemampuan mengajar 4 10 3
1.1 Kemampuan mengajar
12 30 2
a. Menguasai bahan
b. Mampu menjelaskan bahan 24 60 1
c. Menguasai bahan dan mampu
10 25 2
menjelaskannya
1.2 Prosedur mengajarkan bahan 6 15 3
pelajaran
4 60 1
a. Dimulai dari yang umum
b. Dimulai dari yang khusus
c. Harus sistematis
Contoh:
Kita ambil jawaban nomor 1 dari Tabel 1
Jawaban fo fe
a. Menguasai bahan 4 13,3 6,50
b. Mampu menjelaskan 12 13,3 0,13
c. Menguasai bahan dan 24 13,3 8,61
dapat menjelaskannya
x2 = 15,24
177
Keterangan:
- fe = 13,3 diperoleh dari 40/3 = 13,3
- Harga x2 = 15,24 kemudian dibandingkan dengan harga
tabel untuk tingkat kepercayaan 0,05 (misalnya) dengan
derajat bebas 3 – 1 (banyak alternatif jawaban = 3).
- Harga x2 dalam tabel = 5,99
Dengan demikian x2 = 15,24 > 5,99, sehingga perbedaan itu
cukup berarti.
Tabel : Frekuensi jawaban siswa mengenai hubungan guru-siswa
Masalah yang diungkapkan f % R
Hubungan guru-siswa 4 10 3
1. Sifat hubungan
10 25 2
a. Menjaga jarak
b. Tidak menjaga jarak 26 65 1
c. Hubungan orang tua-anak
8 20 3
2. Upaya membina hubungan
a. Memahami siswa 12 30 2
b. Turut serta dalam kegiatan siswa
20 50 1
c. Bergaul dengan siswa
Pengamat,
……………………
Lanjutan . . . .
Dari contoh di atas, skor hasil observasi adalah
3 + 4 + 3 + 4 + 3 = 17
Nilai rata-rata untuk kelima aspek tersebut, adalah 17/5 =
3,4. Skor ini cukup tinggi sebab maksimum rata-rata atau
skor maksimum untuk setiap aspek adalah 4 atau 20
untuk semua aspek (5 x 4).
Skor ini bisa juga dikonversikan ke dalam bentuk standar
100 atau standar 10.
181
- Konversi ke dalam standar 100 adalah
Contoh :
KISI-KISI PEDOMAN WAWANCARA
2. ..................................... ..........................................
3. ...................................... ...........................................
4. .................................... ...........................................
5. .................................... ............................................
.
187
Dalam melaksanakan wawancara, ada beberapa hal yang harus
diperhatikan :
1) Hubungan baik antara pewawancara dengan orang yang
diwawancarai perlu dipupuk dan dibina sehingga tampak
hubungan yang akrab dan harmonis.
2) Dalam wawancara jangan terlalu kaku, tunjukkan sikap yang
bersahabat, bebas, ramah, terbuka dan adaptasikan diri
dengannya.
3) Perlakukan responden itu sebagai sesama manusia secara
jujur.
4) Hilangkan prasangka-prasangka yang kurang baik sehingga
pertanyaan-pertanyaan yang diajukan bersifat netral.
5) Pertanyaan hendaknya jelas, tepat, dengan bahasa yang
sederhana.
b. Angket (Quetioner)
Angket termasuk alat untuk mengumpulkan dan mencatat data
atau informasi, pendapat dan paham dalam hubungan klausal.
Angket mempunyai kesamaan dengan wawancara, kecuali
dalam implementasinya. Angket dilaksanakan secara tertulis,
sedangkan wawancara dilaksanakan secara lisan. Keuntungan
angket antara lain (1) responden dapat menjawab dengan
188
bebas tanpa dipengaruhi oleh hubungan dengan peneliti atau
penilai, dan waktu relatif lama, sehingga objektivitas dapat
terjamin (2) informasi atau data terkumpul lebih mudah karena
itemnya homogen (3) dapat digunakan untuk mengumpulkan
data dari jumlah responden yang besar yang dijadikan sampel.
Kelemahannya adalah (1) ada kemungkinan angket diisi orang
lain (2) hanya diperuntukkan bagi yang dapat melihat saja (3)
responden hanya menjawab berdasarkan jawaban yang ada.
Angket terdiri atas beberapa bentuk, yaitu :
1. Bentuk angket berstruktur, yaitu angket yang menyediakan
beberapa kemungkinan jawaban. Bentuk angket berstruktur
terdiri atas tiga bentuk, yaitu :
a. Bentuk jawaban tertutup, yaitu angket yang setiap
pertanyaannya sudah tersedia berbagai alternatif
jawaban.
b. Bentuk jawaban tertutup, tetapi pada alternatif jawaban
terakhir diberikan secara terbuka. Hal ini dimaksudkan
untuk memberikan kesempatan kepada peserta didik
untuk menjawab secara bebas.
c. Bentuk jawaban bergambar, yaitu angket yang
memberikan jawaban dalam bentuk gambar.
189
2. Bentuk angket tak berstruktur yaitu bentuk angket yang
memberikan jawaban secara terbuka. Peserta didik secara
bebas menjawab pertanyaan tersebut. Hal ini dapat
memberikan pemahaman yang lebih mendalam tentang situasi,
tetapi kurang dapat dinilai secara objektif. Jawabannya tidak
dapat dianalisis secara statistik sehingga kesimpulannya pun
hanya merupakan pandangan yang bersifat umum.
Untuk menyusun angket, dapat mengikuti langkah-langkah
sebagai berikut :
1. Menyusun kisi-kisi angket.
Contoh :
No. Masalah Sub- Indikator Sumber Nomor
masalah data angket
BAB VIII
ANALISIS BUTIR SOAL
A. Reliabilitas
Suatu alat ukur dikatakan reliabel, apabila alat ukur itu
dicobakan kepada objek yang sama secara berulang-ulang maka
hasilnya akan tetap sama, konsisten, stabil atau relatif sama.
Faktor-faktor yang mempengaruhi reliabilitas
a. Konstruksi item yang tidak tepat, sehingga tidak dapat
mempunyai daya pembeda yang kuat.
b. Panjang/pendeknya suatu instrumen
193
c. Evaluasi yang surjektif akan menurunkan reliabilitas
d. Ketidaktepatan waktu yang diberikan
e. Kemampuan yang ada dalam kelompok
f. Luas/tidaknya sampel yang diambil.
Analisis soal tes
Untuk mendapatkan kualitas soal yang baik, maka
dilakukan langkah-langkah sebagai berikut:
1) Daya pembeda
Daya pembeda soal adalah kemampuan suatu
soal untuk membedakan antara siswa yang pandai
dengan siswa yang bodoh. Angka yang menunjukkan
besarnya daya pembeda disebut indek diskriminan.
Untuk menentukan daya pembeda soal dapat dilakukan
seperti yang dikemukakan oleh Prawironegoro
(1985:11):
2) Indeks kesukaran.
Agar tes dapat digunakan secara luas, setiap soal
harus diselidiki tingkat kesukarannya yaitu apakah soal
tersebut termasuk soal yang mudah, sedang atau sukar.
194
3) Penerimaan soal
Setiap soal yang telah dianalisa perlu diklasifikasikan
menjadi soal yang tetap dipakai, direvisi atau dibuang.
Menurut Prawironegoro (1985:16) tentang klasifikasi
soal:
a) Soal yang baik akan tetap dipakai jika Ip signifikan
dan 0% < Ik £ 100%.
b) Soal diperbaiki jika:
Ip signifikan dan Ik = 100% atau Ik = 0%.
Ip tidak signifikan dan 0% < Ik < 100%.
c) Soal diganti jika Ip tidak signifikan dan Ik = 100% atau
Ik = 0%.
Ada dua jenis Analisis Butir Soal :
1. Analisis tingkat kesukaran soal
Soal mudah, sedang, dan sukar
2. Analisis daya pembeda
Siswa dalam kategori lemah atau rendah dan
siswa dalam kategori kuat atau tinggi
prestasinya.
195
B. ANALISIS TINGKAT KESUKARAN
Ada beberapa dasar pertimbangan untuk menentukan
proporsi jumlah soal kategori mudah, sedang, dan sukar :
1. Keseimbangan, yakni jumlah soal untuk kategori tersebut
2. Proporsi jumlah soal untuk ketiga kategori tersebut,
didasarkan atas kurva normal
3. Proporsi perbandingan 3-5-2. Artinya, 30% soal kategori
mudah, 50% soal kategori sedang, 20% soal kategori sukar.
Dalam menentukan kriteria ini digunakan judgement dari
guru berdasarkan pertimbangan-pertimbangan :
a. Abilitas yang diukur dalam pertanyaan tersebut
b. Sifat materi yang diujikan atau ditanyakan
c. Isi bahan yang ditanyakan sesuai dengan bidang
keilmuannya
d. Bentuk soal
B
I= NI =
SR + ST
1 4 1 5 Sedang
2 4 1 5 Sedang
3 3 1 4 Mudah
4 5 2 7 Sedang
5 2 1 3 Mudah
6 4 2 6 Sedang
7 2 1 3 Mudah
8 5 1 6 Sedang
9 5 3 8 Sukar
10 4 2 6 Sedang
11 3 1 4 Mudah
12 3 1 4 Mudah
13 2 1 3 Mudah
14 4 1 5 Sedang
15 5 3 8 Sukar
Dari tabel Rose dan Stanley untuk pilihan ganda option empat,
kriterianya adalah :
0, 24n (soal mudah), 0,75n (soal sedang), dan 1,26n (soal sukar)
Telah diketahui bahwa
27% dari N, yakni x 28 = 8
200
Dengan demikian :
- soal mudah kriteria : 8 x 0,24 = 1,92
- soal sedang kriteria : 8 x 0,75 = 6,00
- soal sukar kriteria : 8 x 1,26 = 10,08
Dengan interpolasi diperoleh kriteria :
0 – 4,0 = Mudah
5,0 – 7,0 = Sedang
8,0 – ke atas= Sukar
Contoh :
Tes pilihan ganda dengan option empat
diberikan kepada 30 orang siswa. Jumlah soal 15. Setelah
diperiksa, datanya sbb :
201
No.Soal Jumlah siswa Jumlah siswa SR - ST Ket.
yang menjawab yang menjawab
salah kelompok salah kelompok
rendah (SR) tinggi (ST)
1 6 1 5
2 6 1 5
3 5 2 3
4 6 1 5
5 2 1 1
6 5 1 4
7 2 1 1
8 7 1 6
9 7 1 6
10 4 2 2
11 3 1 2
12 6 1 2
13 2 1 5
14 6 1 1
15 5 2 3
KESIMPULAN
1. Memeriksa jawaban soal semua siswa peserta tes.
2. Membuat daftar peringkat hasil tes berdasarkan skor yang
dicapainya.
3. Menentukan jumlah sampel sebanyak 27% dari jumlah peserta
tes untuk kelompok pandai dan 27% kelompok kurang.
4. Melakukan analisis butir soal
5. Menghitung SR – ST
6. Membandingkan nilai selisih Menentukan adanya daya
pembeda Analisis Validitas
203
Misalkan guru IPA membuat soal untuk tes IPA bagi siswa
kelas 3 dalam bentuk pilihan ganda. Apakah tes yang dibuatnya
mempunyai validitas yang sama atau tidak. Kemudian
mengorelasikan hasil tes yang dibuatnya dengan soal – soal Ebta
di bidang studi IPA. Setelah diujikan, hasilnya sbb : Hasil tes
buatan guru diberi notasi X
Nama Siswa : A B C D E F G H I J K L M N O
Skor : 14 18 18 17 18 19 19 20 22 23 24 27 24 18 28
Hasil tes EBTA bidang studi diberi notasi Y
Nama Siswa : A B C D E F G H I J K L M N O
Skor : 12 15 17 15 16 17 18 18 20 20 22 24 24 18 26
Apakah kedua tes yang dibuat guru (X) mempunyai validitas
kesamaan dari segi fungsi tes di sekolah
Siswa Skor X Skor Y XY X² Y²
2. Penulisan soal
3. Penelaahan soal, yaitu menguji validitas soal yang bertujuan
untuk mencermati apakah butir-butir soal yang disusun sudah
tepat untuk mengukur tujuan pembelajaran yang sudah
207
dirumuskan, ditinjau dari segi isi/materi, kriteria dan
psikologis.
4. Pengujian butir-butir soal secara empiris, kegiatan ini sangat
penting jika soal yang dibuat akan dibakukan.
5. Penganalisisan hasil uji coba.
6. Pengadministrasian soal
E. Menganalisis Tes
Menganalisis instrument (alat evaluasi) bertujuan untuk
mengetahui apakah alat ukur yang digunakan atau yang akan
digunakan sudah memenuhi syarat-syarat sebagai alat ukur yang
baik, tepat mengukur sesuatu sesuai tujuan yang telah
dirumuskan. Sebuah instrument dikatakan baik jika memenuhi
syarat validitas, reliabelitas dan bersifat praktis.
Validitas Tes
Suatu tes dikatakan valid jika tes itu dapat mengukur apa
yang seharusnya diukur. Valid disebut juga sahih, terandalkan
atau tepat. Tes hasil belajar yang valid, harus dapat
menggambarkan hasil belajar yang di ukur
208
Macam-macam validitas :
1. Validitas isi (content validity)
Validitas isi sering juga disebut validitas logis atau
validitas rasional. Validitas isi dapat dianalisis dengan
bantuan kisi-kisi tes dan pedoman penelaahan butir soal.
Penelaahan butir soal secara umum ditinjau dari tiga aspek
yaitu:
a. Aspek materi
b. Aspek bahasa
c. Aspek konstruksi
2. Validitas ramalan (predictive validity)
Suatu tes dikatakan memiliki validitas ramalan, apabila
hasil pengukuran yang dilakukan dengan tes itu dapat
digunakan untuk meramalkan, atau tes itu mempunyai daya
prediksi yang cukup kuat. Untuk mengetahui apakah suatu
tes hasil belajar dapat dinyatakan sebagai tes yang memiliki
validitas ramalan dapat dilakukan dengan mengkorelasikan
tes hasil belajar yang sedang diuji dengan kriterium yang ada.
3. Validitas bandingan (concurent validity)
Suatu tes dikatakan memiliki validitas concurrent,
apabila tes tersebut mempunyai kesesuaian dengan hasil
pengukuran lain yang dilaksanakan saat itu. Misalnya,
209
membandingkan hasil tes dari soal yang sedang dicari
validitasnya dengan hasil tes dari soal standar. Jika terdapat
korelasi yang positif antara kedua tes tersbut, berarti soal tes
yang dibuat mempunyai validitas concurrent.
4. Construct validity (validitas konstruk)
Validitas konstruk artinya butir-butir soal dalam tes
tersebut membangun setiap aspek berpikir seperti yang
tercantum dalam tujuan pembelajaran yang telah dirumuskan.
Penganalisisan validitas ini dapat dilakukan dengan jalan
melakukan pencocokan antara aspek berpikir yang
dikehendaki diungkapkan oleh tujuan pembelajaran, yaitu
melalui penelaahan butir-butir soal.
Meski terdapat beberapa jenis validitas, dalam periode
terakhir validitas dianggap sebagai suatu konsep utuh, tidak
dipilah-pilah sebagai jenis validitas.
210
211
DAFTAR PUSTAKA
Buchori, M.Ed, 1963. Teknik Evaluasi, diktat kuliah pada FKIP Unpad
Kibler, R.J., et al., Objectives for instruction and Evaluation, Allyn and
Bacon, Inc., Boston-London-Sydney,1974