Anda di halaman 1dari 124

EVELUASI

PENDIDIKAN
BUKU AJAR

D4 BIDAN PENDIDIK
FAKULTAS
KEPERAWATAN
UNIVERSITAS INDONESIA
TIMUR1 2022
PENYUSUN

AISYAH, S.TP.,M.Hum

2
KATA PENGANTAR

Puji Syukur Penulis panjatkan kepada Sang Pencipta Allah SWT


yang telah menggerakkan tangan penulis, untuk menyelesaikan Buku ajar
EVALUASI PENDIDIKAN.
Dalam penyusunan Bahan Ajar ini penulis memperoleh arahan,
bimbingan serta motivasi dari berbagai pihak. Untuk itu penulis ingin
mengucapkan terima kasih kepada pihak-pihak yang telah banyak
memberikan masukan.
Penulis menyadari bahan ajar ini masih banyak kekurangannya,
untuk itu penulis dengan segala hormat dan kerendahan hatio,
mengharpakan kritik dan saran yang bersifat membangun guna
penyempurnaan dan pengembangan bahan ajar ini.
Akhir kata penulis berharap semoga bahan ajar ini dapat
bermanfaat khususnya bagi penulis dan umumnya bagi kita semua serta
pengembangan ilmu pengetahuan.

Makassar, Oktober 2022

Penulis

i
DAFTAR ISI

BAB I EVALUASI BERBASIS KOMPETENS……………………… 1


BAB II KESAHIHAN DAN KETERANDALAN EVALUASI ……….. 16
BAB III HASIL EVALUASI BELAJAR ……………………………….. 21
BAB IV METODE EVALUASI …………………………………………. 34
BAB V EVALUASI PROGRAM PENDIDIKAN …………………....... 51
BAB VI TEORI TES KLASIK ………………………………………….. 60
BAB VII KONSTRUKSI TES ………………………………………….. 66
BAB VIII ANALISIS TES ……………………………………………….. 81
BAB IX MANAJEMEN PENGUJIAN …………………………………. 98

ii
BAB I
EVALUASI BERBASIS KOMPETENSI

Latar Belakang

Dewasa ini, pendidikan dijadikan ujung tombak kemajuan suatu

negara. Pendidikan dipandang mampu jadi pemecah atas masalah-

masalah sosial yang ada. Sejauh ini, pendidikan di negara kita masih

semrawut, terutama soal pengaturan kurikulum. Kritik terhadap

kurikulum kita saat ini ialah kurang tepatnya kurikulum dengan mata

pelajaran yang terlalu banyak, dan tidak berfokus pada hal-hal yang

seharusnya diberikan. Dan yang paling parah pada setiap sistem

pendidikan kita yaitu kurangnya evaluasi yang efektif.

Untuk mengetahui proses pendidikan telah berjalan sesuai

program, serta telah mencapai tujuan secara efisien dan efektif, atau

proses pendidikan tersebut tidak berjalan sesuai program dan tidak

mencapai tujuan yang diharapkan, maka untuk mengetahui hal

tersebut diperlukan kegiatan yang disebut evaluasi.

Evaluasi merupakan bagian dari proses belajar mengajar yang

secara keseluruhan tidak dapat dipisahkan dari kegiatan mengajar.

Pada sebagian guru masih ada yang berasumsi yang kurang tepat.

Asumsi yang tidak pada tempatnya misalnya, adalah hal biasa jika

kegiatan evaluasi tidak mempuyai tujuan tertentu. Kecuali bahwa

evaluasi adalah kegiatan yang diharuskan oleh peraturan atau

Undang-Undang aturan yang mengikat tersebut termasuk pasal 58

1
ayat 1 UU RI No.20 tahun 2003 tentang sisdiknas yang menyatakan

evaluasi hasil belajar peserta didik dilakukan oleh pendidik untuk

memantau proses kemajuan dan perbaikan hasil belajar peserta didik

secara berkesinambungan. Untuk mencapai tersebut, uraian berikut

mendiskusikan cara evaluasi yang dilakukan guru untuk menghasilkan

kegiatan belajar mengajar yang lebih baik.

Kompetensi adalah kecakapan yang memadai untuk melakukan

suatu tugas atau sebagai memiliki ketrampilan & kecakapan yang

diisyaratkan. Sedangkan kompetensi menurut Van Looy, Van

Dierdonck, and Gemmel menyatakan kompetensi adalah sebuah

karakteristik manusia yang berhubungan dengan efektifitas performa,

karakteristik ini dapat dilihat seperti gaya bertindak, berperilaku, dan

berpikir.

Kompetensi yang harus dikuasai peserta didik perlu dinyatakan

sedemikian rupa agar dapat dinilai, sebagai wujud hasil belajar

peserta didik mengacu pada pengalaman langsung. Peserta didik

perlu mengetahui tujuan belajar, dan tingkat-tingkat penguasaan yang

akan digunakan sebagai criteria pencapaian secara eksplisit,

dikembangkan berdasarkan tujuan-tujuan yang telah di tetapkan, dan

memiliki konstribusi terhadap kompetensi-kompetensi yang sedang

dipelajari. Penilaian terhadap pencapaian kompetensi perlu dilakukan

secara objektif, berdasarkan kinerja peserta didik, dengan bukti

penguasaan mereka terhadap pengetahuan, keterampilan, nilai dan

2
sikap sebagai hasil belajar. Dengan demikian dalam pembelajaran

yang di rancang berdasarkan kompetensi, penilaian tidak dilakukan

berdasarkan pertimbangan yang bersifat subjektif.

Oleh karena itu, kompetensi merupakan factor penentu berhasil

tidaknya tujuan pembelajaran. Dengan kompetensi yang tinggi yang

dimiliki oleh peserta didik maka tentu hal ini dapat menentukan

kualitas pembelajaran yang baik. Sehingga pada akhirnya, hal ini

dapat melahirkan peserta didik yang berkualitas tinggi dalam segala

hal, baik kognitif, afektif, Maupun psikomotorik

A. Pengertian Evaluasi Berbasis Kompetensi

1. Secara etimologi

Evaluasi (penilaian) berasal dari bahasa Inggris Evaluation,

akar katanya value yang berarti nilai atau harga. Nilai dalam

bahasa arab disebut al-qimah atau al-taqdir. Dengan demikian

secara harfiah evaluasi pendidikan al-Taqdir al- Tarbawiy dapat

diartikan sebagai penilaian dalam (bidang pendidikan atau

penilaian mengenai hal-hal yang berkaitan dengan kegiatan

pendidikan. Atau juga dapat diartikan sebagai proses menentukan

nilai suatu objek.

2. Secara Terminologi

Ada beberapa pendapat mengenai pengertian penilaian

berdasarkan Terminologinya, diantaranya adalah;

3
a. Evaluasi adalah suatu proses merencanakan, memperoleh, dan

menyediakan informasi yang sangat diperlukan untuk membuat

alternative keputusan (Mehrens & Lehmann, 1978:5).

b. Edwin Wandt dan Gerald W. Brown mengemukakan bahwa,

Evaluasi adalah suatu tindakan atau suatu proses untuk

menentukan nilai dari sesuatu.

c. Evaluasi pembelajaran menurut Grondlund dan Linn (1990)

adalah Suatu proses mengumpulkan, menganalisis dan

menginterpretasi informasi secara sistematik untuk menetapkan

sejauh mana ketercapaian tujuan pembelajaran

d. Menurut m. Chabib Thoha, evaluasi merupakan kegiatan yang

terencana untuk mengetahui keadaan objek dengan

menggunakan instrument dan hasilnya dibandingkan dengan

tolak ukur untuk memperoleh kesimpulan.

e. Dengan demikian evaluasi bukan sekedar menilai suatu aktifitas

secara spontan dan incidental, melainkan kegiatan untuk

menilai sesuatu secara terencana, sistematik, dan berdasarkan

atas tujuan yang jelas. Penilaian berbeda dengan pengukuran

(measurement), karena pengukuran lebih bersifat kuantitatif.

Bahkan pengukuran merupakan instrument untuk melakukan

penilaian atau dengan kata lain pengukuran menjawab

pertanyaan “how much”, sedangkan penilaian menjawab

pertanyaan “what value”.

4
Penilaian dilakukan untuk memperoleh informasi tentang kemajuan

yang dicapai dan ketuntasan penguasaan kompetensi dari siswa.

Teknik dan pelaksanaannya diatur dalam :

a. Undang-undang Republik Indonesia No. 20 tahun 2003 tentang

Sistem Pendidikan Nasional.

b. Peraturan Pemerintah No.19 Tahun 2005 tentang standar

Nasional Pendidikan

c. Peraturan Menteri Pendidikan Nasional No.22 Tahun 2006

tentang Standar Isi

d. Peraturan Pemerintah Pendidikan Nasional No.23 Tahun 2006

tentang Standar Kompetensi Lulusan

e. Peraturan Pemerintah Nasional No.20 Tahun 2007 tentang

Standar Penilaian Pendidikan

Standar Kompetensi dan Kompetensi Dasar di dalam Standar

Isi menjadi fokus perhatian utama dalam penilaian.

Untuk mengetahui tingkat pencapaian kompetensi, guru dapat

melakukan penilaian melalui tes dan non tes. Tes meliputi tes lisan,

tertulis(bentuk uraian, pilihan ganda, jawaban singkat, isian,

menjodohkan, benar-salah), dan tes perbuatan yang meliputi:

kinerja, penugasan, dan hasil katya. Penilaian non-tes contohnya

seperti penilaian sikap, minat, motivasi, penilaian diri, portofolio,

lifeskill. Tes perbuatan dan penilaian non tes dilakukan melalui

pengamatan (observasi).

5
Penilaian Berbasis Kompetensi adalah suatu penilian guru

terhadap murid yang memiliki kemampuan baik dalam

skil,pembelajaran atau yang lainnya. Meminliki point-point yang

termasuk didalamnya yaitu :

a. Penilaian Berbasis Kelas , yaitu : suatu proses pengumpulan,

pelaporan, dan penggunaan informasi tentang proses dan hasil

belajar peserta didik dengan menerapkan prinsip-prinsip

penilaian, pelaksanaan berkelanjutan, bukti-bukti autentik,

akurat, dan konsisten, serta mengidentifikasi pencapaian

kompetensi dan hasil belajar pada mata pelajaran yang

dikemukakan melalui pernyataan yang jelas tentang standar

yang harus telah di capai disertai dengan petunjuk kemajuan

belajar peserta didik dan pelapornya.

b. Penilaian Tes Tulis, yaitu : merupakan tes dimana soal dan

jawaban yang diberikan kepada peserta didik dalam bentuk

tulisan. Dalam menjawab soal peserta didik tidak selalu

merespon dalam bentuk menulis jawaban tetapi dapat juga

dalam bentuk yang lain seperti memberi tanda, mewarnai,

menggambar dan lain sebagainya.

c. Penilain Portofolio, yaitu : Penilaian portofolio merupakan satu

metode penilaian berkesinambungan, dengan mengumpulkan

informasi atau data secara sistematikatas hasil pekerjaan

seseorang.

6
B. Tujuan Evaluasi Berbasis Kompetensi

Secara umum evaluasi berbasis kompetensi bertujuan untuk:

1. Mengetahui pengetahuan awal siswa

2. Mengetahui tingkat pencapaian kompetensi

3. Mengetahui perkembangan siswa, mendiagnosis kesulitan

belajar siswa

4. Mengetahui hasil suatu proses pembelajaran

5. Memotivasi siswa belajar, dan memberi umpan balik kepada

guru tentang pembelajaran yang dikelola

C. Fungsi Evaluasi Berbasis Kompetensi

Penilaian berbasis kompetensi memiliki sejumlah fungsi, yaitu:

1. Sebagai bahan pertimbangan dalam menentukan kenaikan kelas

2. Umpan balik dalam perbaikan program pengajaran

3. Alat pendorong dalam meningkatkan kemampuan peserta didik

4. Sebagian alat bagi peserta didik untuk melakukan evaluasi

terhadap kinerja, serta bercermin diri (instropeksi diri)

D. Ciri – cirri Evaluasi Berbasis Kompetensi

Dalam buku Succeful Teaching karangan J.Mursell yang

diterjemahkan ke dalam bahasa Indonesia oleh J. Mursell dan

S.Nasution (tanpa tahun : 23) dikemukakan bahwa ciri-ciri evaluasi

yang baik adalah” evaluasi dan hasil langsung, evaluasi dan transfer,

dan evaluasi langsung dari proses belajar”.

1. Evaluasi dan hasil langsung

7
Dalam proses pembelajaran, guru sering melakukan kegiatan

evaluasi, baik ketika proses pembelajaran sedang berlangsung,

maka guru ingin mengetahui keefektifan dan kesesuaian strategi

pembelajaran dengan tujuan yang ingin dicapai. Jika evaluasi

dilakukan sesudah proses pembelajaran selesai, berarti guru ingin

mengetahui hasil atau prestasi belajar yang diperoleh peserta

didik.

2. Evaluasi dan transfer

Hal penting yang berkenaan dengan proses belajar adalah

kemungkinan mentransfer hasil yang dipelajari kedalam situasi

yang fungsional. Dasar pemikiran ini merupakan asas psikologis

yang logis dan rasional. Peserta didik tidak dapat disebut telah

menguasai ilmu tajwid (misalnya), jika ia belum dapat

menggunakannya dalam membaca alqur’an. Apabila suatu hasil

belajar tidak dapat ditransfer dan hanya dapat digunakan dalam

satu situasi tertentu saja, maka hasil belajar itu dapat disebut hasil

belajar palsu. Sebaliknya, jika suatu hasil belajar dapat ditransfer

kepada penggunaan yang aktual, maka hasil belajar itu disebut

hasil belajar otentik dan kemungkinan dapat ditransfer.

Dalam penelitian sering ditemui hasil-hasil pembelajaran yang

dicapai tampaknya baik, tetapi sebenarnya hasil itu palsu. Peserta

didik dapat mengucapkan kata-kata yang dihafalkan dari buku

pelajarannya, tetapi mereka tidak dapat menggunakannya dalam

8
situasi baru. Penguasaan materi seperti ini tidak lebih dari

“penguasaan beo”. Evaluasi yang menekankan pada hasil-hasil

palsu, baik untuk informasi bagi peserta didik maupun untuk tujuan

lain, berarti evaluasi itu palsu. Jika peserta didik hanya memiliki

pengetahuan yang bersifat informatife, belum tentu menjamin

pemahaman dan pengertiannya. Oleh karena itu, penekanan pada

pengetahuan yang bersifat informative tidak akan menghasilkan

pola berfikir yang baik. Ada dua sebab mengapa hasil

pembelajaran yang mengakibatkan dan berhubungan dengan

proses transfer menjadi penting artinya dalam proses evaluasi.

Pertama, hasil-hasil itu menyatakan secara khusus dan sejelas-

jelasnya kepada guru mengenai apa yang sebenarnya yang terjadi

ataupu tidak terjadi, dan sampai dimana pula telah tercapai hasil

belajar yang penuh makna serta otentik sifatnya. Kedua, hasil

belajar sangat erat hubungannya dengan tujuan peserta didik

belajar, sehingga mempunyai efek yang sangat kuat terhadap

pembentukan pola dan karakter belajar yang dilakukan peserta

didk. Oleh karena itu, belajar hendaknya dilakukan untuk

mendapatkan hasil-hasil yang dapat ditransfer dan setiap waktu

dapat digunakan menurut keperluannya.

3. Evaluasi langsung dari proses belajar

Di samping harus mengetahui hasil belajar, anda juga harus

menilai proses belajar. Hal ini dimaksudkan agar proses belajar

9
dapat di organisasi sedemikian rupa, sehingga dapat mencapai

hasil yang optimal. Anda dapat mengetahui proses apa yang dilalui

peserta didik dalam mempelajari sesuatu. Misalnya, apakah

peserta didik dalam mempelajari alqur’an cukup sekedar membaca

beberapa ayat alqur’an ataukah ia membaca seluruh ayat alqur’an

untuk memahami dan memecahkan masalah-masalah kehidupan.

Apakah dalam praktik ibadah, peserta didik cukup hanya melatih

gerakan-gerakan sholat atau menganalisis praktek sholat dan

mencari hubungannya dengan tingkah laku sehari-hari,

mendiskusikan manfaat sholat dengan teman-temanya, dan

mencari situasi-situasi yang nyata yang dapat menggunakan fungsi

sholat itu.

Penelitian tentang proses belajar yang diikuti oleh peserta

didik merupakan suatu hal yang sangat penting. Anda akan

mengetahui letak kesulitan peserta didik, kemudian mencari

alternatif bagaimana mengatasi kesulitan tersebut. Disamping

itu,penelitian tentang proses belajar bermanfaat juga bagi peserta

didik itu sendiri. Peserta didik akan melihat kelemahannya,

kemudian berusaha memperbaikinya, dan akhirnya dapat

mempertinggi hasil belajarnya. Meneliti proses belajar seorang

anak bukan pekerjaan yang mudah. Hal ini memerlukan waktu,

tenaga, pemikiran, dan pengalaman. Anda dapat menggunakan

suatu metode untuk menilai proses belajar dengan memperhatikan

10
prinsip konteks, vokalisasi, sosialisasi, imdividualisasi, dan urutan

(sequence).

Seorang peserta didik tidak dapat belajar dengan baik, karena ia tidak

menggunakan konteks yang baik. Ia tidak menggunakan bermacam-

macam sumber dan tidak menggunakan situasi-situasi yang konkrit.

Peserta didik tidak dapat belajar dengan baik, karena tidak mempunyai

fokus tertentu, misalnya tidak melihat masalah-masalah pokok yang

harus dipecahkannya, atau mungkin pula tidak sesuai dengan bakat

dan minatnya (individualisasi) serta tidak mendiskusikannya dengan

orang lain (sosialisasi). Dalam evaluasi pembelajaran, anda jangan

terfokus kepada hasil belajar saja, tetapi juga harus memperhatikan

transfer hasil belajar dan proses belajar yang dijalani oleh peserta

didik.

E. Prinsip-prinsip Evaluasi

Menurut Joko Prasetiyo (2013:15-17) Prinsip tidak lain adalah

pernyataan yang mengandung kebenaran hampir sebagian besar jika

tidak dikatakan benar untuk semua kasus. Keberadaan prinsip bagi

seorang evaluator mempunyai arti penting, karena dengan memahami

prinsip evaluasi dapat menjadi petunjuk atau keyakinan bagi dirinya

guna merealisasi evaluasi dengan cara yang benar. Menurut joko

Prsetiyo (2013). Prinsip –prinsip evaluasi terdiri dari:

1. Komprehensif, evaluasi harus mencakup bidan saran yang luas

atau menyeluruh, baik aspek personalnya, materialnya, maupun

11
aspek operasionalnya. Evaluasi tidak hanya ditujukan pada salah

satu aspek saja. Misalnya aspek personalnya, jangan hanya

menilai gurunya saja, tetapi juga murid, karyawan dan kepala

sekolahnya. Begitu pula untuk aspek material dan operasionalnya.

Evaluasi harus dilakukan secara menyeluruh.

2. Komparatif, prinsip ini menyatakan bahwa dalam mengadakan

evaluasi harus dilaksanakan secara bekerjasama dengan semua

orang. Sebagai contoh dalam mengevaluasi keberhasilan guru

dalam mengajar, harus bekerjasama antara pengawas, kepala

sekolah, guru itu sendiri, dan bahkan dengan pihak murid. Dengan

melibatkan semua pihak diharapkan dapat mencapai keobyektifan

dalam mengevaluasi.

3. Kontinyu, evaluasi hendaknya dilakukan secara terus-menerus

selama proses pelaksanaan program. Evaluasi tidak hanya

dilakukan terhadap hasil yang telah dicapai, tetapi sejak pembuatan

rencana sampai dengan tahap laporan. Hal ini penting

dimaksudkan untuk selalu dapat memonitor setiap saat atas

keberhasilan yang telah dicapai dalam periode waktu tertentu.

Aktivitas yang berhasil diusahakan terjadi peningkatan, sedangkan

aktivitas yang gagal dicari jalan lain untuk mencapai keberhasilan.

4. Obyektif, mengadakan evaluasi harus menilai sesuai dengan

kenyataan yang ada. Katakanlah yang hijau itu hijau dan yang

merah itu merah. Jangan samp[ai mengatakan yang hijau itu

12
kuning, dan yang kuning itu hijau. Sebagai contoh, apabila seorang

guru itu sukes dalam mengajar, maka katakanlah bahwa guru ini

sukses, dan sebaliknya apabila jika guru itu kurang berhasil dalam

mengajar, maka katakanlah guru itu kurang berhasil. Untuk

mencapai keobyektifan dalam evaluasi perlu adanya data dan

fakta. Dari data dan fakta inilah dapat mengolah untuk kemudian

diambil suatu kesimpulan. Makin lengkap data dan fakta yang dapat

dikumpulkan maka makin obyektiflah evaluasi yang dilakukan

5. Berdasarkan kriteria yang valid, selain perlu adanya data dan fakta,

perlu adanya kriteria-kriteria tertentu. kriteria yang digunakan dalam

evaluasi harus konsisten dengan tujuan yang telah dirumuskan.

kriteria ini digunakan agar memiliki standar yang jelas apabila

menilai suatu aktivitas supervise pendidikan. Konsistensi kriteria

evaluasi dengan tujuan berarti criteria yang dibuat harus

mempertimbangkan hakikat substansi supervise pendidikan.

6. Fungsional, evaluasi memiliki nilai guna baik secara langsung

maupun tidak langsung. Kegunaan langsungnya adalah dapatnya

hasil evaluasi digunakan untuk perbaikan apa yang dievaluasi,

sedangkan kegunaan tidak langsungnya adalah hasil evaluasi itu

dimanfaatkan untuk penelitian atau keperluan lainnya.

7. Diagnostik, setiap hasil evaluasi harus didokumentasikan. Bahan-

bahan dokumentasi hasil evaluasi inilah yang dapat dijadikan dasar

13
penemuan kelemahan yang kemudian harus diusahakan jalan

pemecahannya.

Menurut Suharsimi Arikuanto (2013:38-39) ada satu prinsip umum

dan penting dalam kegiatan evaluasi, yaitu adanya triangulasi atau

hubungan erat tiga komponen, yaitu:

1. Tujuan pembelajaran

2. Kegiatan pembelajaran atau KBM, dan

3. Evaluasi

Triangulasi tersebut dapat digambarkan dalam bagan sebagai berikut.

Tujuan

KBM Evaluasi

Penjelasan dari bagan triangulasi adalah sebagai berikut:

1. Hubungan antara tujuan dan KBM

Kegiatan belajar-mengajar yang dirancang dalam bentuk rencana

mengajar disusun oleh guru dengan mengacu pada tujuan yang

hendak dicapai. Dengan demikian, anak panah yang menunjukkan

hubungan antara keduanya mengarah pada tujuan dengan makna

bahwa KBM mengacu pada tujuan, tetapi juga mengarah dari

tujuan ke KBM, menunjukkan langkah dari tujuan dilanjutkan

pemikirannya ke KBM.

2. Hubungan antara tujuan dengan evaluasi

14
Evaluasi adalah kegiatan pengumpulan data untuk mengukur sejauh

mana tujuan sudah tercapai. Dengan makna demikian maka anak

panah berasal dari evaluasi menuju ke tujuan. Di lain sisi, jika

dilihat dari langkah, dalam menyusun alat evaluasi ia mengacu

pada tujuan yang sudah dirumuskan.

3. Hubungan antara KBM dengan evaluasi

Seperti yang sudah disebutkan dalam nomor (1) KBM dirancang dan

disusun dengan mengacu pada tujuan yang telah dirumuskan. Telah

disebutkan pula dalam nomor (2) bahwa alat evaluasi juga disusun

dengan mengacu pada tujuan. Selain mengacu pada tujuan, evaluasi

juga harus mengacu atau disesuaikan dengan KBM yang

dilaksanakan. Sebagai misal, jika kegiatan belajar-mengajar dilakukan

oleh guru dengan menitikberatkan pada keterampilan, evaluasinya

juga harus mengukur tingkat keterampilan siswa, bukannya aspek

pengetahuan.

15
BAB II
KESAHIHAN DAN KETERANDALAN EVALUASI

Latar Belakang

Kesahihan menggantikan kata validasi (validity) yang dapat

diartikan sebagai ketetapan evaluasi mengevaluasi apa yang seharusnya

dievaluasi. Dapat diterjemahkan pula sebagai kelayakan interprestasi

terhadap hasil dari suatu instrument evaluasi atau tes, dan tidak terhadap

instrument itu sendiri (Gronlund, 1985:57).

Validitas adalah suatu ukuran yang menunjukan tingkat-tingkat

kevalidan atau kesahihan suatu instrument (Arikunto 2006:168)

Keterandalan evaluasi berhubungan dengan masalah kepercayaan, yakni

tingkat kepercayaan bahwa suatu instrument evaluasi mampu

memberikan hasil yang tepat (Arikunto, 1990:81).

A. Pengertian Kesahihan

Kesahihan berdasarkan KBBI dapat diartikan sebagai perihal

sahih, kebenaran atau kesempurnaan. Kesahihan menggantikan kata

validitas (validity) yang dapat diartikan sebagai ketepatan evaluasi

mengevaluasi apa yang harusnya dievaluasi. Dapat diterjemahkan

pula sebagai kelayakan interpretasi terhadap hasil dari suatu

instrument evaluasi atau tes, dan tidak terhadap instrument itu sendiri

(Gronlund,1985:57). Kesahihan juga dapat dikatakan lebih

16
menekankan pada hasil/perolehan evaluasi, bukan pada kegiatan

evaluasinya.Sebuah evaluasi dikatakan valid jika evaluasi tersebut

secara tepat,benar,dan sahih telah mengungkapkan atau mengukur

apa yang seharusnya di ukur. Agar diperoleh hasil evaluasi yang

sahih, dibutuhkan instrument yang memiliki/ memenuhi syarat

kesahihan suatu instrument evaluasi.

Contoh berikut dapat dijadikan sarana untuk memahami

pengertian valid.Contoh yang dimaksud adalah berupa barometer dan

termometer.Barometer adalah alat ukur yang dipandang tepat untuk

mengukur tekanan udara. Jadi, kita dapat mengatakan bahwa

barometer tanpa diragukan lagi adalah alat pengukur yang valid untuk

mengukur tekanan udara. Dengan kata lain, apa seseorang melakukan

pengukuran terhadap tekanan udara dengan menggunakan alat

pengukur berupa barometer hasil pengukuran yang diperoleh itu

dipandang tepat dan dapat dipercaya. Demikian pula halnya dengan

termometer. Termometer adalah alat pengukur yang dipandang tepat,

benar, sahih, dan abash untuk mengukur tinggi rendahnya suhu udara.

Jadi dapat dikatakan bahwa termometer adalah alat pengukur yang

valid untuk mengukur suhu udara (Sudijono, 2006:96).

B. Macam- Macam Kesahihan

Kesahihan instrument evaluasi diperoleh melalui hasil

pengalaman. Dari dua cara tersebut, diperoleh empat macam

kesahihan yang terdiri dari:

17
1. Kesahihan isi (content validation)

2. Kepentingan konstruksi (construction validity)

3. Kesahihan ada sekarang (concurrent validity)

4. Kesahihan prediksi (prediction validity)

(Arikunto, 1990:64).

C. Faktor-Faktor yang Mempengaruhi Kesahihan

Faktor-faktor yang mempengaruhi kesahihan hasil evaluasi meliputi :

1. Faktor instrument evaluasi itu sendiri

2. Faktor-faktor administrasi evaluasi dan penskoran juga merupakan

faktor-faktor yang mempunyai suatu pengaruh yang mengganggu

kesahihan interpretasi hasil evaluasi.

3. Faktor-faktor dalam respons-respons siswa merupakan faktor-

faktor yang lebih banyak mempengaruhi kesahihan dari pada faktor

yang ada instrumental evaluasi atau pengadministrasiannya.

D. Pengertian Keterandalan

Keterandalan evaluasi berhubungan dengan masalah kepercayaan,

yakni tingkat kepercayaan bahwa suatu instrument evaluasi mampu

memberikan hasil yang tepat. (Arikunto, 1990:81). Keterandalan

menunjukan kepada konsistensi (keajegan) pengukuran yakni

bagaimanakah keajegan skor tes atau hasil evaluasi lain yang berasal

dari pengukuran yang satu ke pengukuran yang lain. Juga

berhubungan erat dengan kesahihan, karena keterandalan

menyediakan (Arikunto, 1990: 81 ; Gronlund, 1985:87). Tidak selalu

18
menjamin bahwa hasil evaluasi yang andal (Reliable) akan selalu

menjawab bahwa hasil evaluasi sahih (valid).

E. Faktor-Faktor yang Mempengaruhi Keterandalan

Untuk memperjelas tentang faktor-faktor yang mempengaruhi

keterandalan akan diuraikan berikut ini :

1. Panjang tes (length of test)

Tes ini dilakukan dengan tidak banyak menebak, maka keterandalan

hasil evaluasi semakin tinggi.

2. Sebaran skor (spread of scores)

Karena koefisien keterandalan yang lebih besar dihasilkan pada saat

orang perorang tetap pada posisi yang relative sama dalam satu

kelompok dari satu pengujian ke pengajuan lainnya, itu berarti

selisih yang dimungkinkan dari perubahan posisi dalam kelompok

juga menyumbang memperbesar koefisien keterandalan.

3. Tingkat kesulitan tes (difficulty of tes)

Tes acuan norma (norm reference test) tingkat kesulitan tes yang

ideal untuk menungkatkan koefisien keterandalan adalah tes yang

menghasilkan sebaran skor berbentuk atau kurva normal.

4. Objektifitas (objectifity)

Objektifitas suatu tes menunjuk kepada tingkat skor kemampuan yang

sama (yang dimiliki oleh siswa satu dengan siswa yang lain)

memperoleh hasil yang sama dalam mengerjakan tes.

19
Uraian faktor-faktor yang mempengaruhi keterandalan yang

disadur dari Gronlund (1985 :100-104) mencakup juga faktor- faktor

yang mempengaruhi keterandalan yang dikemukakan oleh Arikunto.

20
BAB III

HASIL EVALUASI BELAJAR

Latar Belakang

Pembelajaran adalah suatu proses dimana lingkungan seseorang

secara sengaja dikelola untuk memungkinkan ia turut serta dalam tingkah

laku tertentu dalam kondisi-kondisi khusus atau menghasilkan respons

terhadap situasi tertentu.

Pertama, dalam proses pembelajaran melibatkan proses berfikir.

Kedua , dalam proses pembelajaran membangun suasana dialogis dan

proses Tanya jawab terus menerus yang diarahkan untuk memperbaiki

dan meningkatkan kemampuan berfikir siswa, yang pada gilirannya

kemampuan berfikir itu dapat membantu siswa untuk memperoleh

pengetahuan yang mereka konstruksi sendiri.

Hasil belajar adalah kemampuan yang dimiliki siswa setelah

mereka menerima pengalaman belajar dalam proses pembelajaran.

Prestasi belajar pada dasarnya adalah hasil yang diperoleh seseorang

setelah mengikuti kegiatan belajar. Prestasi belajar biasanya dinyatakan

dalam bentuk angka, simbol, huruf ataupun kalimat.

Dengan membandingkan antara tingkah laku sebelum dengan

sesudah melaksanakan belajar dapat ditentukan seberapa besarhasil

belajar yang dicapai seseorang. Hasil belajar seseorang dapat ditunjukkan

dengan perubahan tingkah laku yang ditampilkan dan dapat diamati

21
antara sebelumdan sesudah melaksanakan kegiatan belajar. Jadi Hasil

belajar adalah merupakan penilaian hasil-hasil kegiatan belajar pada diri

siswa setelah melakukan proses kegiatan belajar.

Kita sebagai calon pengajar ingin mengetahui apa hasil usaha kita

bagi murid. Apakah murid itu bias berubah kea rah yang di inginkan dan di

cita-citakan, apakah pengajaran yang kita berikan menemui sasaran atau

tidak, apakah bahan yang kita ajarkan telah di kuasai sampai taraf yang

ideal atau belum, apakah sikapnya lebih positif terhadap nilai-nilai yang

berlaku dalam masyarakat atau tidak, untuk itu kita perlu mengadakan

evaluasi atau penilaian dengan mengumpulkan keterangan-keterangan

secara sistematis tentang pengaruh usaha kita untuk di analisa agar dapat

di ketahui apakah dan sampai manakah tujuan pelajaran telah tercapai.

Dengan demikian kita mengetahui kebaikan dan kekurangan usaha

kita yang memperkaya pengalaman kita sebagai calon pengajar yang

dapat kita gunakan untuk masa-masa mendatang dengan anggapan

bahwa keberhasilan sekarang juga akan memberi hasil murid-murid yang

baik di kemudian hari.

Oleh karena itu, didalam makalah ini kita akan membahas poin

pokok dari evaluasi pendidikan, yang mencakup evaluasi hasil belajar,

agar kiranya kita dapat mengimplementasikan kedalam aktivita kita

menjadiseorang calon pengajar.

22
A. Pengertian Evaluasi Hasil Belajar

Secara bahasa, evaluasi adalah terjemahan dari

kata evaluation (B. Inggris). Kata Evaluation berasal dari value yang

berarti nilai. Kata evaluation, dengan demikian, diterjemahkan juga

dengan penilaian. Sehingga antara “penilaian” dan “evaluasi” dapat

dipandang sebagai semakna. Dalam bahasa Arab penilaian

diartikan al-taqdir.

Secara istilah, evaluasi diartikan sebagai suatu tindakan atau

proses untuk menentukan nilai dari suatu obyek. Istilah (term) ini pada

awalnya dikaitkan dengan prestasi belajar siswa, akan tetapi seiring

dengan perkembangan waktu, term ini telah memasuki setiap aspek

kehidupan manusia. Tokoh yang mempopulerkan term ini pertama kali

adalah Ralph Tyler, dengan memaknai evaluasi sebagai proses

pengumpulan data guna menentukan sejauh mana, dalam hal apa dan

bagian mana dari tujuan pendidikan sudah dicapai.

Ketika kata evaluasi ini dirangkai dengan kata ”hasil belajar”

berarti, ”suatu tindakan atau proses untuk menentukan nilai

keberhasilan siswa setelah melakukan proses pembelajaran pada

waktu tertentu”. Ketika dirangkai dengan kata pendidikan (evaluasi

pendidikan) berarti suatu proses untuk menentukan nilai pertumbuhan

dan kemajuan siswa ke arah tujuan-tujuan yang telah ditetapkan di

dalam kurikulum. Dan ketika dirangkai dengan pengajaran (evaluasi

pengajaran) berarti suatu proses (sistematis) untuk menentukan atau

4
23
membuat keputusan sampai sejauhmana tujuan-tujuan pengajaran

telah dicapai oleh siswa.

Dari ketiga definisi di atas, tampak bahwa dalam mengadakan

evaluasi selalu diawali dengan sebuah proses. Proses tersebut berupa

tindakan membandingkan antara kemampuan siswa dengan tujuan

pembelajaran. Hal ini dilakukan dengan cara memberikan pertanyaan

kepada siswa (assesment) yang mana pertanyaan tersebut

disesuaikan dengan tujuan pembelajaran, kemudian jawaban yang

diberikan siswa dibandingkan dengan kunci jawaban dari pertanyaan

tersebut (yang tentunya juga sesuai dengan tujuan pembelajaran)

(pengukuran). Baru setelah itu penilaian terhadap siswa bisa diberikan.

Jika jawaban siswa sama dengan kunci (tujuan pembelajaran) maka

siswa dapat dinilai sebagai menguasai materi. Jika jawaban

siswa tidak sesuai dengan kunci maka ia dinilai tidak menguasai dan

seterusnya.

Contoh: setelah menyampaikan materi tentang jihad, yang di

antara tujuan pembelajarannya adalah “Siswa memahami bentuk-

bentuk jihad” dengan indikator: “Mampu membedakan antara jihad

pada zaman Rasul dengan zaman sekarang”, seorang guru ingin

mengetahui apakah materi tersebut sudah difahami oleh siswanya

atau belum. Maka guru tersebut harus menyusun sejumlah pertanyaan

yang materinya harus mengacu pada tujuan pembelajaran tersebut,

dan di antara pertanyaanya tentu adalah “Bagaimana perbedaan

24
bentuk jihad pada zaman Rasul dengan jihad pada zaman

sekarang?” Setelah siswa memberikan jawaban, jawaban tersebut lalu

dibandingkan (dicocokkan) dengan kunci jawaban (yang juga mengacu

pada tujuan pembelajaran). Setelah itu barulah siswa bisa dinilai

tentang tingkat penguasaannya.

Proses pembandingan sebagaimana diebutkan diatas,

dinamakan pengukuran (measurement). Dengan kata lain pengukuran

adalah membandingkan sesuatu dengan atau atas dasar suatu ukuran

atau kriteria tertentu. Jadi didalam evaluasi terdapat kegiatan

pengukuran dan penilaian. Dari sini tampak perbedaan antara evaluasi

dengan penilaian. Penilaian adalah bagian (akhir) dari evaluasi. Dan

tidak benar ketika kita hendak melakukan penilaian terhadap obyek

tertentu tanpa didahului dengan pengukuran sebelumnya.

Sedangkan hubungan antara penilaian dan pengukuran dapat

digambarkan, bahwa penilaian hanya dapat dilakukan dengan tepat

jika didahului dengan pengukuran, dan pengukuran tidak akan

memberikan makna apa-apa jika tidak dikaitkan dengan (kriteria)

penilaian. Baik buruknya evaluasi bergantung pada proses pengukuran

yang mendahuluinya.

Dalam usaha mendapatkan keterangan yang valid dan mudah

dalam pengukuran tersebut digunakanlah angka, yang dimulai dengan

pemberian bobot bagi tiap-tiap item soal dan pemberian skor bagi

jawaban siswa. Skor tersebut kemudian diubah menjadi nilai (berupa

25
angka juga) yang dijadikan sebagai simbul dari penilaian yang

sebenarnya.

Dari sini tampak perbedaan lain antara penilaian dengan

pengukuran. Pengukuran bersifat kuantitatif (berupa penjumlahan

angka) sekaligus merupakan jawaban dari pertanyaan ”how

much”, sementara penilaian bersifat kualitatif dan merupakan jawaban

dari pertanyaan ”what value”.

Sementara beberapa ahli mencoba memberikan penjelasan

lebih lengkap dengan memberi setiap proses dalam evaluasi dengan

sebutan yang lebih rinci. Evaluasi, assesment, pengukuran dan

penilaian. masing-masing istilah tersebut dapat dijelaskan sebagai

berikut. Evaluasi adalah proses yang dilakukan secara sistematis dan

berkesinambungan untuk mengetahui efisiensi kegiatan belajar

mengajar dan efektifitas dari pencapaian tujuan instruksi yang telah

ditetapkan. Assesment adalah proses pengumpulan berbagai

data yang bisa memberikan gambaran perkembangan belajar siswa.

Pengukuran adalah proses membandingkan sesuatu dengan

ukuran tertentu (bersifat kuantitatif). Sedangkan penilaian adalah

proses pengambilan keputusan terhadap sesuatu (bersifat kualitatif).

Dengan demikian, dapat digambarkan, dalam melakukan evaluasi

terhadap hasil belajar, dimulai dengan assesment (melakukan tes dan

pengoreksian) kemudian pengukuran (membandingkan hasil pekerjaan

26
siswa dengan kunci) dan diakhiri dengan penilaian (diambil keputusan

tentang penguasaan anak terhadap materi)

B. Tujuan Evaluasi Hasil Belajar

1. Tujuan Umum

a. Untuk menghimpun data tentang taraf kemajuan dan

perkembangan peserta didik, setelah mereka mengikuti proses

pembelajaran dalam jangka waktu tertentu. (Sampai di mana

keberhasilan mereka dalam mencapai tujuan kurikuler).

b. Untuk mengetahui efektifitas metode pengajaran yang

digunakan dalam proses pembelajaran.

2. Tujuan Khusus

a. Untuk merangsang peserta didik dalam program pembelajaran

b. Untuk mencari faktor keberhasilan dan kegagalan peserta didik

dalam mengikuti pembelajaran

C. Fungsi Evaluasi Hasil Belajar

Pertama, untuk perbaikan dan pengembangan sistem

pembelajaran. Sebagaimana Anda ketahui bahwa pembelajaran

sebagai suatu sistem memiliki berbagai komponen, seperti tujuan,

materi, metoda, media, sumber belajar, lingkungan, guru dan

peserta. Dengan demikian, perbaikan dan pengembangan

pembelajaran harus diarahkan kepada semua komponen

pembelajaran tersebut.

27
Kedua, untuk akreditasi. Dalam UU.No.20/2003 Bab 1 Pasal

1 Ayat 22 dijelaskan bahwa “akreditasi adalah kegiatan penilaian

kelayakan program dalam satuan pendidikan berdasarkan kriteria

yang telah ditetapkan”. Salah satu komponen akreditasi adalah

pembelajaran. Artinya, fungsi akreditasi dapat dilaksanakan jika

hasil evaluasi pembelajaran digunakan sebagai dasar akreditasi

lembaga pendidikan.

Secara umum evaluasi (penilaian) memiliki banyak fungsi. Fungsi-

fungsi tersebut antara lain:

3. Fungsi selektif. Dengan evaluasi, guru dapat menyeleksi

peserta tes (siswa) dalam rangka mencapai tujuan tertentu.

4. Fungsi formatif, yaitu untuk memberikan

umpanbalik (feedback) kepada guru sebagai dasar untuk

memperbaiki proses pembelajaran dan mengadakan

program remedial bagi peserta didik.

5. Fungsi sumatif, yaitu untuk menentukan nilai (angka)

kemajuan/hasil belajar peserta didik dalam mata pelajaran

tertentu, sebagai bahan untuk memberikan laporan kepada

berbagai pihak, penentuan kenaikan kelas dan penentuan

lulus-tidaknya peserta didik.

6. Fungsi diagnostik, yaitu untuk memahami latar belakang

(psikologis, fisik dan lingkungan) peserta didik yang mengalami

28
kesulitan belajar, dimana hasilnya dapat digunakan sebagai

dasar dalam memecahkan kesulitan-kesulitan tersebut.

7. Fungsi penempatan, yaitu untuk menempatkan peserta didik

dalam situasi pembelajaran yang tepat (misalnya dalam

penentuan program spesialisasi) sesuai dengan tingkat

kemampuan peserta didik

Lebih spesifik fungsi Evaluasi Hasil Belajar yang dilaksanakan

dalam PBM di sekolah adalah:

1. untuk mengetahui seberapa jauh hasil yang telah dicapai dalam

proses pendidikan yang telah dilaksanakan.

2. untuk mengetahui apakah mata pelajaran yang kita ajarkan

dapat kita lanjutkan dengan bahan yang baru ataukah kita

harus mengulangi

3. untuk mendapatkan bahan-bahan informasi untuk menentukan

apakah seorang anak dapat dinaikkan ke kelas yang lebih

tinggi atau harus mengulang.

4. untuk membandingkan apakah prestasi yang dicapai oleh anak-

anak sudah sesuai dengan kapasitasnya atau belum.

5. untuk menafsirkan apakah seorang anak telah cukup matang

untuk kita lepaskan ke dalam masyarakat atau ke lembaga

pendidikan yang lebih tinggi.

6. untuk mengadakan seleksi.

29
untuk mengetahui taraf efisiensi metode yang digunakan dalam proses

belajar mengajar.

D. Sasaran Evaluasi

Adapun sasaran evaluasi di sini mencakup beberapa

sasaran penilaian untuk unsure-unsurnya, meliputi : Input,

Transformasi dan Output

1. InPut

Berkenaan dengan hal ini ada beberapa aspek yang harus di

perhatikan untuk mencapai hasil yang di inginkan, yaitu :

a. Kemampuan

Jika sebuah institusi menginginkan out put yang berguna

bagi nusa dan bangsa maka haruslah memperhatikan atau

memilah-milah kemampuan dari beberapa calon murid.

Adapun tes yang di gunakan adalah tes kemampuan.

b. Kepribadian

Kepribadian adalah sesuatau yang terdapat pada diri

manusia serta tampak bentuknya dalam tingkah laku,

sehingga seorang pendidik akan mengetahui satu-persatu

calon peserta didiknya. Adapun alat yang di pakai adalah

tes kepribadian.

c. Sikap

Sikap adalah bagian dari tingkah laku manusia yang

menggambarkan kepribadian seseorang, akan tetapi

30
karena sikap ini sangat menonjol dalam pergaulan maka

banyak orang yang ingin tahu lebih dalam informasi khusus

terkait dengannya. Adapun alat yang di pakai adalah tes

sikap.

2. Intelegensi

Dalam hal ini para ahli seperti binet dan simon

menciptakan tes buatan yang di kenal dengan tes binet-simon

yang dapat mengetahui IQ seseorang, karena IQ bukanlah

intelegensi.

3. Transformasi

Di sini ada beberapa unsur yang dapat menjadi sasaran atau

objek pendidikan demi di perolehnya hasil pendidikan yang di

harapkan, yaitu :

a. Kurikulum/materi

b. Metode dan cara penilaian

c. Media

d. Sistem administrasi

e. Pendidik dan anggotahnya.

4. Out Put

Penilaian atas lulusan suatu sekolah di lakukan untuk

mengetahui seberapa jauh tingkah pencapaian atau prestasi

belajar mereka selama mengikuti program tersebut dengan

menggunakan tes pencapaian.

31
E. Prinsip dan Prosedur Penilaian

Megingat pentingnya penilaian dalam menentukan kualitas

pendidikan, maka upaya merencanakan dan melaksanakan

penilaian hendaknya memperhatikan beberapa prinsip dan

prosedur penilaian sebagai berikut:

8. Dalam menilai hasil belajar, hendaknya dirancang sedemikian

rupa sehingga jelas abilitas yang harus dinilai, materi penilaian,

alat penilaian, dan interpretasi hasil penilaian.

9. Penilaian hasil belajar hendaknya menjadi bagia integral dari

proses belajra-mengajar. Artinya, penilaian senantiasa

dilaksanakan pada tiap saat proses belajar-mengajar sehingga

pelaksanaannya berkesinambungan.

10. Agar diperoleh hasil belajar yang obyektif dalam pengertian

menggambarkan prestasi dan kemampuan siswa sebagaimana

adanya, penilaian harus menggunakan berbagai alat penilaian

dan sifatnya komprehensif (mencakup berbagai ranah, sepesrti

kognitif, afektif, dan psikomotorik).

11. Penilaian hasil belajar hendaknya diikuti dengan tindak

lanjutnya. Data hasil penilaian sangat bermanfaat bagi guru

maupun bagi siapapun.

Prosedur adalah langkah-langkah teratur dan tertib yang

harus ditempuh seorang evaluator pada waktu melakukan evaluasi

32
kurikulum. Adapun beberapa prosedur evaluasi kualitatif dan

kuantitatif sebagai berikut:

1. Prosedur Evaluasi Kuantitatif

Kaedah evaluasi mengatakan bahwasannya evaluasi harus

berkaitan dengan pengembangan kurikulum yang terjadi.

Prosedur untuk evaluasi kuantitatif yakni sebagai berikut :

a. Penentuan masalah atau pertanyaan evaluasi

b. Penentuan variabel, jenis data dan sumber data

c. Penentuan metodologi

d. Pengembangan instrument

e. Penentuan proses pengumpulan data

f. Penentuan proses pengolahan data

2. Prosedur Evaluasi Kualitatif

Ada tiga hal pokok yang harus dilakukan evaluator

ketika melakukan evaluasi kurikulum dengan menggunakan

prosedur sebagai berikut:

a. Menentukan fokus evaluasi

b. Perumusan masalah dan pengumpulan data

c. Proses pengolahan data

d. Menentukan perbaikan dan perubahan program.

33
BAB IV

METODE EVALUASI

Latar Belakang

Dewasa ini, pendidikan dijadikan tombak kemajuan suatu Negara.

Pendidikan dipandang mampu jadi pemecah atas masalah social yang

ada. Sejarah ini, pendidikan di Negara kita masih semrawut, terutama soal

pengaturan kurikulum. Kritik terhadap kurikulum kita saat ini ialah kurang

tepatnya kurikulum dengan mata pelajaran yang terlalu banyak, dan tidak

berfokus pada hal-hal yang seharusnya diberikan. Dan yang paling parah

pada setiap system pendidikan kita yaitu kurangnya evaluasi yang efektif.

Pendidikan adalah upaya sadar dan tanggung jawab untuk

memelihara, membimbing dan mengarahkan pertumbuhan dan

perkembangan kehidupan peserta didik agar ia memiliki makna dan tujuan

hidup yang hakiki. Sementara proses pendidikan bertujuan untuk

menimbulkan perubahan-perubahan yang diinginkan pada setiap peserta

didik.

Perubahan-perubahan yang diinginkan pada peserta didik meliputi

tiga bidang yaitu (1) tujuan yang personal dan yang berkaitan dengan

individu-individu yang sedang belajar untuk terjadinya perubahan yang

diingini pada peserta didik (2) tujuan social yang berkaitan dengan

kehidupan masyarakat sebagai unit sosial berikut dengan dinamika

masyarakat umumnya (3) tujuan professional yang berkaitan dengan

34
pendidikan dan pengajaran sebagai ilmu, seni dan profesi. Proses

pendidikan yang dimaksud tidak terlepas dari beberapa komponen yang

mendukung. Salah satunya komponen yang urgen dalam melihat

keberhasilan pendidikan adalah evaluasi.

Evaluasi adalah pengambilan keputusan berdasarkan hasil

pengukuran dan standar kriteria yang merupakan kegiatan

berkesinambungan. Mengenai hal-hal yang berhubungan dengan kegiatan

evaluasi pendidikan, untuk lebih jelasnya dibahas pada pembahasan

dalam makalah.

A. Pengertian Evaluasi Pendidikan

Evaluasi berasal dari kata to evaluate yang berarti nilai. Nilai

dalam bahasa arab di sebut al kimat. Istilah nilai ini di populerkan oleh

para filsufat, dalam hal ini, plato merupakan filsuf yang pertama kali

mengemukakannya. Pembahasan “nilai” secara khusus di perdalam

dalam diskursus filsafat, terutama pada aspek oksiologinya. Begitu

penting kedudukan nilai dalam filsafat sehingga para filsuf meletakan

nilai sebagai muara bagi epistemology dan antologi filsafat. Kata nilai

menurut filsuf adalah idea of worth selanjutnya, kata nilai menjadi

popular.

Nana sudrajat menjelaskan bahwa evaluasi pada dasarnya

memberikan pertimbangan atau harga untuk nilai berdasarkan kriteria

tertentu. Tujuan tersebut dinyatakan dalam rumusan tingkah laku yang

35
diharapkan dimiliki peserta didik setelah menyelesaikan pengalaman

belajarnya.

Roestiyah N. K. dkk dalam bukunya “masalah-masalah ilmu

keguruan” menyebutkan empat pengertian evaluasi menurut

deskripsinya berikut ini Evaluasi adalah proses memahami atau

memberi arti :

1. Mendapatkan dan mengkomunikasikan suatu informasi bagi petunjuk

pihak-pihak pengambilan keputusan.

2. Evaluasi adalah kegiatan mengumpulkan data seluas-luasnya,

sedalam-dalamnya yang bersangkutan dengan kapabilitas siswa, guna

mengetahui sebab-akibat hasil belajar siswa yang dapat mendorong

dan mengembangkan kemampuan belajar.

3. Dalam rangkah pengembangan siswa instruksional, evaluasi

merupakan suatu kegiatan untuk menilai seberapa jauh program telah

berjalan seperti yang telah direncanakan.

4. Evaluasi adalah suatu hal untuk menentukan apakah tujuan

pendidikan dan apakah proses dalam pengembangan ilmu telah

berada di jalan yang diharapkan.

Jadi evaluasi pendidikan adalah suatu tindakan atau suatu proses

untuk menetukan nilai daripada sesuatu menurut Brown dan Wand

bahwa sebagai suatu tindakan atau proses untuk menentukan nilai

atau segala sesuatu yang berhubungan dengan dunia pendidikan.

Dalam arti luas evaluasi adalah suatu proses merencanakan,

36
memperoleh dan menyediakan informasi yang sangat diperlukan untuk

membuat suatu keputusan.

B. Macam-macam Metode Evaluasi Pendidikan

Klasifikasi atau penggolongan evaluasi dalam bidang

pendidikan sangat beragam. Sangat beragamnya ini disebabkan

karena sudut pandang yang saling berbeda dalam melakukan

kalsifikasi tersebut. Dalam hal ini, klasifikasi tentang evaluasi yang

akan penulis jelaskan adalah evaluasi formatif, sumatif dan

diagnosti.

1. EVALUASI FORMATIF

Evaluasi formatif adalah evaluasi yang dilakukan pada setiap

akhir pembahasan suatu pokok bahasan / topik, dan

dimaksudkan untuk mengetahui sejauh manakah suatu proses

pembelajaran telah berjalan sebagaimana yang direncanakan.

Winkel menyatakan bahwa yang dimaksud dengan evaluasi

formatif adalah penggunaan tes-tes selama proses

pembelajaran yang masih berlangsung, agar siswa dan guru

memperoleh informasi (feedback) mengenai kemajuan yang

telah dicapai. Sementara Tesmer menyatakan formative

evaluation is a judgement of the strengths and weakness of

instruction in its developing stages, for purpose of revising the

instruction to improve its effectiveness and appeal. Evaluasi ini

37
dimaksudkan untuk mengontrol sampai seberapa jauh siswa

telah menguasai materi yang diajarkan pada pokok bahasan

tersebut. Wiersma menyatakan formative testing is done to

monitor student progress over period of time.

Dengan kata lain evaluasi formatif dilaksanakan untuk

mengetahui seberapa jauh tujuan yang telah ditetapkan telah

tercapai. Dari hasil evaluasi ini akan diperoleh gambaran siapa

saja yang telah berhasil dan siapa yang dianggap belum

berhasil untuk selanjutnya diambil tindakan-tindakan yang tepat.

Tindak lanjut dari evaluasi ini adalah bagi para siswa yang

belum berhasil maka akan diberikan remedial, yaitu bantuan

khusus yang diberikan kepada siswa yang mengalami kesulitan

memahami suatu pokok bahasan tertentu. Sementara bagi

siswa yang telah berhasil akan melanjutkan pada topik

berikutnya, bahkan bagi mereka yang memiliki kemampuan

yang lebih akan diberikan pengayaan, yaitu materi tambahan

yang sifatnya perluasan dan pendalaman dari topik yang telah

dibahas.

Untuk membahas evaluasi formatif ini, seperti yang Ahmad

Rohani dan Abu Ahmadi katakan dalam bukunya “Pengelolaan

Pengajaran”, (Rohani dan Ahmadi, 1991: 173-175) perlu

meninjau dari berbagai segi sehingga akan mudah memahami

38
bagaimana sebenarnya evaluasi ini. di antaranya adalah

sebagai berikut:

a. Fungsi dan Tujuan Evaluasi Formatif

Fungsi dari evaluasi formatif adalah untuk memperbaiki

proses belajar-mengajar.

b. Manfaat Evaluasi

Dalam evaluasi formatif ini, ada beberapa manfaat yang

dingkap oleh Suharsimi Arikunto yaitu manfaat bagi siswa,

guru dan program sekolah yang penjabarannya sebagai

berikut:

Manfaat bagi siswa:

1. Digunakan untuk mengetahui apakah siswa sudah

menguasai bahan program secara menyeluruh atau

belum

2. Merupakan penguatan bagi siswa dan memperbesar

motivasi siswa untuk belajar giat

3. Untuk perbaikan belajar siswa

4. Sebagai diagnosa kekurangan dan kelebihan siswa

Manfaat bagi guru:

1. Mengetahui sampai sejauh mana bahan yang diajarkan

sudah dapat diterima oleh siswa

2. Mengetahui bagian-bagian mana dari bahan pelajaran

yang belum dikuasai siswa

39
Manfaat bagi program sekolah:

1. Apakah program yang telah diberikan merupakan program

yang tepat atau tidak

2. Apakah program tersebut membutuhkan pengetahuan-

pengetahuan prasyarat yang belum diperhitungkan

3. Apakah diperlukan alat, sarana, dan prasarana untuk

mempertinggi hasil yang akan dicapai atau tidak

4. Apakah metode, pendekatan dan alat evaluasi yang

digunakan sudah tepat atau tidak (Arikunto, 1996: 34-36)

c. Waktu Pelaksanaan

Sesuai dengan fungsi dan tujuan evaluasi formatif, maka

evaluasi ini dilakukan untuk menilai hasil belajar jangka pendek

dari suatu proses belajar mengajar atau pada akhir unit

pelajaran yang singkat yaitu satuan pelajaran. Sebab perbaikan

belajar mengajar itu hanya mungkin jika dilakukan secara

sistematis dan bertahap.

d. Aspek Tingkah Laku Yang Dinilai

Aspek tingkah laku yang dinilai dari evaluasi formatif ini

cenderung terbatas pada segi kognitif (pengetahuan) dan

psikomotor (ketrampilan) yang terkandung dalam tujuan khusus

pelajaran. Untuk menilai segi afektif (sikap dan nilai), maka

penggunaan penilaian formatif tidaklah tepat. Sebab untuk

40
menilai perkembangan segi afektif ini diperlukan periode

pengajaran yang cukup panjang.

e. Cara Menyusun Soal

Sesuai dengan fungsi evaluasi formatif, maka evaluasi ini

harus disusun dengan sedemikian rupa sehingga benar-benar

mengukur tujuan khusus pengajaran yang dicapai. Oleh karena

itu, soal harus dibuat secara langsung dengan

menjabarkantujuan khusus pengajaran ke dalam bentuk

pertanyaan. Pada evaluasi formatif ini, masalah tingkat

kesukaran dan daya pembeda tiap-tiap soal tes tidak begitu

penting.

f. Pendekatan Evaluasi Yang Digunakan

Sesuai dengan fungsi evaluasi formatif, maka sasaran

penilaian adalah kecakapan nyata setiap peserta didik. Oleh

karena itu, pendekatan dalam penilaian evaluasi formatif adalah

penilaian yang bersumber pada kriteria mutlak.

g. Cara Pengolahan Hasil Evaluasi

Ada beberapa cara pengolahan hasil evaluasi formatif. Cara-

cara tersebut adalah sebagai berikut:

1. Menghitung presentase peserta didik yang gagal dalam

setiap soal. Dengan melihat hasil presentase ini, guru akan

dapat mengetahui sejauh mana tujuan khusus pengajaran

41
(TKP) yang bersangkutan dengan soal telah dicapai atau

dikuasai oleh kelas.

2. Menghitung presentase penguasaan kelas atas bahan yang

telah disajikan. Dengan kata lain, berapa persen kah dari

bahan yang telah disajikan itu dikuasai kelas. Cara

pengolahan ini bertujuan untuk mendapatkan keterangan,

apakah keterangan apakah kriteria keberhasilan belajar yang

diharapkan telah tercapai.

3. Menghitung presentase jawaban yang benar yang dicapai

setiap peserta didik dalam tes secara keseluruhan. Dengan

angka presentase ini, guru akan dapat mengetahui sampai

berapa jauh penguasaan setiap peserta didik atas bahan

yang telah diajarkan. Dengan kata lain, sejauh mana tingkat

keberhasilan setiap peserta didik atas unit pengajaran yang

telah diajarkan ditinjau dari sudut kriteria keberhasilan belajar

yang diharapkan atau yang telah ditetapkan.

h. Penggunaan Hasil Evaluasi

Hasil pengolahan evaluasi formatif sebagaimana disebutkan

di atas, dapat digunakan untuk keperluan-keperluan sebagai

berikut:

1. Atas dasar angka presentase peserta didik yang gagal dalam

setiap soal. Guru dapat mempertimbangkan apakah bahan

42
pelajaran yang bersangkutan dengan soal tes perlu

dibicarakan lagi secara umum atau tidak.

2. Atas dasar angka presentase penguasaan kelas atas bahan

yang telah disajikan, guru dapat menilai dirinya sendiri

mengenai kemampuannya dalam mengajar. Jika angka itu

belum mencapai kriteria keberhasilan umpamanya, maka

guru akan mencari sebabnya dan kemudian ia akan

memikirkan perbaikan-perbaikan apa yang perlu diadakan

agar proses belajar mengajar dapat berjalan secara efisien

dan efektif sehingga kriteria keberhasilan itu dapat tercapai.

3. Dengan mengetahui presentase jawaban yang benar dari

setiap peserta didik dalam tes secara keseluruhan, guru

dapat mengetahui kekuatan dan kelemahan yang ada pada

setiap peserta didik sehingga guru mendapat bahan yang

dapat dijadikan sebagai dasar pertimbangan apakah peserta

didik perlu dapat bantuan atau pelayanan khusus dari guru

untuk mengatasi kesulitan dalam belajar. (Rohani dan

Ahmadi, 1991: 173

2. EVALUASI SUMATIF

Evaluasi sumatif adalah evaluasi yang dilakukan pada setiap

akhir satu satuan waktu yang didalamnya tercakup lebih dari

satu pokok bahasan, dan dimaksudkan untuk mengetahui

43
sejauhmana peserta didik telah dapat berpindah dari suatu unit

ke unit berikutnya. Winkel mendefinisikan evaluasi sumatif

sebagai penggunaan tes-tes pada akhir suatu periode

pengajaran tertentu, yang meliputi beberapa atau semua unit

pelajaran yang diajarkan dalam satu semester, bahkan setelah

selesai pembahasan suatu bidang studi.

Adapun tujuan utama dari evaluasi sumatif ini adalah untuk

menentukan nilai yang melambangkan keberhasilan peserta

didik setelah mereka menempuh program pengajaran dalam

jangka waktu tertentu. (Sudijono, 2007: 23) Berikut ini beberapa

hal yang berhubungan dengan evaluasi sumatif yang terdapat

dalam buku karangan Ahmad Rohani dan Abu Ahmadi yang

berjudul “Pengelolaan Pengajaran”, (Rohani dan Ahmadi, 1991:

176-179), sebagai berikut:

a. Fungsi Evaluasi Sumatif

Fungsi evaluasi sumatif ini adalah untuk menentukan

angka kemajuan atau hasil belajar peserta didik.

b. Manfaat Evaluasi Sumatif

Berikut ini merupakan beberapa manfaat yang didapat

dari evaluasi sumatif

1. Untuk menentukan nilai

2. Untuk menentukan seseorang anak dapat atau tidak

mengikuti kelompok dalam menerima program berikutnya

44
3. Untuk mengisi catatan kemampuan siswa (Arikunto, 1996:

36)

c. Waktu Pelaksanaan

Sesuai dengan fungsi evaluasi, maka evaluasi sumatif ini

dilakukan untuk menilai hasil belajar jangka panjang dari

suatu proses belajar mengajar seperti pada akhir program

pengajaran.

d. Aspek Tingkah Laku Yang Dinilai

Karena evaluasi sumatif merupakan untuk menilai hasil

jangka panjang, maka aspek tingkah laku yang dinilai harus

meliputi segi kognitif (pengetahuan), psikomotor

(ketrampilan) dan afektif (sikap dan nilai).

e. Cara Menyusun Soal

Penilaian sumatif ini merupakan evaluasi yang dilakukan

pada akhir program pengajaran. Ini berarti bahan pengajaran

yang menjadi sasaran penilaian cukup luas dan banyak.

Oleh karena itu, tidak efisien jika soal-soalnya disusun atas

dasar tujuan khusus pengajaran (TKP) seperti pada evaluasi

formatif. Akan tetapi penyusunan soal-soalnya harus

didasarkan pada tujuan umum pengajaran (TUP) yang ada

di dalam program pengajaran tersebut.

Selanjutnya, karena tujuan evaluasi sumatif itu untuk

menentukan angka kemajuan setiap peserta didik yang di

45
antaranya untuk menentukan kenaikan kelas atau lulus

tidaknya, maka masalah tingkat kesukaran soal harus

diperhatikan. Artinya, soal-soal itu harus disusun sedemikian

rupa sehingga mencakup yang mudah, sedang dan sukar

yang jumlahnya perbandingannya sekitar 3 : 5 : 2,

perbandingan ini tidak harus mutlak demikian. Masalah

tingkat kesukaran soal ini dimaksudkan agar hasil penilaian

dapat memberi gambaran mengenai tingkat kecerdasan atau

kemampuan atau kepandaian tiap-tiap peserta didik atas

dasar klasifikasi kurang, sedang dan pandai.

Di samping masalah tingkat kesukaran soal, pada

evaluasi sumatif ini diperhatikan daya pembeda dari setiap

soal. Artinya setiap soal harus mempunyai daya untuk

membedakan peserta didik yang pandai dengan yang

kurang atau tidak pandai. Tapi tingkat kesukaran dan daya

pembeda suatu soal itu hanya dapat diketahui melalui

analisis soal setelah tes itu dicobakan. Untuk itu perlu

diperhatikan pengetahuan lebih lanjut mengenai teknik

penilaian pendidikan yang menyangkut masalah “analisis

soal”.

f. Pendekatan Evaluasi Yang Digunakan

Pada evaluasi sumatif, ada dua pendekatan yang dapat

digunakan dalam menilai: 1) penilaian yang bersumber pada

46
kriteria mutlak dan 2) penilaian yang bersumber pada norma

relatif (kelompok)

g. Cara Pengolahan Hasil Evaluasi

Karena pada evaluasi sumatif ini ada dua pendekatan

dalam mengevaluasi, maka pengolahan hasilnya pun ada

dua cara:

1. Pengolahan hasil evaluasi berdasarkan ukuran mutlak.

Jika pengolahan hasil evaluasi itu berdasarkan ukuran

atau kriteria mutlak, maka yang harus dicari adalah

presentase jawaban benar yang dicapai oleh setiap

peserta didik.

2. Pengolahan hasil evaluasi berdasarkan norma relatif

(kelompok). Untuk mengolah hasil evaluasi yang

berdasarkan norma relatif, digunakan nilai-nilai yang

standar seperti skala nilai 0 – 10 atau skala nilai 0 –

100. Untuk merubah nilai atau skor mentah ke dalam

skor terjabar berdasarkan skala penilaian tertentu,

maka prosedur atau langkah-langkah sebagai berikut:

a) Menyusun distribusi atau frekwensi skor yang

diperoleh peserta didik

b) Menghitung angka rata-rata

c) Menghitung standar devisi

47
d) Mengubah skor ke dalam skala penilaian

yang dikehendaki

h. Penggunaan Hasil Evaluasi

Pada evaluasi sumatif, hasilnya digunakan antara lain

sebagai berikut:

a) Menentukan kenaikan kelas

b) Menentukan angka raport

c) Mengadakan seleksi

d) Menentukan lulus tidaknya peserta didik

e) Mengetahui status setiap peserta didik dibandingkan

dengan peserta didik lainnya dalam kelompok yang sama

1. EVALUASI DIAGNOSTIK

Evaluasi diagnostik adalah evaluasi yang digunakan untuk

mengetahui kelebihan-kelebihan dan kelemahan-kelemahan

yang ada pada siswa sehingga dapat diberikan perlakuan yang

tepat. Evaluasi diagnostik dapat dilakukan dalam beberapa

tahapan, baik pada tahap awal, selama proses, maupun akhir

pembelajaran. Pada tahap awal dilakukan terhadap calon siswa

sebagai input. Dalam hal ini evaluasi diagnostik dilakukan untuk

mengetahui kemampuan awal atau pengetahuan prasyarat

yang harus dikuasai oleh siswa. Pada tahap proses evaluasi ini

diperlukan untuk mengetahui bahan-bahan pelajaran mana

48
yang masih belum dikuasai dengan baik, sehingga guru dapat

memberi bantuan secara dini agar siswa tidak tertinggal terlalu

jauh. Sementara pada tahap akhir evaluasi diagnostik ini untuk

mengetahui tingkat penguasaan siswa atas seluruh materi yang

telah dipelajarinya.

Perbandingan Tes Diagnostik, Tes Formatif, dan Tes Sumatif

Ditinjau dari Tes Diagnostik Tes Formatif Tes Sumatif

Fungsinya - - Umpan balik bagi - Memberi tanda

mengelompokka siswa, guru maupun telah mengikuti

n siswa program untuk suatu program,

berdasarkan menilai pelaksanaan dan menentukan

kemampuannya suatu unit program posisi kemampuan

- menentukan siswa

kesulitan belajar dibandingkan

yang dialam dengan anggota

kelompoknya

Cara memilih - memilih tiap- - Mengukur semua - Mengukur

tujuan yang tiap keterampilan tujuan instruksional tujuan

dievaluasi prasarat khusus instruksional

- memilih tujuan umum

setiap program

pembelajaran

secara berimbang

- memilih yang

berhubungan

dengan tingkah

49
laku fisik, mental

dan perasaan

Skoring (cara - - menggunakan - menggunakan

menyekor) menggunakan standar mutlak standar relative

standar mutlak

dan relative

50
BAB V

EVALUASI PROGRAM PENDIDIKAN

Latar Belakang

Evaluasi reflektif digunakan untuk mengevaluasi kurikulum sebagai

suatu ide. Evaluasi terhadap ide ini dapat dilakukan pada waktu pertama

kali suatu kurikulum dikemukakan atau pada akhir dari kurikulum. Evaluasi

rencana merupakan evaluasi yang banyak dilakukan orang terutama

setelah banyak inovasi diperkenalkan dalam pengembangan.

Persyaratan-persyaratan seperti format, keterbacaan, hubungan antaqr

komponen, organisasi vertikan dan horizontal dari pengalaman belajar,

biasanya merupakan hal yang menuntut perhatian evaluator pada waktu

melakukan evaluasi program pendidikan sebagai suatu rencana.

Evaluasi merupakan komponen yang sangat penting dalam

keseluruhan dalam proses pengembangan program pendidikan. Evaluasi

merupakan langkah untuk memperoleh gambaran mengenai tingkat

keberhasilan kurikulum yang sedang dan telah dikembangkan. Dari hasil

evaluasi tersebu akan diketahui hal-hal yang telah dan belum tercapai.

Dengan hal tersebut maka dapat diputuskan apakah suatu program

pendidikan akan dilanjutkan, direvisi, atau bahkan diganti dengan program

yang lebih baik lagi.

Dengan kata lain, kegiatan evaluasi adalah untuk mengetahui apakah

tujuan-tujuan yang telah dirumuskan sudah tercapai atau kah belum.

51
Dengan evaluasi diharapkan bisa dilakukan perbaikan-perbaikan di masa

mendatang.

A. Pengertian Evaluasi Program Pendidikan

Evaluasi secara etimologis berasal dari kata “evalution” yang

berarti “penilaian/penapsiran terhadap sesuatu”. Evaluasi dapat

digunakan pada bidang yang sangat luas, termasuk pada bidang

pendidikan. Arti umum tersebut adalah penilaian dan kata itu dapat

digunakan segala sesuatu. Dengan demikian, mengevaluasi berarti

memberi , menilai, apakah sesuatu itu bernilai atau tidak bernilai.

Evaluasi menurut beberapa ahli:

1. Menurut Mehrens dan Lelma (1978)

Evaluasi adalah proses dalam merencanakan, memperoleh

dan menyediakan informasi yang sangat diperlukan untuk membuat

alternatif- alternatif keputusan.

2. Menurut Gronlund (1975)

Evaluasi sebagai suatu proses yang sistematis untuk

menentukan keputusan sampai sejauhmana tujuan-tujuan

pengajaran telah dicapai siswa.

3. Menurut Wrigths Tone, dkk (1956)

Evaluasi adalah penaksiran terhadap pertumbuhan dan

kemajuan siswa ke arah tujuan- tujuan pendidikan.

Pengertian istilah “program”, yaitu diartikan sebagai “rencana” Jadi

yang dimaksud dengan Evaluasi Program Pendidkan adalah langkah

52
awal dalam supervisim yaitu mengumpulkan data yang tepat agar

dapat dilanjutkan dengan pemberian pembinaan yang tepat pula dalam

perencanaan yang sudah direncanakan dalam ranah pendidikan.

B. Kerangka Dasar Evaluasi Program

Susun kerangka acuan (terms of reference) bagi


evaluasi
(1). Tujuan evaluasi
(2). Peranan evaluasi, yakni untuk apa hasil evaluasi
itu digunakan
(3). Kendalanya
(4). Penunjangnya

Tentukan unsur- unsur program


(1). Struktural
(2). Fungsional

Kembangkan atau pilih teknik pengumpulan data bagi masing- masing


unsur program
(1). Dipersiapkan
(2). Operasional

Buatpengumpulam
Buat jadwal jadwal pengumpulam data

Kumpulkan dan susun data


Yang dibutuhkan

Beberapa kriteria evaluasi yang relevan

53
(1). Koherensi
(2). Penyebaran sumber
(3). Tanggapan pemakai
(4). Tanggapan pelaksana
(5). “Cost- Effectivenesss ”
(6). Kemampuan
generative
(7). Dampak
(8). Pengarahan kebijakan
(9). “Cost – Benefit
analysis” (10). Efek

Analisis data
Kriteria – Deskriptif

Rangkuman hasil analisis


Pencarian pola

C. Kriteria Evaluasi Program Pendidikan

Ada beberapa kriteria yang dipilih untuk digunakan dalam

evaluasi yang berfungsi sebagai acuan pengkajian. Ada dua jenis

kriteria yang dapat dipergunakan dalam evaluasi program, yaitu

kriteria internal dan kriteria eksternal.

Kriteria internal adalah standar yang dapat diaplikasikan

terhadap suatu program dalam kerangka program itu sendiri.

Kriteria eksternal adalah standar yang diterapkan terhadap suatu

program dari suatu sumber diluar kerangka program.

1. Kriteria internal

54
a. Kriteria internal yang dipergunakan adalah koherensi.

b. Kriteria internal yang dipergunakan adalah penyebaran sumber

c. Tanggapan pemakai, sikap dan reaksi pemakai yang

berpartisipasi dalam program sering menjadi criteria.

d. Tanggapan penyedia yaitu mengacu pada tanggapan pihak

yang menyediakan program, dinilai dengan kriteria yang

dijabarkan dari tujuan-tujuan program yang ditetapkan

e. Keefektifan penggunaan biaya (cost effectininess)

f. Kemampuan generative

g. Dampak, yaitu efek lebih dibandingkan dengan yang mungkin

terjadi secara ilmiah, yaitu tanpa kehadiran program

2. Kriteria eksternal

a. Pengarahan kebijakan, biasanya program - program yang harus

dilaksanakan dalam kerangka pengarahan kebijakan tertentu.

b. Cost benefit analysis

Yaitu menghendaki keuntungan- keuntungan program baik

yang segera tampak atau yang tidak segera tampak, dan biaya

pelaksanaan program, baik baiaya langsung amupun tidak

langsung.

c. Efek pelipatgandaan

D. Komponen dan indicator program

Program merupakan sistem, sedangkan sistem adalah satu

kesatuan dari beberapa bagian atau komponen program yang saling

55
kait-mengait dan bekerja sama satu dengan lain untuk mencapai

tujuan yang sudah ditetapkan dalam sistem. Dengan demikian program

terdiri dari komponen-komponen yang saling berkaitan dan saling

menunjang dalam rangka mencapai suatu tujuan (Arikunto dan Jabar,

2009:9).

Komponen program adalah bagian-bagian atau unsur-unsur

yang membangun sebuah program yang saling terkait dan merupakan

faktor-faktor penentu keberhasilan program. Oleh karena suatu

program merupakan sebuah sistem maka komponen-komponen

program tersebut dapat dipandang sebagai bagian sistem dan dikenal

dengan istilah “subsistem”. Selanjutnya istilah indikator berasal dari

bahasa Inggris yaitu to indicate yang berarti menunjukkan atau tanda.

Jadi indikator merupakan sesuatu yang dapat menunjukkan atau

sebagai tanda dari suatu subkomponen dan sekaligus menunjukkan

atau sebagai tanda suatu komponen.

Dalam kegiatan evaluasi program, indikator merupakan petunjuk

untuk mengetahui keberhasilan atau ketidakberhasilan suatu kegiatan.

Perlu diketahui bahwa ketidakberhasilan suatu kegiatan dapat juga

dipengaruhi oleh komponen atau subkomponen yang lain. Ilustrasi dari

penjelasan terkait dengan komponen, subkomponen dan indikator dari

program yang akan dievaluasi maka dalam hal ini dikutip deskripsi

yang disampaikan Arikunto dan Jabar (2009:10-12) terkait dengan

evaluasi program pembelajaran. Di mana dalam pembelajaran sebagai

56
program memiliki komponen-komponen yang menjadi faktor penting

keberlangsungannya, dalam hal ini faktor-faktor yang dimaksud

sebagai berikut:

1. Pendidik.

2. Peserta didik.

3. Materi/kurikulum.

4. Sarana dan prasarana.

5. Pengelolaan.

6. Lingkungan.

E. Langkah – langkah Evaluasi Program Pendidikan

Evaluasi program pendidikan dilaksanakan melalui beberapa

tahapan. Secara garis besar tahapan tersebut meliputi: tahap

persiapan evaluasi program, tahap pelaksanaan evaluasi program,

dan tahap monitoring pelaksanaan progam.

a. Persiapan evaluasi program berupa penyusunan desain evaluasi,

penyusunan instrument evaluasi, validasi menentukan jumlah

sampel yang diperlukan dalam kegiatan evaluasi, dan penyamaan

persepsi antar evaluator sebelum pengambilan data. Seorang

evaluator harus mengetahui program dan criteria keberhasilan

program evaluasi. Setelah mengetahui tujuan dan kriteria

keberhasilan program maka seorang evaluator baru bisa

menentukan metode, alat, sasaran dan jadwal evaluasi program

pendidikan yang akan dilaksanakan. Sistematika ataukomponen

57
yang harus ada dalam evaluasi program pendidikan secara garis

besar sebagai berikut : latar belakang masalah, problematika,

tujuan evaluasi, populasidan sampel, instrument, dan sumber data.

b. Pelaksanaan evaluasi program

Agar proses pelaksanaan evaluasi program pendidikan

berjalan dengan baik dapat menggunakan alat pengumpulan data,

sebagai berikut :

1) Pengambilan data dengan tes

2) Pengambilan data dengan observasi

3) Pengambilan data dengan angket

4) Pengambilan data dengan wawancara

5) Pengambilan data dengan metode analisis dokumen dan artifak.

c. Monitoring pelaksanaan evaluasi program

Dalam pelaksanaan evaluasi terdapat pemantauan atau

monitoring dalam pelaksanaannya,diantaranya yaitu :

1) Fungsi pemantauan

Pemantauan memiliki fungsi pokok yaitu mengetahui

kesesuaian pelaksanaan program dengan rencana program dan

untuk mengetahui seberapa pelaksanaan program yang sedang

berlangsung dapat diharapkan akan menghasilkan perubahan

yang diinginkan.

2) Sasaran pemantauan

58
Sasaran pemantauan yaitu dengan menemukan Hal-hal

bagaimana seberapa jauh pelaksanaan program telah sesuai

dengan rencana program dan menunjukkan tanda-tanda

tercapainya tujuan program.

3) Pelaku pemantauan

Pemantauan program dilakukan oleh evaluator bersama dengan

pelaku atau pelaksana program.

59
BAB VI

TEORI TES KLASIK

Latar Belakang

Salah satu teori pengukuran yang tertua didunia pengukuran

behavioral adalah classical true-score theory. Teori ini dalam bahasa

Indonesia sering disebut dengan teori tes klasik. Teori tes klasik

merupakan sebuah teori yang mudah dalam penerapannya serta model

yang cukup berguna dalam mendeskripsikan bagaimana kesalahan dalam

pengukuran dapat mempengaruhi skor amatan.

Inti teori klasik adalah asumsi-asumsi yang dirumuskan secara

sistematis serta dalam jangka waktu yang lama. Dari asumsi-asumsi

tersebut kemudian dijabarkan dalam beberapa kesimpulan. Ada tujuh

macam asumsi yang ada dalam teori tes klasik ini. Allen & Yen (1979: 67 -

60) menguraikan asumsi-asumsi teori klasik sebagai berikut :

Asumsi-asumsi teori klasik akan pelajari dan hal ini memungkinkan

untuk dikembangkan dalam rangka pengembangan berbagai formula yang

berguna dalam melakukan pengukuran psikologis. Daya beda, indeks

kesukaran, efektifitas distraktor, reliabilitas dan validitas adalah formula

penting yang disarikan dari teori tes klasik.

A. Pengertian Teori Tes Klasik

Teori tes klasik atau classical test theory (CTT) merupakan

salah satu pendekatan yang digunakan dalam dunia pengukuran

60
dibidang Psikologi. Teori tes klasik dikenal juga dengan sebutan teori

skor murni (true score theory). Hal ini berkaitan dengan fokus kajian

teori tes klasik yang ingin melihat nilai skor murni dari skor tampak

yang diperoleh. Teori ini dikembangkan oleh Charles Spearman tahun

1904 dan masih terus digunakan hingga saat ini. Spearman

mengembangkan CTT dengan menggabungkan konsep eror dan

korelasi (Salkind, 2007).

CTT merupakan teori psikometri yang populer serta banyak

digunakan pada berbagai disiplin ilmu (psikologi, pendidikan, dan ilmu

sosial lainnya). Istilah “klasik” yang digunakan tidak hanya mengacu

kronologi model ini, tetapi juga sebagai kontras dengan lebih teori

psikometri yang lebih baru yang disebut sebagai sebagai Teori Respon

Butir (Item Response Theory), yang sering kali disebut juga dengan

istilah "teori modern". Terdapat beberapa perbedaan yang mendasari

teori tes klasik dengan teori respon butir.

Dari sisi pendekatan, teori tes klasik mengadopsi pendekatan

deterministik (certainty) dimana fokus utama analisis adalah skor total

individu (X). Setiap tes memiliki eror (E) yang menyertai setiap hasil

pengukuran dalam mengukur sifat manusia. Skor murni (T) dan error

(E) keduanya adalah variabel laten, namun tujuan pengujian adalah

untuk menarik kesimpulan mengenai skor murni individu. Skor per-item

juga dapat dipastikan benar dan salahnya yaitu misalnya jika jawaban

seseorang benar maka diberi skor 1 dan salah diberi skor 0.

61
Sedangkan IRT berfokus pada probabilitas dalam menjawab setiap

item dimana menilai jawaban bukan pada total skor seseorang

melainkan mempertimbangkan respon/jawaban seseorang pada level

item. Pemberian skornya juga bukan dengan cara menentukan skor 1

atau 0, melainkan probabilitas orang tersebut mendapat skor 1 atau

skor 0.

B. Asumsi Teoritik Mengenai Skor

Seperti yang dijelaskan sebelumnya, teori tes klasik memiliki

banyak asumsi di dalamnya. Performasi subjek pada suatu skala

pengukuran dinyatakan dalam angka yang disebut skor. Skor ini

merupakan skor perolehan pengukuran yang selanjutnya disebut

sebagai skor tampak atau dilambangkan dengan X. Di dalam skor

tampat terdapat skor murni (T) dan error pengukuran (E) yang tidak

pernah dapat diketahui besarannya (Azwar, 2011). Teori tes klasik

bekerja pada tataran skor tampak dengan menggunakan model

linier dalam menjelaskan model skor. Beberapa asumsi yang

mendasar skor dalam teori tes klasik diantaranya sebagai berikut

(disarikan dari Azwar, 2015)

Asumsi ini menyatakan bahwa hubungan Skor tampak (X), skor

murni (T), dan eror pengukuran (E) bersifat aditif. Skor tampak (X)

yang diperoleh individu merupakan akumulasi dari skor murni (T)

dan eror pengukuran (E).

62
Asumsi pertama teori tes klasik adalah bahwa terdapat hubungan

antara skor tampak (observed score) yang dilambangkan dengan

huruf X, skor murni (true score) yang dilambangkan dengan T dan

skor kasalahan (error) yang dilambangkan dengan E. Menurut

Saifuddin Azwar (2001: 30) yang dimaksud kesalahan pada

pengukuran dalam teori klasik adalah penyimpangan tampak dari

skor harapan teoritik yang terjadi secara random. Hubungan itu

adalah bahwa besarnya skor tampak ditentukan oleh skor murni

dan kesalahan pengukuran. Dalam. bahasa matematika dapat

dilambangkan dengan X = T + E.

Asumsi ini menyatakan bahwa skor murni merupakan nilai harapan

X. Karena besar skor murni diasumsikan tetap dalam setiap

pengukuran, maka besar varians skor tampak akan tergantung

pada variasi eror pengukuran.

Asumsi kedua adalah bahwa skor murni (T) merupakan nilai

harapan є (X). Dengan demikian skor murni adalah nilai rata-rata

skor perolehan teoretis sekiranya dilakukan pengukuran berulang-

ulang (sampai tak terhingga) terhadap seseorang dengan

menggunakan alat ukur.

63
Korelasi antara eror pengukuran dan skor murni adalah nol.

Menurut asumsi ini, bagi suatu kelompok populasi subjek yang

dikenai tes distribusi eror pengukuran dan distribusi skor murni

adalah independen satu sama lain. variasi eror tidak tergantung

pada variasi skor murni.

Asumsi kelima menyatakan bahwa jika terdapat dua tes untuk

mengukur atribut yang sama maka skor kesalahan pada tes

pertama tidak berkorelasi dengan skor murni pada tes kedua ( ).

Asumsi ini akan gugurjika salah satu tes tersebut ternyata

mengukur aspek yang berpengaruh terhadap teradinya kesalahan

pada pengukuran yang lain.

Bila e1 adalah eror pengukuran tes pertama dan e2 adalah eror

pengukuran tes kedua, maka asumsi ini menyatakan bahwa

distribusi eror kedua tes tersebut tidak berkorelasi satu sama lain.

Asumsi kelima menyatakan bahwa eror pada suatu tes tidak

berkorelasi degan skor murni pada tes lain.

Asumsi keenam teori tes klasik adalah menyajikan tentang

pengertian tes yang pararel. Dua perangkat tes dapat clikatakan

sebagai tes-tes yang pararel jika skor-skor populasi yang

menempuh kedua tes tersebut mendapat skor murni yang sama ( T

64
= T' )dan varian skor-skor kesalahannya sama ( ). Dalam

prakteknya, asumsi keenam teori ini sulit terpenuhi.

Asumsi terakhir dari teori tes klasik menyatakan tentang definisi tes

yang setara (essentially equivalent). Jika dua perangkat tes

mempunyai skor-skor perolehan dan yang memenuhi asumsi 1

sampai 5 dan apabila untuk setiap populasi subyek X1 = X2 + C12,

dimana C12 adalah sebuah bilangan konstanta, maka kedua tes itu

disebut tes yang pararel.

Asumsi-asumsi teori klasik di atas memungkinkan untuk

dikembangkan dalam rangka pengembangan berbagai formula

yang berguna dalam melakukan pengukuran psikologis. Daya

beda, indeks kesukaran, efektifitas distraktor, reliabilitas dan

validitas adalah formula penting yang disarikan dari teori tes klasik.

65
BAB VII

KONSTRUKSI TES

Latar Belakang

Pengukuran yaitu membandingkan objek yang mau diukur dengan

skalanya. Dalam kontalu kita akan membuat skalanya, apakah valid dan

reliabel atau tidak. Dalam konstruk psikologi, dibagi menjadi 2 macam

tes: tes intelegensi/IQ/kecerdasan dan tes personality.

Tes prestasi belajar yaitu keberhasilan belajar pada saat itu.

Sudah ada silabus dan kompetensi, jadi ujian mengarah ke kompetensi

tersebut.

Penjelasannya mengenai teori ini berangkat dari analisis

korelasional yang dilakukannya terhadap skor seperangkat tes yang

mempunyai tujuan dan fungsi ukur yang berlainan. Hasil analisisnya

memperlihatkan adanya interkorelasi positif di antara berbagai tes

tersebut. Menurut Spearman, interkorelasi positif itu terjadi karena

masing-masing tes tersebut memang mengukur suatu faktor umum yang

sama, yang dinamainya faktor g. Namun demikian, korelasi-korelasi itu

tidaklah sempurna sebab setiap tes, di samping mengukur faktor umum

yang sama, juga mengukur komponen tertentu yang spesifik bagi masing-

masing tes tersebut. Faktor yang spesifik dan hanya diungkap oleh tes

tertentu saja ini disebut faktor s.

66
Misalnya orang yang sudah lulus sarjana IQ G Factornya 73, skor

itu bisa jadi tekniknya yang salah, mungkin pada saat tes terlalu banyak

orang, spekernya tidak bagus, duduknya paling ujung dan jauh sehingga

instruksi yang diberikan tidak terdengar. Isu pendidikan kita yang paling

aktual pasca diumumkannya hasil Ebtanas sekolah menengah,

khususnya SMU, adalah penerimaan mahasiswa baru di perguruan

tinggi. Sekarang ini para lulusan sekolah menengah kita sedang sibuk

menyiapkan diri untuk menembus dinding perguruan tinggi, Perguruan

Tinggi Negeri (PTN) ataupun Perguruan Tinggi Swasta (PTS), yang

dianggap dapat mengembangkan kemampuannya untuk menggapai cita-

cita.

Di sisi lainnya pihak perguruan tinggi sendiri tengah menghadapi

persoalan tentang bagaimana metode menciptakan sistem seleksi yang

efektif hingga kandidat yang tersaring menggunakan alat testing yang

dibuat benar-benar kandidat yang bermutu; dalam pengertian (kandidat)

mahasiswa baru dengan potensi akademik yang pantas. Kiranya

memang tidak bisa dipungkiri bahwa sampai saat inipun masih banyak

perguruan tinggi yang mengaplikasi sistem seleksi mahasiswa baru di

dalam tahapan formalistik saja.

Secara empirik ada berbagai jenis alat seleksi yang dikembangkan

oleh perguruan tinggi kita; misalnya saja PTN pernah menerapkan tes

model Proyek Perintis (PP), Sipenmaru, UMPTN, dan

sebagainya, sementara itu ada beberapa PTS yang dalam menseleksi

67
kandidat mahasiswa baru menggunakan tes psikologis (psycho-test), tes

bakat, tes kemampuan abstraksi, tes pengetahuan umum, dsb. Lebih

daripada itu Tes Potensi Akademik (TPA) yang dibuat oleh Overseas

Training Office (OTO) pun sekarang mulai "masuk kampus".

Oleh karena itu, kita perlu mengetahui salah satu alat ukur tes yang

dapat dijadikan sebagai alah satu penilaian, salah satunya yaitu kontruksi

test, dimana di makalah ini akan membahas tentang kontruksi test.

Sehingga pada akhirnya, hal ini dapat melahirkan peserta didik yang

berkualitas tinggi dalam segala hal, baik kognitif, afektif, Maupun

psikomotorik.

A. Definisi Konstruksi Tes

Kontruksi tes adalah studi cara penyusunan alat ukur psikologis

(tes) secara ilmiah (sistematis, obyektif, standard)

1. Perbandingan

a. Psikodiagnostik : manfaat praktis alat tes untuk mendiagnosis

masalah-masalah psikologis

b. Sikometri : teori-teori pengukuran psikologi

c. Konstruksi Tes : teknis penyusunan alat tes psikologis

d. Penyusunan skala psikologis : bagian dari kontes khusus

untuk data skala

2. Pengertian tes

a. Prosedur sistematis untuk mengukur sample perilaku sso

(Brown)

68
b. Pengukuran obyektif, standard, sampel perilaku (Anastasi)

c. Prosedur sistematis untuk mengamati perilaku seseorang dan

digambarkan dalam skala angka atas kategori tertentu.

(cronbach)

3. Simpulan

a. Prosedur sistematis : ada aturan tertentu untuk menyusun

item administrasi dan skoring yang jelas terperinci dan kondisi

testing berlaku sama untuk semua test.

b. Berisi sample perilaku : isi sesuai dengan populasi perilaku

yang didefinisikan. Kualitas diri seberapa representatifnya isi.

c. Mengukur perilaku : merespon terh adap apa yang diketahui


oleh testee.
2
d. Format tes : tergantung maksud dan tujuannya.

e. Materi tes : achievement, minat, intelegensi, kepribadian.

f. Tahu tidaknya yang diukur tentang aspek yang akan diukur.

4. Pengukuran psikologis

a. Adanya asumsi manusia punya kualitas tertentu yang relative

konsisten sepanjang waktu. Kualitas psikologis atau trait /

karakter dikonsepkan ke dalam konstruk.

(Konstruk adalah konsep hipotesis hasil imajinasi ilmuwan).

b. Kualitas psikologis/atribut merupakan konstruk yang disusun

untuk mengorganisasikan pengalaman terhadap perilaku

konsisten yang dapat dibandingkan satu dengan orang yang

69
lain. Atribut tidak dapat diukur secara langsung tetapi lewat

observable behavior sebagai ludikate yang sah.

Penyusunan alat ukur psikologis: menyusun sebuah sample perilaku

indikate dalam situasi standard dngan prinsip isomorpishm (realita dan

hasil ukur).

B. Pendekatan Konstruksi Tes (sebagai applied psychometrics –

thorndike)

Ada 2 model pendekatan:

1. Domain mastery approach

2. Latent trait approach

Pengertian model pendekatan

1. Domain mastery approach

a. Pendekatan ini mengukur seberapa besar penguasaan testee

terhadap rentang pengetahuan (knowledge domain) atau

keterampilan yang didefinisikan (skill defined). Disebut pula

criterion reference testing

b. Disebut pula sebagai tes presentasi (Achieved tes) di bidang

pendidikan dimana definisi dan batas rentang pengetahuan

atau skill dibuat secara jelas dan tepat sesuai kurikulum /

tujuan instruksionalnya.

c. Langkahnya secara umum: mendefinisikan batas domain,

menentukan stimulus dan responnya, memilih jenis dan

70
ukuran sample dari domain, menentukan kategori “mastery”

sesuai tujuan penyusunan alat ukur ini.

2. Latent trait approach

a. Pendekatan ini mengukur attribute (karakteristik hopotetik)

yang unobservable dan konsisten yang dimiliki seseorang

baik besar maupun tarafnya (noun, adjective, maupun

adverb)

b. Meskipun attribute bersifat unobservable namun

merupakan konstruk yang berbentuk untuk mengorganisir

pengalaman atau perilaku yang konsisten.

c. Bentuk attribute misalnya termperament aptitude ability.

d. Skor tes dianggap sebagai representasi dari latent attribute

meskipun tidak perfect.

e. Tidak memiliki batas (atas – bawah) dalam definisinya.

f. Berhasil tidaknya pengukuran tergantung pengalaman

masa lalu dari testee terhadap situasi yang dihadirkan

dalam item.

g. Item disusun tergantung anggapan apa yang mewakili dan

tergantung kreativitas penyusun tes

C. Perencanaan (Umum) Penyusunan Tes

1. Mendefinisikan tujuan pengukuran alat tulis tsb, apakah tergolong

pendekatan domain atau latent attribute

2. Menyatakan tujuan dan manfaat alat ukur sesuai rencana.

71
3. Mengidentifikasikan hambatan yang akan dihadapi dalam

pelaksanaan, seperti waktu media, kondisi tes.

4. Membuat blue print yang mungkin berdasarkan content

specification, topics to be covered, skill to be tapped, sun-ability

tobe tested

5. Menetapkan format-format item: stimulus, response, prosedur

scoring

6. Rencanakan ty out dan analisis data untukmenyeleksi item

7. Menentukan parameter statistik taraf kesulitan, daya beda,

realibilitas yang diinginkan sesuai tujuan.

8. Standarisasi prosedur penyajian dan warna statistik.

9. Pelaksanaan pengumpulan data dan evaluasi validitas

10. Menyusun manual tes dan kata pengantar tes.

D. Langkah-langkah penyusunan alat ukur (Kontruksi)

1. Menentukan wilayah yang akan dikenai pengukuran

a. hasil belajar

b. intelegensia

c. potensi intelektual

2. Menetukan dasar konseptual

a. dasar konseptual mengenai belajar

1) apakah hasil belajar

2) faktor yang berpengaruh terhadap proses dan hasil

belajar

72
3) bagaimana proses belajar terjadi

4) apa bukti bahwa proses belajar telah terjadi

b. dasar konseptual mengenai intelegensi

1) pendekatan spekulatif : memberikan definisi tentang intel

egensi umum;memberikan definisi mengenai daya jiwa;

memberikan definisi intelegensisebagai taraf umum dari

pada sejumlah daya jiwa khusus

2) pendekatan pragmatis : intelegensi adalah apa yang dites

oleh tesintelegensi

3) pendekatan analisis faktor : intelegensi dipengauhi oleh

faktor tertentu

4) pendekatan operasional : merespon pendekatan analisis

faktor daripendefinisian dan pengukuran.

5) pendekatan fungsional : disusun atas analisis

bagaimana berfungsinyaintelegensi, lalu dirumuskan

definisinya

c. dasar konseptual mengenai potensi intelektual : manusia

memiliki intelegensiumum (general intelegence) dan potensi

khusus (special attitude)

3. Penentuan subjek yang akan dikenai pengukuran

4. Menentukan tujuan pengukuran

5. Menentukan materi test alat ukuran.

a. materi projektif

73
b. materi non projektif

6. Menentukan tipe soal

a. menuntut respon uraian

b. menuntut pemilihan alternatif jawaban

7. Menentukan jumlah soal untuk keseluruhan alat ukur dan

masing-masing bagiannya

a. hubungan banyak soal dengan bobot : membuat banyaknya

soal untukmasing-masing bagian sebanding dengan

bobotnya

b. hubungan banyak soal dengan reliabilitas tes : makin tinggi

rata-rata korelasisoal dengan perangkat tes, makin tinggilah

reliabilitas tes tersebut

c. hubungan banyak soal dengan waktu tes : menyediakan

waktu yang cukup bagi kira-kira 75% sampai 90% pengambil

tes menyelesaikan tes tersebut

d. hubungan banyak soal dengan uji coba tes : sebelum di uji

coba, rencana tes banyak berupa terkaan

8. Merencanakan taraf dan distribusi kesukaran soal

a. Indeks kesukaran soal : perbandingan banyaknya subyek

yang menjawabb enar dengan banyaknya subyek yang

mengerjakan soal

b. Rata-rata skor tes : perbandingan banyak soal dengan rata-

rata taraf kesukaran soal

74
9. Menyusun kisi-kisi (test blue print)

a. Fungsi kisi-kisi : merumuskan setepat mungkin ruang

lingkup, tekanan tes dan bagian-bagiannya sehingga

perumusan tersebut menjadi petunjuk yang efektifbagi

penyusun tes, terutama bagi perakit soal

b. Dua aspek isi tes :

1) analisis isi mata pengetahuan : terdiri atas hasil

analisis mengunsurtentang daerah kurikulum yang akan

di tes terkait perbedaan kondisidengan daerah yang lain.

2) analisis behavioral objectives bertitik tolak pada tujuan

dasar pendidian yaitu modifikasi perilaku

c. klasifikasi dua jalan : serempak menyajikan kedua dimensi di

atas

10. Merencanakan tugas untuk para penulis soal:

a. Penulis soal: spesialis dibidang bersangkutan yang punya

latar pendidikandalam penulisan soal

b. Alokasi waktu penulisan soal

c. Bentuk penugasan :dapat memilih satu penulisan soal yang

dikontak

d. Catatan-catatan mengenai soal: kartu soal yang berupa

bagian dari kisi soal yang dibuatnya, bentuk soal, taraf

kompetensi, kunci jawaban, estimasi taraf kesukaran

e. Penelaahan soal:

75
1) aspek teknis

2) aspek substansi

3) spek editorial

11. Merencanakan perakitan soal

12. Merencanakan jadwal penerbitan tes

E. Jenis –jenis Tes

a. Dari segi bentuk pelaksanaannya

1) Tes Tertulis ( paper and pencil test)

Tes tertulis dalam pelaksanaannya lebih menekankan pada

penggunaan kertas dan pencil sebagai instrumen utamanya,

sehingga tes mengerjakan soal atau jawaban ujian pada

kertas ujian secara tertulis, baik dengan tulisan tangan

maupun menggunakan komputer.

2) Tes Lisan ( oral test)

Tes lisan dilakukan dengan pembicaraan atau wawancara

tatap muka antara guru dan murid.

3) Tes Perbuatan (performance test)

Tes perbuatan mengacu pada proses penampilan seseorang

dalam melakukan sesuatu unit kerja. Tes perbuatan

mengutamakan pelaksanaan perbuatan peserta didik.

b. Dari segi bentuk soal dan kemungkinan jawabannya

1) Tes Essay (uraian)

76
Tes Essay adalah tes yang disusun dalam bentuk

pertanyaan terstruktur dan siswa menyusun,

mengorganisasikan sendiri jawaban tiap pertanyaan itu

dengan bahasa sendiri. Tes essay ini sangat bermanfaat

untuk mengembangkan kemampuan dalam menjelaskan

atau mengungkapkan suatu pendapat dalam bahasa sendiri.

2) Tes Objektif

Tes objektif adalah tes yang disusun sedemikian rupa dan

telah disediakan alternatif jawabannya. Tes ini terdiri

dariberbagai macam bentuk, antara lain ;

a) Tes Betul-Salah (TrueFalse)

b) Tes Pilihan Ganda (Multiple Choice)

c) Tes Menjodohkan (Matching)

d) Tes Analisa Hubungan (Relationship Analysis)

c. Dari segi fungsi tes di sekolah

1) Tes Formatif

Tes Formatif, yaitu tes yang diberikan untuk

memonitor kemajuan belajar selama proses pembelajaran

berlangsung. Tes ini diberikankan dalam tiap satuan unit

pembelajaran. Manfaat tes formatif bagi peserta didik adalah

a) Untuk mengetahui apakah peserta didik sudah

menguasai materi dalam tiap unit pembelajaran.

77
b) Merupakan penguatan bagi peserta didik.

c) Merupakan usaha perbaikan bagi siswa, karena

dengan tes formatif peserta didik mengetahui

kelemahan-kelemahan yang dimilikinya.

d) Peserta didik dapat mengetahui bagian dari bahan

yang mana yang belum dikuasainya.

2) Tes Summatif

Tes sumatif diberikan dengan maksud untuk

mengetahui penguasaan atau pencapaian peserta didik

dalam bidang tertentu. Tes sumatif dilaksanakan pada

tengah atau akhir semester.

3) Tes Penempatan

Tes penempatan adalah tes yang diberikan dalam

rangka menentukan jurusan yang akan dimasuki peserta

didik atau kelompok mana yang paling baik ditempati atau

dimasuki peserta didik dalam belajar.

4) Tes Diagnostik

Tes diagnostik adalah tes yang digunakan untuk

mendiagosis penyebab kesulitan yang dihadapi seseorang

baik dari segi intelektual, emosi, fisik dan lain-lain yang

mengganggu kegiatan belajarnya.

78
F. Ciri – cirri Tes Yang Baik

Menurut arikonto (1992), Sebuah tes yang dapat dikatakan baik

sebagai alat pengukur harus memilki persyaratan tes, yaitu

memiliki:

a. Validitas

Sebuah tes disebut valid apabila tes tersebut dapat tepat

mengukur apa yang hendak diukur. Contoh, untuk mengukur

partisipasi siswa dalam proses belajar mengajar, bukan diukur

melalui nilai yang diperoleh pada waktu ulangan, tetapi dilihat

melalui: kehadiran, terpusatnya perhatian pada pelajaran,

ketepatan menjawab pertanyaan-pertanyaan yang diajukan oleh

guru dalam arti relevan pada permasalahannya.

b. Reliabilitas

Berasal dari kata asal reliable yang artinya dapat

dipercaya. Tes dapat dikatakan dapat dipercaya jika

memberikan hasil yang tetap apabila diteskan berkali-kali.

Sebuah tes dikatakan reliabel apabila hasil-hasil tes tersebut

menunjukan ketetapan. Jika dihubungkan dengan validitas,

maka: Validitas adalah ketepatan dan reliabilitas adalah

ketetapan.

c. Objektivitas

Sebuah dikatakan memiliki objektivitas apabila dalam

melaksanakan tes itu tidak ada faktor subjektif yang

79
mempengaruhi. hal ini terutama terjadi pada sistem scoringnya.

Apabila dikaitkan dengan reliabilitas maka objektivitas

menekankan ketetapan pada sistem scoringnya, sedangkan

reliabilitas menekankan ketetapan dalam hasil tes.

d. Praktikabilitas

Sebuah tes dikatakan memiliki praktibilitas yang tinggi

apabila tes tersebut bersifat praktis dan mudah

pengadministrasiannya. tes yang baik adalah yang mudah

dilaksanakan, mudah pemeriksaannya, dan dilengkapi dengan

petunjuk-petunjuk yang jelas.

e. Ekonomis

Yang dimaksud ekonomis disini ialah bahwa pelaksanaan

tes tersebut tidak membutuhkan ongkos atau biaya yang mahal,

tenaga yang banyak, dan waktu yang lama

80
BAB VIII

ANALISIS

TES

Latar Belakang

Usaha yang lebih baik yaitu untuk selalu meningkatkan mutu tes

yang disusun oleh seorang tenaga pendidik, namun hal ini tidak

dilaksanakan karena kecenderungan seseorang untuk beranggapan

bahwa hasil karyanya adalah yang terbaik atau setidak – tidaknya sudah

cukup baik.

Tenaga pendidik yang sudah banyak berpengalaman mengajar dan

menyusun soal – soal tes, juga masih sukar menyadari bahwa tesnya

masih belum sempurna. Oleh karena itu, cara yang paling baik adalah

secara jujur melihat hasil yang diperoleh oleh siswa, masalah inilah yang

melatarbelakangi penulisan makalah ini yang berjudul Analisis Tes.

A. Pengertian Analisis Tes

Analisis tes adalah salah satu kegiatan dalam rangka

mengkonstruksi tes untuk mendapatkan gambaran tentang mutu tes,

baik mutu keseluruhan tes maupun mutu tiap butir soal/tugas.Analisis

dilakukan setelah tes disusun dan dicobakan kepada sejumlah subyek

dan hasilnya menjadi umpan balik untuk perbaikan/peningkatan mutu

tes bersangkutan. Oleh karena itu kegiatan analisis tes merupakan

keharusan dalam keseluruhan proses mengkonstruksi tes. Dalam

81
analisis tes juga ada beberapa yang harus kita perhatikan,

diantaranya:

1. Menilai tes yang dibuat sendiri

Secara teoritis, siswa dalam satu kelas merupakan populasi atau

kelompok yang keadaannya heterogen. Dengan demikian, maka

apabila dikenai sebuah tes akan tercermin hasilnya dalam suatu kurva

normal. Sebagai besar siswa berada di daerah sedang, sebagian kecil

berada di ekor kiri, dan sebagaian kecil yang lain berada di ekor kanan

kurva.

Apabila keadaan setelah hasil dianalisis tidak seperti yang

diharapkan dalam kurva normal, maka tentu ada “apa-apa” dengan

soal tesnya.Apabila hampir seluruh siswa memperoleh skor jelek,

berarti bahwa tes yang disusun mungkin terlalu sukar.Sebaliknya jka

seluruh siswa memperoleh skor baik, dapat diartikan bahwa tesnya

terlalu mudah. Tentu saja interpretasi terhadap soal tes akan lain

seandainya tes itu sudah disusun sebaik-baiknya sehingga memenuhi

persyaratan sebagai tes.

Dengan demikian maka apabila kita memperoleh keterangan

tentang hasil tes, akan membantu kita dalam mengadakan penilaian

secara objektif terhadap tes yang kita susun. Ada 4 (empat)cara untuk

menilai tes, yaitu:

82
a. Cara pertama meneliti secara jujur soal-soal yang sudah disusun, kadang-

kadang dapat diperoleh jawaban tentang ketidakjelasan perintah atau

bahasa, taraf kesukaran, dan lain-lain keadaan soal tersebut. Pertanyaan-

pertanyaan tersebut, antara lain:

1) Apakah banyaknya soal untuk tiap topik sudah seimbang?

2) Apakah semua soal menanyakan bahan yang telah diajarkan?

3) Apakah soal yang kita susun tidak merupakan pertanyaan yang

membingungkan (dapat di salah tafsirkan)?

4) Apakah soal itu tidak sukar untuk dimengerti?

5) Apakah soal itu dapat dikerjakan oleh sebagaian bbesar siswa?

b. Cara kedua adalah mengadakan analisis soal (item analysis). Analisis soal

adalah suatu prosedur yang sistematis, yang akan memberikan informasi-

informasi yang sangat khusus terhadap butir tes yang kita susun.

c. Cara ketiga adalah mengadakan checking validitas. Validitas yang paling

penting dari tes buatan guru adalah validitas kurikuler (content validity).

Untuk mengadakan checking validitas kurikuler, kita harus merumuskan

tujuan setiap bagian pelajaran secara khusus dan jelas sehingga setiap soal

dapat kita jodohkan dengan setiap tujuan khusus tersebut.

d. Cara keempat adalah mengadakan checking reliabilita. Salah satu indikator

untuk tes yang mempunyai reliabilitas yang tinggi adalah bahwa

kebanyakan dari soal – soal tes itu mempunyai daya pembeda yang tinggi.

2. Cakupan kegiatan analisis tes

Kegiatan analisis tes meliputi empat hal yakni :

a. Analisis validitas tes

b. Analisis reliabilitas tes

c. Analisis butir soal yang meliputi :

1) Analisis daya pembeda tiap butir soal,

83
2) Analisis tingkat kesukaran tiap butir soal,

3) Analisis pengecoh (distraktor) pada setiap butir soal,

4) Analisis homogenitas tiap butir soal.

d. Analisis teknis kegunaan tes.

Dengan melakukan analisis tes, guru dapat “menabung-soal” atau

membuat “bank-soal” yakni kumpulan soal-soal yang sudah teruji

kebaikannya.Manfaat terbesar dari kegiatan analisis tes ialah guru makin

memahami bagaimana wujud tes yang baik, bagaimana butir soal yang

baik.Sehingga pada akhirnya guru makin terampil menyusun tes dengan

baik dan efisien.

Kritik terhadap tes bentuk pilihan ganda yang dianggap lebih buruk dari

tes bentuk uraian karena “makin membodohkan siswa”, sebenarnya

bersumber pada tes pilihan ganda yang buruk. Tes pilihan ganda (tes

obyektif) yang baik, yang dianalisis dari berbagai segi dan digunakan sesuai

tujuan pendidikan, akan lebih baik dibanding tes bentuk uraian yang tidak

dianalisis. Oleh sebab itu tes bentuk apapun perlu dianalisis agar dapat

terjamin obyektifitas dan keakuratannya.

Pembahasan analisis tes di sini akan terbatas pada tes buatan

guru/dosen, dan bukan psikotes yang dibuat para ahli atau THB yang

dibakukan.

B. Cara Mengetahui Validitas Tes

Validitas tes adalah tingkat keabsahan atau ketepatan suatu tes. Tes yang

valid (absah = sah) adalah tes benar-benar mengukur apa yang hendak diukur.

Tes matematika kelas dua SMP, hendaknya benar-benar mengukur hasil belajar

matematika siswa SMP kelas dua ; bukan siswa SMP kelas tiga atau siswa SD

kelas enam. Dan bukan mengukur hasil belajar dalam bidang studi lainnya.

84
Tes yang disusun untuk mengukur hasil belajar mata pelajaran kimia

pada kelas tertentu, hendaknya tidak menyimpang sehingga mengukur hasil

belajar matematika atau bahasa, atau kimia untuk kelas lainnya. Dengan kata

lain, validitas tes menunjukkan tingkat ketepatan tes dalam mengukur sasaran

yang hendak diukur.Ada empat macam validitas tes hasil belajar, yakni:

1. Validitas permukaan (face validity)

Tingkat validitas permukaan diketahui dengan melakukan analisis atau

telaah rasional (semata-mata berdasarkan pertimbangan logis, bukan pada

hitungan angka-angka empirik ). Analisis permukaan meliputi berbagai aspek

berikut ini:

a. Apakah bahasa dan susunan kalimat (redaksi) tiap butir soal cukup jelas dan

sesuai dengan kemampuan siswa?

b. Apakah isi jawaban yang diminta tidak membingungkan?

c. Apakah cara menjawab sudah dipahami siswa?

d. Jangan sampai siswa tahu isi jawabannya tetapi tidak tahu bagaimana cara

menjawab soal bersangkutan.

e. Apakah tes itu telah disusun berdasar kaidah/prinsip penulisan butir soal?

Tes yang tidak mengikuti kaidah penulisan butir soal akan tampak

semerawut sehingga membingungkan.

Setiap tes paling sedikit harus diperiksa melalui analisis permukaan.

Walaupun analisis ini tergolong paling lemah, namun lebih baik daripada tidak

ada analisis sama sekali. Tentu saja akan lebih baik bila suatu tes dianalisis

lebih lanjut.

2. Validitas isi (content validity)

Tingkat validitas isi juga diketahui dengan analisis rasional. Pada

prinsipnya dilakukan pemeriksaan terhadap tiap butir soal, apakah soal sudah

sesuai dengan Tujuan Pembelajaran Khusus atau dengan kompetensi yang

85
hendak diukur atau dengan indikator keberhasilan siswa. Cara yang lazim ialah

mencocokkan tiap butir soal dengan kisi-kisi yang disusun berdasarkan GBPP

(Garis Besar Program Pengajaran).Pengujian validitas isi dilakukan dengan

menjawab pertanyaan berikut.

a. Apakah keseluruhan tes telah sesuai dengan kisi-kisi?

Kisi-kisi adalah suatu bagian atau matrik yang menggambarkan

penyebaran soal-soal sesuai dengan aspek atau pokok bahasan yang hendak

diukur, tingkat kesukaran dan jenis soal. Kisi-kisi itu harus disusun

sedemikian rupa sehingga mencakup seluruh bahan pelajaran yang akan

diteskan.

Tingkat kesesuaian seluruh butir soal dengan kisi-kisi (dengan bahan

yang akan diteskan) menunjukkan tingkat validitas isi.

b. Apakah terdapat butir soal yang menyimpang, atau menuntut jawaban di luar

bahan pelajaran bersangkutan?

Misalnya soal dalam mata pelajaran fisika menjurus/menyimpang ke

hitungan matematika atau kemampuan di luar pokok bahasan yang diajarkan.

Penyimpangan yang tidak kentara itu perlu dihilangkan.Semakin

banyak soal yang menyimpang, semakin rendah tingkat validitas isi.Untuk

melakukan analisis validitas isi diperlukan adanya kisi-kisi tes yang disusun

sebelum soal-soal ditulis.

3. Validitas kriteria (criterion validity)

Validitas ini diketahui dengan cara empirik, yakni menghitung koefisien

korelasi antara tes bersangkutan dengan tes lain sebagai kriterianya. Yang

dapat digunakan sebagai kriteria adalah tes yang sudah dianggap valid, atau

nilai mata pelajaran yang sama yang dipandang cukup obyektif. Sebagai contoh,

skor tes Bahasa Inggris buatan guru dikorelasikan dengan skor tes Bahasa

Inggris yang telah dibakukan.Skor tes Matematika kelas I SMA dikorelasikan

86
dengan nilai rata-rata Matematika.Dengan rumus korelasi Pearson’s Product

Moment dan menggunakan kalkulator, perhitungan validitas criteria tersebut

tidak terlalu sulit, apalagi bila menggunakan komputer. Kesulitan utama dalam

menentukan validitas kriteria ialah mencari skor tes yang akan dijadikan kriteria.

Bila kriterianya buruk atau tidak valid, maka validitas tes yang diperoleh akan

percuma saja.

4. Validitas ramalan (predictive validity)

Validitas ini menunjukkan sejauh mana skor tes bersangkutan dapat

digunakan meramal keberhasilan siswa dimasa mendatang dalam bidang

tertentu. Cara menghitungnya sama seperti validitas kriteria, dalam hal ini skor

tes dikorelasikan dengan keberhasilan siswa di masa dating. Misalnya antara

nilai UAN ( Ujian Akhir Nasional ) di SMA, dengan prestasi belajar di perguruan

tinggi dalam mata pelajaran yang sama.

Suatu tes yang baik biasanya memiliki angka validitas 0,50 atau lebih;

tentu saja angka itu makin tinggi makin baik. Suatu tes dengan angka validitas

kurang dari 0,50 belum tentu buruk. Mungkin kriterianya yang buruk atau keliru

menentukan criteria.

C. Cara Mengetahui Reliabitas Tes

Reliabilitas tes adalah tingkat keajegan (konsistensi) suatu tes, yakni

sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang

ajeg/konsisten (tidak berubah-ubah).Tes yang reliabel atau dapat dipercaya

adalah tes yang menghasilkan skor secara ajeg, relatif tidak berubah walaupun

diteskan pada situasi dan waktu yang berbeda-beda. Sebaiknya, tes yang tidak

reliabel seperti karet untuk mengukur panjang, hasil pengukuran dengan karet

dapat berubah-ubah ( tidak konsisten ).

87
Ada tiga cara mengetahui reliabilitas tes. Pada prinsipnya diperoleh

dengan menghitung koefisien korelasi antara dua kelompok skor tes. Tiga cara

itu sebagai berikut.[6]

1. Tes-retest method (metoda tes ulang)

Suatu tes (yakni tes yang akan dihitung reliabilitasnya), diteskan terhadap

kelompok siswa tertentu dua kali dengan jangka waktu tertentu (misalnya satu

semester atau satu catur wulan).

Skor hasil pengetesan pertama dikorelasikan dengan skor hasil

pengetesan kedua.Koefisien korelasi yang diperoleh menunjukkan koefisien

reliabilitas tes tersebut.

Contoh:

Tes Pertama Tes Kedua

Siswa Skor Ranking Skor Ranking

A 15 3 20 3

B 20 1 25 1

C 9 5 15 5

D 18 2 23 2

E 12 4 18 4

Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh

semua siswa.

Metode ini disebut self-correlation method (korelasi diri sendiri) karena

mengkorelasikan hasil dari tes yang sama.

2. Paralel test method (metoda tes parallel)

Cara ini mengharuskan adanya dua tes yang parallel, yakni dua tes yang

disusun dengan tujuan yang sama (hanya sedikit perbedaan redaksi, isi atau

88
susunan kalimatnya). Dua tes tersebut diadministrasikan pada satu kelompok

siswa dengan perbedaan waktu beberapa hari saja. Skor dari kedua macam tes

tersebut dikorelasikan dengan teknik yang sama seperti pada metode tes-retest.

Koefisien korelasi yang diperoleh menunjukkan tingkat reliabilitas tes.

3. Split-half method (metode belah dua)

Kelemahan penggunaan metode dua-tes kali percobaan dan satu-tes dua

kali percobaan diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam

menggunakan metode ini pengetes hanya menggunakan sebuah tes dan

dicobakan satu kali. Oleh karena itu, disebut juga single-test-single-trial-method.

Berbeda dengan metode pertama dan kedua yang setelah diketemukan

koefisien dan korelasi langsung ditafsirkan itulah koefisien reliabitas maka

dengan metode ketiga ini tidak dapat demikian.Pada waktu membelah dua dan

mengkorelasikan dua belahan, baru diketahui reliabitas setengah tes.Untuk

mengetahui reliabitas seluruh tes harus digunakan rumus. Spearman-Brown

sebagai berikut:

Contoh:

2 × 𝑟½½
𝑟11 =
(1 + 𝑟½½)

Di mana:

r½½ = korelasi antara skor-skor setiap belahan tes

r11 = koefisien realibitas yang sudah disesuaikan

Contoh:

Korelasi antara belahan tes = 0,60

Maka Reliabilitas tes 2×0,60


(1+0,60) = 0,75

Banyak pemakai metode ini salah membelah hasil tes pada waktu,

menganalisis. Yang mereka lakukan adalah mengelompokkan hasil setengah

subjek peserta tes dan setengah yang lain kemudian hasil kedua kelompok ini

89
dikorelasikan. Yang benar adalah membelah item atau butir soal. Tidak akan

keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya butir soal

harus genap agar dapat dibelah.

Ada dua cara membelah butir soal:

a. Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut

belahan ganjil-genap, dan

b. Membelah atas item-item awal dan item-item akhir yaitu setengah jumlah

pada nomor-nomor awal dan setengah pada nomor-nomor akhir yang

selanjutnya disebut belahan awal-akhir.

D. Cara Mengetahui Analisis Butir Soal (Item Analysis)

Analisis butir soal atau analisis item adalah pengkajian pertanyaan-

pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas yang

memadai.[7] Ada dua jenis analisis butir soal, yakni analisis tingkat kesukaran

soal dan analisis daya pembeda disamping validitas dan reliabitas. Menganalisis

tingkat kesukaran soal artinya mengkaji soal-soal mana yang termasuk mudah,

sedang dan sukar.

Sedangkan menganalisis daya pembeda artinya mengkaji soal-soal tes

dari segi kesanggupan tes tersebut dalam membedakan siswa yang termasuk ke

dalam kategori lemah atau rendah dan kategori kuat atau tinggi

prestasinya.Sedangkan validitas dan reliabitas mengkaji kesulitan dan keajegan

pertanyaan tes.

Salah satu cara untuk memperbaiki proses belajar-mengajar yang paling

efektif ialah dengan jalan mengevaluasi test hasil belajar yang diperoleh hasil

belajar dari proses belajar-mengajar itu sendiri. Dengan kata lain, hasil test itu

kita oleh sedemikian rupa sehingga dari hasil pengolahan itu dapat diketahui

kompenan-kompenan manakakah dari proses belajar-mengajar itu yang masih

lemah.

90
Pengolahan test hasil belajar dalam rangka memperbaiki proses belajar-

mengajar dapat dilakukan dengan berbagai cara, antara lain:

1. Dengan membuat analisis soal (item analysis)

2. Dengan mennghitung validitas dan kaeandalan tes.

3. Dalam pasal ini khusus akan di bicarakan cara yang pertama,yaitu teknik

analisis soal atau yang biasa disebut item analisis.

Cara yang kedua, yaitu menghitung validititas dan keandalan tes.Menurut

thorndike dan hagen(1977), analisis terhadap soal-soal (items) tes yang telah di

jawab oleh murid-murid mempunyai dua tujuan penting. Pertama, jawaban-

jawaban soal itu merupakan informasi diagnostik untuk meneliti pelajaran dari

kelas itu dan kegagalan-kegagalan belajarnya, serta selanjutnya untuk

membimbing ke arah belajar yang lebih baik.

Kedua, jawaban-jawaban terhadap soal-soal yang terpisah dan perbaikan

(review) soal-soal yang didasarkan atas jawaban-jawaban itu merupakan basis

bagi penyiapan tes-tes yang lebih baik untuk tahun berikutnya.

Jadi, tujuan khususnya dari items analysis ialah mencari soal tes mana

yang baik dan mana yang tidak baik,dan mengapa items atau soal itu di katakan

baik atau tidak baik. Dengan mengetahui soal-soal yang tidak baik itu selanjutnya

kita dapat mencari kemungkinan sebab-sebab mengapa item itu tidak baik.

Dengan membuat analisis soal, sedikitnya kita dapat mengetahui tiga hal penting

yang dapat di peroleh dari tiap soal,yaitu:

1. Sampai dimana tingkat atau taraf kesukaran soal itu (difficulty levelof an

item).

2. Apakah soal itu mempunyai daya pembeda (discriminating power) sehingga

dapat membedakan kelompok siswa yang pandai dengan kelompok siswa

yang bodoh.

91
3. Apakah semua alternatif jawaban (options) menarik jawaban-jawaban

ataukah ada yang demikian tidak menarik tidak menarik sehingga tidak tidak

perlu dimasukkan ke dalam soal.

a. Taraf Kesukaran

Asumsi yang digunakan untuk memperoleh kualitas soal yang

baik, disamping memenuhi validitas dan reliabitas, adalah adanya

keseimbangan dari tingkat kesulitan soal tersebut.Keseimbangan yang

dimaksudkan adalah adanya soal-soal yang termasuk mudah, sedang,

sukar secara proporsional.Tingkat kesukaran soal dipandang dari

kesanggupan atau kemampuan siswa dalam menjawabnya, bukan dilihat

dari sudut guru sebagai pembuat soal.Persoalan yanng penting dalam

melakukan analisis tingkat kesukaran soal adalah penentuan proporsi

dan kriteria soal yang termasuk mudah, sedang, dan sukar.

Soal yang baik adalah soal yang tidak terlalu mudah atau tidak

terlalu sukar.Soal yang terlalu mudah tidak merangsang siswa untuk

mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar

akan menyebabkan siswa menjadi putus asa dan tidak mempunyai

semangat untuk mencoba lagi karena di luar jangkauannya.

Bilangan yang menunjukan sukar dan mudahnya sesuatu soal

tersebut indeks kesukaran (difficulty index). Besarnya indeks kesukaran

antara 0,00 sampai dengan 1,0. Indeks kesukaran ini menunjukan taraf

kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukan bahwa

soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukan bahwa soalnya

terlalu mudah.

0,0 1,0

Sukar Mudah

92
Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P (p

besar), singkatan dari kata “proporsi”. Dengan demikian maka soal

dengan P = 0,70 lebih mudah jika dibandingkan dengan P = 0,20.

Sebaliknya soal dengan P = 0,30 lebih sukar dengan P = 0,80.

Melihat besarnya bilangan indeks maka lebih cocok jika bukan

disebut sebagai indeks kesukaran tetapi indeks kemudahan atau indeks

fasilitas, karena semakin mudah soal itu, semakin besar pula bilangan

indeksnya.Akan tetapi telah disepakati bahwa walaupunseemakin tinggi

indeksnya menunjukan soal yang semakin mudah, tetapi tetap disebut

indeks kesukaran.

Rumus mencari P adalah:


𝐵
Rumus :𝑃 =
𝐽𝑆

Di mana:

P = Indeks kesukaran

B = Banyaknya siswa yang menjawab soal itu dengan betul

JS = Jumlah seluruh siswa peserta tes

b. Daya Pembeda

Daya pembeda soal adalah kemampuan sesuatu soal untuk

membedakan antara siswa yang pandai (berkemampuan tinggi) dengan

siswa yang bodoh (berkemampuan rendah).

Angka yang menunjukan besarnya daya pembeda disebut indeks

diskriminasi, disingkat D (d besar). Seperti hanya indeks kesukaran,

indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai

1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-

), tetapi pada indeks diskriminasi digunakan jika sesuatu soal “terbalik”

menunjukan kualitas testee.Yaitu anak pandai disebut bodoh dan anak

93
bodoh disebut pandai. Dengan demikian ada tiga titik pada daya

pembeda, yaitu:

-1,000,00 1,00

. daya pembeda daya pembeda daya pembeda

negatif rendah tinggi (positif)

Jawab benar oleh siswa pandai maupun siswa bodoh, maka soal

itu tidak baik karena tidak mempunyai daya pembeda.Demikian pula jika

semua siswa baik pandai maupun bodoh tidak dapat menjawab dengan

benar.Soal tersebut tidak baik juga karena tidak mempunyai daya

pembeda.Soal yang baik adalah soal yang dapat dijawab benar oleh

siswa-siswa pandai saja.

Analisis daya pembeda mengkaji butir-butir soal dengan tujuan

untuk mengetahui kesanggupan soal dalam membedakan siswa yang

tergolong mampu (tinggi prestasinya) dengan siswa yang tergolong

kurang atau lemah prestasinya.Artinya, bila soal tersebut diberikan

kepada anak yang mampu, hasilnya menunjukan prestasi yang tinggi;

dan bila diberikan kepada siswa yang lemah, hasilnya rendah.Tes

dikatakan tidak memiliki daya pembeda apabila tes tersebut, jika diujikan

kepada anak berprestasi, hasilnya rendah, tetapi bila diberikan kepada

anak yang lemah hasilnya lebih tinggi. Atau bila diiberikan kepada kedua

kategori siswa tersebut, hasilnya sama aja. Dengan demikian, tes yang

tiidak memiliki daya pembeda, tidak akan menghasilkan gambaran hasil

yang sesuai dengan kemampuan siswa yang sebenarnya. Sungguh

aneh bila anak pandai tidak lulus, tetapi anak bodoh lulus dengan baik

tanpa dilakukan manipulasi oleh si penilai atau di luar faktor kebetulan.

94
Cara yang biasa dilakukan dalam analisis daya pembeda adalah

dengan menggunakan tabel atau kriteria dari Rose dan Stanley seperti

berikut.

Di mana:

SR -

SR = Siswa yang menjawab salah dari kelompok rendah

ST = Siswa yang menjawab salah dari kelompok tinggi

Contoh:

Tes pilihan ganda atau option 4 diberikan kepada 30 orang

siswa.Jumlah soal 15. Setelah diperiksa, datanya adalah sebagai berikut:

Jumlah siswa Jumlah siswa

yang yang menjawab


No. Soal
menjawab salah kelompok SR - ST Ket.

salah tinggi (ST)

kelompok

rendah (SR)

1 6 1 5

2 6 1 5

3 5 2 3

4 6 1 5

5 2 1 1

6 5 1 4

7 2 1 1

8 7 1 6

9 7 1 6

95
10 4 2 2

11 3 1 2

12 6 1 2

13 2 1 5

14 6 1 1

15 5 2 3

c. Pola jawaban soal

Yang dimaksud pola jawaban disini adalah distribusi testee dalam hal

menentukan pilihan jawaban pada soal bentuk pilihan ganda.Pola jawaban soal

diperoleh dengan menghitung banyaknya testee yang memilih pilihan jawaban a,

b, c, atau d atau yang tidak memilih pilihan manapun (blangko). Dalam istilah

evaluasi disebut omit, disingkat O.

Dan pola jawaban soal dapat ditentukan apakah pengecoh (distractor)

berfungsi sebagai pengecoh dengan baiik atau tidak. Pengecoh yang tidak

dipilih sama sekali oleh testee berarti bahwa pengecoh itu jelek, terlalu menyolok

menyesatkan. Sebaliknya sebuah distraktor (pengecoh) dapat dikatakan

berfungsi dengan baik apabila distraktor tersebut mempunyai daya tarik yang

besar bagi pengikut-pengikut tes yang kurang memahami konsep atau kurang

menguasai bahan.

Dengan melihat pola jawaban soal, dapat diketahui:

1) Taraf kesukaran soal;

2) Daya pembeda soal;

3) Baik dan tidaknya distraktor.

Sesuatu distraktor dapat diperlukan dengan 3 (tiga) cara:

1) Diterima, karena sudah baik,

2) Ditolak, karena tidak baik, dan

96
97
3) Ditulis kembali, karena kurang baik.

Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga

hanya perlu ditulis kembali, dengan perubahan seperlunya.Menulis soal adalah

suatu pekerjaan yang sulit, sehingga apabila masih dapat diperbaiki, sebaiknya

diperbaiki saja, tidak dibuang.Suatu distraktor dapat dikatakan berfungsi baik jika

paling sedikit dipilih oleh 5% pengikut tes.

98
BAB IX

MANAJEMEN PENGUJIAN

Latar Belakang

Evaluasi merupakan bagian dari sistem manajemen yaitu perencanaan,

organisasi, pelaksanaan, monitoring dan evaluasi. Tanpa evaluasi, maka tidak

akan diketahui bagaimana kondisi objek evaluasi tersebut dalam rancangan,

pelaksanaan serta hasilnya. Istilah evaluasi sudah menjadi kosa kata dalam

bahasa Indonesia, akan tetapi kata ini adalah kata serapan dari bahasa Inggris

yaitu “evaluation”yang berarti penilaian atau penaksiran (Echols dan Shadily,

2000:220)

Evaluasi merupakan subsistem yang sangat penting dan sangat di

butuhkan dalam setiap sistem pendidikan, karena evaluasi dapat mencerminkan

seberapa jauh perkembangan atau kemajuan hasil pendidikan. Dengan evaluasi,

maka maju dan mundurnya kualitas pendidikan dapat diketahui, dan dengan

evaluasi pula, kita dapat mengetahui titik kelemahan serta mudah mencari jalan

keluar untuk berubah menjadi lebih baik ke depan.

Tanpa evaluasi, kita tidak bisa mengetahui seberapa jauh keberhasilan

mahasiswa, dan tanpa evaluasi pula kita tidak akan ada perubahan menjadi lebih

baik,maka dari itu Jadi secara umum evaluasi adalah suatu proses sistemik umtuk

mengetahui tingkat keberhasilan suatu program.

Evaluasi pendidikan dan pengajaran adalah proses kegiatan untuk

mendapatkan informasi data mengenai hasil belajar mengajar yang dialami

mahasiswa dan mengolah atau menafsirkannya menjadi nilai berupa data

kualitatif atau kuantitatif sesuai dengan standar tertentu. Hasilnya diperlukan

untuk membuat berbagai putusan dalam bidang pendidikan dan pengajaran.

99
Tes dikatakan baik sebagai alat ukur apabila memenuhi persyaratan tes,

yaitu memiliki: (1) validitas, (2) reliabilitas, (3) objektifitas, (4) praktisibilitas dan (5)

ekonomis. Sebuah tes dikatan valid apabila tes itu dapat tepat mengukur apa

yang hendak diukur. Tes dikatakan reliable apabila memberikan hasil yang tepat

apabila diteskan berkali-kali. Susunan tes dikatakan objektif apabila dalam

melaksanakan tes itu tidak ada faktor subjektif yang mempengaruhi. Sebuah tes

dikatakan memiliki praktisibilitas tinggi apabila tes tersebut bersifat praktis yaitu

mudah dilaksanakan, mudah pemeriksaannya dan dilengkapi petunjuk-petunjuk

yang jelas. Sedangkan persyaratan ekonomis artinya bahwa pelaksanaan tes

tersebut tidak membutuhkan biaya yang mahal, tenaga yang banyak dan waktu

yang lama(Arikunto, 2010: 23).

Seperti yang telah sebutkan di atas dengan berlakunya kurikulum tingkat

satuan pendidikan (KTSP) guru diberi keleluasaan dalam melakukan penilaian

mulai dari perencanaan sampai pelaksanaan, terutama dalam menyusun soal tes.

Baik tidaknya soal

100
tes sangat ditentukan oleh kemampuan guru dalam menyusun soal. Bahkan

biasanya lebih tinggi lagi yaitu tingkat karisidenan, agar evaluasi yang dilakukan

melalui penilaian dengan menggunakan tes sesuai dengan yang diharapkan maka

diperlukan adanya peninjauan kembali terhadap pelaksanaan evaluasi yang telah

dilaksanakan tersebut.

A. Pengertian Mnajemen Pengujian

Menurut Suharsimi Arikunto manajemen (pengelolaan) pendidikan

adalah suatu kegiatan atau rangkaian kegiatan yang berupa proses

pengelolaan atau usaha kerjasama sekelompok manusia yang tergabung

dalam organisasi pendidikan,untuk mencapai tujuaan pendidikan yang telah

ditetapkan sebelumnya agar efektif dan efesien.

Manajemen menurut Stoner merupakan proses perencanaan,

pengorganisasian, pengarahan dan pengawasan usaha-usaha para anggota-

organisasi dan penggunaan sumber daya organisasi lainnya agar mencapai

tujuan organisasi yang telah ditetapkan, sedangkan menurut Sudjana

manajemen merupakan rangkaian berbagai kegiatan wajar yang dilakukan

seseorang berdasarkan norma-norma yang telah ditetapkan dan dalam

pelaksanaannya memiliki hubungan dan saling berkaitan dengan lainnya. Hal

tersebut dilaksanakan oleh orang atau beberapa orang yang ada dalam

organisasi dan diberi tugas untuk melaksanakan kegiatan tersebut.

Setiap ahli memberikan pandangan yang berbeda tentang batasan

manajemen, karena itu tidak mudah memberi arti universal yang dapat

diterima semua orang, namun manajemen yang penulis maksud dalam

penelitian ini adalah suatu proses yang menggunakan

101
kemampuan atau keahlian untuk mencapai suatu tujuan yang didalam

pelaksaaananya kemampuan seseorang dalam memanajerial suatu

persoalan.

Pandangan yang lebih umum tentang pengertian manajemen

menurut Jhonson adalah proses mengintegrasikan sumber-sumber yang

tidak berhubungan menjadi system total untuk menyelesaikan suatu tujuan,

yang dimaksud sumber-sumber disini adalah mencakup orang-orang, alat

media barang, uang dan sarana yang akan diserahkan dan dikoordinasikan

agar terpusat dalam rangka penyelesaian tujuan.

Dari beberapa pengertian diatas dapat diambil kesimpulan bahwa

manajemen mengandung beberapa pengertian antara lain:

1. Manajemen sebagai suatu proses

2. Manajemen sebagai suatu aktifitas orang-orang yang melakukan

aktifitas manajemen

3. Manajemen sebagai suatu seni sekaligus sebagai suatu ilmu yang

akan dipelajari.

Dari beberapa pendapat ahli diatas mengenai manajemen

maka penulis dapat menarik suatu pandangan bahwa manajemen

merupakan suatu bentuk kegiatan yang terencana dan tersusun secara

sistematis dengan tujuan untuk mengelola dan menata dengan baik

sehingga sesuatu aktifitas dapat menghasilkan hasil yang baik.

Kehadiran manajemen dalam organisasi pendidikan berfungsi

untuk melaksanakan kegiatan agar suatu tujuan tercapai dengan efektif

dan efesien sehingga segala sesuatu yang dihasilkan dapat tertata dan

dikelola dengan baik.

102
Para ahli mempunyai pendapatyang berbeda tentang fungsi

dari manajemen, namun pada dasarnya fungsi dari manajemen adalah

perencanaan(planning), pengorganisasian (organizing), penggerakan,

(actuating), dan pengawasan (controlling)

1. Perencanaan (planning)

Perencanaan adalah proses penentuan tujuan atau sasaran

yang hendak dicapai dan menetapkan jalan dan sumber yang

diperlukan untuk mencapai tujuan itu. Menurut Rozer A. Kauffman

yang dikutip oleh Nanang Fattah bahwa dalam setiap perencanaan

selalu terdapat tiga kegiatan yang meskipun dapat dibedakan tetapi

tidak dapat dipisahkan. Kegiatan itu adalah:

a. Perumusan tujuan yang ingin dicapai

b. Pemilihan program untuk mencapai tujuan

c. Identifikasi dan pengerahan sumber yang jumlahnya selalu

terbatas.

2. Pengorganisasian (organizing)

Pengorganisasian adalah system kerja sama sekelolmpok

orang yang dilakukan dengan pembidangan dan pembagian

seluruh pekerjaan atau tugas dengan menentukan sejumlah satuan

atau unit kerja yang menghimpun pekerjaan sejenis dalam satu

satuan atau unit kerja.

3. Pengggerakan (actuating)

Penggerakan adalah menempatkan semua anggota dari pada

kelompok agar bekerja secara sadar untuk mencapai suatu tujuan

yang ditetapkan sesuai dengan perencanaan dan pola organisasi.

103
4. Pengawasan (controlling)

Pengawasan adalah proses pengamatan atau pemantauan

terhadap pelaksanaan kegiatan organisasi untuk menjamin agar

semua pekerjaan yang sedang dilakukan berjalan sesuai dengan

rencana yang telah ditentukan sebelumnya.

Pengawasan (controlling), dapat juga diartikan sebagai salah

satu kegiatan untuk mengetahui realisasi perilaku personel dalam

organisasi pendidikan dan apakah tingkat pencapaian tujuan

pendidikan sesuai dengan yang dikehendaki, kemudian apakah

perlu diadakan perbaikan. Pengawasan dilakukan untuk

mengumpulkan data tentang penyelenggaraan kerja sama antara

guru, kepala sekolah, konselor, supervisor, dan petugas madrasah

lainnya dalam institusi satuan pendidikan.

Pada dasarnya ada tiga langkah yang perlu ditempuh dalam

melaksanakan pengawasan, yaitu (1) menetapkan alat ukur atau

standar, (2) mengadakan penilaian atau evaluasi, dan (3)

mengadakan tindakan perbaikan atau koreksi dan tindak lanjut.

Oleh sebab itu, kegiatan pengawasan itu dimaksudkan untuk

mencegah penyimpangan dalam pelaksanaan pekerjaan, menilai

proses dan hasil kegiatan dan sekaligus melakukan tindakan

perbaikan.

5. Penilaian (evaluating)

Evaluasi merupakan salah satu komponen dari sistem

pendidikan yang harus dilakukan secara sistematis dan terencana

sebagai alat untuk mengukur keberhasilan atau target yang akan

dicapai dalam proses pendidikan dan pembelajaran. Evaluasi pada

104
dasarnya adalah memberikan pertimbangan atau harga atau nilai

berdasarkan kriteria tertentu.

Istilah "evaluasi" mempunyai pengertian banyak, antara lain

didefinisikan berdasarkan:

a. Menurut bahasa kata evaluasi berasal dari bahasa inggris

evalution yang berarti penilaian atau penaksiran.

b. Menurut istilah, evaluasi merupakan kegiatan yang terencana

untuk mengetahui keadaan suatu objek dengan menggunakan

instrument (alat) dan hasilnya dibandingkan dengan tolok ukur

untuk memperoleh kesimpulan.

c. Menurut Sidney P. Rollins,“Evaluation is the process of

making judgments”.(evaluasi merupakan proses pembuatan

keputusan,

dimulai dengan pengumpulan data-data dan informasi dan

akhirnya dibuat suatu kesimpulan).

d.James L. Mursell mengartikan evaluasi adalah “penghargaan

yang dijalankan dengan sadar dan secara diskrimainatif terhadap

proses belajar demi usaha perbaikan itu sendiri.”

e. Benjamin S. Bloom sebagaimana dikutip oleh Suke Silverius,

evaluasi merupakan “pengumpulan suatu kenyataan secara

sistematis untuk menetapkan apakah dalam kenyataannya

terjadi perubahan dalam diri sisiwa dan menetapkan sejuh mana

tingkat perubahan dalam diri pribadi siswa.”

f. Menurut W. S. Winkel SJ., evaluasi adalah “penentuan sampai

berapa jauh sesuatu berharga, bermutu atau bernilai.”

Dengan demikian dapat disimpulkan bahwa evaluasi secara

105
umum dapat diartikan sebagai kegiatan atau proses penentuan

nilai sehingga dapat diketahui mutu atau hasil-hasilnya.

Ada istilah yang hampir sama pengertiannya dengan

evaluasi, yaitu pengukuran (measurement) dan penilaian. Pada hal

istilah tersebut tidak sama artinya, namun masih ada kaitannya.

Pengukuran diartikan sebagai pekerjaan membandingkan sesuatu

hasil belajar siswa dengan ukuran yang sudah ditentukan.

Penilaian adalah suatu proses pemberian atau penentuan

nilai dengan tujuan pendidikan karena hasil belajar diukur untuk

mengetahui ketercapaian tujuan pendidikan melalui proses belajar

mengajar.

Mengukur adalah membandingkan sesuatu dengan satu

ukuran. Misalnya mengukur panjang meja dengan satuan panjang

yaitu meter, atau mengukur berat badan dengan satuan berat yaitu

kilogram. Hasil pengukuran bersifat kuantitatif. Penilaian adalah

kegiatan menilai. Menilai adalah mengambil suatu keputusan

terhadap sesuatu berdasarkan membandingkan hasil pengukuran

dengan suatu kriteria tertentu (ukuran baik buruk). Putusan itu

sesuai atau tidak sesuai dengan kriteria itu. Sedangkan kegiatan

mengevaluasi adalah kegiatan mengukur dan menilai itu. Jadi

kegiatan pengukuran, penilaian, dan evaluasi itu bersifat hierarkhis,

artinya dilakukan secara berurutan: dimulai dengan pengukuran,

dilanjutkan dengan penilaian, dan diakhiri dengan mengevaluasi.

Pengukuran menurut Guilford ( 1982) adalah proses

penetapan angka terhadap suatu gejala menurut aturan tertentu.

Pengukuran pendidikan berbasis kompetensi dasar berdasarkan

pada klasifikasi observasi unjuk kerja atau kemampuan peserta


106
didik dengan menggunakan suatu standar. Pengukuran dapat

menggunakan tes dan nontes. Tes adalah seperangkat prtanyaan

yang memiliki jawaban benar atau salah, atau suatu

pernyataan/permintaan untuk melakukan sesuatu. Nontes berisi

pertanyaan atau pernyataan yang tidak memiliki jawaban benar

atau salah. Instrumen nontes bisa berbentuk kuesioner atau

inventori. Kuesi pertanyaan atau perny oner berisi sejumlah ataan,

peserta didik diminta menjawab atau memberikan pendapat

terhadap pernyataan. Inventori merupakan instrumen yang berisi

tentang laporan diri yaitu keadaan peserta didik, misalnya potensi

peserta didik.

Pengujian merupakan bagian dari pengukuran yang dilanjutkaan

dengan penilaian. Ada istilah ujian akhir semester di perguruan tinggi

dan ujian akhir tahun untuk kenaikan kelas di sekolah. Dalam bahan

sosialisasi Kurikulum Berbasis Kompetensi pengertian tersebut

dijelaskan sbb.: Pengukuran adalah kegiatan yang sistematik untuk

menentukan angka pada objek atau gejala. Pengujian terdiri dari

sejumlah pertanyaan yang memiliki jawaban benar atau salah.

Penilaian adalah penafsiran hasil pengukuran dan penentuan

pencapaian hasil belajar Evaluasi adalah penentuan nilai suatu

program dan penentuan pencapaian tujuan suatu program.

B. Prinsip –prinsip Dalam Pengujian

1. Keterpaduan

Pengujian harus dilakukan dengan prinsip keterpaduan antara tujuan

intrusional pengajaran, materi pembelajaran dan metode pengajaran

107
2. Keterlibatan peserta didik

Prinsip ini merupakan suatu hal yang mutlak, karena keterlibatan

peserta didik dalam pengujian bukan alternatif, tapi kebutuhan mutlak.

3. Koherensi

Pengujian harus berkaitan dengan materi pengajaran yang telah

dipelajari dan sesuai dengan ranah kemampuan peserta didik yang

hendak diukur

4. Pedagogis

Perlu adanya tool penilai dari aspek pedagogis untuk melihat

perubahan sikap dan perilaku sehingga pada akhirnya hasil evaluasi

mampu menjadi motivator bagi diri siswa.

5. Akuntabel

Hasil dari pengujian haruslah menjadi alat akuntabilitas atau bahan

pertnggungjawaban bagi pihak yang berkepentingan seeprti orangtua siswa,

sekolah, dan lainnya.

C. Tekhnik Pengujian

Teknik Pengujian digolongkan menjadi 2 yaitu teknik tes dan teknik

non Tes.

1. Teknik non tes meliputi ; skala bertingkat, kuesioner,daftar cocok,

wawancara, pengamatan, riwayat hidup.

a. Rating scale atau skala bertingkat menggambarkan suatu nilai dalam

bentuk angka. Angka-angak diberikan secara bertingkat dari anggak

terendah hingga angkat paling tinggi. Angka-angka tersebut kemudian

dapat dipergunakan untuk melakukan perbandingan terhadap angka

yang lain.

108
b. Kuesioner adalah daftar pertanyaan yang terbagi dalam beberapa

kategori. Dari segi yang memberikan jawaban, kuesioner dibagi menjadi

kuesioner langsung dan kuesioner tidak langsung. Kuesioner langsung

adalah kuesioner yang dijawab langsung oleh orang yang diminta

jawabannya. Sedangkan kuesiioner tidak langsung dijawab oleh secara

tidak langsung oleh orang yang dekat dan mengetahui si penjawab

seperti contoh, apabila yang hendak dimintai jawaban adalah seseorang

yang buta huruf maka dapat dibantu oleh anak, tetangga atau anggota

keluarganya. Dan bila ditinjau dari segi cara menjawab maka kuesioner

terbagi menjadi kuesioner tertutup dan kuesioner terbuka. Kuesioner

tertututp adalah daftar pertanyaan yang memiliki dua atau lebih jawaban

dan si penjawab hanya memberikan tanda silang (X) atau cek (√) pada

awaban yang ia anggap sesuai. Sedangkan kuesioner terbuka adalah

daftar pertanyaan dimana si penjawab diperkenankan memberikan

jawaban dan pendapat nya secara terperinci sesuai dengan apa yang ia

ketahui.

c. Daftar cocok adalah sebuah daftar yang berisikan pernyataan beserta

dengan kolom pilihan jawaban. Si penjawab diminta untuk memberikan

tanda silang (X) atau cek (√) pada jawaban yang ia anggap sesuai.

d. Wawancara, suatu cara yang dilakukan secara lisan yang berisikan

pertanyaan-pertanyaan yang sesuai dengan tujuan informsi yang hendak

digali. wawancara dibagi dalam 2 kategori, yaitu pertama, wawancara

bebas yaitu si penjawab (responden) diperkenankan untuk memberikan

jawaban secara bebas sesuai dengan yang ia diketahui tanpa diberikan

batasan oleh pewawancara. Kedua adalah wawancara terpimpin dimana

pewawancara telah menyusun pertanyaan pertanyaan terlebih dahulu

109
yang bertujuan untuk menggiring penjawab pada informsi-informasi yang

diperlukan saja.

e. Pengamatan atau observasi, adalah suatu teknik yang dilakuakn dengan

mengamati dan mencatat secara sistematik apa yang tampak dan

terlihat sebenarnya. Pengamatan atau observasi terdiri dari 3 macam

yaitu :

1) Observasi partisipan yaitu pengamat terlibat dalam kegiatan kelompok

yang diamati.

2) Observasi sistematik, pengamat tidak terlibat dalam kelompok yang

diamati. Pengamat telah membuat list faktor faktor yang

telah diprediksi sebagai memberikan pengaruh terhadap sistem

yang terdapat dalam obejek pengamatan.

f. Riwayat hidup, evaluasi ini dilakukan dengan mengumpulkan data

dan informasi mengenai objek evaluasi sepanjang riwayat hidup

objek evaluasi tersebut.

2. Teknik Tes

Dalam evaluasi pendidikan terdapat 3 macam tes yaitu :

a. Formatif

Evaluasi formatif adalah evaluasi yang dilakukan pada setiap

akhir pembahasan suatu pokok bahasan / topik, dan dimaksudkan

untuk mengetahui sejauh manakah suatu proses pembelajaran

telah berjalan sebagaimana yang direncanakan. Winkel

menyatakan bahwa yang dimaksud dengan evaluasi formatif

adalah penggunaan tes-tes selama proses pembelajaran yang

masih berlangsung, agar siswa dan guru memperoleh informasi

(feedback) mengenai kemajuan yang telah dicapai. Sementara

Tesmer menyatakan formative evaluation is a judgement of the

110
strengths and weakness of instruction in its developing stages, for

purpose of revising the instruction to improve its effectiveness and

appeal. Evaluasi ini dimaksudkan untuk mengontrol sampai

seberapa jauh siswa telah menguasai materi yang diajarkan pada

pokok bahasan tersebut. Wiersma menyatakan formative testing is

done to monitor student progress over period of time. Ukuran

111
keberhasilan atau kemajuan siswa dalam evaluasi ini adalah

penguasaan kemampuan yang telah dirumuskan dalam rumusan

tujuan (TIK) yang telah ditetapkan sebelumnya. TIK yang akan dicapai

pada setiap pembahasan suatu pokok bahasan, dirumuskan dengan

mengacu pada tingkat kematangan siswa. Artinya TIK dirumuskan

dengan memperhatikan kemampuan awal anak dan tingkat kesulitan

yang wajar yang diperkiran masih sangat mungkin dijangkau/ dikuasai

dengan kemampuan yang dimiliki siswa. Dengan kata lain evaluasi

formatif dilaksanakan untuk mengetahui seberapa jauh tujuan yang

telah ditetapkan telah tercapai. Dari hasil evaluasi ini akan diperoleh

gambaran siapa saja yang telah berhasil dan siapa yang dianggap

belum berhasil untuk selanjutnya diambil tindakan-tindakan yang

tepat. Tindak lanjut dari evaluasi ini adalah bagi para siswa yang

belum berhasil maka akan diberikan remedial, yaitu bantuan khusus

yang diberikan kepada siswa yang mengalami kesulitan memahami

suatu pokok bahasan tertentu. Sementara bagi siswa yang telah

berhasil akan melanjutkan pada topik berikutnya, bahkan bagi mereka

yang memiliki kemampuan yang lebih akan diberikan pengayaan,

yaitu materi tambahan yang sifatnya perluasan dan pendalaman dari

topik yang telah dibahas.

b. Sumatif

Evaluasi sumatif adalah evaluasi yang dilakukan pada setiap

akhir satu satuan waktu yang didalamnya tercakup lebih dari satu

pokok bahasan, dan dimaksudkan untuk mengetahui sejauhmana

peserta didik telah dapat berpindah dari suatu unit ke unit berikutnya.

112
Winkel mendefinisikan evaluasi sumatif sebagai penggunaan tes-tes

pada akhir suatu periode pengajaran tertentu, yang meliputi beberapa

atau semua unit pelajaran yang diajarkan dalam satu semester,

bahkan setelah selesai pembahasan suatu bidang studi.

c. Diagnostik

Evaluasi diagnostik adalah evaluasi yang digunakan untuk mengetahui

kelebihan-kelebihan dan kelemahan-kelemahan yang ada pada siswa

sehingga dapat diberikan perlakuan yang tepat. Evaluasi diagnostik

dapat dilakukan dalam beberapa tahapan, baik pada tahap awal,

selama proses, maupun akhir pembelajaran. Pada tahap awal

dilakukan terhadap calon siswa sebagai input. Dalam hal ini evaluasi

diagnostik dilakukan untuk mengetahui kemampuan awal atau

pengetahuan prasyarat yang harus dikuasai oleh siswa. Pada tahap

proses evaluasi ini diperlukan untuk mengetahui bahan-bahan

pelajaran mana yang masih belum dikuasai dengan baik, sehingga

guru dapat memberi bantuan secara dini agar siswa tidak tertinggal

terlalu jauh. Sementara pada

tahap akhir evaluasi diagnostik ini untuk mengetahui tingk penguasaan

siswa atas seluruh materi yang telah dipelajarinya.

D. Prosedur Pelaksanaan

Dalam melaksanakan evaluasi pendidikan hendaknya

dilakukan secara sistematis dan terstruktur. Sebagaimana telah

dikemukakan sebelumnya bahwa evaluasi pendidikan secara garis

besar melibatkan 3 unsur yaitu input, proses dan out put. Apabila

prosesdur yang dilakukan tidak bercermin pada 3 unsur tersebut maka

dikhawatirkan hasil yang digambarkan oleh hasil evaluasi tidak mampu

menggambarkan gambaran yang sesungguhnya terjadi dalam proses

113
pembelajaran. Langkah-langkah dalam melaksanakan kegiatan

evaluasi pendidikan secara umum adalah sebagai berikut :

1. Penentuan tujuan tes

2. Penyusunan kisi-kisi tes

3. Penulisan tes

4. Penelaahan soal (review dan revisi soal)

5. Uji-coba soal, termasuk analisisnya

6. Perakitan soal menjadi perangkat tes

7. Penyajian tes

8. Skoring

9. Pelaporan hasil tes

10. Pemanfaatan hasil tes

1. Penentuan Tujuan Tes

Dalam melakukan evaluasi, seorang guru tentu mempunyai

tujuan tertentu, baik berupa tujuan khusus, yaitu untuk melihat

tingkat pencapaian suatu program. Dalam hal ini evaluasi bertujuan

untuk mengetahui penguasaan peserta didik dalam salah satu materi

pembelajaran tertentu setelah diajarkan. Tes ini juga dapat bertujuan

untuk mengetahui kesulitan belajar siswa (tes diagnostik). Tujuan tes

harus jelas agar dapat memberikan arah dan lingkup pengembangan

tes selanjutnya.

2. Penyusunan Kisi-Kisi

Kisi-kisi tes merupakan deskripsi mengenai ruang lingkup

dan isi dari apa yang akan diujikan, serta memberikan perincian

mengenai soal-soal yang diperlukan oleh tes tersebut.

114
3. Penulisan Soal

Penulisan soal Penulisan soal merupakan salah satu

langkah penting untuk dapat menghasilkan alat ukur atau tes yang

baik. Penulisan soal adalah penjabaran indikator jenis dan tingkat

perilaku yang hendak diukur menjadi pertanyaan-

pertanyaan yang karakteristiknya sesuai dengan perinciannya dalam

kisi-kisi. Dengan demikian setiap pertanyaan atau butir soal perlu

dibuat sedemikian rupa sehingga jelas apa )'ang ditanyakan dan

jelas pula jawaban apa yang dituntut. Mutu setiap butir soal akan

menentukan mutu tes secara keseluruhan.

4. Telaah dan Perbaikan (Review dan revisi) Soal

Langkah ini merupakan hal penting untuk diperhatikan,

karena seringkali kekurangan yang terdapat pada suatu soal tidak

terlihat oleh penulis soal. Review dan revisi soal ini idealnya

dilakukan oleh orang lain (bukan si penulis soal) dan terdiri dari

suatu tim penelaah yang terdiri dari ahli-ahli bidang studi,

pengukuran, dan bahasa.

5. Ujicoba Soal

Ujicoba soal pada prinsipnya adalah upaya untuk

mendapatkan informasi empirik mengenai sejauh mana sebuah

soal dapat mengukur apa yang hendak diukur. Informasi empirik

tersebut pada umumnya menyangkut segala hal yang dapat

mempengaruhi validitas soal seperti aspek-aspek "keterbacaan"

24

115
115

soal, tingkat kesukaran soal, pola jawaban, tingkat daya

pembeda soal, pengaruh budaya, dan sebagainya.

6. Perakitan Soal

Agar skor tes yang diperoleh dapat dipercaya,

diperlukan banyak butir soal. Sebab itu, dalam

penyajiannya butir-butir soal perlu dirakit menjadi suatu

alat ukur yang terpadu. Hal- hal yang dapat mempengaruhi

validitas skor tes seperti urutan nomor soal,

pengelompokan bentuk-bentuk soal, kalau dalam satu

perangkat tes terdapat lebih dari satu bentuk soal, tata

"lay-out" soal, dan sebagainya haruslah diperhatikan

dalam perakitan soal menjadi sebuah tes.

7. Penyajian Tes

Setelah tes tersusun, naskah (tes) siap diberikan

atau disajikan kepada peserta didik' Hal-hal yang perlu

diperhatikan dalam penyajian tes ini adalah waktu

penyajian, petunjuk yang jelas mengenai cara menjawab

atau mengerjakan tes, ruangan dan tempat duduk peserta

didik. Pada prinsipnya, hal-hal yang menyangkut segi

administratif penyajian tes harus diperhatikan sehingga

pengetesan dapat terselenggara dengan lancar dan baik.

116
116

8. Skoring atau pemeriksaan terhadap jawaban peserta didik

dan pemberian angka merupakan langkah untuk

mendapatkan informasi kuantitatif dari masing-masing

siswa. Pada prinsipnya, skoring ini harus diusahakan agar

dapat dilakukan secara obyektif. Artinya, apabila skoring

dilakukan oleh dua orang atau lebih, yang sama tingkat

kompetensinya, akan menghasilkan skor atau angka yang

sama. Atau jika orang yang sama mengulangi proses

penskoran, akan dihasilkan skor yang sama.

9. Pelaporan Hasil Tes

Setelah tes dilaksanakan dan dilakukan skoring,

hasil pengetesan tersebut perlu dilaporankan. Laporan

tersebut dapat diberikan kepada peserta didik yang

bersangkutan, kepada orang tua peserta didik, kepada

Kepala Sekolah, dsb. Laporan kepada masing-masing

yang berkepentingan dengan hasil tes ini sangat penting

karena dapat memberikan informasi yang sangat berguna

dalam rangka penentuan kebijakan atau kebijaksanaan

selanjutnya.

10. Pemanfaatan Hasil Tes

Hasil pengukuran yang diperoleh melalui

pengetesan sangat berguna sesuai dengan tujuan

pengetesan. Informasi atau data hasil pengukuran dapat

117
117

dimanfaatkan untuk perbaikan atau penyempurnaan

sistem, proses atau kegiatan belajar mengajar, maupun

sebagai data untuk mengambil keputusan atau

menentukan kebijakan. Contoh, hasil tes formatif (yang

bertujuan untuk memantau/memperbaiki kegiatan belajar

mengajar) dapatdigunakan untuk mengulangi pelajaran,

memperbaiki metode mengajar, atau melanjutkan

pelajaran.

Hal-hal seperti di atas itulah yang seharusnya dilakukan

oleh seorang evaluator agar dapat menciptakan evaluasi

pendidikan yang komprehensif dan akuntabel.

118
118

DAFTAR PUSTAKA

Daryanto. 1997. Evaluasi Pendidikan. Solo: Rineka Cipta.

Djiwandon, Sri Esti W. (2004). Psikologi Pendidikan (Rev-2). Jakarta:


Gramedia

Djaali & Mulyono, Pudji. (2007). Pengukuran dalam Bidang Pendidikan.


Jakarta: Grasindo

Masidjo, Ign. (1995). Penilaian Hasil Belajar Siswa Di Sekolah. Yogjakarta:


Kanisius.

Rahardjo, Susilo & Gudnanto. (2011) Pemahaman Individu (teknik Non


Tes). Kudus:

Purwanto, Ngalim. (2006). Prinsip-Prinsip dan Teknik Evaluasi


Pengajaran. Bandung: PT Remaja Rosdakarya.

Sudijono, Anas. (2001). Pengantar Evaluasi pendidikan. Jakarta: Raja


Grafindo Persada.

Sanjaya, Wina. 2008. Kurikulum dan Pembelajaran. Bandung: Kencana


Prenada Media Group.

Sukardi. (2008). Evaluasi Pendidikan. Jakarta: Bumi Aksara

Departemen Pendidikan Nasional Direktorat Jenderal Manajemen


Pendidikan Dasar dan Menengah Direktorat Pembinaan Sekolah
Menengah Atas Tahun 2008, Online),
(file.upi.edu/Direktori/.../JUR.../26_penyusunan_lhb SMP.pdfp)
Keputusan Dirjen Mandikdasmen Nomor: 12/C/KEP/TU/2008 tentang
Bentuk Dan Tatacara Penyusunan Laporan Hasil Belajar Peserta
Didik Satuan Pendidikan Dasar Dan Menengah (SD/MI/SDLB,
SMP/MTs./SMPLB, dan SMA/MA/SMK/SMALB), (Online),
(file.upi.edu/Direktori/SPS/PRODI.PENDIDIKAN.../PENILAIAN.pdf),
diakses 17 Februari 2016.

119
119

Ramadhani, Kurnia. 2011. Membuat Laporan Hasil Evaluasi, (Online),

(file:///C:/Users/E10-30/Downloads/evaluasi/membuat-laporan-

hasil-evaluasi.html)

120

Anda mungkin juga menyukai