Anda di halaman 1dari 147

DI SUSUN OLEH:

ISVA NASARI ISHAK

(NIM: 191302061)

KELAS: E19

PROGRAM PENDIDIKAN DIV KEBIDANAN FAKULTAS KEPERAWATAN


UNIVERSITAS INDONESIA TIMUR
MAKASSAR
2020
MATA KULIAH : EVALUASI PENDIDIKAN
KODE MATA KULIAH : 2BD.610
BEBAN STUDI : 2 SKS (T=1P=1)
PENEMPATAN : SEMESTER VII

Deskripsi Mata Kuliah


Mata kuliah ini membahas tentang perencanaan evaluasi dan
pelaksanaan evaluasi hasil belajar dan evaluasi pendidikan mata kuliah ini
menggunakan competency based lerning serta metode interaktif yang
membentuk mahasiswa terlibat aktip.
Tujuan Instruksional Umum (TIU)
Setelah mengikuti perkuliahan mahasiswa memiliki kemampuan dalam
merencanakan melaksanakan dan mengevaluasi hasil pembelajaran serta
proses pendidikan kebidanan.
Tujuan Instruksional Khusus (TIK)
Setelah menyelesaikan mata kuliah ini mahasiswa di harapkan
berkompoten mampu:
1. Menjelaskan definisi evaluasi berbasis kompetensi ciri-ciri dan prinsip
evaluasi
2. Menjelaskan kesahihan dan keterandalan evaluasi
3. Menjelaskan hasil evaluasi belajar (fungsi,sasaran, prosedur evaluasi)
4. Menjelaskan macam-macam metode evaluasi
5. Menjelaskan evaluasi program pendidikan
6. Melaksanakan teori tes klasik
7. Melaksanakan konstruksi tes
8. Melaksanakan analisis tes
9. Melaksanakan menajemen pengujian
POKOK BAHASAN:
1. Definisi evaluasi berbasis kompetensi, ciri-ciri dan prinsip evaluasi
2. Menjelaskan kesahihan dan keterandalan evaluasi
3. Hasil evaluasi belajar (fungsi,sasaran, prosedur evaluasi)
4. Macam-macam metode evaluasi
5. Evaluasi program pendidikan
6. Teori tes klasik
7. Konstruksi tes
8. Analisis tes
9. Menajemen pengujian
Pustaka
1. Anas Sudijono, Pengantar Evaluasi Pendidikan, hlm. 73, 75
2. Anas Sudijono, Pengantar Evaluasi Pendidikan, ( 2012 : 67)
3. Arifin, Z. 2011. Evaluasi Pembelajaran. Bandung: PT. Remaja Rosdakarya
4. Arikanto, S. 2013. Dasar-Dasar Evaluasi Pendidikan.Jakarta : PT.Bumi
Aksara
5. Arikunto, Suharsimi. 2008. Evaluasi Program Pendidikan. Jakarta; Bumi
Aksara
6. Allen, MJ, & Yen, WM (2002).Introduction to Measurement Theory. Long
Grove, IL: Waveland Press. Allen, MJ, & Yen, WM (2002):.Pengenalan
Pengukuran untuk IL.Teori Long Grove, Tekan Waveland.
7. Djaali. 2004. Pengukuran Dalam Bidang Pendidikan. Jakarta: Program
Pascasarjana UNJ
8. Diambil dari Z Arifin - 2009 - winarno.staff.iainsalatiga.ac.id
9. Dr. Suke Silverius. 1991. Evaluasi Hasil Belajar dan Umpan Balik. Jakarta:
PT. Gramedia Widiasarana Indonesia.
10. Dr. Muhibbin Syah, M.Ed. 2010. Psikologi Pendidikan. Bandung : PT
Remaja Rosdakarya.
11. https://www.academia.edu/19927305/Evaluasi_berbasis_kompetensi_4
12. https://www.academia.edu>makalahkonstruksitest
13. https://captainkodox19.blogspot.com/2012/12/penilaian-atau-evalusi-
berbasis-kompetensi_18.html
14. https://iie-choooy.blogspot.com/2012/09/prinsip-prinsip-evaluasi-
pembelajaran.html
15. http://repository.uinsu.ac.id/928/1/Buku%20Evaluasi
%20Pembelajaran.pdf\
16. https://semuailmiah.blogspot.com/2011/02/bab-i-pengertian-tujuan-
fungsi-dan-ciri.html
17. https://www.ilmuakademika.com/2016/09/makalah-penilaian-berbasis-
kompetensi.html
18. http://teoribagus.com/teori-tes-klasik-dan-tes-modern
19. https://pepuny.blogspot.com/2007/11/teori-tes-klasik08.html
20. https://www.semestapsikometrika.com/2017/07/sekilas-tentang-teori-tes-
klasik.html
21. https://www.academia.edu/7611635/KONSTRUKSI_TEST_ALAT_UKUR
_ATRIBUT_KOGNITIF
22. https://gdsy.blogspot.com/2012/10/kontruksi-alat-ukur-pert-4-html
23. https://www.kompasiana.com/delimaps/54f964efa33311a13d8b51c9/pem
aha-man-mahasiswa-tentang-konstruksi-tes
24. Mulyadi. 2010. Evaluasi Pendidikan. Malang: Maliki Press.
25. Rahmawati – Jurnal BK UNESA, 2017 – jurnalmahasiswa.unesa.ac.id
26. Suwandi, Sarwiji. 2011. Model-model Asesmen dalam Pembelajaran.
Surakarta: Yuma Pustaka
BAB I
EVALUASI BERBASIS KOMPETENSI

I. PENDAHULUAN

A. Deskripsi Singkat

Dalam materi ini membahas tentang pengertian evaluasi

berbasis kompetensi, Tujuan evaluasi, Fungsi evaluasi, ciri-ciri

evaluasi, dan prinsip-prinsip evaluasi.Mata kuliah ini akan membentuk

mahasiswa terlibat aktif dalam pembelajaran.

B. Manfaat

Mata kuliah ini merupakan pengetahuan dasar yang

mendukung mahasiswa agar lebih aktif dalam melaksanakan evaluasi

belajar. Mata kuliah ini sangat membantu mahasiswa dalam

meningkatkan prestasi belajar. Dengan memahami secara tepat mata

kuliah ini, akan sangat membantu mahasiswa dalam meningkatkan

kegiatan belajar.

C. Tujuan Instruksional Umum

Setelah mengikuti perkuliahan mahasiswa memiliki kemampuan dalam

merencanakan, melaksanakan dan mengevaluasi hasil pembelajaran.

D. Tujuan Instruksional Khusus


Setelah mengikuti mata kuliah ini mahasiswa akan dapat mengetahui

pengertian Evaluasi Berbasis Kompetensi dan melaksanakannya.

II. PENYAJIAN

A. Definisi Evaluasi Berbasis Kompetensi

Pada pembahasan tentang penilaian berbasis kompetensi,

bahwa istilah kompetensi dimaknai sebagai kebulatan pengetahuan,

keterampilan dan sikap yang dapat didemonstrasikan atau

ditampilkan oleh siswa dalam berfikir dan bertindak.Istilah evaluasi

diartikan sebagai penetuan nilai program dan penentuan pencapaian

tujuan suatu program, sedangkan penilaian dapat diartikan sebagai

penafsiran hasil pengukuran dan penentuan hasil belajar.

Penilaian berbasis kompetensi adalah uraian keterangan yang

teratur sebagai penjelasan prosedur dan cara menilai pencapaian

kompetensi oleh siswa. Selain itu penilaian berbasis kompetensi juga

dapat dirtikan sebagai teknik evaluasi yang harus dilakukan guru

dalam pembelajaran di sekolah.Instrumen penilaiannya

dikembangkan mengacu pada pada indikator-indikator pencapaian

kompetensi yang di tetapkan.Penilaian mencakup semua kompetensi

dasar.Penilaian dilakukan untuk memperoleh informasi tentang

kemajuan yang dicapai dan ketuntasan penguasaan kompetensi dari

siswa. Teknik dan pelaksanaannya diatur dalam :


1. Undang-undang Republik Indonesia No. 20 tahun 2003 tentang
Sistem Pendidikan Nasional.
2. Peraturan Pemerintah No.19 Tahun 2005 tentang standar

Nasional Pendidikan.

3. Peraturan Menteri Pendidikan Nasional No.22 Tahun 2006 tentang

Standar Isi.

4. Peraturan Pemerintah Pendidikan Nasional No.23 Tahun 2006

tentang Standar Kompetensi Lulusa.

5. Peraturan Pemerintah Nasional No.20 Tahun 2007 tentang

Standar Penilaian Pendidikan

Standar Kompetensi dan Kompetensi Dasar di dalam Standar

Isi menjadi fokus perhatian utama dalam penilaian.Untuk mengetahui

tingkat pencapaian kompetensi, guru dapat melakukan penilaian

melalui tes dan non tes. Tes meliputi tes lisan, tertulis(bentuk uraian,

pilihan ganda, jawaban singkat, isian, menjodohkan, benar-salah),

dan tes perbuatan yang meliputi: kinerja, penugasan, dan hasil katya.

Penilaian non-tes contohnya seperti penilaian sikap, minat, motivasi,

penilaian diri, portofolio, lifeskill.Tes perbuatan dan penilaian non tes

dilakukan melalui pengamatan (observasi).

B. Tujuan dan fungsi penilaian berbasis kompetensi

Secara umum penilaian berbasis kompetensi bertujuan untuk

mengetahui pengetahuan awal siswa, mengetahui tingkat pencapaian

kompetensi, mengetahui perkembangan siswa, mendiagnosis

kesulitan belajar siswa, mengetahui hasil suatu proses pembelajaran,


memotivasi siswa belajar, dan memberi umpan balik kepada guru

tentang pembelajaran yang dikelola.

Penilaian berbasis kompetensi memiliki sejumlah fungsi, yaitu

sebagai bahan pertimbangan dalam menentukan kenaikan kelas,

umpan balik dalam perbaikan program pengajaran, alat pendorong

dalam meningkatkan kemampuan peserta didik, dan sebagia alat bagi

peserta didik untuk melakukan evaluasi terhadap kinerja,

serta  bercermin diri (instropeksi diri).

C. Ciri – ciri Penilaian Berbasis Kompetensi

Penilaian berbasis kompetensi memiliki ciri – cirri sebagai berikut:

1. Harus memenuhi prinsip - prinsip dasar penilaian

2. Harus menggunakan acuan dan patokan belajar tuntas

3. Berorientasi pada kompetensi

4. Terintegrasi dengan proses pembelajaran

5. Dilakukan oleh guru dan siswa.

D. Prinsip –Prinsip Penilaian Berbasis Kompetensi

Dalam proses pelaksanaan evaluasi dengan sistem penilaian

berbasis kompetensi terdapat beberapa prinsip yang harus

diperhatikan, diantaranya yaitu :

1. Valid
Penilaian berbasis kompetensi harus mengukur apa yang

seharusnya diukur dengan menggunakan alat yang dapat

dipercaya dan sahih.

2. Keterbukaan

Penilaian berbasis kompetensi adalah penilaian yang

dilaksanakan secara terbuka, artinya guru sebagai evaluator bukan

hanya berperan sebagai orang yang memberi nilai atau kritik, akan

tetapi siswa yang dievaluasi perlu memahami mengapa kritik itu

muncul, oleh sebab itu guru harus terbuka melalui argumentasi

yang tepat dalam setiap memberikan penilaian.

3. Adil dan Obyektif

Penilaian harus adil terhadap semua siswa dan tidak

membeda-bedakan latar belakang siswa.

4. Mendidik

Penilaian harus memberi sumbangan yang positif terhadap

pencapaian hasil belajar siswa.Penilaian ini dapat dirasakan

sebagai penghargaan yang memotivasi bagi siswa yang berhasil

dan sebagai pemicu semangat bagi siswa yang kurang berhasil.

5. Berkesinambungan
Penilaian dilakukan secara berencana, bertahap, teratur, terus-

menerus dan berkesinambungan untuk memperoleh gambaran

tentang perkembangan kemajuan belajar siswa.

6. Bermakna

Penilaian hendaknya mudah dipahami dan mudah ditindak

lanjuti oleh pihak-pihak yang berkepentingan.

7. Berorientasi pada Proses dan Hasil

Penilaian berbasis kompetensi bertumpu pada dua sisi yang

sama pentingnya, yakni sisi proses dan hasil belajar secara

seimbang. Penilaian berbasis kompetensi  mengikuti setiap aspek

perkembangan siswa, bagaimana cara belajar siswa, bagaimana

motivasi belajar, sikap, minat, kebiasaan, dan lain sebagainya dan

pada akhirnya menilai bagaimana hasil belajar yang diperoleh

siswa.

E. Ciri-Ciri Evaluasi

Dalam buku Succeful Teaching karangan J.Mursell yang

diterjemahkan ke dalam bahasa Indonesia oleh J. Mursell dan

S.Nasution (tanpa tahun : 23) dikemukakan bahwa ciri-ciri evaluasi

yang baik adalah” evaluasi dan hasil langsung, evaluasi dan transfer,

dan evaluasi langsung dari proses belajar”.

1. Evaluasi dan hasil langsung


Dalam proses pembelajaran, guru sering melakukan kegiatan

evaluasi, baik ketika proses pembelajaran sedang berlangsung,

maka guru ingin mengetahui keefektifan dan kesesuaian strategi

pembelajaran dengan tujuan yang ingin dicapai. Jika evaluasi

dilakukan sesudah proses pembelajaran selesai, berarti guru ingin

mengetahui hasil atau prestasi belajar yang diperoleh peserta didik.

2. Evaluasi dan transfer

Hal penting yang berkenaan dengan proses belajar adalah

kemungkinan mentransfer hasil yang dipelajari kedalam situasi

yang fungsional. Dasar pemikiran ini merupakan asas psikologis

yang logis dan rasional. Peserta didik tidak dapat disebut telah

menguasai ilmu tajwid (misalnya), jika ia belum dapat

menggunakannya dalam membaca alqur’an. Apabila suatu hasil

belajar tidak dapat ditransfer dan hanya dapat digunakan dalam

satu situasi tertentu saja, maka hasil belajar itu dapat disebut hasil

belajar palsu.Sebaliknya, jika suatu hasil belajar dapat ditransfer

kepada penggunaan yang aktual, maka hasil belajar itu disebut

hasil belajar otentik dan kemungkinan dapat ditransfer.

Dalam penelitian sering ditemui hasil-hasil pembelajaran yang

dicapai tampaknya baik, tetapi sebenarnya hasil itu palsu.Peserta

didik dapat mengucapkan kata-kata yang dihafalkan dari buku

pelajarannya, tetapi mereka tidak dapat menggunakannya dalam


situasi baru.Penguasaan materi seperti ini tidak lebih dari

“penguasaan beo”.Evaluasi yang menekankan pada hasil-hasil

palsu, baik untuk informasi bagi peserta didik maupun untuk tujuan

lain, berarti evaluasi itu palsu.Jika peserta didik hanya memiliki

pengetahuan yang bersifat informatife, belum tentu menjamin

pemahaman dan pengertiannya. Oleh karena itu, penekanan pada

pengetahuan yang bersifat informative tidak akan menghasilkan

pola berfikir yang baik. Ada dua sebab mengapa hasil

pembelajaran yang mengakibatkan dan berhubungan dengan

proses transfer menjadi penting artinya dalam proses evaluasi.

Pertama, hasil-hasil itu menyatakan secara khusus dan sejelas-

jelasnya kepada guru mengenai apa yang sebenarnya yang terjadi

ataupun tidak terjadi, dan sampai dimana pula telah tercapai hasil

belajar yang penuh makna serta otentik sifatnya. Kedua, hasil

belajar sangat erat hubungannya dengan tujuan peserta didik

belajar, sehingga mempunyai efek yang sangat kuat terhadap

pembentukan pola dan karakter belajar yang dilakukan peserta

didk.Oleh karena itu, belajar hendaknya dilakukan untuk

mendapatkan hasil-hasil yang dapat ditransfer dan setiap waktu

dapat digunakan menurut keperluannya.

3. Evaluasi langsung dari proses belajar


Di samping harus mengetahui hasil belajar, anda juga harus

menilai proses belajar. Hal ini dimaksudkan agar proses belajar

dapat di organisasi sedemikian rupa, sehingga dapat mencapai

hasil yang optimal. Anda dapat mengetahui proses apa yang dilalui

peserta didik dalam mempelajari sesuatu. Misalnya, apakah

peserta didik dalam mempelajari alqur’an cukup sekedar membaca

beberapa ayat alqur’an ataukah ia membaca seluruh ayat alqur’an

untuk memahami dan memecahkan masalah-masalah kehidupan.

Apakah dalam praktik ibadah, peserta didik cukup hanya melatih

gerakan-gerakan sholat atau menganalisis praktek sholat dan

mencari hubungannya dengan tingkah laku sehari-hari,

mendiskusikan manfaat sholat dengan teman-temanya, dan

mencari situasi-situasi yang nyata yang dapat menggunakan fungsi

sholat itu.

Penelitian tentang proses belajar yang diikuti oleh peserta didik

merupakan suatu hal yang sangat penting. Anda akan mengetahui

letak kesulitan peserta didik, kemudian mencari alternatif

bagaimana mengatasi kesulitan tersebut. Disamping itu,penelitian

tentang proses belajar bermanfaat juga bagi peserta didik itu

sendiri. Peserta didik akan melihat kelemahannya, kemudian

berusaha memperbaikinya, dan akhirnya dapat mempertinggi hasil

belajarnya. Meneliti proses belajar seorang anak bukan pekerjaan


yang mudah. Hal ini memerlukan waktu, tenaga, pemikiran, dan

pengalaman. Anda dapat menggunakan suatu metode untuk

menilai proses belajar dengan memperhatikan prinsip konteks,

vokalisasi, sosialisasi, imdividualisasi, dan urutan (sequence).

Seorang peserta didik tidak dapat belajar dengan baik,

karena ia tidak menggunakan konteks yang baik. Ia tidak

menggunakan bermacam-macam sumber dan tidak menggunakan

situasi-situasi yang konkrit. Peserta didik tidak dapat belajar

dengan baik, karena tidak mempunyai fokus tertentu, misalnya

tidak melihat masalah-masalah pokok yang harus dipecahkannya,

atau mungkin pula tidak sesuai dengan bakat dan minatnya

(individualisasi) serta tidak mendiskusikannya dengan orang lain

(sosialisasi). Dalam evaluasi pembelajaran, anda jangan terfokus

kepada hasil belajar saja, tetapi juga harus memperhatikan transfer

hasil belajar dan proses belajar yang dijalani oleh peserta didik.

F. Prinsip-Prinsip Evaluasi

Menurut Joko Prasetiyo (2013:15-17) Prinsip tidak lain adalah

pernyataan yang mengandung kebenaran hampir sebagian besar jika

tidak dikatakan benar untuk semua kasus. Keberadaan prinsip bagi

seorang evaluator mempunyai arti penting, karena dengan memahami

prinsip evaluasi dapat menjadi petunjuk atau keyakinan bagi dirinya


guna merealisasi evaluasi dengan cara yang benar. Menurut joko

Prsetiyo (2013). Prinsip –prinsip evaluasi terdiri dari:

1. Komprehensif

Evaluasi harus mencakup bidan saran yang luas atau

menyeluruh, baik aspek personalnya, materialnya, maupun aspek

operasionalnya.Evaluasi tidak hanya ditujukan pada salah satu

aspek saja.Misalnya aspek personalnya, jangan hanya menilai

gurunya saja, tetapi juga murid, karyawan dan kepala

sekolahnya.Begitu pula untuk aspek material dan

operasionalnya.Evaluasi harus dilakukan secara menyeluruh.

2. Komparatif

Prinsip ini menyatakan bahwa dalam mengadakan evaluasi

harus dilaksanakan secara bekerjasama dengan semua

orang.Sebagai contoh dalam mengevaluasi keberhasilan guru

dalam mengajar, harus bekerjasama antara pengawas, kepala

sekolah, guru itu sendiri, dan bahkan dengan pihak murid.Dengan

melibatkan semua pihak diharapkan dapat mencapai keobyektifan

dalam mengevaluasi.

3. Kontinyu

Evaluasi hendaknya dilakukan secara terus-menerus selama

proses pelaksanaan program. Evaluasi tidak hanya dilakukan

terhadap hasil yang telah dicapai, tetapi sejak pembuatan rencana


sampai dengan tahap laporan.Hal ini penting dimaksudkan untuk

selalu dapat memonitor setiap saat atas keberhasilan yang telah

dicapai dalam periode waktu tertentu. Aktivitas yang berhasil

diusahakan terjadi peningkatan, sedangkan aktivitas yang gagal

dicari jalan lain untuk mencapai keberhasilan.

4. Obyektif

Mengadakan evaluasi harus menilai sesuai dengan

kenyataan yang ada.Katakanlah yang hijau itu hijau dan yang

merah itu merah. Jangan samp[ai mengatakan yang hijau itu

kuning, dan yang kuning itu hijau. Sebagai contoh, apabila seorang

guru itu sukes dalam mengajar, maka katakanlah bahwa guru ini

sukses, dan sebaliknya apabila jika guru itu kurang berhasil dalam

mengajar, maka katakanlah guru itu kurang berhasil.Untuk

mencapai keobyektifan dalam evaluasi perlu adanya data dan

fakta.Dari data dan fakta inilah dapat mengolah untuk kemudian

diambil suatu kesimpulan. Makin lengkap data dan fakta yang

dapat dikumpulkan maka makin obyektiflah evaluasi yang

dilakukan

5. Berdasarkan kriteria yang valid

Selain perlu adanya data dan fakta, perlu adanya kriteria-

kriteria tertentu. Kriteria yang digunakan dalam evaluasi harus

konsisten dengan tujuan yang telah dirumuskan. Kriteria ini


digunakan agar memiliki standar yang jelas apabila menilai suatu

aktivitas supervise pendidikan. Konsistensi kriteria evaluasi dengan

tujuan berarti criteria yang dibuat harus mempertimbangkan hakikat

substansi supervise pendidikan.

6. Fungsional

Evaluasi memiliki nilai guna baik secara langsung maupun

tidak langsung. Kegunaan langsungnya adalah dapatnya hasil

evaluasi digunakan untuk perbaikan apa yang dievaluasi,

sedangkan kegunaan tidak langsungnya adalah hasil evaluasi itu

dimanfaatkan untuk penelitian atau keperluan lainnya.

7. Diagnostik

Setiap hasil evaluasi harus didokumentasikan.Bahan-bahan

dokumentasi hasil evaluasi inilah yang dapat dijadikan dasar

penemuan kelemahan yang kemudian harus diusahakan jalan

pemecahannya.

Menurut Suharsimi Arikuanto (2013:38-39) ada satu prinsip umum

dan penting dalam kegiatan evaluasi, yaitu adanya triangulasi atau

hubungan erat tiga komponen, yaitu:

1. Tujuan pembelajaran

2. Kegiatan pembelajaran atau KBM, dan

3. Evaluasi

Triangulasi tersebut dapat digambarkan dalam bagan sebagai berikut.


Tujuan

KBM Evaluasi

Penjelasan dari bagan triangulasi adalah sebagai berikut:

1. Hubungan antara tujuan dan KBM

Kegiatan belajar-mengajar yang dirancang dalam bentuk

rencana mengajar disusun oleh guru dengan mengacu pada tujuan

yang hendak dicapai.Dengan demikian, anak panah yang

menunjukkan hubungan antara keduanya mengarah pada tujuan

dengan makna bahwa KBM mengacu pada tujuan, tetapi juga

mengarah dari tujuan ke KBM, menunjukkan langkah dari tujuan

dilanjutkan pemikirannya ke KBM.

2. Hubungan antara tujuan dengan evaluasi

Evaluasi adalah kegiatan pengumpulan data untuk mengukur

sejauh mana tujuan sudah tercapai.Dengan makna demikian maka

anak panah berasal dari evaluasi menuju ke tujuan. Di lain sisi, jika

dilihat dari langkah, dalam menyusun alat evaluasi ia mengacu pada

tujuan yang sudah dirumuskan.

3. Hubungan antara KBM dengan evaluasi

Seperti yang sudah disebutkan dalam nomor (1) KBM

dirancang dan disusun dengan mengacu pada tujuan yang telah


dirumuskan.Telah disebutkan pula dalam nomor (2) bahwa alat

evaluasi juga disusun dengan mengacu pada tujuan.Selain mengacu

pada tujuan, evaluasi juga harus mengacu atau disesuaikan dengan

KBM yang dilaksanakan.Sebagai misal, jika kegiatan belajar-mengajar

dilakukan oleh guru dengan menitikberatkan pada keterampilan,

evaluasinya juga harus mengukur tingkat keterampilan siswa,

bukannya aspek pengetahuan.

Soal Latihan

1. Sebutkan Ciri-Ciri penilaian berbasis kompetensi dalam melakukan

evaluasi secara efektif sehingga sesuai tujuan yang di rencanakan ?

2. Jelaskan dan berikan contoh Hubungan Antara KMB dengann Evaluasi ?


BAB II

KESAHIHAN DAN KETERANDALAN EVALUASI PEMBELAJARAN

1. PENDAHULUAN

A. Deskripsi singkat

Mata kuliah ini membahas tentang bagaimana kesahihan dan

keterandalan dalam evaluasi pembelajaran yang meliputi macam –

macam kesahihan, factor – factor yang mempengaruhi kesahihan,

keterandalan dan kepraktisan dalam evaluasi pembelajaran.

B. Manfaat

Mata kuliah ini merupakan pengetahuan dasar yang dapat

memberikan penjelasan mengenai cara yang dilakukan untuk

mengevaluasi hasil pembelajaran. Karena isi materi mata kuliah ini


memberikan panduan bagaimana cara melakukan evaluasi

pembelajaran mengenai kesahihan, keterandalan dan kepraktisan dari

hasil evaluasi pembelajaran.

C. Tujuan Instruksional Umum

Setelah menyelesaikan mata kuliah ini mahasiswa dapat

menerapkan cara melakukan evaluasi hasil pembelajaran.

D. Tujuan Instruksional Khusus

Setelah menyelesaikan mata kuliah ini mahasiswa akan dapat

menerapkan cara melakukan evaluasi hasil pembelajaran.

II PENYAJIAN

A. Kesahihan

Kesahihan menggantikan kata validitas (validity) yang dapat

diartikan sebagai ketepatan evaluasi mengevaluasi apa yang

seharusnya dievaluasi. Dapat diterjemahkan pula sebagai kelayakan

interpretasi terhadap hasil dari suatu instrument evaluasi atau tes, dan

tidak terhadap instrument itu sendiri (Gronlund, 1985:57). Kesahihan

juga dapat dikatakan lebih menekankan pada hasil/ perolehan

evaluasi, bukan pada kegiatan evaluasinya. Untuk memperoleh hasil

evaluasi yang sahih, dibutuhkan / memenuhi syarat kesahihan suatu

instrument evaluasi. Kesahihan instrument evaluasi diperoleh melalui

hasil pemikiran dan dari hasil pengalaman.


Istilah kesahihan, disebut pula validitas, menunjukan berapa

dekat alat ukur menyatakan ap yang seharusnya diukur. Contoh yang

extriem untuk menyatakan kesahihan adalah : timbangan merupakan

alat yang sahih untuk mengukur berat badan. Validitas merupakan

kesesuaian antara definisi operasional dengan konsep yang mau

diukur. Alat ukur yang tidak reliabel pasti tidak valid sedangkan alat

ukur yang reliabel belum tentu valid. Penilaian kesahihan alat ukur

terdiri dari :

1. Kesahihan alat ukur berskala numeric

Penilaian kesahihan alat ukur variable berskla numerik

dilakukan dengan cara membandingkan alat ukur yang baku

sebagai penera. Misalnya, timbangan untuk mengukur berat badan

dibandingkan dengan timbangan baku, kemudian dinyatakan

sebagai selisih rerata nilai baku dengan nilai pengukuran yang

diperoleh dibagi dengan nilai baku.

2. Kesahihan alat ukur berskla nominal

Alat ukur untuk variable berskla nominal dapat dinilai dengan

cara membandingkan dengan alat diagnostic terbaik yang ada

( gold standar ). Dengan cara tersebut dapat diperoleh nilai

sensitivitas, spesifitas, nilai prediksi serta rasio kemungkinan.


Kesahihan instrument evaluasi diperoleh melalui hasil

pengalaman. Dari dua cara tersebut, diperoleh empat macam

kesahihan yang terdiri dari:

a. kesahihan isi (content validation)

Kesahihan isi diartikan sebagai Ketepatan suatu tes ditinjau

dari isi tes tersebut. Suatu tes hasil belajar dikatakan valid

menurut validitas isi ini bilamana materi tes tersebut betul – betul

dapat mewakili secara menyeluruh (representative) dari bahan –

bahan pelajaran yang diberikan.

b. Kepentingan konstruksi (construction validity)

Validitas kontruksi dapat diartikan sebagai ketepatan suatu

tes ditinjau dari susunan (Konstruk) tes tersebut. Untuk

mengetahui apakah tes yang kita susunmemenuhi syarat – syarat

validitas konstruk ini, maka kita harus membandingkan susunan

tes tersebut dengan syarat – syarat penyusunan tes yang baik.

c. kesahihan ada sekarang (concurrent validity)

Concurrent validity atau validitas bandingan adalah

ketepatan dari suati tes terlihat dari korelasinyaterhadap

kecakapan yang telah dimiliki saat ini secara nyata. Apabila

validitas ramalan melihat hubungannya dengan masa yang akan

dating, validitas bandingan melihat hubungannya dengan masa

sekarang.
d. Kesahihan prediksi (prediction validity) (Arikunto, 1990:64)

Prediction validity atau validitas ramalan dapat diartikan

sebagai ketepatan dari suatu alat pengukur ditinjau dari

kemampuan tes tersebut untuk meramalkan prestasi yang

dicapaikemudian.Faktor-faktor yang mempengaruhi kesahihan

hasil evaluasi meliputi:

1) Faktor instrumen evaluasi itu sendiri, adapun hal – hal yang

mempengaruhi hasil evaluasi diantaranya, ketidak jelasan

petunjuk, tingkat kesulitan kata, dan struktur kalimat pada

instrument evaluasi serta susunan item evaluasi yang kurang

baik, item evaluasi yang terlalu pendek dan dapat dikebalinya

pola jawaban instrument evaluasi.

2) Faktor-faktor administrasi evaluasi dan penskoran merupakan

factor – factor yang mempunyai suatu pengaruh yang

mengganggu kesahihan interpretasi hasil evaluasi.Factor –

factor yang berkaitan dengan administrasi antara lain

pengaturan waktu yang kurang tepat, misalnya waktu yang

disediakan bantuan yang tidak wajar kepada siswa yang minta

pertolongan menyontek saat ujian dan penskoran jawaban

esai yang tidak dapat dipercaya karena cenderung kearah

kesahihan yang rendah. juga merupakan faktor-faktor yang


mempunyai suatu pengaruh yang menganggu kesahihan

interpretasi hasil evaluasi.

3) Faktor-faktor dalam respons-respons siswa yaitu

kecenderungan siswa untuk merespon secara cepat atau

kecenderungan merespon secara tiba – tiba atau penggunaan

gaya tertentu siswa dalam merespon item evaluasi. Faktor-

faktor yang lebih banyak mempengaruhi kesahihan daripada

faktor yang ada instrumental evaluasi atau

pengadministrasiannya.

B. Keterandalan

Keterandalan evaluasi berhubungan dengan masalah

kepercayaan, yakni tingkat kepercayaan bahwa suatu instrument

evaluasi mampu memberikan hasil yang tepat (Arikunto, 1990:81).

Keterandalan dapat kita artikan sebagai tingkat kepercayaan

menunjukan kepada konsistensi (keajegan) hasil evaluasi yang

diperoleh dari suatu instrument evaluasi yakni bagaimanakah keajegan

skor tes atau hasil evaluasi lain yang berasal dari pengukuran yang

satu ke pengukuran yang lain. Juga berhubungan erat dengan

kesahihan, karena keterandalan menyediakan keajegan yang

memungkinkan terjadinya kesahihan (Arikunto, 1990: 81; Gronlund,

1985:87). Tidak selalu menjamin bahwa hasil evaluasi yang andal

(reliable) akan selalu menjawab bahawa hasil evaluasi sahih (valid).


Keterandalan suatu pengukuran dipengaruhi oleh kesalahan

acak ( random error ) , bila kesalahannya semakin besar , berarti

pengukuran tersebut kurang andal. Dalam proses pengukuran terdapat

3 jenis variable yang berperan yakni variabilitas pengamat, variabilitas

subyek dan variabilatas instrument.

Variabilitas pengamat menunjukan variabilitas pada pemeriksa

misalnya pemilihan kata pada wawancara atau ketrampilan tangan

seseorang dalam mengoperasikan alat ukur. Variabilitas subyek

merujuk pada variasi biologis, misalnya frekwensi emosi, tekanan

darah dan sebagainya. Variabilitas instrument menunjuk pada hal – hal

yang mempengaruhi ketepatan, misalnya perubahan sensivitas alat,

suhu kamar atau derajat kebisingan sekitar. Strategi untuk

meningkatkan keterandalan pengukuran:

1. Standarisasi cara pengukuran yaitu aturan khusus yang terinci

untuk melakukan pengukuran.

2. Pelatihan pengukur yaitu pelatihan yang memadai selalu

memberikan hasil yang lebih baik bagi para pengukur. Bila perlu

dapat diberikan sertifikat yang menunjukan bahwa yang

bersangkutan telah dilatih dan cakap untuk melakukan

pengukuran.

3. Penyempurnaan instrument , banyak peralatan mekanis atau

elektrik dapat diatur untuk mengurangi variabilitas pengukuran.


4. Automatisasi, mengandalkan presisi pada saat dilakukan,

sehingga hasil yang diperoleh lebih baik daripada bila dilakukan

oleh manusia.

5. Pengulangan pengukuran, kesalahan acak dapat dikurangi bila

dilakukan pengulangan pengukuran. Berkaitan dengan hal

tersebutterdapat suatu fenomena statistikayang disebut regression

to the mean, yang dapatdijelaskan dengan ilustrasi.

Nurkancana dan sumartana (Aunurrahman, 2012:218)

menjelaskan beberapa cara yang dapat dipergunakan untuk mencari

taraf reliabilitas suatu tes yakni:

1. Teknik Ulangan

Teknik ulangan adalah suatu cara yang ditempuh untuk

mencari reliabilitas suatu tes dengan cara memberikan tes

tersebut kepada sekelompok anak dalam dua kesempatan yang

berlainan

2. Teknik Bentuk Paralel

Pada teknik bentuk parallel digunakan dua bentuk tes yang

sejenis ( tapi tidak identik), baik mengenai isinya, proses mental

yang diukur, tingkat kesukaran maupun jumlah item. Kedua tes ini

diberikan kepada kelompok subyek yang sama tanpa adanya

rentang waktu. Skor yang diperoleh dari kedua tes tersebut

selanjutnya di korelasikan.
3. Teknik Belah Dua

Dalam teknik ini, tes yang telah diberikan kepada kelompok

subyek dibelah menjadi dua bagian. Tiap –tiap bagian diberikan

skor secara terpisah. Umumnya ada dua prosedur yang dapat

dipergunakan untuk membelahdua suatu tes, yaitu:

a. Prosedur ganjil genap, artinya seluruh item yang bernomor

ganjil dikumpulkan menjadi satu kelompok, dan seluruh item

yang bernomor genap menjadi kelompok lain.

b. Prosedur secara random, misalnya dengan menggunakan

undian atau dengan menggunakan tabel bilangan random.

Gronlund (Dimyati, 2009:196) mengemukakan ada empat

factor faktor yang mempengaruhi keterandalan akan diuraikan berikut

ini:

1. Panjang tes (length of test)

Panjang tes berhubungan dengan banyaknya butiran tes,

pada umumnya lebih banyak butir tes lebih tinggi keterandalan

evaluasi. Tes ini dilakukan dengan tidak banyak menebak, maka

keterandalan hasil evaluasi semakin tinggi

2. Sebaran skor (spread of scores)

Koefisien keterandalan secara langsung dipengaruhi oleh

sebaran skor dalam kelompok tercoba. Dengan kata lain, besarnya

sebaran skor akan membuat perkiraan keterandalan yang lebih


tinggi akan terjadi menjadi kenyataan. Karena koefisien

keterlandan yang lebih besar dihasilkan pada saat orang perorang

tetap pada posisi yang relative sama dalam satu kelompok dari

satu pengujian ke pengujian lainnya, itu berarti selisih yang

dimungkinkan dari perubahan posisi dalam kelompok juga

menyumbang memperbesar koefisien keterandalan

3. Tingkat kesulitan tes (difficulty of tes)

Tes acuan norma (norm reference test) yang paling mudah

atau yang paling sukar untuk anggota – anggota kelompok yang

mengerjakan, cenderung menghasilkan skor tes keterandalan yang

rendah. Ini disebabkan antara hasil tes yang mudah dan yang sulit

keduanya dalam satu sebaran skor yang terbatas. Tingkat kesulitan

tes yang ideal untuk meningkatkan koefisien keterandalan adalah

tes yang menghasilkan sebaran skor berbentuk atau kurva normal

4. Objektivitas (objectivity)

Objektivitas suatu tes menunjuk kepada tingkat skor

kemampuan yang sama (yang dimiliki oleh siswa satu dengan

siswa yang lain) memperoleh hasil yang sama dalam mengerjakan

tes

Uraian faktor-faktor yang mempengaruhi keterandalan yang

disadur dari Groundlund (1985 : 100-104) mencakup juga faktor-


faktor yang mempengaruhi keterandalan yang dikemukakan oleh

Arikunto.

C. Kepraktisan

Kepraktisan evaluasi dapat diartikan sebagai kemudahan-

kemudahan yang ada pada instrument evaluasi baik dalam

mempersiapkan, menggunakan, menginterpretasi/memperoleh hasil,

maupun kemudahan dalam menyimpannya.

Dalam memilih tes dan instrument evaluasi yang lain, kepraktisan

merupakan syarat yang tidak dapat diabaikan. Kepraktisan evaluasi

terutama dipertimbangkan pada saat memilih tes atau instrument

evaluasi lain yang dipublikasikan oleh suatu lembaga. Faktor-faktor

yang mempengaruhi kepraktisan instrument evaluasi meliputi:

1. Kemudahan mengadministrasi

Kemudahan administrasi ini dapat dilakukan dengan

memberikan petunjuk yang sederhana yang jelas seta pengaturan

waktu evaluasi sebaiknya tidak menimbulkan kesulitan. Jika

instrument evaluasi di administrasikan oleh guru atau orang lain

dengan kemampuan yang terbatas, kemudian pengadministrasian

adalah suatu kualitas penting yang diminta dalam instrument

evaluasi.

2. Waktu yang disediakan untuk melancarkan evaluasi


Waktu yang disediakan harus diperhitungkan secara cermat

sehingga cukup untuk melaksanakan rangakaian evaluasi tidak

menimbulkan kesulitan dari peserta tes dan pelaksana. Kepraktisan

dipengaruhi pula oleh factor waktu yang disediakan untuk

melancarkan evaluasi.

3. Kemudahan menskor

Untuk memudahkan dalam penskoran perlu petunjuk yang

jelas untuk penskoran demikianpula dalam hal kunci penskoran.

Pemisahan antara lembar soal dan lembar jawaban. Secara

tradisional, hal yang membosankandan aspek yang menganggu

dalam melancarkan evaluasi adalah penskoran. Guru seringkali

bekerja berat ber jam – jam untuk melaksanakan tugas ini.

4. Kemudahan interpretasi dan aplikasi

Dalam analisis terakhir keberhasilan atau kegagalan evaluasi

ditentukan oleh penggunaan hasil evaluasi. Jika hasil evaluasi

diterjemahkan / ditafsirkan secara tepat dan diterapkan secara

efektif, hasil evaluasi akan mendukung terhadap keputusan –

keputusan pendidikan yang lebig tepat.

5. Tersedianya bentuk instrument evaluasi yang ekuivalen

Untuk berbagai kegunaan pendidikan, bentuk – bentuk

ekuivalen untuk tes yang sama sering kali diperlukan. Instrument

evaluasi yang sebanding adalah instrument evaluasi yang memiliki


kemungkinan dibandingkan makna dari skala skor umum yang

dimiliki. Bentk – bentuk ekuivalen dari sebuah tes mengukur aspek

– aspek perilaku melalui butir – butir tes yang memiliki kesamaan

dalam isi, tingkat kesulitan, dan karakteristik lainnya.

Soal Latihan

1. Jelaskan apa yang dimaksud dengan Kesahian menurut Graonlud dan

keterandalan menurut Arikununto dalam melakukan evaluasi ?

2. Sebutkan Faktor-Faktor yang mempengaruhi keterandalan menurut

Graonlud?

BAB III

HASIL EVALUASI, HASIL BELAJAR, FUNGSI, SASARAN DAN

PROSEDUR EVALUASI

I. PENDAHULUAN

A. Deskripsi Singkat
Di dalam Bab ini membahas tentang Definisi hasil belajar,

Tujuan evaluasi hasil belajar, Fungsi evaluasi hasil belajar, sasaran,

Indikator prestasi belajar, Batas minimal prestasi belajar, Evaluasi

prestasi kognitif, afektif, psikomotor .

B. Manfaat

Dengan Evaluasi dapat diketahui sejauh mana dia telah

berhasil mengikuti pelajaran yang di berikan, mengetahui kondisi

belajar yang berlangsung, mengetahui apakah metode dan materi

yang di berikan sudah tepat atau belum

C. Tujuan Instruksional Umum

Setelah mengikuti perkuliahan mahasiswa memiliki kemampuan

dalam merencanakan, melaksanakan dan mengevaluasi hasil

pembelajaran.

D. Tujuan Instruksional Khusus

Setelah mengikuti mata kuliah ini mahasiswa dapat mampu

mengetahui apa-apa saja hasil evaluasi hasil belajar fungsi sasaran

dan prosedur evaluasi.

II. PENYAJIAN

A. Definisi Evaluasi Hasil Belajar

Secara bahasa, evaluasi adalah dari kata evaluation.

Kata Evaluation berasal dari value yang berarti nilai. Kata evaluatin,


dengan demikian, diterjemahkan juga dengan penilaian. Sehingga

antara “penilaian” dan “evaluasi”  dapat dipandang sebagai

semakna. Dalam bahasa Arab penilaian diartikan al-taqdir.

Secara istilah, evaluasi diartikan sebagai suatu tindakan atau

proses untuk menentukan nilai dari suatu obyek. Istilah (term) ini

pada awalnya dikaitkan dengan prestasi belajar siswa, akan tetapi

seiring dengan perkembangan waktu, term ini telah memasuki

setiap aspek kehidupan manusia. Tokoh yang mempopulerkan term

ini pertama kali adalah Ralph Tyler, dengan memaknai evaluasi

sebagai proses pengumpulan data guna menentukan sejauh mana,

dalam hal apa dan bagian mana dari tujuan pendidikan sudah

dicapai.

Ketika kata evaluasi ini dirangkai dengan kata ”hasil belajar” 

berarti, ”suatu tindakan atau proses untuk menentukan nilai

keberhasilan siswa setelah melakukan proses pembelajaran pada

waktu tertentu”. Ketika dirangkai dengan kata pendidikan (evaluasi

pendidikan) berarti suatu proses untuk menentukan nilai

pertumbuhan dan kemajuan siswa ke arah tujuan-tujuan yang telah

ditetapkan di dalam kurikulum. Dan ketika dirangkai dengan

pengajaran (evaluasi pengajaran) berarti suatu proses (sistematis)

untuk menentukan atau membuat keputusan sampai sejauhmana

tujuan-tujuan pengajaran telah dicapai


4 oleh siswa.
Dari ketiga definisi di atas, tampak bahwa dalam

mengadakan evaluasi selalu diawali dengan sebuah proses. Proses

tersebut berupa tindakan membandingkan antara kemampuan

siswa dengan tujuan pembelajaran. Hal ini dilakukan dengan cara

memberikan pertanyaan kepada siswa (assesment) yang mana

pertanyaan tersebut disesuaikan dengan tujuan pembelajaran,

kemudian jawaban yang diberikan siswa dibandingkan dengan

kunci jawaban dari pertanyaan tersebut (yang tentunya juga sesuai

dengan tujuan pembelajaran) (pengukuran). Baru setelah itu

penilaian terhadap siswa bisa diberikan. Jika jawaban siswa sama

dengan kunci (tujuan pembelajaran) maka siswa dapat dinilai

sebagai menguasai materi. Jika jawaban siswa tidak sesuai

dengan kunci maka ia dinilai tidak menguasai dan seterusnya.

Contoh: setelah menyampaikan materi tentang jihad, yang di antara

tujuan pembelajarannya adalah “Siswa memahami bentuk-bentuk

jihad” dengan indikator: “Mampu membedakan antara jihad pada

zaman Rasul dengan zaman sekarang”, seorang guru ingin

mengetahui apakah materi tersebut sudah difahami oleh siswanya

atau belum. Maka guru tersebut harus menyusun sejumlah

pertanyaan yang materinya harus mengacu pada tujuan

pembelajaran tersebut, dan di antara pertanyaanya tentu adalah

“Bagaimana perbedaan bentuk jihad pada zaman Rasul dengan


jihad pada zaman sekarang?” Setelah siswa memberikan jawaban,

jawaban tersebut lalu dibandingkan (dicocokkan) dengan kunci

jawaban (yang juga mengacu pada tujuan pembelajaran). Setelah

itu barulah siswa bisa dinilai tentang tingkat penguasaannya.

Proses pembandingan sebagaimana diebutkan diatas,

dinamakan pengukuran (measurement). Dengan kata lain

pengukuran adalah membandingkan sesuatu dengan atau atas

dasar suatu ukuran atau kriteria tertentu. Jadi didalam evaluasi

terdapat kegiatan pengukuran dan penilaian. Dari sini tampak

perbedaan antara evaluasi dengan penilaian. Penilaian adalah

bagian (akhir) dari evaluasi. Dan tidak benar ketika kita hendak

melakukan penilaian terhadap obyek tertentu tanpa didahului

dengan pengukuran sebelumnya.

Sedangkan hubungan antara penilaian dan pengukuran

dapat digambarkan, bahwa penilaian hanya dapat dilakukan dengan

tepat jika didahului dengan pengukuran, dan pengukuran tidak akan

memberikan makna apa-apa jika tidak dikaitkan dengan (kriteria)

penilaian. Dimana Baik buruknya evaluasi bergantung

pada proses pengukuran yang mendahuluinya.

Dalam usaha mendapatkan keterangan yang valid dan

mudah dalam pengukuran tersebut digunakanlah angka, yang

dimulai dengan pemberian bobot bagi tiap-tiap item soal dan


pemberian skor bagi jawaban siswa. Skor tersebut kemudian diubah

menjadi nilai (berupa angka juga) yang dijadikan sebagai simbul

dari penilaian yang sebenarnya.

Dari sini tampak perbedaan lain antara penilaian dengan

pengukuran. Pengukuran bersifat kuantitatif (berupa penjumlahan

angka) sekaligus merupakan jawaban dari pertanyaan ”how

much”, sementara penilaian bersifat kualitatif dan merupakan

jawaban dari pertanyaan ”what value”.

Sementara beberapa ahli mencoba memberikan penjelasan

lebih lengkap dengan memberi setiap proses dalam evaluasi

dengan sebutan yang lebih rinci. Evaluasi, assesment, pengukuran

dan penilaian. masing-masing istilah tersebut dapat dijelaskan

sebagai berikut. Evaluasi adalah proses yang dilakukan secara

sistematis dan berkesinambungan untuk mengetahui

efisiensi kegiatan belajar mengajar dan efektifitas dari pencapaian

tujuan instruksi yang telah ditetapkan. Assesment adalah proses

pengumpulan berbagai data yang bisa memberikan gambaran

perkembangan belajar siswa.

Pengukuran adalah proses membandingkan sesuatu dengan

ukuran tertentu (bersifat kuantitatif). Sedangkan penilaian adalah

proses pengambilan keputusan terhadap sesuatu (bersifat

kualitatif). Dengan demikian, dapat digambarkan, dalam melakukan


evaluasi terhadap hasil belajar, dimulai dengan assesment

(melakukan tes dan pengoreksian) kemudian pengukuran

(membandingkan hasil pekerjaan siswa dengan kunci) dan diakhiri

dengan penilaian (diambil keputusan tentang penguasaan anak

terhadap materi).

B. Tujuan Evaluasi Hasil Belajar (Pendidikan)

1. Tujuan Umum

a. Untuk menghimpun data tentang taraf kemajuan dan

perkembangan peserta didik, setelah mereka mengikuti

proses pembelajaran dalam jangka waktu tertentu. (Sampai di

mana keberhasilan mereka  dalam mencapai tujuan

kurikuler).    

b. Untuk mengetahui efektifitas metode pengajaran yang

digunakan dalam proses pembelajaran.

2. Tujuan Khusus

a. Untuk merangsang peserta didik dalam program

pembelajaran

b. Untuk mencari faktor keberhasilan dan kegagalan peserta

didik dalam mengikuti pembelajaran

C. Fungsi Evaluasi Hasil Belajar

Secara umum evaluasi (penilaian) memiliki banyak fungsi.

Fungsi-fungsi tersebut antara lain:


1. Fungsi selektif. Dengan evaluasi, guru dapat menyeleksi

peserta tes (siswa) dalam rangka mencapai tujuan tertentu.

2. Fungsi formatif, yaitu untuk memberikan

umpanbalik (feedback) kepada guru sebagai dasar untuk

memperbaiki proses pembelajaran dan mengadakan

program remedial bagi peserta didik.

3. Fungsi sumatif, yaitu untuk menentukan nilai (angka)

kemajuan/hasil belajar peserta didik dalam mata pelajaran

tertentu, sebagai bahan untuk memberikan laporan kepada

berbagai pihak, penentuan kenaikan kelas dan penentuan lulus-

tidaknya peserta didik.

4. Fungsi diagnostik, yaitu untuk memahami latar belakang

(psikologis, fisik dan lingkungan) peserta didik yang mengalami

kesulitan belajar, dimana hasilnya dapat digunakan sebagai

dasar dalam memecahkan kesulitan-kesulitan tersebut.

5. Fungsi penempatan, yaitu untuk menempatkan peserta didik

dalam situasi pembelajaran yang tepat (misalnya dalam

penentuan program spesialisasi) sesuai dengan tingkat

kemampuan peserta didik

Lebih spesifik fungsi Evaluasi Hasil Belajar yang dilaksanakan

dalam PBM di sekolah adalah:


1. Untuk mengetahui seberapa jauh hasil yang telah dicapai dalam

proses pendidikan yang telah dilaksanakan.

2. Untuk mengetahui apakah mata pelajaran yang kita ajarkan

dapat kita lanjutkan dengan bahan yang baru ataukah kita harus

mengulangi.

3. Untuk mendapatkan bahan-bahan informasi untuk menentukan

apakah seorang anak dapat dinaikkan ke kelas yang lebih tinggi

atau harus mengulang.

4. Untuk membandingkan apakah prestasi yang dicapai oleh anak-

anak sudah sesuai dengan kapasitasnya atau belum.

5. Untuk menafsirkan apakah seorang anak telah cukup matang

untuk kita lepaskan ke dalam masyarakat atau ke lembaga

pendidikan yang lebih tinggi.

6. Untuk mengadakan seleksi.

7. Untuk mengetahui taraf efisiensi metode yang digunakan dalam

proses belajar mengajar.

D. Sasaran Evaluasi

Sasaran evaluasi adalah segala sesuatu yang dititik pusat

pengamatan karena penilai menginginkan informasi tentang sesuatu

tersebut. Dengan demikian sasaran penilai untuk unsur-unsurnya

meliputi input, transformasi dan output

1. Input
Calon siswa sebagai pribadi yang utuh, dapat ditinjau dari

beberapa segi yang menghasilkan bermacam-macam bentuk tes

yang digunakan sebagai alat untuk mengukur. Aspek yang

bersifat rohani setidak nya mencakup 4 (empat) hal

a. Aspek kemampuan

Untuk dapat diterima sebagai calon peserta didik dalam

rangka mengikuti program pendidikan tertentu, maka para

calon peserta didik harus memiliki kemampuan yang sesuai

atau memadai, sehingga dalam mengikuti proses

pembelajaran pada program pendidikan tertentu itu nantinya

peserta didik tidak akan mengalami banyak hambatan atau

kesulitan Sehubungan dengan itu, maka bekal kemampuan

yang dimiliki calon peserta didik perlu untuk dievaluasi terlebih

dahulu, guna mengetahui sampai sejauh mana kemampuan

yang dimiliki oleh masing-masing calon peserta didik dalam

mengikuti program tertentu. adapun alat yang biasa

dipergunakan dalam rangka mengevaluasi kemampuan

peserta didik itu adalah tes kemampuan (aptitude test)

b. Aspek kepribadian

Kepribadian adalah sesuatu yang terdapat pada diri

seseorang, dan menampakkan bentuknya dalam tingkah laku.

Sebelum mengikuti program pendidikan tertentu, para calon

peserta didik perlu terlebih dahulu dievaluasi kepribadiannya


masing-masing, sebab baik buruknya kepribadian mereka

secara psikologis akan dapat mempengaruhi keberhasilan

mereka dalam mengikuti program pendidikan tertentu.

evaluasi yang dilakukan untuk mengetahui atau

mengungkapkan kepribadian seseorang adalah dengan jalan

menggunakan tes kepribadian (personality test).

c. Aspek sikap

Sikap pada dasarnya adalah merupakan bagian dari

tingkah laku manusia, sebagai gejala atau gambaran

kepribadian yang memancar keluar.Karena sikap ini

merupakan sesuatu yang sangat dibutuhkan dalam

pergaulan, maka memperoleh informasi mengenai sikap

sseorng adalah hal yang sangat penting.Karena itu maka

aspek sikap perlu dinilai atau di evaluasi terlebih dahulu bagi

calon peserta didik sebelum mengikuti program pendidikan

tertentu.

d. Aspek intelegensi

Untuk mengetahui tingkat intelegensi digunakan tes

intelegensi yang sudah banyak diciptakan oleh para

ahli.Dalam hal ini yang terkenal adalah tes buatan Binet dan

Simon yang dikenal dengan tes Binet-Simon. Dari hasil tes

akan diketahui IQ (Intelliigence Quotient) orang tersebut. IQ


bukanlah intelegensi.IQ berbeda dengan intelegensi karena

IQ hanyalah angka yang memberikan petunjuk tinggi

rendahnya intelegensi seseorang.

2. Transformasi

Telah dijelaskan bahwa banyak unsur yang terdapat

dalam transformasi yang semuanya dapat menjadi sasaran atau

objek penilaian demi diperoleh nya hasil pendidikan yang

diharapkan. Selanjutnya apabila disoroti dari segi transformasi

maka obyek dari evaluasi pendidikan itu meliputi;

a. Bahan pelajaran atau materi pelajaran

Bahan pelajaran  merupakan informasi, alat, dan teks

yang diperlukan guru atau instruktur untuk perencanaan

pembelajaran Bahan ajar juga dapat diartikan sebagai

seperangkat materi yang disusun secara sistematis baik

tertulis maupun tidak tertulis sehingga tercipta lingkungan

atau suasana yang memungkinkan siswa untuk belajar.

b. Metode mengajar dan teknik penilaian

Metode pengajaran suatu ilmu pengetahuan tentang

motode yang dipergunakan dalam pekerjaan mendidik. Atau

bisa juga yang dimaksud metode mengajar adalah suatu

pengetahuan tentang cara-cara mengajar yang di pergunakan

oleh seorang guru atau instruktur dan metode mengajar yang


digunakan untuk menyampaikan informasi berbeda dengan

cara yang ditempuh untuk memantapkan siswa dalam

menguasai materi pelajaran.

c. Sarana atau media pendidikan.

Segala sesuatu yang dapat dipakai sebagai alat untuk

mencapai maksud atau tujuan dan merupakan penunjang

utama terselenggaranya suatu proses kegiatan belajar dan

mengajar.

d. Sistem administrasi

Sistem administrasi kegiatan untuk mengumpulkan data,

pengolahan data dan menyusun perencanaan dengan

administrasi sangat penting dalam transformasi. Demikian

juga dalam melakukan pengorganisasian dalam menjalankan

aktivitas organisasi diperlukan administrasi misalnya

administrasi keuangan, absensi siswa, guru dan kegiatan lain

nya

e. Guru dan unsur-unsur personal lainya

Guru meliputi mendidik, mengajar dan melatih/

membimbing. Mendidik berarti meneruskan dan

mengembangkan nilai-nilai hidup. Mengajar berarti

meneruskan dan mengembangkan ilmu pengetahuan dan

teknologi. Melatih/Membimbing berarti mengembangkan


ketrampilan-ketrampilan peserta didik. Itulah sebabnya setiap

guru perlu manatap dirinya dan memahami konsep dirinya.

Misalnya dalam penampilan, guru harus mampu menarik

simpati para siswanya, karena bila seorang guru dalam

penampilannya sudah tidak menarik, maka kegagalan

pertama adalah ia tidak akan dapat menanamkan benih

pengajarannya kepada para siswanya. Maka guru harus

memahami hal ini dan berusaha mengubah dirinya menjadi

simpatik. Demikian juga dalam hal kepribadian lainya

3. Output

Adapun dari segi output, yang menjadi sasaran evaluasi

pendidikan adalah tingkat pencapaian atau prestasi belajar yang

berhasil diraih oleh masing-masing peserta didik, setelah mereka

terlibat dalam proses pendidikan selama jangka waktu yang telah

ditentukan

a. Prinsip evaluasi

Menurut Suharsimi Arikunto, Ada satu prinsip umum dan

penting dalam kegiatan evaluasi yaitu adanya triangulasi

(hubungan erat tiga komponen) yaitu;

1) Tujuan Pembelajaran.

2) Kegiatan pembelajaran atau KBM, dan

3) Evaluasi

E. Indikator Prestasi Belajar


Adapun indikator prestasi belajar menurut Abin Syamsudin

Makmur (2000: 26), dengan mengutip pendapat Benjamin Bloom,

indikator prestasi belajar mencakup tiga ranah, yaitu ranah kognitif,

ranah afektif, dan ranah psikomotor. Ranah kognitif seperti

pengamatan, indikatornya adalah menunjukan, membandingkan,

dan menghubungkan. Ranah afektif seperti penerimaan,

indikatornya adalah menunjukan sikap menerima dan menunjukan

sikap menolak. Ranah psikomotor seperti keterampilan bergerak dan

bertindak indikatornya adalah mengkoordinasikan gerak mata,

tangan, kaki, dan anggota badan lainnya.

F. Prinsip dan Prosedur Penilaian

Mengingat pentingnya penilaian dalam menentukan kualitas

pendidikan, maka upaya merencanakan dan melaksanakan

penilaian hendaknya memperhatikan beberapa prinsip dan prosedur

penilaian sebagai berikut:

1. Dalam menilai hasil belajar, hendaknya dirancang sedemikian

rupa sehingga jelas abilitas yang harus dinilai, materi penilaian,

alat penilaian, dan interpretasi hasil penilaian.

2. Penilaian hasil belajar hendaknya menjadi bagia integral dari

proses belajra-mengajar. Artinya, penilaian senantiasa

dilaksanakan pada tiap saat proses belajar-mengajar sehingga

pelaksanaannya berkesinambungan.
3. Agar diperoleh hasil belajar yang obyektif dalam pengertian

menggambarkan prestasi dan kemampuan siswa sebagaimana

adanya, penilaian harus menggunakan berbagai alat penilaian

dan sifatnya komprehensif (mencakup berbagai ranah, sepesrti

kognitif, afektif, dan psikomotorik).

4. Penilaian hasil belajar hendaknya diikuti dengan tindak

lanjutnya. Data hasil penilaian sangat bermanfaat bagi guru

maupun bagi siapapun.

Prosedur adalah langkah-langkah teratur dan tertib yang harus

ditempuh seorang evaluator pada waktu melakukan evaluasi

kurikulum. Adapun beberapa prosedur evaluasi kualitatif dan kuantitatif

sebagai berikut:

1. Prosedur Evaluasi Kuantitatif

Kaedah evaluasi mengatakan bahwasannya evaluasi harus

berkaitan dengan pengembangan kurikulum yang terjadi. Prosedur

untuk evaluasi kuantitatif yakni sebagai berikut :

a. Penentuan masalah atau pertanyaan evaluasi

b. Penentuan variabel, jenis data dan sumber data

c. Penentuan metodologi

d. Pengembangan instrument

e. Penentuan proses pengumpulan data

f. Penentuan proses pengolahan data


2. Prosedur Evaluasi Kualitatif

Ada tiga hal pokok yang harus dilakukan evaluator ketika

melakukan evaluasi kurikulum dengan menggunakan prosedur

sebagai berikut:

a. Menentukan fokus evaluasi

b. Perumusan masalah dan pengumpulan data

c. Proses pengolahan data

d. Menentukan perbaikan dan perubahan program.

G. Batas Minimal Prestasi Belajar

Setelah mengetahui indikator prestasi belajar di atas, guru perlu

pula mengetahui bagaimana kiat menetapkan batas minimal

keberhasilan belajar para siswanya. Keberhasilan tidak hanya terikat

oleh kiat penilaian yang bersifat kognitif, tetapi juga memperhatikan

kiat penilaian afektif dan psikomotor siswa.

Menetapkan batas minimum keberhasilan belajar siswa selalu

berkaitan dengan upaya pengungkapan hasil belajar. Ada beberapa

alternatif norma pengukuran tingkat keberhasilan siswa setelah

mengikuti proses mengajar-belajar. Di antara norma-norma

pengukuran tersebut ialah :

1. Norma skala angka dari 0 sampai 10.

2. Norma skala angka dari 0 samapai 100.


H. Evaluasi Prestasi Kognitif, Afektif, Dan Psikomotor

1. Evaluasi Prestasi Kognitif

Mengukur keberhasilan siswa yang berdimensi

kognitif  (ranah cipta) dapat dilakukan dengan berbagai cara, baik

dengan tes tertulis maupun tes lisan dan perbuatan.

2. Evaluasi Prestasi Afektif

Dalam merencanakan penyusunan instrumen tes

prestasi siswa yang berdimensi afektif (ranah rasa) jenis-jenis

prestasi internalisasi dan karakterisasi setidaknya mendapat

perhatian khusus. Alasannya, karena kedua jenis prestasi ranah

rasa itulah yang lebih banyak mengendalikan sikap dan

perbuatan siswa.

3. Evaluasi Belajar Psikomotor

Cara yang dipandang tepat untuk mengevaluasi

keberhasilan belajar yang berdimensi ranah psikomotor (ranah

karsa) adalah observasi. Observasi, dalam hal ini, dapat diartikan

sebagai sejenis tes mengenai peristiwa, tingkah laku, atau

fenomena lain dengan pengamatan langsung.

Soal Latihan

a. Jelakan Definisi secara umum mengenai evaluasi hasil belajar dan

prosesnya secara singkat?


b. Jelaskan Fungsi secara umum dalam melakukan evaluasi yang mencakuf

fungsi Selektif, formatif ,sumatif, diagnostik dan penempatan ?


BAB IV

MACAM-MACAM METODE EVALUASI

I. PENDAHULUAN

A. Deskripsi Singkat

Materi ini membahas tentang definisi metode evaluasi, macam-

macam metode pembelajaran.

B. Manfaat

Mata kuliah ini merupakan pengetahuan dasar yang

mendukung mahasiswa agar lebih aktif dalam melaksanakan

evaluasi belajar. Dengan memahami secara tepat mata kuliah ini,

akan sangat membantu mahasiswa untuk mengetahui macam-

macam metode evaluasi.

C. Tujuan Instruksional Umum

Setelah mengikuti perkuliahan mahasiswa memiliki kemampuan

dalam merencanakan, melaksanakan dan mengevaluasi hasil

pembelajaran.

D. Tujuan Instruksional Khusus

Setelah mengikuti mata kuliah ini mahasiswa memiliki

kemampuan untuk menjelaskan dan mengetahui macam-macam

metode evaluasi.
II. PENYAJIAN

A. Pengertian Metode Evaluasi

Definisi metode evaluasi adalah metode yang digunakan

dalam proses penentuan nilai atau efektivitas suatu kegiatan untuk

tujuan pembuatan keputusan. A Joint Committee on Standard for

Evaluation . Evaluasi adalah suatu proses pemeriksaan

(penyelidikan) yang sistematis tentang manfaat atau kegunaan dari

sesuatu berdasarkan pada suatu standar/kriteria tertentu.

Klasifikasi atau penggolongan evaluasi dalam bidang

pendidikan sangat beragam. Sangat beragamnya ini disebabkan

karena sudut pandang yang saling berbeda dalam melakukan

kalsifikasi tersebut.

Roestiyah N. K. dkk dalam bukunya “masalah-masalah ilmu

keguruan” menyebutkan empat pengertian evaluasi menurut

deskripsinya berikut ini Evaluasi adalah proses memahami atau

memberi arti :

1. Mendapatkan dan mengkomunikasikan suatu informasi bagi

petunjuk pihak-pihak pengambilan keputusan.

2. Evaluasi adalah kegiatan mengumpulkan data seluas-luasnya,

sedalam-dalamnya yang bersangkutan dengan kapabilitas siswa,

guna mengetahui sebab-akibat hasil belajar siswa yang dapat

mendorong dan mengembangkan kemampuan belajar.


3. Dalam rangkah pengembangan siswa instruksional, evaluasi

merupakan suatu kegiatan untuk menilai seberapa jauh program

telah berjalan seperti yang telah direncanakan.

4. Evaluasi adalah suatu hal untuk menentukan apakah tujuan

pendidikan dan apakah proses dalam pengembangan ilmu telah

berada di jalan yang diharapkan.

B. Macam-macam Metode Evaluasi Pendidikan

Klasifikasi atau penggolongan evaluasi dalam bidang

pendidikan sangat beragam.Sangat beragamnya ini disebabkan

karena sudut pandang yang saling berbeda dalam melakukan

kalsifikasi tersebut. Dalam hal ini, klasifikasi tentang evaluasi yang

akan penulis jelaskan adalah evaluasi formatif, sumatif dan

diagnosti.

1. Evaluasi Formatif

Evaluasi formatif adalah evaluasi yang dilakukan pada

setiap akhir pembahasan suatu pokok bahasan / topik, dan

dimaksudkan untuk mengetahui sejauh manakah suatu proses

pembelajaran telah berjalan sebagaimana yang direncanakan.

Winkel menyatakan bahwa yang dimaksud dengan evaluasi

formatif adalah penggunaan tes-tes selama proses pembelajaran

yang masih berlangsung, agar siswa dan guru memperoleh

informasi (feedback) mengenai kemajuan yang telah dicapai.


Sementara Tesmer menyatakan formative evaluation is a

judgement of the strengths and weakness of instruction in its

developing stages, for purpose of revising the instruction to

improve its effectiveness and appeal.Evaluasi ini dimaksudkan

untuk mengontrol sampai seberapa jauh siswa telah menguasai

materi yang diajarkan pada pokok bahasan tersebut. Wiersma

menyatakan formative testing is done to monitor student progress

over period of time.

Dengan kata lain evaluasi formatif dilaksanakan untuk

mengetahui seberapa jauh tujuan yang telah ditetapkan telah

tercapai. Dari hasil evaluasi ini akan diperoleh gambaran siapa

saja yang telah berhasil dan siapa yang dianggap belum berhasil

untuk selanjutnya diambil tindakan-tindakan yang tepat. Tindak

lanjut dari evaluasi ini adalah bagi para siswa yang belum

berhasil maka akan diberikan remedial, yaitu bantuan khusus

yang diberikan kepada siswa yang mengalami kesulitan

memahami suatu pokok bahasan tertentu. Sementara bagi siswa

yang telah berhasil akan melanjutkan pada topik berikutnya,

bahkan bagi mereka yang memiliki kemampuan yang lebih akan

diberikan pengayaan, yaitu materi tambahan yang sifatnya

perluasan dan pendalaman dari topik yang telah dibahas.


Untuk membahas evaluasi formatif ini, seperti yang

Ahmad Rohani dan Abu Ahmadi katakan dalam bukunya

“Pengelolaan Pengajaran”, (Rohani dan Ahmadi, 1991: 173-175)

perlu meninjau dari berbagai segi sehingga akan mudah

memahami bagaimana sebenarnya evaluasi ini. di antaranya

adalah sebagai berikut:

a. Fungsi dan Tujuan Evaluasi Formatif

Fungsi dari evaluasi formatif adalah untuk memperbaiki

proses belajar-mengajar.

b. Manfaat Evaluasi

Dalam evaluasi formatif ini, ada beberapa manfaat yang

dingkap oleh Suharsimi Arikunto yaitu manfaat bagi siswa,

guru dan program sekolah yang penjabarannya sebagai

berikut:

Manfaat bagi siswa:

1) Digunakan untuk mengetahui apakah siswa sudah

menguasai bahan program secara menyeluruh atau belum

2) Merupakan penguatan bagi siswa dan memperbesar

motivasi siswa untuk belajar giat

3) Untuk perbaikan belajar siswa

4) Sebagai diagnosa kekurangan dan kelebihan siswa


Manfaat bagi guru:

1) Mengetahui sampai sejauh mana bahan yang diajarkan

sudah dapat diterima oleh siswa

2) Mengetahui bagian-bagian mana dari bahan pelajaran

yang belum dikuasai siswa.

Manfaat bagi program sekolah:

1) Apakah program yang telah diberikan merupakan

program yang tepat atau tidak ?

2) Apakah program tersebut membutuhkan pengetahuan-

pengetahuan prasyarat yang belum diperhitungkan ?

3) Apakah diperlukan alat, sarana, dan prasarana untuk

mempertinggi hasil yang akan dicapai atau tidak ?

4) Apakah metode, pendekatan dan alat evaluasi yang

digunakan sudah tepat atau tidak (Arikunto, 1996: 34-36)

c. Waktu Pelaksanaan

Sesuai dengan fungsi dan tujuan evaluasi formatif, maka

evaluasi ini dilakukan untuk menilai hasil belajar jangka

pendek dari suatu proses belajar mengajar atau pada akhir

unit pelajaran yang singkat yaitu satuan pelajaran. Sebab

perbaikan belajar mengajar itu hanya mungkin jika dilakukan

secara sistematis dan bertahap


d. Aspek Tingkah Laku Yang Dinilai

Aspek tingkah laku yang dinilai dari evaluasi formatif ini

cenderung terbatas pada segi kognitif (pengetahuan) dan

psikomotor (ketrampilan) yang terkandung dalam tujuan

khusus pelajaran.Untuk menilai segi afektif (sikap dan nilai),

maka penggunaan penilaian formatif tidaklah tepat.Sebab

untuk menilai perkembangan segi afektif ini diperlukan

periode pengajaran yang cukup panjang.

e. Cara Menyusun Soal

Sesuai dengan fungsi evaluasi formatif, maka evaluasi ini

harus disusun dengan sedemikian rupa sehingga benar-benar

mengukur tujuan khusus pengajaran yang dicapai.Oleh

karena itu, soal harus dibuat secara langsung dengan

menjabarkantujuan khusus pengajaran ke dalam bentuk

pertanyaan.Pada evaluasiformatif ini, masalah tingkat

kesukaran dan daya pembeda tiap-tiap soal tes tidak begitu

penting.

f. Pendekatan Evaluasi Yang Digunakan

Sesuai dengan fungsi evaluasi formatif, maka sasaran

penilaian adalah kecakapan nyata setiap peserta didik.Oleh

karena itu, pendekatan dalam penilaian evaluasi formatif

adalah penilaian yang bersumber pada kriteria mutlak.


g. Cara Pengolahan Hasil Evaluasi

Ada beberapa cara pengolahan hasil evaluasi formatif.

Cara-cara tersebut adalah sebagai berikut:

1) Menghitung presentase peserta didik yang gagal dalam

setiap soal. Dengan melihat hasil presentase ini, guru

akan dapat mengetahui sejauh mana tujuan khusus

pengajaran (TKP) yang bersangkutan dengan soal telah

dicapai atau dikuasai oleh kelas.

2) Menghitung presentase penguasaan kelas atas bahan

yang telah disajikan. Dengan kata lain, berapa persen kah

dari bahan yang telah disajikan itu dikuasai kelas. Cara

pengolahan ini bertujuan untuk mendapatkan keterangan,

apakah keterangan apakah kriteria keberhasilan belajar

yang diharapkan telah tercapai.

3) Menghitung presentase jawaban yang benar yang dicapai

setiap peserta didik dalam tes secara keseluruhan.

Dengan angka presentase ini, guru akan dapat

mengetahui sampai berapa jauh penguasaan setiap

peserta didik atas bahan yang telah diajarkan. Dengan

kata lain, sejauh mana tingkat keberhasilan setiap peserta

didik atas unit pengajaran yang telah diajarkan ditinjau dari

sudut kriteria keberhasilan belajar yang diharapkan atau

yang telah ditetapkan.


h. Penggunaan Hasil Evaluasi

Hasil pengolahan evaluasi formatif sebagaimana

disebutkan di atas, dapat digunakan untuk keperluan-

keperluan sebagai berikut:

1) Atas dasar angka presentase peserta didik yang gagal

dalam setiap soal. Guru dapat mempertimbangkan apakah

bahan pelajaran yang bersangkutan dengan soal tes perlu

dibicarakan lagi secara umum atau tidak.

2) Atas dasar angka presentase penguasaan kelas atas

bahan yang telah disajikan, guru dapat menilai dirinya

sendiri mengenai kemampuannya dalam mengajar. Jika

angka itu belum mencapai kriteria keberhasilan

umpamanya, maka guru akan mencari sebabnya dan

kemudian ia akan memikirkan perbaikan-perbaikan apa

yang perlu diadakan agar proses belajar mengajar dapat

berjalan secara efisien dan efektif sehingga kriteria

keberhasilan itu dapat tercapai.

3) Dengan mengetahui presentase jawaban yang benar dari

setiap peserta didik dalam tes secara keseluruhan, guru

dapat mengetahui kekuatan dan kelemahan yang ada

pada setiap peserta didik sehingga guru mendapat bahan

yang dapat dijadikan sebagai dasar pertimbangan apakah


peserta didik perlu dapat bantuan atau pelayanan khusus

dari guru untuk mengatasi kesulitan dalam belajar.

(Rohani dan Ahmadi, 1991: 173

2. Evaluasi Sumatif

Evaluasi sumatif adalah evaluasi yang dilakukan pada

setiap akhir satu satuan waktu yang didalamnya tercakup lebih

dari satu pokok bahasan, dan dimaksudkan untuk mengetahui

sejauhmana peserta didik telah dapat berpindah dari suatu unit

ke unit berikutnya.Winkel mendefinisikan evaluasi sumatif

sebagai penggunaan tes-tes pada akhir suatu periode

pengajaran tertentu, yang meliputi beberapa atau semua unit

pelajaran yang diajarkan dalam satu semester, bahkan setelah

selesai pembahasan suatu bidang studi.

Adapun tujuan utama dari evaluasi sumatif ini adalah

untuk menentukan nilai yang melambangkan keberhasilan

peserta didik setelah mereka menempuh program pengajaran

dalam jangka waktu tertentu. (Sudijono, 2007: 23) Berikut ini

beberapa hal yang berhubungan dengan evaluasi sumatif yang

terdapat dalam buku karangan Ahmad Rohani dan Abu Ahmadi

yang berjudul “Pengelolaan Pengajaran”, (Rohani dan Ahmadi,

1991: 176-179), sebagai berikut

a. Fungsi Evaluasi Sumatif

Fungsi evaluasi sumatif ini adalah untuk menentukan

angka kemajuan atau hasil belajar peserta didik.


b. Manfaat Evaluasi Sumatif

Berikut ini merupakan beberapa manfaat yang didapat

dari evaluasi sumatif.

1) Untuk menentukan nilai.

2) Untuk menentukan seseorang anak dapat atau tidak

mengikuti kelompok dalam menerima program berikutnya.

3) Untuk mengisi catatan kemampuan siswa (Arikunto, 1996:

36)

c. Waktu Pelaksanaan

Sesuai dengan fungsi evaluasi, maka evaluasi sumatif ini

dilakukan untuk menilai hasil belajar jangka panjang dari

suatu proses belajar mengajar seperti pada akhir program

pengajaran.

d. Aspek Tingkah Laku Yang Dinilai

Karena evaluasi sumatif merupakan untuk menilai hasil

jangka panjang, maka aspek tingkah laku yang dinilai harus

meliputi segi kognitif (pengetahuan), psikomotor (ketrampilan)

dan afektif (sikap dan nilai).

e. Cara Menyusun Soal

Penilaian sumatif ini merupakan evaluasi yang dilakukan

pada akhir program pengajaran.Ini berarti bahan pengajaran

yang menjadi sasaran penilaian cukup luas dan banyak.Oleh


karena itu, tidak efisien jika soal-soalnya disusun atas dasar

tujuan khusus pengajaran (TKP) seperti pada evaluasi

formatif.Akan tetapi penyusunan soal-soalnya harus

didasarkan pada tujuan umum pengajaran (TUP) yang ada di

dalam program pengajaran tersebut.

Selanjutnya, karena tujuan evaluasi sumatif itu untuk

menentukan angka kemajuan setiap peserta didik yang di

antaranya untuk menentukan kenaikan kelas atau lulus

tidaknya, maka masalah tingkat kesukaran soal harus

diperhatikan. Artinya, soal-soal itu harus disusun sedemikian

rupa sehingga mencakup yang mudah, sedang dan sukar

yang jumlahnya perbandingannya sekitar 3 : 5 : 2,

perbandingan ini tidak harus mutlak demikian. Masalah

tingkat kesukaran soal ini dimaksudkan agar hasil penilaian

dapat memberi gambaran mengenai tingkat kecerdasan atau

kemampuan atau kepandaian tiap-tiap peserta didik atas

dasar klasifikasi kurang, sedang dan pandai.

Di samping masalah tingkat kesukaran soal, pada

evaluasi sumatif ini diperhatikan daya pembeda dari setiap

soal.Artinya setiap soal harus mempunyai daya untuk

membedakan peserta didik yang pandai dengan yang kurang


atau tidak pandai.Tapi tingkat kesukaran dan daya pembeda

suatu soal itu hanya dapat diketahui melalui analisis soal

setelah tes itu dicobakan.Untuk itu perlu diperhatikan

pengetahuan lebih lanjut mengenai teknik penilaian

pendidikan yang menyangkut masalah “analisis soal”.

f. Pendekatan Evaluasi Yang Digunakan

Pada evaluasi sumatif, ada dua pendekatan yang dapat

digunakan dalam menilai: 1) penilaian yang bersumber pada

kriteria mutlak dan 2) penilaian yang bersumber pada norma

relatif (kelompok)

g. Cara Pengolahan Hasil Evaluasi

Karena pada evaluasisumatif ini ada dua pendekatan

dalam mengevaluasi, maka pengolahan hasilnya pun ada dua

cara:

1) Pengolahan hasil evaluasi berdasarkan ukuran mutlak.

Jika pengolahan hasil evaluasi itu berdasarkan ukuran

atau kriteria mutlak, maka yang harus dicari adalah

presentase jawaban benar yang dicapai oleh setiap

peserta didik.

2) Pengolahan hasil evaluasi berdasarkan norma relatif

(kelompok). Untuk mengolah hasil evaluasi yang


berdasarkan norma relatif, digunakan nilai-nilai yang

standar seperti skala nilai 0 – 10 atau skala nilai 0 – 100.

Untuk merubah nilai atau skor mentah ke dalam skor

terjabar berdasarkan skala penilaian tertentu, maka

prosedur atau langkah-langkah sebagai berikut:

a) Menyusun distribusi atau frekwensi skor yang diperoleh

peserta didik

b) Menghitung angka rata-rata

c) Menghitung standar devisi

d) Mengubah skor ke dalam skala penilaian yang

dikehendaki

h. Penggunaan Hasil Evaluasi

Pada evaluasi sumatif, hasilnya digunakan antara lain

sebagai berikut:

1) Menentukan kenaikan kelas

2) Menentukan angka raport

3) Mengadakan seleksi

4) Menentukan lulus tidaknya peserta didik

5) Mengetahui status setiap peserta didik dibandingkan

dengan peserta didik lainnya dalam kelompok yang sama

3. Evaluasi Diagnostik

Evaluasi diagnostik adalah evaluasi yang digunakan

untuk mengetahui kelebihan-kelebihan dan kelemahan-


kelemahan yang ada pada siswa sehingga dapat diberikan

perlakuan yang tepat.Evaluasi diagnostik dapat dilakukan dalam

beberapa tahapan, baik pada tahap awal, selama proses,

maupun akhir pembelajaran. Pada tahap awal dilakukan

terhadap calon siswa sebagai input. Dalam hal ini evaluasi

diagnostik dilakukan untuk mengetahui kemampuan awal atau

pengetahuan prasyarat yang harus dikuasai oleh siswa. Pada

tahap proses evaluasi ini diperlukan untuk mengetahui bahan-

bahan pelajaran mana yang masih belum dikuasai dengan baik,

sehingga guru dapat memberi bantuan secara dini agar siswa

tidak tertinggal terlalu jauh. Sementara pada tahap akhir evaluasi

diagnostik ini untuk mengetahui tingkat penguasaan siswa atas

seluruh materi yang telah dipelajarinya.

Perbandingan Tes Diagnostik, Tes Formatif, dan Tes Sumatif

Ditinjau Tes Diagnostik Tes Tes Sumati


dari Formatif
Fungsinya  mengelompokk  Umpan  Memberi
an siswa balik bagi tanda telah
berdasarkan siswa, mengikuti
kemampuannya guru suatu
menentukan maupun program, dan
kesulitan belajar program menentukan
yang dialami untuk posisi
menilai kemampuan
pelaksana siswa
an suatu dibandingkan
unitprogra dengan
m. anggota
kelompoknya
Cara  memilih tiap-  Menguk  Mengukur
memilih tiap ur tujuan
tujuan keterampilan semua instruksion
yang prasarat tujuan al umum
dievaluasi  memilih tujuan instruksi
setiap onal
program khusus
pembelajaran
secara
berimbang
 memilih yang
berhubungan
dengan
tingkah laku
fisik, mental
dan perasaan
Skoring  menggunakan  menggu  menggunak
(cara standar nakan an standar
menyekor) mutlak dan standar relative
relative mutlak

Soal Latihan

1. Jelaskan apa yang dimaksud dengan evaluasi formatif beserta fungsinya

dalam metode evaluasi ?


2. Jelaskan evaluasi Sumatif beserta manfaat yang diperoleh?

BAB V

EVALUASI PROGRAM PENDIDIKAN

I.PENDAHULUAN
A. Deskripsi Singkat

Mata kuliah ini membahas tentang Evaluasi program pendidikan,

tujuan dan fungsi evaluasi program, manfaat dan pentingnya evaluasi

program,kerangka dasar evaluasi program, kriteria evaluasi program,

komponen dan indikator program,Model-model evaluasi program,

langkah-langkah evaluasi program pendidikan.

B. Manfaat

Mata kuliah ini adalah merupakan hal yang sangat penting

dimana Evaluasi dapat digunakan ada bidang yang sangat luas,

termasuk pada bidang pendidikan dimana memberikan manfaat Bagi

pelaksana program yang berguna untuk dasar penyusunan laporan

sebagai kelengkapan pertanggung jawaban tugas, kemudian Bagi

lembaga atau badan yang membawahi pelakasana program

mempunyai data yang akurat sebagai bahan pengambilan keputusan,

khususnya untuk kepentingan supervise dan bagi evaluator luar dapat

bertindak dengan obyektif karena berpijak pada data yang

dikumpulkan dengan cara-cara sesuai dengan aturan tertentu.

C. Tujuan Instruksional Umum

Setelah menyelesaikan mata kuliah ini mahasiswa dapat menerapkan

Evaluasi program pendidikan dalam proses pembelajaran

D. Tujuan Instruksional Khusus

Setelah mengikuti mata kuliah ini mahasiswa akan dapat

mengetahui apa yang dimaksud dengan Evaluasi program pendidikan,

tujuan dan fungsi evaluasi program, manfaat dan pentingnya evaluasi


program,kerangka dasar evaluasi program, kriteria evaluasi program,

komponen dan indikator program,Model-model evaluasi program,

langkah-langkah evaluasi program pendidikan

II. PENYAJIAN

A. PENGERTIAN EVALUASI PROGRAM PENDIDIKAN

Evaluasi secara etimologis berasal dari kata “evalution” yang

berarti “penilaian/penapsiran terhadap sesuatu”. Evaluasi dapat

digunakan ada bidang yang sangat luas, termasuk pada bidang

pendidikan.

Adapun Evaluasi menurut beberapa ahli yaitu dapat diuraikan

sebagai berikut :

1. Menurut Mehrens dan Lelma (1978)

Evaluasi adalah proses dalam merencanakan, memperoleh

dan menyediakan informasi yang sangat diperlukan untuk

membuat alternatif- alternatif keputusan.

2. Menurut Gronlund (1975)

Evaluasi sebagai suatu proses yang sistematis untuk

menentukan keputusan sampai sejauhmana tujuan-tujuan

pengajaran telah dicapai siswa.

3.  Menurut Wrigths Tone, dkk (1956)

Evaluasi adalah penaksiran terhadap pertumbuhan dan

kemajuan siswa ke  arah tujuan- tujuan pendidikan.


Pengertian istilah “program”, yaitu diartikan sebagai “rencana”

Jadi yang dimaksud dengan Evaluasi Program Pendidkan adalah

langkah awal dalam supervisim yaitu mengumpulkan data yang tepat

agar dapat dilanjutkan dengan pemberian pembinaan yang tepat pula

dalam perencanaan yang sudah direncanakan dalam ranah

pendidikan.

B. TUJUAN DAN FUNGSI EVALUASI PROGRAM


Di dalam merumuskan tujuan penelitian evaluasi, perancang

harus mengingat bahwa biasanya ada dua hasil yang diperoleh dari

pelaksanaan program, yaitu: hasil yang dinyatakan (stated outcomes)

dan hasil yang dinyatakan (unstated outcomes atau unintended

outcomes).

Hasil yang dinyatakan adalah hasil suatu program yang sudah

diharapkan akan muncul. Hasil ini merupakan efek pokok dari

program, misalnya kemampuan menggunakan komputer. Siswa yang

mengambil kursus komputer sudah memprogramkan kegiatannya

untuk belajar menggunakan komputer. Dalam hal ini penilaian

programnya diarahkan pada sejauh mana kemampuan menggunakan

komputer tersebut telah dikuasai.

Hasil yang tidak dinyatakan adalah hasil suatu program yang

tidak diharapkan atau tidak dengan sengaja diharapkan muncul tetapi

hasilnya ada. Contoh dari belajar menggunakan komputer adalah


demikian. Karena di dalam belajar menggunakan komputer tersebut

diperlukan konsentrasi penuh, agar tidak sering salah pencet, maka

selain memperoleh kemampuan menggunakan komputer, sehabis

mengikuti kursus siswa tersebut menjadi tambah tinggi daya

konsentrasinya. Kenaikan daya konsentrasi tersebut merupakan hasil

yang tidak dinyatakan, dan sering dikenal dengan istilah efek

pengiring.

Dengan melihat pada efek pengiring, yaitu hasil yang tidak

dinyatakan seperti dicontohkan, penilai program tentu saja belum

tahu ada tidaknya efek pengiring tersebut serta jika ada seperti apa

wujudnya. Demikian juga dengan perancang, pengelola dan

pelaksana program.

Oleh karena efek pengiring tersebut belum tentu positif, maka

tidak mustahil bahwa para penilai program mendapat tanggapan

yang baik dari pengelola program. Bisa jadi, mereka didakwa

mengada-ada, menjelekkan program dan sebagainya.

Adapun Tujuan evaluasi program antara lain sebagai berikut:

1. Untuk mengumpulkan/memperoleh data tentang hasil-hasil yang

telah dicapai pada akhir suatu periode pelaksanaan program.

2. Untuk mengetahui kesulitan atau hambatan yang dialami dalam

pelaksanaan program.
3. Untuk memperoleh dasar bagi pembuatan atau pengambilan

keputusan dalam penyusunan langkah-langkah/kebijakan yang

akandi tempuh dalam periode berikutnya.

4. Untuk menghin dari gangguan/hambatan, serta menjamin

efektivitas dan efisiensi kerja pada periode berikutnya.

Menurut Chabib Toha secara sederhana tujuan dan fungsi

evaluasi program pendidikan adalah sebagai berikut:

1. Bagi guru:
a. Untuk mengetahui kemajuan belajar siswa.
b. Untuk mengetahui kedudukan masing-masing individu peserta
didik dalam kelompoknya.
c. Untuk mengetahui kelemahan-kelemahan dalam cara belajar
mengajar.
d. Untuk memperbaiki proses belajar mengajar dan menentukan
kelulusan peserta didik.
2. Bagi peserta didik:
a. Untuk mengetahui kemampuan dan hasil belajar.
b. Untuk memperbaiki cara belajar.
c. Untuk menumbuhkan motivasi belajar.
3. Bagi sekolah:
a. Untuk mengukur mutu hasil pendidikan.
b. Untuk mengetahui kemajuan dan kemunduran sekolah.
c. Untuk membuat keputusan pada peserta didik.
d. Untuk mengadakan perbaikan kurikulum.
   4. Bagi orang tua peserta didik:

a. Untuk mengetahui hasil belajar anaknya.

b. Meningkatkan pengawasan dan bimbingan serta bantuan pada

anaknya dalam usaha belajar.

c. Mengarahkan pemilihan jurusan/jenis sekolah pendidikan

lanjutan bagi anaknya.

5. Bagi masyarakat dan pemakai jasa pendidikan:

a. Untuk mengetahui kemajuan sekolah.

b. Untuk ikut mengadakan kritik dan saran perbaikan bagi

kurikulum pendidikan pada sekolah tersebut.

c. Untuk lebih meningkatkan partisipasi masyarakat dalam usaha

membantu lembaga pendidikan.

C. MANFAAT DAN PENTINGNYA EVALUASI PROGRAM

1. Bagi pelaksana program berguna untuk dasar penyusunan laporan

sebagai kelengkapan pertanggung jawaban tugas.

2. Bagi lembaga atau badan yang membawahi pelakasana program

mempunyai data yang akurat sebagai bahan pengambilan

keputusan, khususnya untuk kepentingan supervisi.

3. Bagi evaluator luar dapat bertindak dengan obyektif karena

berpijak pada data yang dikumpulkan dengan cara-cara sesuai

dengan aturan tertentu.

D. KERANGKA DASAR EVALUASI PROGRAM


Susun kerangka acuan (terms of reference) bagi
evaluasi
(1). Tujuan evaluasi
(2). Peranan evaluasi, yakni untuk apa hasil evaluasi
itu digunakan
(3). Kendalanya
(4). Penunjangnya

Tentukan unsur- unsur program


(1). Struktural
(2). Fungsional

Kembangkan atau pilih teknik pengumpulan data bagi


masing- masing unsur program
(1). Dipersiapkan
(2). Operasional

Buat jadwal pengumpulam data

Kumpulkan dan susun data


Yang dibutuhkan

Beberapa kriteria evaluasi yang relevan


(1). Koherensi
(2). Penyebaran sumber
(3). Tanggapan pemakai
(4). Tanggapan pelaksana
(5). “Cost- Effectivenesss ”
(6). Kemampuan generative
(7). Dampak
(8). Pengarahan kebijakan
(9). “Cost – Benefit analysis”
(10). Efek pelipatganda

Analisis data
Kriteria – Deskriptif

Rangkuman hasil analisis


Pencarian pola

E. KRITERIA EVALUASI PROGRAM


Ada beberapa kriteria yang dipilih untuk digunakan dalam

evaluasi Program yang berfungsi sebagai acuan pengkajian. Ada dua

jenis kriteria yang dapat dipergunakan dalam evaluasi program, yaitu

kriteria internal dan kriteria eksternal.

Kriteria internal adalah standar yang dapat diaplikasikan

terhadap suatu program dalam kerangka program itu sendiri.

Kriteria eksternal adalah standar yang diterapkan terhadap

suatu program dari suatu sumber diluar kerangka program.

1. Kriteria internal

a. Kriteria internal yang dipergunakan adalah koherensi.

b. Kriteria internal yang dipergunakan adalah penyebaran sumber

c. Tanggapan pemakai, sikap dan reaksi pemakai yang

berpartisipasi dalam program sering menjadi criteria.

d. Tanggapan penyedia yaitu mengacu pada tanggapan pihak

yang menyediakan program, dinilai dengan kriteria yang

dijabarkan dari tujuan-tujuan program yang ditetapkan 


e. Keefektifan penggunaan biaya (cost effectininess)

f. Kemampuan generative

g. Dampak, yaitu efek lebih dibandingkan dengan yang mungkin

terjadi secara ilmiah, yaitu tanpa kehadiran program

2. Kriteria eksternal

a. Pengarahan kebijakan, biasanya program - program yang harus

dilaksanakan dalam kerangka pengarahan kebijakan tertentu.

b. Cost benefit analysis Yaitu menghendaki keuntungan-

keuntungan program baik yang segera tampak atau yang tidak

segera tampak, dan biaya pelaksanaan program, baik baiaya

langsung amupun tidak langsung.

c. Efek pelipat gandaan

F. KOMPONEN DAN INDIKATOR PROGRAM

Program merupakan sistem, sedangkan sistem adalah satu

kesatuandari beberapa bagian atau komponen program yang saling

kait-mengaitdan bekerja sama satu dengan lain untuk mencapai

tujuan yang sudah ditetapkan dalam sistem. Dengan demikian

program terdiri dari komponen-komponen yang saling berkaitan dan

saling menunjang dalam rangka mencapai suatu tujuan (Arikunto dan

Jabar, 2009:9).

Komponen program adalah bagian-bagian atau unsur-unsur

yang membangun sebuah program yang saling terkait dan

merupakan faktor-faktor penentu keberhasilan program. Oleh karena


suatu program merupakan sebuah sistem maka komponen-

komponen program tersebut dapat dipandag sebagai bagian sistem

dan dikenal dengan istilah “subsistem”.Selanjutnya istilah indikator

berasal dari bahasa Inggris yaitu to indicateyang berarti menunjukkan

atau tanda. Jadi indikator merupakan sesuatu yang dapat

menunjukkan atau sebagai tanda dari suatu subkomponen dan

sekaligus menunjukkan atau sebagai tanda suatu komponen.

Dalam kegiatan evaluasi program, indikator merupakan

petunjuk untuk mengetahui keberhasilan atau ketidakberhasilan

suatu kegiatan. Perlu diketahui bahwa ketidak berhasilan suatu

kegiatan dapat juga dipengaruhi oleh komponen atau sub komponen

yang lain.Ilustrasi dari penjelasan terkait dengan komponen,

subkomponen dan indikator dari program yang akan dievaluasi maka

dalam hal ini dikutip deskripsi yang disampaikan Arikunto dan Jabar

(2009:10-12) terkait dengan evaluasi program pembelajaran.

Di mana dalam pembelajaran sebagai program memiliki

komponen-komponen yang menjadi faktor penting

keberlangsungannya, dalam hal ini faktor-faktor yang dimaksud

sebagai berikut:

1. Pendidik.

2. Peserta didik.

3. Materi/kurikulum.
4. Sarana dan prasarana.

5. Pengelolaan.

6. Lingkungan.

F. MODEL-MODEL EVALUASI PROGRAM

1. CIPP (Context, Input, Process, Product).

Huruf pertama dari konteks evaluasi dijadikan ringkasan

CIPP, model ini terkenal dengan model CIPP oleh Stufflebeam

diantaranya sebagai berikut:

a. Evaluasi context, meliputi perumusan tujuan kegiatan evaluasi

dan lingkungan atau kondisi dimana program berlangsung.

b. Evaluasi Input, meliputi data khusus dan pertimbangan-

pertimbangan mengenai ketenagaan, waktu, biaya yang

dibutuhkan, strategi edukatif dan administratif, dsb. Bagaimana

prosedur kerja untuk mencapainya.

c. Evaluasi Process, berlangsung pada saat dilaksanakannya

program.

d. Evaluasi Product (hasil), yaitu mengadakan evaluasi terhadap

keluaran atau output dari program.

2. Evaluasi Model UCLA

Alkin (1969) menulis tentang kerangka kerja evaluasi yang

hampir sama dengan model CIPP. Ia mengemukakan lima

macam evaluasi, yaitu:


a. Sistem Assessment, yang memberikan informasi tentang

keadaan atau posisi sistem.

b. Program Planning, membantu pemilihan program tertentu

yang mungkin akan berhasil memenuhi kebutuhan program.

c. Program Implementation, yang menyiapkan informasi apakah

program sudah diperkenalkan kepada kelompok tertentu yang

tepat seperti yang direncanakan?

d. Program Improvement, yang memberikan informasi tentang

bagaimana program berfungsi, bagaiman progranm bekerja,

atau berjalan? Apakah menuju pencapaian tujuan, adakah hal-

hal atau masalah-masalah baru yang tak terduga?

e. Program Certification, yang memberi informasi tentang nilai

atau guna program.

G. LANGKAH-LANGKAH EVALUASI PROGRAM PENDIDIKAN

Evaluasi program pendidikan dilaksanakan melalui beberapa

tahapan. Secara garis besar tahapan tersebut meliputi: tahap

persiapan evaluasi program, tahap pelaksanaan evaluasi progr am,

dan tahap monitoring pelaksanaan progam.

1. Persiapan evaluasi program berupa penyusunan desain evaluasi,

penyusunan instrument evaluasi, validasi menentukan jumlah


sampel yang diperlukan dalam kegiatan evaluasi, dan penyamaan

persepsi antar evaluator sebelum pengambilan data. Seorang

evaluator harus mengetahui program dan criteria keberhasilan

program evaluasi. Setelah mengetahui tujuan dan kriteria

keberhasilan program maka seorang evaluator baru bisa

menentukan metode, alat, sasaran dan jadwal evaluasi program

pendidikan yang akan dilaksanakan. Sistematika ataukomponen

yang harus ada dalam evaluasi program pendidikan secara garis

besar sebagai berikut : latar belakang masalah, problematika,

tujuan evaluasi, populasidan sampel, instrument, dan sumber data.

2. Pelaksanaan evaluasi program

Agar proses pelaksanaan evaluasi program pendidikan

berjalan dengan baik dapat menggunakan alat pengumpulan data,

sebagai berikut :

a. Pengambilan data dengan tes

b. Pengambilan data dengan observasi

c. Pengambilan data dengan angket

d. Pengambilan data dengan wawancara

e. Pengambilan data dengan metode analisis dokumen dan artifak.

f. Monitoring pelaksanaan evaluasi program


Dalam pelaksanaan evaluasi terdapat pemantauan atau

monitoring dalam pelaksanaannya,diantaranya yaitu :

1) Fungsi pemantauan

Pemantauan memiliki fungsi pokok yaitu mengetahui

kesesuaian pelaksanaan program dengan rencana program dan

untuk mengetahui seberapa pelaksanaan program yang sedang

berlangsung dapat diharapkan akan menghasilkan perubahan

yang diinginkan.

2) Sasaran pemantauan

Sasaran pemantauan yaitu dengan menemukan Hal-hal

bagaimana seberapa jauh pelaksanaan program telah sesuai

dengan rencana program dan menunjukkan tanda-tanda

tercapainya tujuan program.

3) Pelaku  pemantauan Pemantauan program dilakukan oleh

evaluator bersama dengan pelaku atau pelaksana program

Soal Latihan

1. Jelaskan secara Etimomologis dan umum mengenai Evaluasi Program

Pendidikan ?

2. Jelaskan apa yang dimaksud dengan komponen program dan bagian hal

penting dalam komponen program dalam melakukan suatu kegiatan

evaluasi ?
BAB VI
TEORI TES KLASIK

I. PENDAHULUAN

A. Deskripsi Singkat

Materi ini membahas tentang pengertian teori klasik, asumsi-

asumsi teori klasik, jenis-jenis skala pengukuran.

B. Manfaat
Mata kuliah ini mendukung mahasiswa agar lebih aktif dalam

melaksanakan evaluasi belajar. Dengan memahami secara tepat mata

kuliah ini, akan sangat membantu mahasiswa untuk mengetahui

pengertian teori klasik.

C. Tujuan Instruksional Umum

Setelah mengikuti perkuliahan mahasiswa memiliki kemampuan

dalam merencanakan, melaksanakan dan mengevaluasi hasil

pembelajaran.

D. Tujuan Instruksional Khusus

Setelah mengikuti mata kuliah ini mahasiswa memiliki kemampuan

untuk menjelaskan pengertian dari teori klasik.

II. Pengkajian

A. Pengertian Teori Tes Klasik

Teori tes klasik atau classical test theory (CTT) merupakan salah

satu pendekatan yang digunakan dalam dunia pengukuran dibidang

Psikologi. Teori tes klasik dikenal juga dengan sebutan teori skor

murni (true score theory). Hal ini berkaitan dengan fokus kajian teori tes
klasik yang ingin melihat nilai skor murni dari skor tampak yang

diperoleh. Teori ini dikembangkan oleh Charles Spearman tahun 1904

dan masih terus digunakan hingga saat ini. Spearman mengembangkan

CTT dengan menggabungkan konsep eror dan korelasi (Salkind, 2007).

CTT merupakan teori psikometri yang populer serta banyak

digunakan pada berbagai disiplin ilmu (psikologi, pendidikan, dan ilmu

sosial lainnya). Istilah “klasik” yang digunakan tidak hanya mengacu

kronologi model ini, tetapi juga sebagai kontras dengan lebih teori

psikometri yang lebih baru yang disebut sebagai sebagai Teori Respon

Butir (Item Response Theory), yang sering kali disebut juga dengan

istilah "teori modern". Terdapat beberapa perbedaan yang mendasari

teori tes klasik dengan teori respon butir. Dari sisi pendekatan, teori tes

klasik mengadopsi pendekatan deterministik (certainty) dimana fokus

utama analisis adalah skor total individu (X). Setiap tes memiliki eror (E)

yang menyertai setiap hasil pengukuran dalam mengukur sifat manusia.

Skor murni (T) dan error (E) keduanya adalah variabel laten, namun

tujuan pengujian adalah untuk menarik kesimpulan mengenai skor

murni individu. Skor per-item juga dapat dipastikan benar dan salahnya

yaitu misalnya jika jawaban seseorang benar maka diberi skor 1 dan

salah diberi skor 0. Sedangkan IRT berfokus pada probabilitas dalam

menjawab setiap item dimana menilai jawaban bukan pada total skor

seseorang melainkan mempertimbangkan respon/jawaban seseorang


pada level item. Pemberian skornya juga bukan dengan cara

menentukan skor 1 atau 0, melainkan probabilitas orang tersebut

mendapat skor 1 atau skor 0.

B. Asumsi Teoritik Mengenai Skor

Seperti yang dijelaskan sebelumnya, teori tes klasik memiliki

banyak asumsi di dalamnya. Performasi subjek pada suatu skala

pengukuran dinyatakan dalam angka yang disebut skor. Skor ini

merupakan skor perolehan pengukuran yang selanjutnya disebut

sebagai skor tampak atau dilambangkan dengan X. Di dalam skor

tampat terdapat skor murni (T) dan error pengukuran (E) yang tidak

pernah dapat diketahui besarannya (Azwar, 2011). Teori tes klasik

bekerja pada tataran skor tampak dengan menggunakan model linier

dalam menjelaskan model skor. Beberapa asumsi yang mendasar skor

dalam teori tes klasik diantaranya sebagai berikut (disarikan dari Azwar,

2015)

Asumsi ini menyatakan bahwa hubungan Skor tampak (X), skor

murni (T), dan eror pengukuran (E) bersifat aditif. Skor tampak (X) yang

diperoleh individu merupakan akumulasi dari skor murni (T) dan eror

pengukuran (E).
Asumsi pertama teori tes klasik adalah bahwa terdapat hubungan

antara skor tampak (observed score) yang dilambangkan dengan huruf

X, skor murni (true score) yang dilambangkan dengan T dan skor

kasalahan (error) yang dilambangkan dengan E. Menurut Saifuddin

Azwar (2001: 30) yang dimaksud kesalahan pada pengukuran dalam

teori klasik adalah penyimpangan tampak dari skor harapan teoritik yang

terjadi secara random. Hubungan itu adalah bahwa besarnya skor

tampak ditentukan oleh skor murni dan kesalahan pengukuran. Dalam.

bahasa matematika dapat dilambangkan dengan X = T + E.

Asumsi ini menyatakan bahwa skor murni merupakan nilai harapan

X. Karena besar skor murni diasumsikan tetap dalam setiap pengukuran,

maka besar varians skor tampak akan tergantung pada variasi eror

pengukuran.

Asumsi kedua adalah bahwa skor murni (T) merupakan nilai

harapan є (X). Dengan demikian skor murni adalah nilai rata-rata skor

perolehan teoretis sekiranya dilakukan pengukuran berulang-ulang

(sampai tak terhingga) terhadap seseorang dengan menggunakan alat

ukur.
Korelasi antara eror pengukuran dan skor murni adalah nol.

Menurut asumsi ini, bagi suatu kelompok populasi subjek yang dikenai

tes distribusi eror pengukuran dan distribusi skor murni adalah

independen satu sama lain. variasi eror tidak tergantung pada variasi

skor murni.

Asumsi kelima menyatakan bahwa jika terdapat dua tes untuk

mengukur atribut yang sama maka skor kesalahan pada tes pertama

tidak berkorelasi dengan skor murni pada tes kedua ( ). Asumsi ini akan

gugurjika salah satu tes tersebut ternyata mengukur aspek yang

berpengaruh terhadap teradinya kesalahan pada pengukuran yang lain.

Bila e1 adalah eror pengukuran tes pertama dan e2 adalah eror

pengukuran tes kedua, maka asumsi ini menyatakan bahwa distribusi

eror kedua tes tersebut tidak berkorelasi satu sama lain.

Asumsi kelima menyatakan bahwa eror pada suatu tes tidak

berkorelasi degan skor murni pada tes lain.

Asumsi keenam teori tes klasik adalah menyajikan tentang

pengertian tes yang pararel. Dua perangkat tes dapat clikatakan sebagai
tes-tes yang pararel jika skor-skor populasi yang menempuh kedua tes

tersebut mendapat skor murni yang sama ( T = T' )dan varian skor-skor

kesalahannya sama ( ). Dalam prakteknya, asumsi keenam teori ini sulit

terpenuhi.

Asumsi terakhir dari teori tes klasik menyatakan tentang definisi tes

yang setara (essentially equivalent). Jika dua perangkat tes mempunyai

skor-skor perolehan dan yang memenuhi asumsi 1 sampai 5 dan apabila

untuk setiap populasi subyek X1 = X2 + C12, dimana C12 adalah sebuah

bilangan konstanta, maka kedua tes itu disebut tes yang pararel.

Asumsi-asumsi teori klasik di atas memungkinkan untuk

dikembangkan dalam rangka pengembangan berbagai formula yang

berguna dalam melakukan pengukuran psikologis. Daya beda, indeks

kesukaran, efektifitas distraktoradalah formula penting yang disarikan dari

teori tes klasik.

1. Daya beda

Daya beda (diskriminasi) suatu butir tes adalah kemampuan

suatu butir untuk membedakan antara peserta tes yang

berkemampuan tinggi dan berkemampuan rendah. Adapun fungsi dari

daya pembeda adalah mendeteksi perbedaan individual yang sekecil-

kecilnya diantara para peserta tes. Penentuan daya beda butir


biasanya dilakukan dengan menggunakan indeks korelasi,

diskriminasi, dan indeks keselarasan item. Dari ketiga cara tersebut

yang paling sering digunakan adalah indeks korelasi. Ada empat

macam teknik korelasi yang biasa digunakan untuk menghitung daya

beda, yaitu : (1) teknik point biserial, (2) teknik biserial, (3) teknik phi,

dan (4) teknik tetrachorik. Brennan (1972) sebagaimana dikutip Yen

W.M dalam Encyclopedia of EducationalResearch memperkenalkan

cara untuk menghitung Indeks diskriminasi dengan menggunakan

rumus sebagai berikut:

B=U_L

 n1    n2

Dimana dari rumus di atas dapat dimaknai bahwa daya beda adalah

perbedaan antara proporsi kelompok atas yang menjawab benar butir

tes menjawab benar butir tes U

n1 

Dengan proporsi kelompok bawah yang menjawab butir tes L

n2
Rumus tersebut dapat digunakan untuk menghitung daya beda butir-

butir soal dalam bentuk pilihan ganda.

Daya beda juga dapat dijelaskan sebagai derajad hubungan

antara skor butir dengan skor  total dengan menggunakan teknik

korelasi product moment dari Pearson. Rumus khusus korelasi product

moment yang dikenal dengan korelasi point biserial untuk data dalam

bentuk dikotomi sebagaimana dikutip dalam Encyclopedia of

Educational Research adalah sebagai berikut:

rpbis = (x+ -x)   p    

Sx       q

Dimana x , mean total skor peserta yang memiliki jawaban benar. x

adalah mean skormtotal S, adalah standar deviasi skor total,  p adalah

proporsi peserta ujian yang menjawab benar pada butir tes sedangkan

q adalah 1 – p. Rumus korelasi point biserial juga dapat diturunkan

langsung dari rumus korelasi produk momen tanpa membuat

pembatasan asumsi.Alternatif lain untuk melihat indeks daya beda

adalah dengan menggunakan rumus korelasi biserial. Korelasi biserial

berbeda dengan korelasi point biserial baik secara teori maupun

perhitungan, akan tetapi jika digunakan untuk tujuan menganalisis


butir, kedua teknik tersebut dapat di interpretasikan dengan cara yang

sama. Crocker menyatakan rumus korelasi biserial sebagai berikut: rbis 

= ( x+ – x  ) P

                   Sx         y

“y” pada rumus korelasi biserial di atas melambangkan ordinat p dalam

kurva normal. x+ adalah mean skor dari peserta tes yang memiliki

jawaban benar,  x adalah mean skor total, Sx adalah deviasi standar

total,  p adalah proporsi peserta ujian yang menjawab benar butir ini

dikarenakan tingkat kesukaran dikombinasikan dengan kriteria oleh

koefisien point biserial.

Teknik lain untuk menentukan nilai daya beda adalah dengan

menggunakan teknik korelasi phi (ø) f . Anas Sudijono menuliskan

rumus tentang teknik korelasi phi sebagai berikut: ø = P H – P L

           2√(p)(q)

ø adalah adalah angka indeks diskriminasi phi yang dianggap sebagai

angka indeks diskriminasi butir. PH adalah proporsi orang yang

menjawab benar kelompok atas. PL adalah proporsi orang yang

menjawab benar kelompok bawah. p adalah proporsi seluruh peserta

tes yang menjawab betul dan q adalah 1 dikurangi p.


Untuk menyatakan bahwa besaran daya beda dapat berfungsi

dengan baik, ada beberapa patokan yang dapat digunakan. Menurut

Djemari Mardapi butir yang diterima harus memiliki indeks daya beda

> 0,3 butir dengan indeks daya beda kurang dari antara 0,1 sampai 0,3

perlu direvisi dan jika daya bedanya < 0,1 maka butir tersebut tidak

diterima. Sedangkan Ebel & Frisbie  memberikan patokan indeks daya

beda sebagai berikut:

Indeks daya beda Evaluasi butir

0,4 keatas Butir yang sangat baik

0,3 – 0,39 Sedikit atau tidak memerlukan revisi

0,2 – 0,29 Butir memerlukan revisi

< 0,19 Butir harus dieliminasi

2. Indeks Kesukaran

Indeks kesukaran butir sebagaimana dinyatakan oleh Allen & Yen

adalah proportion ofexaminees who get that item correct. Senada

dengan mereka, Sax menulis bahwa indeks kesukaran adalah proporsi

peserta ujian yang menjawab benar. Saifuddin Azwar (2003: 134)


menyatakan dengan lebih lugas bahwa indeks kesukaran butir adalah

rasio penjawab butir dengan benar dan banyaknya penjawab butir.

Proporsi menjawab benar p (proportion correct) adalah indeks

kesukaran soal yang paling sederhana dan sering digunakan dalam

menentukan besaran indeks.

Rumus untuk menentukabesarnya indeks kesukaran secara

matematis dirumuskan oleh Saifuddin sebagai berikut: P = n1

P adalah indeks kesukaran butir, n1 adalah jumlah peserta tes

yang menjawab benar sedangkan N adalah banyaknya siswa yang

menjawab butir soal tersebut. Dengan demikian untuk menghitung

indeks kesukaran butir dilakukan dengan tidak membagi kelompok

peserta tes kedalam kelompok atas dan bawah sebagaimana untuk

menentukan daya beda.

Besarnya indeks korelasi berkisar antara 0 sampai 1. Makin tinggi

besaran indeks korelasi maka butir soal tersebut semakin mudah. Dan

semakin kecil angka indeks korelasi maka butir soal tersebut semakin

sulit. Indeks kesukaran yang berada disekitar 0,5 dianggap yang

terbaik. Karena itulah maka menurut Allen & Yen tingkat kesukaran

yang baik adalah 0,3 sampai 0,7. Butir dengan tingkat kesulitan
dibawah 0,3 dianggap butir soal yang sukar sedangkan jika indeksnya

diatas 0,7 butir soal tersebut dianggap mudah.Dari penjelasan di atas

bisa disimpulkan berkaitan dengan indeks kesukaran butir yaitu bahwa

nilai p bagi suatu butir hanya menunjukkan indeks bagi kelompok yang

diuji. Harga p ini bisa berubah jika tes diujikan pada kelompok yang

berbeda. Selain itu, indeks kesukaran yang dihasilkan dari rumus ini

adalah indeks kesukaran yang berlaku bagi kelompok secara

keseluruhan bukan perorangan. Indeks kesukaran bagi tiap peserta

tes tidak bisa disimpulkan dengan melihat indeks proporsi menjawab

benar p.

3. Efektivitas Distraktor

Setiap tes pilihan ganda memiliki satu pertanyaan serta beberapa

pilihan jawaban. Diantara pilihan jawaban yang ada, hanya satu yang

benar. Selain jawaban yang benar ada juga Jawaban yang salah atau

distractor (pengecoh). Dengan demikian, efektifitas distraktor adalah

seberapa baik pilihan yang salah tersebut dapat mengecoh peserta tes

yang memang tidak mengetahui kunci jawaban yang tersedia.

Semakin banyak peserta tes yang memilih distraktor tersebut, maka

distaktor itu dapat menjalankan fungsinya dengan baik.


Cara menganalisis fungsi distraktor dapat dilakukan dengan

menganalisis pola penyebaran jawaban butir. Pola penyebaran

jawaban adalah suatu pola yang dapat menggambarkan bagaimana

peserta tes dapat menentukan pilihan jawabannya terhadap

kemungkinan-kemungkinan jawaban yang telah dipasangkan pada

setiap butir.

Menurut Fernandes (1984: 29) distraktor dikatakan baik jika

dipilih oleh minimal 2% dari seluruh peserta. Distraktor yang tidak

memenuhi kriteria tersebut sebaiknya diganti dengan distraktor lain

yang mungkin lebih menarik minat peserta tes untuk memilihnya.

Meskipun penggunaan teori tes klasik relatif mudah dalam

menganalisis butir, tapi teori ini memiliki beberapa kelemahan

mendasar. Kelemahan utama teori tes klasik adalah keterikatan alat

ukur teori tersebut pada sampel (sample bound). Kemampuan

kelompok siswa yang mengikuti tes sangat mempengaruhi nilai

statistik. sehingga nilai statistiknya akan berbeda jika tes diberikan

kepada kelompok yang lain.

Selain itu, perkiraan kemampuan peserta tergantung pada butir

soal. Jika indeks kesukaran rendah maka estimasi kemampuan

seseorang akan tinggi dan sebaliknya. Perkiraan kesalahan


pengukuran tidak mencakup perorangan tetapi kelompok secara

bersama-sama. Hal ini dikarenakan respon setiap peserta tes

terhadap soal tidak bisa dijelaskan oleh teori tes klasik.

Dalam proses pembelajaran hal-hal tersebut akan menimbulkan

berbagai macam kesukaran terutama untuk melihat kemampuan

peserta tes secara perorangan. Oleh karena itulah ada upaya untuk

membebaskan alat ukur dari keterikatan terhadap sampel (sample-

free). Berangkat dari hal itulah para ahli kemudian menyusun teori

baru yang bermaksud untuk melengkapi dan memperbaiki kelemahan-

kelemahan yang ada dalam teori tes klasik. Teori ini kemudian dikenal

dengan Item Response Theory (IRT) atau teori respon butir.

Soal Latihan

1. Jelaskan definisi teori tes klasik yang dikembangkan oleh Charles

Spearman tahun 1904?

2. Sebutkan formula yang berguna penting dari teori klasik ?


BAB VII

KONSTRUKSI TEST

I. PENDAHULUAN

A. Deskripsi Singkat

Materi ini membahas tentang konsep belajar, konsep hasil

belajar, pengertian konstruksi tes, hal yang harus diperhatikan dalam

dalam merencanakan evaluasi, prinsip-prinsip dasar dalam

penyusunan test, jenis-jenis test, ciri-ciri tes yang baik.

B. Manfaat

Materi ini juga bermanfaat bagi pendidik dalam melakukan

konstruksi test karena dalam materi ini berisi pembahasan tentang

pengertian konstruksi tes, hal yang harus diperhatikan dalam dalam


merencanakan evaluasi, prinsip-prinsip dasar dalam penyusunan

test, jenis-jenis test, ciri-ciri tes yang baik.

C. Tujuan Instruksional Umum

Setelah mengikuti perkuliahan mahasiswa memiliki kemampuan

dalam merencanakan, melaksanakan dan mengevaluasi hasil

pembelajaran.

D. Tujuan Instruksional Khusus

Setelah mengikuti mata kuliah ini mahasiswa akan dapat

mengetahui pengertian kontruksi test.

II. PENYAJIAN

A. Konsep Belajar

Menurut Teori belajar behaviorisme (tingkah laku) belajar

adalah proses perubahan tingkah laku. Menurut teori ini yang

terpenting adalah masukan/input yang berupa masukkan dan

keluaran/output yang berupa respon.Selanjutnya teori belajar

kognitivisme menyatakan bahwa belajar adlah perubahan persepsi

dan pemahaman.

Berdasarkan pendapat ini dapat dipahami bahwa pada

dasarnya belajar merupakan proses perubahan tingkah laku yang

berlangsujng dalam jangka waktu tertentu melalui pemberian

pengetahuan, latihan maupun pengalaman. Belajar dengan


pengalaman akan membawa pada perubahan diri dan cara

merespon lingkungan.

B. Konsep Hasil Belajar

Hasil belajar merupakan tujuan akhir dilaksanakannya kegiatan

pembelajaran disekolah. Menurut Sudjana (2010:22), hasil belajar

merupakan kemampuan yang dimiliki siswa setelah menerima

pengalaman belajar. Selanjutnya Warsito mengemukakan bahwa

hasil dari kegiatan belajar ditandai dengan adanya perubahan

perilaku kea rah positif yang relative permanen pada diri orang yang

belajar. Sehubungan dengan pendapat itu, maka Wahidmurni,dkk.

(2010:18) menjelaskan bahwa seseorang dapat dikatakan telah

berhasil dalam belajar jika ia mampu menunjukkan adanya

perubahan dalam dirinya. Perubahan-perubahan tersebut

diantaranya dari segi kemampuan berpikirnya, keterampilannya,

atau sikapnya terhadap suatu objek.

Untuk mengetahui hasil belajar seseorang dapat dilakukan

dnegan melakukan tes dan pengukuran.Tes dan pengukuran

memerlukan alat sebagai pengumpul data yang disebut dengan

instrument penilaian hasil belajar. Menurut Wahidmurni,dkk

(2010:28), instrument dibagi menjadi dua bagian besar, yakni tes

dan nontes. Selanjutnya, menurut Hamalik (2006:155), gambaran

hasil belajar yang diperoleh dapat diukur melalui kemajuan yang


diperoleh siswa setelah belajar.Hasil belajar tampak terjadinya

perubahan tingkah laku pada diri siswa yang dapat diamati dan

diukur melalui perubahan sikap dan keterampilan.Perubahan

tersebut dapat diartikan terjadinya peningkatan dan pengembangan

yang lebih baik disbanding sebelumnya.

Berdasarkan konsepsi diatas, pengertian hasil belajar dapat

disimpulkan sebagai perilaku secara positif serta kemampuan yang

dimiliki siswa dari suatu interaksi tindak belajar dan mengajar yang

berupa hasil intelektual, strategi kogitif, sikap dan nilai, inovasi verbal

dan hasil belajar motoric.Perubahan tersebut dapat diartkan

terajdinya peningkatan dan pengembangan yang lebih baik

disbanding dengan sebelumnya.

C. Konstruksi Tes

1. Pengertian Konstruksi Tes

Menurut Michael Suswanto konstruksi adalah cara

penyusunan alat ukur tes secara ilmiah ( sistematis, obyektif dan

standar).

Test Menurut Ridwan (2006;37) adalah sebagai

instrument pengumpulan data, serangkaian pertanyaan/latihan

yang digunakan untuk mengukur keterampilan pengetahuan,

intelegensi, kemampuan atau bakat yang dimiliki

individu/kelompok.
Konstruksi Tes adalah prosedur sistematis untuk

mengukur keterampilan pengetahuan atau bakat yang dimiliki

individu atau kelompok.

2. Hal yang harus diperhatikan dalam merencanakan test

(Menheren & Lehman, 1984,p.64)

a. Tujuan Test

b. Pengetahuan, keterampilan, sikap atau lainnya yang ingin

diukur.

c. tabel spesifikasi

d. Kesesuaian butir tes dengan tujuan

e. Format butir tes

f. Lama waktu untuk tes

g. Tingkat kesukaran tes

h. Tingkat pembedaan tes

i. susunan format tes (bisa lebih dari satu)

j. Susunan butir tes untuk tiap format

k. Persiapan mahasiswa

l. Tempat menulis jawaban tes

m. Cara penskoran

n. Penskoran tes esai dan pilihan ganda

o. Tabulasi skor tes

p. laporan hasil tes


Test yang banyak digunakan di sekolah adalah tes hasil belajar

yang dilaksanakan di kelas. Tes ini mempunyai beberapa tujuan :

a. Menentukan tingkat kemampuan siswa

b. mengukur pertumbuhan dan perkembangan siswa

c. merangking siswa berdasarkan kemampuannya

d. mendiagnosis kesulitan siswa

e. mengevaluasi hasil pengajaran

f. mengetahui efektifitas kurikulum (pencapaian kurikulum)

g. memotivasi siswa

Sebuah tes sering kali bisa digunakan untuk beberapa

tujuan, tetapi tidak akan memiliki efektifitas yang sama untuk

semua tujuan.

3. Prinsip-Prinsip Dasar Dalam Penyusunan Tes Hasil Belajar

Ada beberapa prinsip dasar yang perlu dicermati didalam

menyusun tes hasil belajar agar tes tersebut dapat mengukur

tujuan instruksional khusus untuk mata pelajaran yang telah

diajarkan, atau mengukur kemampuan dan keterampilan peserta

didik yang diharapkan setelah mereka menyelesaikan suatu unit

pengajaran tertentu.

a. Tes hasil belajar harus dapat mengukur secara jelas hasil

belajar (learning out comes) yang telah ditetapkan sesuai

dengan tujuan instruksional. Kejelasan mengenai pengukuran


hasil belajar yang dikehendaki akan memudahkan bagi guru

dalam menyusun butir-butir soal tes hasil belajar.

b. Butir-butir soal tes hasil belajar harus merupakan sampel

yang representatif dari populasi bahan pelajaran yang telah

diajarkan, sehingga dapat dianggap mewakili seluruh

performan yang telah diperoleh selama peserta didik

mengikuti suatu unit pengajaran.

c. Bentuk soal yang dikeluarkan dalam tes hasil belajar harus

dibuat bervariasi, sehingga betul-betul cocok untuk mengukur

hasil belajar yang diinginkan sesuai dengan tujuan tes itu

sendiri.Untuk mengukur hasil belajar yang berupa

keterampilan misalnya, tidak tepat jika hanya menggunakan

soal-soal yang berbentuk essay test yang jawabannya hanya

mengurai dan bukan melakukan atau mempraktekkan

sesuatu. Demikian pula untuk mengukur kemampuan

menganalisis suatu prinsip, tidak cocok jika digunakan butir-

bitir soal yang berbentuk objective test yang pada dasarnya

hanya mengungkap daya ingat peserta didik.

d. Tes hasil belajar harus didesain sesuai dengan kegunaannya

untuk memperoleh hasil yang diinginkan.Pernyataan tersebut

mengandung makna, bahwa desain tes hasil belajar harus


disusun relevan dengan kegunaan yang dimiliki oleh masing-

masing jenis tes.

e. Tes hasil belajar harus memiliki reliabiltas yang dapat

diandalkan. Artinya, setelah tes hasil belajar itu dilaksanakan

berkali-kali terhadap subyek yang sama, hasilnya selalu sama

atau relatif sama. Dengan demikian tes hasil belajar itu

hendaknya memiliki keajegan hasil pengukuran yang tidak

diragukan lagi

Tes hasil belajar disamping harus dapat dijadikan alat

pengukur keberhasilan belajar siswa, juga harus dapat

dijadikan alat untuk mencari informasi yang berguna untuk

memperbaiki cara belajar siswa dan cara mengajar guru itu

sendiri.

4. Jenis-Jenis Tes

a. Dari segi bentuk pelaksanaannya

1) Tes Tertulis ( paper and pencil test)

Tes tertulis dalam pelaksanaannya lebih

menekankan pada penggunaan kertas dan pencil sebagai

instrumen utamanya, sehingga tes mengerjakan soal atau

jawaban ujian pada kertas ujian secara tertulis, baik

dengan tulisan tangan maupun menggunakan komputer.

2) Tes Lisan ( oral test)


Tes lisan dilakukan dengan pembicaraan atau

wawancara tatap muka antara guru dan murid.

3) Tes Perbuatan (performance test)

Tes perbuatan mengacu pada proses penampilan

seseorang dalam melakukan sesuatu unit kerja. Tes

perbuatan mengutamakan pelaksanaan perbuatan peserta

didik.

b. Dari segi bentuk soal dan kemungkinan jawabannya

1) Tes Essay (uraian)

Tes Essay adalah tes yang disusun dalam bentuk

pertanyaan terstruktur dan siswa menyusun,

mengorganisasikan sendiri jawaban tiap pertanyaan itu

dengan bahasa sendiri. Tes essay ini sangat bermanfaat

untuk mengembangkan kemampuan dalam menjelaskan

atau mengungkapkan suatu pendapat dalam bahasa

sendiri.

2) Tes Objektif

Tes objektif adalah tes yang disusun sedemikian

rupa dan telah disediakan alternatif jawabannya. Tes ini

terdiri dariberbagai macam bentuk, antara lain ;

a) Tes Betul-Salah (TrueFalse)

b) Tes Pilihan Ganda (Multiple Choice)


c) Tes Menjodohkan (Matching)

d) Tes Analisa Hubungan (Relationship Analysis)

c. Dari segi fungsi tes di sekolah

1) Tes Formatif

Tes Formatif, yaitu tes yang diberikan untuk

memonitor kemajuan belajar selama proses pembelajaran

berlangsung. Tes ini diberikankan dalam tiap satuan unit

pembelajaran. Manfaat tes formatif bagi peserta didik

adalah :

a) Untuk mengetahui apakah peserta didik sudah

menguasai materi dalam tiap unit pembelajaran.

b) Merupakan penguatan bagi peserta didik.

c) Merupakan usaha perbaikan bagi siswa, karena

dengan tes formatif peserta didik mengetahui

kelemahan-kelemahan yang dimilikinya.

d) Peserta didik dapat mengetahui bagian dari bahan

yang mana yang belum dikuasainya.

2) Tes Summatif

Tes sumatif diberikan dengan maksud untuk

mengetahui penguasaan atau pencapaian peserta didik

dalam bidang tertentu.Tes sumatif dilaksanakan pada

tengah atau akhir semester.


3) Tes Penempatan

Tes penempatan adalah tes yang diberikan dalam

rangka menentukan jurusan yang akan dimasuki peserta

didik atau kelompok mana yang paling baik ditempati atau

dimasuki peserta didik dalam belajar.

4) Tes Diagnostik

Tes diagnostik adalah tes yang digunakan untuk

mendiagosis penyebab kesulitan yang dihadapi seseorang

baik dari segi intelektual, emosi, fisik dan lain-lain yang

mengganggu kegiatan belajarnya.

5. Ciri-ciri tes yang baik

Menurut arikonto (1992), Sebuah tes yang dapat

dikatakan baik sebagai alat pengukur harus memilki persyaratan

tes, yaitu memiliki:

a. Validitas

Sebuah tes disebut valid apabila tes tersebut dapat tepat

mengukur apa yang hendak diukur. Contoh, untuk mengukur

partisipasi siswa dalam proses belajar mengajar, bukan diukur

melalui nilai yang diperoleh pada waktu ulangan, tetapi dilihat

melalui: kehadiran, terpusatnya perhatian pada pelajaran,

ketepatan menjawab pertanyaan-pertanyaan yang diajukan

oleh guru dalam arti relevan pada permasalahannya.


b. Reliabilitas

Berasal dari kata asal reliable yang artinya dapat

dipercaya.Tes dapat dikatakan dapat dipercaya jika

memberikan hasil yang tetap apabila diteskan berkali-

kali.Sebuah tes dikatakan reliabel apabila hasil-hasil tes

tersebut menunjukan ketetapan. Jika dihubungkan dengan

validitas, maka: Validitas adalah ketepatan dan reliabilitas

adalah ketetapan.

c. Objektivitas

Sebuah dikatakan memiliki objektivitas apabila dalam

melaksanakan tes itu tidak ada faktor subjektif yang

mempengaruhi.hal ini terutama terjadi pada sistem

scoringnya. Apabila dikaitkan dengan reliabilitas maka

objektivitas menekankan ketetapan pada sistem scoringnya,

sedangkan reliabilitas menekankan ketetapan dalam hasil tes.

d. Praktikabilitas

Sebuah tes dikatakan memiliki praktibilitas yang tinggi

apabila tes tersebut bersifat praktis dan mudah

pengadministrasiannya.tes yang baik adalah yang mudah

dilaksanakan, mudah pemeriksaannya, dan dilengkapi

dengan petunjuk-petunjuk yang jelas.

e. Ekonomis
Yang dimaksud ekonomis disini ialah bahwa

pelaksanaan tes tersebut tidak membutuhkan ongkos atau

biaya yang mahal, tenaga yang banyak, dan waktu yang

lama.

Soal Latihan

1. Jelaskan jenis-jenis Tes dari segi bentuk pelaksanaanya baik secara

ltertulisan, lisan, dan perbuatan?

2. Sebutkan Ciri-ciri melakukan tes yang baik menurut Arikunto(1992)

BAB VIII

ANALISIS TES

I. PENDAHULUAN

A. Deskripsi singkat

Mata kuliah ini membahas tentang pengertian analisi tes,kegiatan

analisis tes meliputi empat hal yakni analisis validasi tes

reliabitas,analisis butir soal( item analysis) dan analisis teknik kegunaan

tes.

B. Manfaat

Mata kuliah ini merupakan penjelasan tentang kegiatan analisis tes

untuk mengetahui mutu suatu tes yang di buat oleh tenaga pendidik.

Mata kuliah ini sangat membantu tenaga pendidik untuk memahami

wujud tes yang baik dan bagaimana butir soal yang baik, karena isi

materi mata kuliah ini memberi panduan pada tenaga pendidik dalam
membuat tes agar dapat terjamin objektifitas dan keakuratannya.

Dengan memahami secara tepat mata kuliah ini, akan sangat

membantu tenaga pendidik dalam menyususn tes dengan baik dan

efisien.

C. Tujuan Instruksional Umum

Setelah menyelesaikan mata kuliah ini mahasiswa

dapatmengetahui apa analisis tes.

4) Tujuan Instruksional Khusus

Setelah mengikuti mata kuliah ini mahasiswa akan dapat

menerapkan analisis tes dengan melakukan empat carayakni analisis

validasi tes reliabitas,analisis butir soal( item analysis) dan analisis

teknik kegunaan tes.


II. PENYAJIAN

A. Pengertian Analisis Tes

Analisis tes adalah salah satu kegiatan dalam rangka

mengkonstruksi tes untuk mendapatkan gambaran tentang mutu tes,

baik mutu keseluruhan tes maupun mutu tiap butir soal/tugas.Analisis

dilakukan setelah tes disusun dan dicobakan kepada sejumlah subyek

dan hasilnya menjadi umpan balik untuk perbaikan/peningkatan mutu

tes bersangkutan. Oleh karena itu kegiatan analisis tes merupakan

keharusan dalam keseluruhan proses mengkonstruksi tes. Dalam

analisis tes juga ada beberapa yang harus kita perhatikan,

diantaranya:

1. Menilai tes yang dibuat sendiri

Secara teoritis, siswa dalam satu kelas merupakan populasi

atau kelompok yang keadaannya heterogen. Dengan demikian,

maka apabila dikenai sebuah tes akan tercermin hasilnya dalam

suatu kurva normal. Sebagai besar siswa berada di daerah

sedang, sebagian kecil berada di ekor kiri, dan sebagaian kecil

yang lain berada di ekor kanan kurva.

Apabila keadaan setelah hasil dianalisis tidak seperti yang

diharapkan dalam kurva normal, maka tentu ada “apa-apa”

dengan soal tesnya.Apabila hampir seluruh siswa memperoleh

skor jelek, berarti bahwa tes yang disusun mungkin terlalu


sukar.Sebaliknya jka seluruh siswa memperoleh skor baik, dapat

diartikan bahwa tesnya terlalu mudah. Tentu saja interpretasi

terhadap soal tes akan lain seandainya tes itu sudah disusun

sebaik-baiknya sehingga memenuhi persyaratan sebagai tes.

Dengan demikian maka apabila kita memperoleh keterangan

tentang hasil tes, akan membantu kita dalam mengadakan

penilaian secara objektif terhadap tes yang kita susun. Ada 4

(empat)cara untuk menilai tes, yaitu:

a. Cara pertama meneliti secara jujur soal-soal yang sudah

disusun, kadang-kadang dapat diperoleh jawaban tentang

ketidakjelasan perintah atau bahasa, taraf kesukaran, dan

lain-lain keadaan soal tersebut. Pertanyaan-pertanyaan

tersebut, antara lain:

1) Apakah banyaknya soal untuk tiap topik sudah seimbang?

2) Apakah semua soal menanyakan bahan yang telah

diajarkan?

3) Apakah soal yang kita susun tidak merupakan pertanyaan

yang membingungkan (dapat di salah tafsirkan)?

4) Apakah soal itu tidak sukar untuk dimengerti?

5) Apakah soal itu dapat dikerjakan oleh sebagaian bbesar

siswa?
b. Cara kedua adalah mengadakan analisis soal (item analysis).

Analisis soal adalah suatu prosedur yang sistematis, yang

akan memberikan informasi-informasi yang sangat khusus

terhadap butir tes yang kita susun.

c. Cara ketiga adalah mengadakan checking validitas. Validitas

yang paling penting dari tes buatan guru adalah validitas

kurikuler (content validity). Untuk mengadakan checking

validitas kurikuler, kita harus merumuskan tujuan setiap

bagian pelajaran secara khusus dan jelas sehingga setiap

soal dapat kita jodohkan dengan setiap tujuan khusus

tersebut.

2. Cakupan kegiatan analisis tes

Kegiatan analisis tes meliputi empat hal yakni :

a. Analisis validitas tes

b. Analisis reliabilitas tes

c. Analisis butir soal yang meliputi :

1) Analisis daya pembeda tiap butir soal,

2) Analisis tingkat kesukaran tiap butir soal,

3) Analisis pengecoh (distraktor) pada setiap butir soal,

4) Analisis homogenitas tiap butir soal.

d. Analisis teknis kegunaan tes.


Dengan melakukan analisis tes, guru dapat “menabung-

soal” atau membuat “bank-soal” yakni kumpulan soal-soal

yang sudah teruji kebaikannya.Manfaat terbesar dari kegiatan

analisis tes ialah guru makin memahami bagaimana wujud

tes yang baik, bagaimana butir soal yang baik.Sehingga pada

akhirnya guru makin terampil menyusun tes dengan baik dan

efisien.

Kritik terhadap tes bentuk pilihan ganda yang dianggap

lebih buruk dari tes bentuk uraian karena “makin

membodohkan siswa”, sebenarnya bersumber pada tes

pilihan ganda yang buruk. Tes pilihan ganda (tes obyektif)

yang baik, yang dianalisis dari berbagai segi dan digunakan

sesuai tujuan pendidikan, akan lebih baik dibanding tes

bentuk uraian yang tidak dianalisis. Oleh sebab itu tes bentuk

apapun perlu dianalisis agar dapat terjamin obyektifitas dan

keakuratannya.

Pembahasan analisis tes di sini akan terbatas pada tes

buatan guru/dosen, dan bukan psikotes yang dibuat para ahli

atau THB yang dibakukan.

B. Cara Mengetahui Validitas Tes

Validitas tes adalah tingkat keabsahan atau ketepatan suatu

tes. Tes yang valid (absah = sah) adalah tes benar-benar mengukur
apa yang hendak diukur. Tes matematika kelas dua SMP, hendaknya

benar-benar mengukur hasil belajar matematika siswa SMP kelas dua

; bukan siswa SMP kelas tiga atau siswa SD kelas enam. Dan bukan

mengukur hasil belajar dalam bidang studi lainnya.

Tes yang disusun untuk mengukur hasil belajar mata pelajaran

kimia pada kelas tertentu, hendaknya tidak menyimpang sehingga

mengukur hasil belajar matematika atau bahasa, atau kimia untuk

kelas lainnya.

Dengan kata lain, validitas tes menunjukkan tingkat ketepatan

tes dalam mengukur sasaran yang hendak diukur.Ada empat macam

validitas tes hasil belajar, yakni:

1. Validitas permukaan (face validity)

Tingkat validitas permukaan diketahui dengan melakukan analisis

atau telaah rasional ( semata-mata berdasarkan pertimbangan

logis, bukan pada hitungan angka-angka empirik ). Analisis

permukaan meliputi berbagai aspek berikut ini:

a. Apakah bahasa dan susunan kalimat (redaksi) tiap butir soal

cukup jelas dan sesuai dengan kemampuan siswa?

b. Apakah isi jawaban yang diminta tidak membingungkan?

c. Apakah cara menjawab sudah dipahami siswa?

d. Jangan sampai siswa tahu isi jawabannya tetapi tidak tahu

bagaimana cara menjawab soal bersangkutan.


e. Apakah tes itu telah disusun berdasar kaidah/prinsip

penulisan butir soal?

Tes yang tidak mengikuti kaidah penulisan butir soal akan tampak

semerawut sehingga membingungkan.

Setiap tes paling sedikit harus diperiksa melalui analisis

permukaan. Walaupun analisis ini tergolong paling lemah, namun

lebih baik daripada tidak ada analisis sama sekali. Tentu saja akan

lebih baik bila suatu tes dianalisis lebih lanjut.

2. Validitas isi (content validity)

Tingkat validitas isi juga diketahui dengan analisis rasional.

Pada prinsipnya dilakukan pemeriksaan terhadap tiap butir soal,

apakah soal sudah sesuai dengan Tujuan Pembelajaran Khusus

atau dengan kompetensi yang hendak diukur atau dengan

indikator keberhasilan siswa.

Cara yang lazim ialah mencocokkan tiap butir soal dengan

kisi-kisi yang disusun berdasarkan GBPP (Garis Besar Program

Pengajaran).Pengujian validitas isi dilakukan dengan menjawab

pertanyaan berikut.

a. Apakah keseluruhan tes telah sesuai dengan kisi-kisi?

Kisi-kisi adalah suatu bagian atau matrik yang menggambarkan

penyebaran soal-soal sesuai dengan aspek atau pokok

bahasan yang hendak diukur, tingkat kesukaran dan jenis soal.


Kisi-kisi itu harus disusun sedemikian rupa sehingga mencakup

seluruh bahan pelajaran yang akan diteskan.Tingkat kesesuaian

seluruh butir soal dengan kisi-kisi (dengan bahan yang akan

diteskan) menunjukkan tingkat validitas isi.

b. Apakah terdapat butir soal yang menyimpang, atau menuntut

jawaban di luar bahan pelajaran bersangkutan?

Misalnya soal dalam mata pelajaran fisika dimana

menjurus/menyimpang ke hitungan matematika atau

kemampuan di luar pokok bahasan yang diajarkan.

Penyimpangan yang tidak kentara itu perlu dihilangkan.Semakin

banyak soal yang menyimpang, semakin rendah tingkat

validitas isi.Untuk melakukan analisis validitas isi diperlukan

adanya kisi-kisi tes yang disusun sebelum soal-soal ditulis.

3. Validitas kriteria (criterion validity)

Validitas ini diketahui dengan cara empirik, yakni menghitung

koefisien korelasi antara tes bersangkutan dengan tes lain sebagai

kriterianya. Yang dapat digunakan sebagai kriteria adalah tes yang

sudah dianggap valid, atau nilai mata pelajaran yang sama yang

dipandang cukup obyektif. Sebagai contoh, skor tes Bahasa

Inggris buatan guru dikorelasikan dengan skor tes Bahasa Inggris

yang telah dibakukan.Skor tes Matematika kelas I SMA

dikorelasikan dengan nilai rata-rata Matematika.Dengan rumus

korelasi Pearson’s Product Moment dan menggunakan kalkulator,


perhitungan validitas criteria tersebut tidak terlalu sulit, apalagi bila

menggunakan komputer.

Kesulitan utama dalam menentukan validitas kriteria ialah

mencari skor tes yang akan dijadikan kriteria. Bila kriterianya buruk

atau tidak valid, maka validitas tes yang diperoleh akan percuma

saja.

4. Validitas ramalan (predictive validity)

Validitas ini menunjukkan sejauh mana skor tes

bersangkutan dapat digunakan meramal keberhasilan siswa

dimasa mendatang dalam bidang tertentu. Cara menghitungnya

sama seperti validitas kriteria, dalam hal ini skor tes dikorelasikan

dengan keberhasilan siswa di masa datang. Misalnya antara nilai

UAN ( Ujian Akhir Nasional ) di SMA, dengan prestasi belajar di

perguruan tinggi dalam mata pelajaran yang sama.

Suatu tes yang baik biasanya memiliki angka validitas 0,50

atau lebih; tentu saja angka itu makin tinggi makin baik. Suatu tes

dengan angka validitas kurang dari 0,50 belum tentu buruk.

Mungkin kriterianya yang buruk atau keliru menentukan kriteria.

C. Cara Mengetahui Reliabitas Tes

Reliabilitas tes adalah tingkat keajegan (konsistensi) suatu tes,

yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan

skor yang ajeg/konsisten (tidak berubah-ubah).Tes yang reliabel atau


dapat dipercaya adalah tes yang menghasilkan skor secara ajeg,

relatif tidak berubah walaupun diteskan pada situasi dan waktu yang

berbeda-beda. Sebaiknya, tes yang tidak reliabel seperti karet untuk

mengukur panjang, hasil pengukuran dengan karet dapat berubah-

ubah ( tidak konsisten ).

Ada tiga cara mengetahui reliabilitas tes. Pada prinsipnya

diperoleh dengan menghitung koefisien korelasi antara dua kelompok

skor tes. Tiga cara itu sebagai berikut.

A. Tes-retest method (metoda tes ulang)

Suatu tes (yakni tes yang akan dihitung reliabilitasnya),

diteskan terhadap kelompok siswa tertentu dua kali dengan jangka

waktu tertentu (misalnya satu semester atau satu catur wulan).

Skor hasil pengetesan pertama dikorelasikan dengan skor

hasil pengetesan kedua.Koefisien korelasi yang diperoleh

menunjukkan koefisien reliabilitas tes tersebut.

Contoh:

Tes Pertama Tes Kedua


Siswa
Skor Ranking Skor Ranking
A 15 3 20 3
B 20 1 25 1
C 9 5 15 5
D 18 2 23 2
E 12 4 18 4
Walaupun tampak skornya naik, akan tetapi kenaikannya dialami

oleh semua siswa.Metode ini disebut self-correlation method

(korelasi diri sendiri) karena mengkorelasikan hasil dari tes yang

sama.

B. Paralel test method (metoda tes parallel)

Cara ini mengharuskan adanya dua tes yang parallel, yakni

dua tes yang disusun dengan tujuan yang sama (hanya sedikit

perbedaan redaksi, isi atau susunan kalimatnya). Dua tes tersebut

diadministrasikan pada satu kelompok siswa dengan perbedaan

waktu beberapa hari saja. Skor dari kedua macam tes tersebut

dikorelasikan dengan teknik yang sama seperti pada metode tes-

retest. Koefisien korelasi yang diperoleh menunjukkan tingkat

reliabilitas tes.

C. Split-half method (metode belah dua)

Kelemahan penggunaan metode dua-tes kali percobaan dan

satu-tes dua kali percobaan diatasi dengan metode ketiga ini yaitu

metode belah dua. Dalam menggunakan metode ini pengetes

hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh

karena itu, disebut juga single-test-single-trial-method.

Berbeda dengan metode pertama dan kedua yang setelah

diketemukan koefisien dan korelasi langsung ditafsirkan itulah

koefisien reliabitas maka dengan metode ketiga ini tidak dapat


demikian.Pada waktu membelah dua dan mengkorelasikan dua

belahan, baru diketahui reliabitas setengah tes.Untuk mengetahui

reliabitas seluruh tes harus digunakan rumus. Spearman-Brown

sebagai berikut:

Contoh:

2× r ½½
r 11=
( 1+r ½½ )

Di mana:

r½½ = korelasi antara skor-skor setiap belahan tes

r11 = koefisien realibitas yang sudah disesuaikan

Contoh:

Korelasi antara belahan tes = 0,60

2 ×0,60
Maka Reliabilitas tes =0,75
( 1+ 0,60 )

Banyak pemakai metode ini salah membelah hasil tes pada

waktu, menganalisis. Yang mereka lakukan adalah

mengelompokkan hasil setengah subjek peserta tes dan setengah

yang lain kemudian hasil kedua kelompok ini dikorelasikan. Yang

benar adalah membelah item atau butir soal. Tidak akan keliru

kiranya bagi pemakai metode ini harus ingat bahwa banyaknya

butir soal harus genap agar dapat dibelah.Ada dua cara membelah

butir soal:
a. Membelah atas item-item genap dan item-item ganjil yang

selanjutnya disebut belahan ganjil-genap, dan

b. Membelah atas item-item awal dan item-item akhir yaitu

setengah jumlah pada nomor-nomor awal dan setengah pada

nomor-nomor akhir yang selanjutnya disebut belahan awal-

akhir.

D. Cara Mengetahui Analisis Butir Soal (Item Analysis)

Analisis butir soal atau analisis item adalah pengkajian

pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan yang

memiliki kualitas yang memadai.Ada dua jenis analisis butir soal,

yakni analisis tingkat kesukaran soal dan analisis daya pembeda

disamping validitas dan reliabitas.Menganalisis tingkat kesukaran soal

artinya mengkaji soal-soal mana yang termasuk mudah, sedang dan

sukar.

Sedangkan menganalisis daya pembeda artinya mengkaji soal-

soal tes dari segi kesanggupan tes tersebut dalam membedakan

siswa yang termasuk ke dalam kategori lemah atau rendah dan

kategori kuat atau tinggi prestasinya.Sedangkan validitas dan

reliabitas mengkaji kesulitan dan keajegan pertanyaan tes.

Salah satu cara untuk memperbaiki proses belajar-mengajar

yang paling efektif ialah dengan jalan mengevaluasi test hasil belajar

yang diperoleh hasil belajar dari proses belajar-mengajar itu sendiri.


Dengan kata lain, hasil test itu kita oleh sedemikian rupa sehingga

dari hasil pengolahan itu dapat diketahui kompenan-kompenan

manakakah dari proses belajar-mengajar itu yang masih lemah.

Pengolahan test hasil belajar dalam rangka memperbaiki proses

belajar-mengajar dapat dilakukan dengan berbagai cara, antara lain:

1. Dengan membuat analisis soal (item analysis)

2. Dengan mennghitung validitas dan kaeandalan tes.

3. Dalam pasal ini khusus akan di bicarakan cara yang pertama,yaitu

teknik analisis soal atau yang biasa disebut item analisis. Cara

yang kedua, yaitu menghitung validititas dan keandalan tes.

Menurut thorndike dan hagen(1977), analisis terhadap soal-soal

(items) tes yang telah di jawab oleh murid-murid mempunyai dua

tujuan penting. Pertama, jawaban-jawaban soal itu merupakan

informasi diagnostik untuk meneliti pelajaran dari kelas itu dan

kegagalan-kegagalan belajarnya, serta selanjutnya untuk

membimbing ke arah belajar yang lebih baik.

Kedua, jawaban-jawaban terhadap soal-soal yang terpisah dan

perbaikan (review) soal-soal yang didasarkan atas jawaban-jawaban

itu merupakan basis bagi penyiapan tes-tes yang lebih baik untuk

tahun berikutnya.

Jadi, tujuan khususnya dari items analysis ialah mencari soal

tes mana yang baik dan mana yang tidak baik,dan mengapa items
atau soal itu di katakan baik atau tidak baik. Dengan mengetahui soal-

soal yang tidak baik itu selanjutnya kita dapat mencari kemungkinan

sebab-sebab mengapa item itu tidak baik. Dengan membuat analisis

soal, sedikitnya kita dapat mengetahui tiga hal penting yang dapat di

peroleh dari tiap soal,yaitu:

1. Sampai dimana tingkat atau taraf kesukaran soal itu (difficulty

levelof an item).

2. Apakah soal itu mempunyai daya pembeda (discriminating power)

sehingga dapat membedakan kelompok siswa yang pandai

dengan kelompok siswa yang bodoh.

3. Apakah semua alternatif jawaban (options) menarik jawaban-

jawaban ataukah ada yang demikian tidak menarik tidak menarik

sehingga tidak tidak perlu dimasukkan ke dalam soal.

a. Taraf Kesukaran

Asumsi yang digunakan untuk memperoleh kualitas soal

yang baik, disamping memenuhi validitas dan reliabitas, adalah

adanya keseimbangan dari tingkat kesulitan soal

tersebut.Keseimbangan yang dimaksudkan adalah adanya soal-

soal yang termasuk mudah, sedang, sukar secara

proporsional.Tingkat kesukaran soal dipandang dari kesanggupan

atau kemampuan siswa dalam menjawabnya, bukan dilihat dari

sudut guru sebagai pembuat soal.


Persoalan yanng penting dalam melakukan analisis tingkat

kesukaran soal adalah penentuan proporsi dan kriteria soal yang

termasuk mudah, sedang, dan sukar.

Soal yang baik adalah soal yang tidak terlalu mudah atau

tidak terlalu sukar.Soal yang terlalu mudah tidak merangsang

siswa untuk mempertinggi usaha memecahkannya. Sebaliknya

soal yang terlalu sukar akan menyebabkan siswa menjadi putus

asa dan tidak mempunyai semangat untuk mencoba lagi karena di

luar jangkauannya.

Bilangan yang menunjukan sukar dan mudahnya sesuatu

soal tersebut indeks kesukaran (difficulty index). Besarnya indeks

kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran ini

menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran

0,0 menunjukan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0

menunjukan bahwa soalnya terlalu mudah.

0,0 1,0

Sukar Mudah

Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P

(p besar), singkatan dari kata “proporsi”. Dengan demikian maka

soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P =


0,20. Sebaliknya soal dengan P = 0,30 lebih sukar dengan P =

0,80.

Melihat besarnya bilangan indeks maka lebih cocok jika

bukan disebut sebagai indeks kesukaran tetapi indeks kemudahan

atau indeks fasilitas, karena semakin mudah soal itu, semakin

besar pula bilangan indeksnya.Akan tetapi telah disepakati bahwa

walaupunseemakin tinggi indeksnya menunjukan soal yang

semakin mudah, tetapi tetap disebut indeks kesukaran.

Rumus mencari P adalah:

B
Rumus : P=
JS

Di mana:

P = Indeks kesukaran

B = Banyaknya siswa yang menjawab soal itu dengan betul

JS = Jumlah seluruh siswa peserta tes

b. Daya Pembeda

Daya pembeda soal adalah kemampuan sesuatu soal untuk

membedakan antara siswa yang pandai (berkemampuan tinggi)

dengan siswa yang bodoh (berkemampuan rendah).

Angka yang menunjukan besarnya daya pembeda disebut

indeks diskriminasi, disingkat D (d besar). Seperti hanya indeks

kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara


0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak

mengenal tanda negatif (-), tetapi pada indeks diskriminasi

digunakan jika sesuatu soal “terbalik” menunjukan kualitas

testee.Yaitu anak pandai disebut bodoh dan anak bodoh disebut

pandai. Dengan demikian ada tiga titik pada daya pembeda, yaitu:

-1,000,00 1,00

daya pembeda daya pembeda daya pembeda

negatif rendah tinggi (positif)

Jawab benar oleh siswa pandai maupun siswa bodoh, maka

soal itu tidak baik karena tidak mempunyai daya

pembeda.Demikian pula jika semua siswa baik pandai maupun

bodoh tidak dapat menjawab dengan benar.Soal tersebut tidak

baik juga karena tidak mempunyai daya pembeda.Soal yang baik

adalah soal yang dapat dijawab benar oleh siswa-siswa pandai

saja.

Analisis daya pembeda mengkaji butir-butir soal dengan

tujuan untuk mengetahui kesanggupan soal dalam membedakan

siswa yang tergolong mampu (tinggi prestasinya) dengan siswa

yang tergolong kurang atau lemah prestasinya.Artinya, bila soal

tersebut diberikan kepada anak yang mampu, hasilnya


menunjukan prestasi yang tinggi; dan bila diberikan kepada siswa

yang lemah, hasilnya rendah.

Tes dikatakan tidak memiliki daya pembeda apabila tes

tersebut, jika diujikan kepada anak berprestasi, hasilnya rendah,

tetapi bila diberikan kepada anak yang lemah hasilnya lebih tinggi.

Atau bila diiberikan kepada kedua kategori siswa tersebut,

hasilnya sama aja. Dengan demikian, tes yang tiidak memiliki daya

pembeda, tidak akan menghasilkan gambaran hasil yang sesuai

dengan kemampuan siswa yang sebenarnya.

Sungguh aneh bila anak pandai tidak lulus, tetapi anak bodoh

lulus dengan baik tanpa dilakukan manipulasi oleh si penilai atau

di luar faktor kebetulan.

Cara yang biasa dilakukan dalam analisis daya pembeda

adalah dengan menggunakan tabel atau kriteria dari Rose dan

Stanley seperti berikut.

Di mana:

SR - ST

SR = Siswa yang menjawab salah dari kelompok rendah

ST = Siswa yang menjawab salah dari kelompok tinggi

Contoh:
Tes pilihan ganda atau option 4 diberikan kepada 30 orang

siswa.Jumlah soal 15. Setelah diperiksa, datanya adalah sebagai

berikut:

Jumlah siswa Jumlah siswa


yang yang
No. menjawab menjawab SR - ST Ket.
Soal salah salah
kelompok kelompok
rendah (SR) tinggi (ST)
1 6 1 5
2 6 1 5
3 5 2 3
4 6 1 5
5 2 1 1
6 5 1 4
7 2 1 1
8 7 1 6
9 7 1 6
10 4 2 2
11 3 1 2
12 6 1 2
13 2 1 5
14 6 1 1
15 5 2 3

c. Pola jawaban soal

Yang dimaksud pola jawaban disini adalah distribusi testee

dalam hal menentukan pilihan jawaban pada soal bentuk pilihan

ganda.Pola jawaban soal diperoleh dengan menghitung

banyaknya testee yang memilih pilihan jawaban a, b, c, atau d


atau yang tidak memilih pilihan manapun (blangko). Dalam istilah

evaluasi disebut omit, disingkat O.

Dan pola jawaban soal dapat ditentukan apakah pengecoh

(distractor) berfungsi sebagai pengecoh dengan baiik atau tidak.

Pengecoh yang tidak dipilih sama sekali oleh testee berarti bahwa

pengecoh itu jelek, terlalu menyolok menyesatkan. Sebaliknya

sebuah distraktor (pengecoh) dapat dikatakan berfungsi dengan

baik apabila distraktor tersebut mempunyai daya tarik yang besar

bagi pengikut-pengikut tes yang kurang memahami konsep atau

kurang menguasai bahan.

Dengan melihat pola jawaban soal, dapat diketahui:

1) Taraf kesukaran soal;

2) Daya pembeda soal;

3) Baik dan tidaknya distraktor.

Sesuatu distraktor dapat diperlukan dengan 3 (tiga) cara:

1) Diterima, karena sudah baik,

2) Ditolak, karena tidak baik,

3) Ditulis kembali, karena kurang baik.

Kekurangannya mungkin hanya terletak pada rumusan

kalimatnya sehingga hanya perlu ditulis kembali, dengan

perubahan seperlunya.Menulis soal adalah suatu pekerjaan yang


sulit, sehingga apabila masih dapat diperbaiki, sebaiknya

diperbaiki saja, tidak dibuang.Suatu distraktor dapat dikatakan

berfungsi baik jika paling sedikit dipilih oleh 5% pengikut tes

Soal Latihan

1. Jelaskan apa yang dimaksud dengan analisis Test dan kapan

penggunaanya ?

2. Sebutkan cakupan yang termasuk dalam kegiatan analisis tes ?


BAB IX

MANAJEMEN PENGUJIAN

I. PENDAHULUAN

A. Deskripsi Singkat

Dalam materi ini membahas tentang definisi materi pengujian,

organisasi pengujian (aturan dasar) terdiri dari tupoksi panitian ujian,

Blue print ujian ( kisi-kisi, parameter), pengembangan instrument.

B. Manfaat

Mata kuliahmendukung mahasiswa agar lebih aktif dalam

melaksanakan evaluasi belajar. Dengan memahami secara tepat

mata kuliah ini, akamn sangat membantu mahasiswa dalam

mengetahui manajemen pengujian.

C. Tujuan Intrusional Umum

Setelah mengikuti perkuliahan mahasiswa memiliki kemampuan

dalam merencanakan, melaksanakan dan mengevaluasi hasil

pembelajaran.

D. Tujuan Instruksional Khusus

Setelah mengikuti mata kuliah ini mahasiswa memeliki

kemampuan untuk mengetahui langkah-langkah manajemen

pengujian
II. PENYAJIAN

A. Definisi

1. Manajemen

Manajemen adalah suatu proses perencanaan,

perorganisasian, penggerakan dan pengawasan usaha anggota

dalam organisasi serta penggunaan sumber daya lain untuk

mencapai tujuan yang telah ditetapkan.

2. Pengujian

Menurut Kep.Dir No 004.K/DIR/2013, penguji adalah

segala kegiatan yang bertujuan untuk mengukur dan menilai

unjuk kerja suatu instalasi

Secara umum menajemen pengujian adalah suatu

proses perencanaan, penyusunan, pelaksanaan dan

pengawasan dalam mengelola segala sumber daya yang berupa

manusia, uang material, metode, mesin market, waktu dan

informasi, untuk mencapai tujuan dengan efektif dan efisien

dalam bidang pendidikan.

B. Organisasi Pengujian

1. Tupoksi Panitian Ujian

Tugas Panitia Ujian Pemantapan :

a. Persiapan Ujian Pemantapan

Setelah pembentukan Panitia Ujian Pemantapan oleh

kepala Sekolah, Panitia mengadakan rapat Panitia untuk


menyusun Program Kerja, RAPBS, Jadwal Ujian

Pemantapan, Penetapan Peserta Pemantapan, pembuatan

nomor peserta, nomor ruang dsb.

b. Melaksanakan sosialisasi pelaksanaan ujian Pemantapan

kepada guru dan siswa

c. Hari Pertama, empat puluh lima (45) menit sebelum ujian

dimulai Panitia Ujian Pemantapan telah

d. hadir di Sekolah Penyelenggara Ujian Pemantapan untuk

memberikan penjelasan dan pengarahan kepada Pengawas

Ujian Pemantapan .

e. memeriksa kesiapan ruang ujian

f. memberikan pengarahan kepada peserta ujian

2. Pelaksanaan Ujian Pemantapan

a. Panitia menbunyikan bel 2 kali tanda masuk ruangan Ujian

Pemantapan

b. Panitia Ujian Pemantapan memberikan bahan Ujian

Pemantapan kepada pengawas berupa

c. naskah soal Ujian Pemantapan, LJK Ujian Pemantapan,

amplop LJK Ujian Pemantapan, daftar hadir, dan berita

acara pelaksanaan Ujian Pemantapan.

d. Panitia membunyikan bel 1 kali tanda mulai mengerjakan soal


e. Panitia Ujian Pemantapan memonitor pelaksanaan Ujian

Pemantapan dan mengabsen pengawas

f. Panitia membunyikan bel 1 kali tanda waktu tinggal 5 menit

g. Panitia membunyikan bel 2 kali tanda waktu Ujian

Pemantapan selesai

h. Panitia ujian Pemantapan menerima : naskah soal Ujian

Pemantapan, LJ Ujian Pemantapan,

i. amplop LJK Ujian Pemantapan, daftar hadir, dan berita

acara pelaksanaan Ujian Pemantapan.

j. Memeriksa jumlah LJK UP dan keabsahan dari: LJK Ujian

Pemantapan, daftar hadir, dan berita

k. acara pelaksanaan Ujian Pemantapan yang telah diisi dan

diserahkan oleh pengawas

3. Setelah Pelaksanaan Ujian Pemantapan

a. Panitia Ujian Pemantapan menyerahkan LJK UP, Berita

Acara, Daftar Hadir, masing masing

b. Ruangan rangkap 2 yang telah dimasukan kedalan amplop

selanjutnya di setor ke Sekretariat Ujian.

C. Penyusunan Kisi – Kisi

Kisi-kisi (test blue-print atau table of specification) merupakan

deskripsi kompetensi dan materi yang akan diujikan.


Tujuan penyusunan kisi-kisi adalah untuk menentukan ruang

lingkup dan sebagai petunjuk dalam menulis soal.

Kisi-kisi yang baik harus memenuhi persyaratan berikut ini:

1. Kisi-kisi harus dapat mewakili isi silabus/kurikulum atau materi

yang telah diajarkan secara tepat dan proporsional.

2. Komponen-komponennya diuraikan secara jelas dan mudah

dipahami.

3. Materi yang hendak ditanyakan dapat dibuatkan soalnya.

D. Pengembangan Instrumen

Instrument penelitian adalah alat – alat yang digunakan untuk

memperoleh atau mengumpulkan data dalam rangka memecahkan

masalah penelitian atau mencapai tujuan penelitian. Jika data yang

diperoleh tidak akurat (valid), maka keputusan yang diambilpun akan

tidak tepat. Instrumen memegang peranan penting dalam

menentukan mutu suatu penelitian dan penilaian.Fungsi instrumen

adalah mengungkapkan fakta menjadi data. Menurut Arikunto, data

merupakan penggambaran variabel yang diteliti dan berfungsi

sebagai alat pembuktian hipotesis, benar tidaknya data tergantung

dari baik tidaknya instrumen pengumpulan data.(nunu nurjannah

2011)

1. Pengembangan Instrumen

a. Intrumen tes

Langkah-langkah Pengembangan Instrumen Tes :


1) Menetapkan tujuan tes

Langkah awal dalam mengembangkan instrumen

tes adalah menetapkan tujuannya. Tujuan ini penting

ditetapkan sebelum tes dikembangkan karena seperti apa

dan bagaimana tes yang akan dikembangkan sangat

bergantung untuk tujuan apa tes tersebut digunakan.

Ditinjau dari tujuannya, ada empat macam tes yang

banyak digunakan di lembaga pendidikan, yaitu : (a) tes

penempatan, (b) tes diagnostik, (c) tes formatif, dan (d) tes

sumatif (Thorndike & Hagen, 1977).

2) Melakukan analisis kurikulum

Analisis kurikulum dilakukan dengan cara melihat

dan menelaah kembali kurikulum yang ada berkaitan

dengan tujuan tes yang telah ditetapkan. Langkah ini

dimaksudkan agar dalam proses pengembangan

instrumen tes selalu mengacu pada kurikulum (SKKD)

yang sedang digunakan. Instrumen yang dikembangkan

seharusnya sesuai dengan indikator pencapaian suatu KD

yang terdapat dalam Standar Isi (SI).

3) Membuat kisi-kisi

Kisi-kisi merupakan matriks yang berisi spesifikasi

soal-soal (meliputi SK-KD, materi, indikator, dan bentuk


soal) yang akan dibuat. Dalam membuat kisi-kisi ini, kita

juga harus menentukan bentuk tes yang akan kita berikan.

Beberapa bentuk tes yang ada antara lain: pilihan ganda,

jawaban singkat, menjodohkan, tes benar-salah.

4) Menulis soal

Pada kegiatan menuliskan butir soal ini, setiap

butir soal yang Anda tulis harus berdasarkan pada

indikator yang telah dituliskan pada kisi-kisi dan

dituangkan dalam spesifikasi butir soal.Bentuk butir soal

mengacu pada deskripsi umum dan deskrips khusus yang

sudah dirancang dalam spesifikasi butir soal.

5) Melakukan telaah instrumen secara teoritis

Telaah instrumen tes secara teoritis atau kualitatif

dilakukan untuk melihat kebenaran instrumen dari segi

materi, konstruksi, dan bahasa. Telaah instrumen secara

teoritis dapat dilakukan dengan cara meminta bantuan

ahli/pakar, teman sejawat, maupun dapat dilakukan telaah

sendiri. Setelah melakukan telaah ini kemudian dapat

diketahui apakah secara teoritis instrumen layak atau

tidak.

6) Melakukan ujicoba dan analisis hasil ujicoba tes

Sebelum tes digunakan perlu dilakukan terlebih

dahulu uji coba tes.Langkah ini diperlukan untuk


memperoleh data empiris terhadap kualitas tes yang telah

disusun. Ujicoba ini dapat dilakukan ke sebagian siswa,

sehingga dari hasil ujicoba ini diperoleh data yang

digunakan sebagai dasar analisis tentang reliabilitas,

validitas, tingkat kesukaran, pola jawaban, efektivitas

pengecoh, daya beda, dan lain-lain. Jika perangkat tes

yang disusun belum memenuhi kualitas yang diharapkan,

berdasarkan hasil ujicoba tersebut maka kemudian

dilakukan revisi instrumen tes.

7) Merevisi soal

Berdasarkan hasil analisis butir soal hasil ujicoba

kemudian dilakukan perbaikan.Berbagai bagian tes yang

masih kurang memenuhi standar kualitas yang diharapkan

perlu diperbaiki sehingga diperoleh perangkat tes yang

lebih baik.Untuk soal yang sudah baik tidak perlu lagi

dibenahi, tetapi soal yang masuk kategori tidak bagus

harus dibuang karena tidak memenuhi standar

kualitas.Setelah tersusun butir soal yang bagus, kemudian

butir soal tersebut disusun kembali untuk menjadi

perangkat instrumen tes, sehingga instrumen tes siap

digunakan.Perangkat tes yang telah digunakan dapat

dimasukkan ke dalam bank soal sehingga suatu saat nanti

bisa digunakan lagi.


b. Instrumen nontes

Ada sembilan langkah dalam mengembangkan instrumen non

tes, yaitu :

1) Menentukan spesifikasi instrument

Penentuan spesifikasi instrumen dimulai dengan

menentukan kejelasan tujuan.Setelah menetapkan tujuan,

kegiatan berikutnya menyusun kisi-kisi instrumen.

Membuat kisikisi diawali dengan menentukan definisi

konseptual, yaitu definisi aspek yang akan diukur menurut

hasil kajian teoritik berbagai ahli/referensi. Selanjutnya

merumuskan definisi operasional, yaitu definisi yang Anda

buat tentang aspek yang akan diukur setelah mencermati

definisi konseptual. Definisi operasional ini kemudian

dijabarkan menjadi indikator dan ditulisan dalam kisi-

kisi.Selanjutnya Anda perlu menentukan bentuk instrumen

dan panjang instrumen.

2) Menentukan skala penilaian

Skala yang sering digunakan dalam instrumen

penilaian antara lain adalah: Skala Thurstone, Skala

Likert, dan Skala Beda Semantik.

3) Menulis butir instrument


Pada tahap ini Anda merumuskan butir-butir

instrumen berdasarkan kisi-kisi.Pernyataan dapat berupa

pernyataan positif dan negatif.Pernyataan positif

merupakan pernyataan yang mengadung makna selaras

dengan indikator, sedangkan pernyataan negatif adalah

pernyataan yang berisi kontra kondisi dengan indikator.

4) Menentukan penyekoran

Sistem penyekoran yang digunakan tergantung

pada skala pengukuran yang digunakan.Pada skala

Thurstone, skor tertinggi tiap butir 7 dan skor terendah 1.

Pada skala Likert, awal skor tertinggi tiap butir 5 dan

terendah 1, karena sering terjadi kecenderungan

responden memilih jawaban katergori tengah, maka

dimodifikasi hanya menggunakan empat pilihan.

5) Menelaah instrument

Kegiatan pada telaah instrumen adalah menelaah

apakah: a) butir pertanyaan/ pernyataan sesuai dengan

indikator, b) bahasa yang digunakan komunikatif dan

menggunakan tata bahasa yang benar, c) butir

pertanyaan/pernyataan tidak bias, d) format instrumen

menarik untuk dibaca, e) pedoman menjawab atau

mengisi instrumen jelas, dan f) jumlah butir dan/atau


panjang kalimat pertanyaan/ pernyataan sudah tepat

sehingga tidak menjemukan untuk dibaca/dijawab. Hasil

telaah instrumen digunakan untuk memperbaiki instrumen.

6) Menyusun instrument

Langkah ini merupakan tahap menyusun butir-

butir instrumen setelah dilakukan penelaahan menjadi

seperangkat instrumen yang siap untuk

diujicobakan.Format instrumen harus dibuat menarik dan

tidak terlalu panjang, sehingga responden tertarik untuk

membaca dan mengisinya.

7) Melakukan uji coba instrumen

Setelah instrumen tersusun dengan utuh,

kemudian melakukan ujicoba instrumen.Untuk itu dipilih

sampel yang karakteristiknya mewakili populasi.Ujicoba

dilakukan untuk memperoleh informasi empirik tentang

kualitas instrumen yang dikembangkan.

8) Menganalisis hasil ujicoba

Analisis hasil ujicoba dilakukan untuk

menganalisis kualitas instrumen berdasarkan data

ujicoba.Dari analisis ini diharapkan diketahui mana yang

sudah baik, mana yang kurang baik dan perlu diperbaiki,

dan mana yang tidak bisa digunakan.Selain itu, analisis

hasil ujicoba ini juga dapat digunakan untuk memperoleh

informasi tentang validitas dan reliabilitas instrumen.


9) Memperbaiki instrument

Perbaikan dilakukan berdasarkan analisis hasil

ujicoba.Bisa saja hasil telaah instrumen baik, namun hasil

ujicoba empirik tidak baik.Perbaikan termasuk

mengakomodasi saran-saran dari responden ujicoba.

2. Keriteria instrumen yang baik

Ada tiga kriteria pokok yang harus dipenuhi oleh suatu

instrument penelitian agar dapat dinyatakan memiliki kualitas

yang baik. Kriteria tersebut adalah: (1) validitas, (2) reliabilitas,

(3) praktikabilitas (Gronlund & Linn, 1997:47). Dua kriteria yang

disebutkan pertama perlu mendapatkan perhatian yang seksama

dalam pengembangan instrument penelitian. Seperti yang

dinyatakan oleh Kerlinger (1973:442), “Apabila seorang peneliti

tidak mengetahui validitas dan reliabilitas instrument yang

digunakannya, maka sedikit keyakinan yang dapat diberikannya

kepada data yang diperoleh dan kesimpulan yang diambil dari

data tersebut”

a. Validasi

Suatu instrument dikatakan telah memiliki validitas

(kesahihan/ketepatan) yang baik ‘ jika instrument tersebut

benar – benar mengukur apa yang seharusnya hendak

diukur”. (Nunnally,1978:86). Ketepatan beberapa alat ukur


relative mudah ditetapkan, seperti penggaris untuk mengukur

panjang dan timbangan untuk mengukur berat. Validitas

instrument lebih tepat diartikan sebagai derajat kedekatan

hasil pengukuran dengan keadaan yang sebenarnya

(kebenaran), bukan masalah sama sekali benar atau

seluruhnya salah. Validitas mengacu pada ketepatan

interpretasi yang dibuat dari data yang dihasilkan oleh suatu

instrument dalam hubungannya dengan suatu tujuan tertentu.

Sebagai contoh, sebuah tes yang dipakai untuk

keperluan seleksi mahasiswa baru mungkin valid untuk tujuan

tersebut, namun kurang atau tidak valid untuk mengukur

tingkat penguasaan siswa terhadap bahan pelajaran di SMTA.

Berkenaan dengan hal tersebut, validitas instrument

dibedakan menjadi tiga bagian besar yang dikenal dengan

nama validitas isi, validitas kriteria, dan validitas konstruk

(Gronlund & linn,1990; Anastasi, 1988; Kerlinger, 1973)

Validitas isi yang sering juga disebut dengan validitas

kurikuler, validitas intrinsik atau validitas kerevrentatipan,

diartikan sebagai derajat keterwakilan aspek kemampuan

yang hendak diukur di dalam butir – butir instrument. Untuk

mengetahui validitas isi suatu instrument ialah dengan jalan

membandingkan butir – butir instrument dengan spesifikasi

(kisi – kisi) instrument yang merupakan deskripsi dari aspek

yang hendak diukur.


Berkenaan dengan hal tersebut, validitas instrument

dibedakan menjadi tiga bagian besar yang dikenal dengan

nama validitas isi, validitas kriteria, dan validitas

konstruk(Gronlund & linn, 1990; Anastasi, 1988; Kerlinger,

1973).

Validitas isi yang sering juga disebut dengan validitas

kurikuler, validitas intrinsik atau validitas kerevrentatipan,

diartikan sebagai derajat keterwakilan aspek kemampuan

yang hendak diukur di dalam butir – butir instrument. Untuk

mengetahui validitas isi suatu instrument ialah dengan jalan

membandingkan butir – butir instrument dengan spesifikasi

(kisi – kisi) instrument yang merupakan deskripsi dari aspek

yang hendak diukur.

Validitas konstruk merupakan hal yang paling sulit untuk

diketahui, karena hal ini menunjuk pada seberapa jauh suatu

instrument mampu mengukur secara akurat hal – hal yang

berdimensi psikologis.Untuk keperluan ini biasanya digunakan

analisis faktor, suatu jenis teknik analisis statistik yang

tergolong dalam statistik lanjut.

b. Realibitas

Diartikan sebagai keajegan (consistency) hasil dari

instrument tersebut. Ini berarti, suatu instrument dikatakan


memiliki keterandalan sempurna, manakala hasil pengukuran

berkali-kali terhadap subjek yang sama selalu menunjukkan

hasil atau skor yangsama.

Estimasi reliabilitas instrument dilandaskan pada teori

salah ukur (measurement error) ini. Semakin kecil salah ukur

(X_c) semakin kecil pula perbedaan skor riil (X_t ) dengan

skor sebenarnya, sehingga koefisien reabilitasnya menjadi

semakin tinggi.

Ada empat metode yang dapat dipakai untuk

mengestimasi tingkat reliabilitas instrument, yaitu : metode tes

ulang (test-retest method), (2) metode bentuk setara

(equivalent form method), (3) metode belah dua (split half

method), dan (4) metode konsistensi internal (internal

consistency method).

c. Praktikabilitas

Syarat ketiga yang harus dipenuhi oleh instrument untuk

dapat dikatakan baik ialah kepraktisan atau keterpakaian

(usability).Instrumen yang baik pertama-tama harus ekonomis

baik ditinjau dari sudut uang maupun waktu. Kedua, ia harus

mudah dilaksanakan dan diberi skor, dan yang terakhir,

instrument itu harus mampu menyediakan hasil yang dapat

diinterpretasikan secara akurat serta dapat digunakan oleh

pihak-pihak yang memerlukan (Groulund & Linn, 1990).


Soal Latihan

1. Jelaskan pengertian secara umum mengenai manajemen pengujian ?

2. Sebutkan persyaratan yang harus dipenuhi dalam pembuatan kisi-kisi

yang baik dalam menajemen pengujian?

Anda mungkin juga menyukai