Anda di halaman 1dari 71

CRITICAL BOOK REPORT

EVALUASI HASIL BELAJAR


Dosen Pengampu : Deni Andriani

Disusun Oleh :
KELOMPOK 8
Filia Violencia Ginting(7183341005)
Grecya Siregar(7183341017)
Iin Rohimah Saragih(7183141034)
Surtama S.D Simanjuntak (7183141045)

PENDIDIKAN EKONOMI
FAKULTAS EKONOMI
UNIVERSITAS NEGERI MEDAN
2021
KATA PENGANTAR

Puji syukur kami ucapkan kepada Tuhan Yang Maha Esa, yang telah melimpahkan rahmat,
taufiq, serta hidayah-Nya kepada kami, sehingga kami bisa menyelesaikan tugas “Critical Book
Report” sesuai dengan waktu yang telah di tentukan.
Terimakasih saya ucapkan kepada Deni Andriani, yang telah membimbing kami dalam
mata kuliah Eva;uasi Hasil Belajar, sehingga kami dapat menyelesaikan tugas CBR ini. Kami
menyadari dalam pembuatan CBR ini masih banyak terdapat kesalahan dan kekurangan, maka dari
itu kami mohon kritik dan saran yang membangun demi kesempurnaan makalah ini.
Dan harapan kami, walaupun mungkin hanya sedikit ilmu yang bisa kami tuliskan dalam
makalah ini. Semoga  bisa bermanfaat bagi kita semua khususnya bagi pembaca.

Medan, Maret 2021

Penulis

ii
DAFTAR ISI

KATA PENGANTAR............................................................................................................................. ii

DAFTAR ISI.......................................................................................................................................... iii

BAB I PENDAHULUAN....................................................................................................................... 1

1.1. RASIONALISASI PENTINGNYA CBR........................................................................................ 1

1.2. TUJUAN PENULISAN CBR.......................................................................................................... 1

1.3. MANFAAT PENULISAN CBR...................................................................................................... 1

1.4. IDENTITAS BUKU........................................................................................................................ 2

BAB II RINGKASAN BUKU............................................................................................................. 3

2.1. BUKU UTAMA............................................................................................................................... 3

2.2. BUKU PEMBANDING................................................................................................................. 48

BAB III PEMBAHASAN..................................................................................................................... 55

3.1 PERBANDINGAN ISI BUKU........................................................................................................ 55

3.2. KELEBIHAN DAN KEKURANGAN BUKU.............................................................................55

BAB IV PENUTUP............................................................................................................................... 57

4.1. KESIMPULAN.............................................................................................................................. 57

4.2. SARAN.......................................................................................................................................... 57

DAFTAR PUSTAKA............................................................................................................................ 58

iii
BAB I

PENDAHULUAN

1.1.RASIONALISASI PENTINGNYA CBR

Mengkritik sebuah buku atau lebih adalah salah satu kegiatan yang harus dikuasai
oleh siswa maupun mahasiswa. Terlebih lagi untuk kita para calon pendidik bangsa.
Baik dari segi penulisan, cocok tidaknya materi dengan pembaca, maupun dari segi
kelengkapan materi. Setiap buku pada umumnya mempunyai tujuan yang sama yaitu
sebagai bahan pembelajaran atau sumber informasi bagi para pembaca. Banyaknya buku
yang beredar dipasaran, menyebabkan kita terkadang sulit memilih dan memilah buku
yang bagus serta cocok sebagai bahan referensi. Setiap buku pasti memiliki kelebihan
dan kekurangan masing-masing. Untuk itu kita sebagai pengguna harus pandai-pandai
menilai buku mana yang lebih layak untu kita gunakan walaupun pada dasarnya
penilaian-penilaian tersebut bersifat relatif.

1.2.TUJUAN PENULISAN CBR

1. Mengulas isi buku

2. Mencari dan mengetahui informasi yang ada dalam buku

3. Mengkritis isi buku dari sudut pandang penulis

1.3.MANFAAT PENULISAN CBR

1. Untuk memberi pengetahuan pembaca dan penulis tentang manfaat CBR.

2. Memberikan pengetahuan bagi penulis dan pembaca tentang Evaluasi Hasil Belajar

3. Memberi rumusan dan informasi tentang buku yang telah dikaji.

4. Melatih mahasiswa untuk berpikir kritis.

5. Mengembangkan potensi mahasiswa dalam mengkritisi sebuah buku.

1
1.4. IDENTITAS BUKU
A. BUKU UTAMA
Judul buku : Dasar- Dasar Evaluasi Pendidikan
Penulis : Prof. Dr. Suharsimi Arikunto
Penerbit : Bumi Aksara
Tahun terbit : 2018
Kota terbit : Bandung
ISBN : 978-602-217-257-4
Tebal Buku : 344 halaman

B. BUKU PEMBANDING
Judul Buku : Evaluasi Pembelajaran
Penulis : Joko Widiyanto
Penerbit : Unipma Press
Tahun Terbit : 2018
Cetakan : ke-6
BAB II

RINGKASAN BUKU

2.1. BUKU UTAMA


Bab 1 PENDAHULUAN
1. Pengertian Pengukuran, Penilaian dan Evaluasi
Menurut Prof. Dr. Suharsimi Arikunto dalam bukunya dasar-dasar evaluasi pendidikan,
yang menyatakan : kita tidak dapat mengadakan penilain sebelum kita mengadakan pengukuran.
 Mengukur adalah membandingkan sesuatu dengan satu ukuran. Pengukuran bersifat
kuantitatif.
 Menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik dan
buruk. Penilaian bersifat kuantitatif.
 Mengadakan Evaluasi meliputi kedua langkah diatas, yakni mengukur dan menilai
Jadi, dalam istilah asing pengukuran adalah Measurement, sedang penilaian
adalah Evaluation. Dari kata evaluation inilah diperoleh kata evaluasi yang berarti menilai (tetapi
dilakukan dengan mengukur terlebih dahulu). Jadi  evaluasi adalah kegiatan untuk mengumpulkan
informasi tentang bekerjanya sesuatu, yang selanjutnya informasi tersebut digunakan untuk
menentukan alternatif yang tepat dalam mengambil keputusan, yang dimaksudkan untuk membantu
para guru dalam pengambil keputusan  dalam usaha menjawab pertanyaan  atau permasalahan yang
ada. Fungsi utama evaluasi dalam hal ini adalah menyediakan informasi-informasi yang berguna
bagi pihak decision maker untuk menentukan kebijakan yang akan diambil berdasarkan evaluasi
yang telah dilakukan.
2. Penilaian Pendidikan
Dalam pendidikan, ada awalnya pengertian evaluasi pendidikan selalu dikaitkan dengan
prestasi belajar siswa. Definisi yang pertama dikembangkan oleh Ralph Tyler (1950). Ahli ini
mengatakan bahwa evaluasi merupakan sebuah proses pengumpulan data untuk menentukan sejauh
mana, dalam hal apa, dan bagian mana tujuan tercapai. Jika belum, bagaimana yang belum dan apa
sebabnya. Definisi ini diperluaskan oleh dua ahli lain, yakni Cronbach dan Stufflebeam.
Tambahan definisi tersebut adalah bahwa proses evaluasi bukan sekedar mengukur sejauh mana
tujuan tercapai, digunakan untuk membuat keputusan.
3. Mengapa Menilai?
Menurut suharsimi arikunto ada beberapa makna dari proses penilaian antara lain sebagai

3
berikut:

a. Makna Bagi siswa


Dengan diadakannya penilaian maka siswa dapt mengetahui sejauh man telah
berhasil mengikuti pelajaran yang diberikan oleh guru. Hasil yang diperoleh oleh
siswa ada 2 kemungkinan :
1). Memuaskan. Jika siswa memperoleh hasil yang memuaskan siswa akan memiliki
motvasi yang cukup besar agar dapat belajar lebih giat.
2). Tidak Memuaskan. Jika siswa tidak puas dengan hasil yang diperolehnya, maka
ia akan beruaha agar lain kali tidak seperti itu lagi.

b. Makna bagi guru


1). Dengan hasil penilaian guru dapat mengetahui siswa mana saja yang berhak
melanjutkan pelajaran.
2). Guru dapat mengetahui apakah pelajaran yang ia sampaikan tepat sasaran kepada
siswa.
3). Guru akan mengetahui apakah metode yang ia gunakan sudah dapat maksimal
atau belum.
c.       Makna Bagi Sekolah
1). Apabila guru-guru mangadakan penilaian akan diketahui hasil siswa, maka dapat
diketahui pula apakah kondisi belajar disekolah sudah sesuai harapan atau belum.
2). Akan ada informasi tentang tepat tidaknya kurikulum sekolah.
3). Akan ada informasi hasil penilaian dari tahun ke tahun yang bias digunakan
sebagai pedoman dari tahun ke tahun.
4. Tujuan atau Fungsi Penilaian
Dengan diketahuinya makna dari penilaian, maka dapat dikatakan bahwa fungsi penilaian
adalah sebagai berikut:

a. Penilaian berfungsi selektif.


Dengan cara penilaian guru mempunyai cara untuk mengadakan seleksiatau penilaian terhadap
siswanya.

b. Penilaian berfungsi diagnostik.


Apabila alat yang digunakan dalam penilaian cukup memenuhi syarat, maka dengan melihat
hasilnya guru dapat mengetahui kelemahan siswa. Disamping itu akan diketahui pula sebab-sebab
4
kelemahan itu. Jadi dengan mengadakan penilaian guru sebanarnya melakukan diagnosis kepada
siswanya.

c. Penilaian berfungsi sebagai penempatan


Setiap siswa sejak lahir telah membawa bakat sendiri-sendiri sehingga belajar akan lebih efektif
jika di sesuaikan dengan pembawaan yang ada. Untuk dapat menentukan dengan pasti kelompok
mana yang sesuai dengan kemampuan siswa, maka digunakan suatu penilaian.

d. Penilaian berfungsi sebagai pengukur keberhasilan.


Fungsi ini dimaksudkan untuk mengetahui suatu mana suatu program berhasil diterapkan kepada
siswa.Jadi dapat disimpulkan bahwa penilaian berfungsi sebagai alat ukur keberhasilan dalam
proses belajar.
5. Ciri-Ciri Penilaian dalam Pendidikan
Untuk dapat menentukan kepandaian seseorang, bukan kepandaian yang diukur. Namun
kita dapat melihat dari gejala-gejala yang tampak atau memancar dari kepandaianya. Salah satu
contohnya adalah bahwa anak yang pandai biasanya dapat menyelesaikan soal-soal yang diberikan
oleh gurunya.
Ciri-ciri penilaian antara lain sebagai berikut:
a.             Ciri pertama yaitu bahwa penilaian dilakukan secara tidak langsung. Dalam
contoh ini kita menilai kepandaian melalui ukuran menyelesaikan soal.
b.            Ciri kedua yaitu pengunaan ukuran kuantitatif. Penilaian bersifat kuantitatif
artinya mengunakan simbol bilangan sebagai hasil pertama pengukuran. Setelah itu
lalu diinterpretasikan ke bentuk kualitatif. Contoh : dari hasil pengukuran tia
mempunyai IQ 126 sedangkan budi 89. Maka tia dapat dikatagorikan sebagai anak
pandai sedangkan budi anak dibawah rata-rata.
c.             Ciri ketiga yaitu bahwa penilaian pendidikan mengunakan, unit-unit atau
satuan-satuan yang tetap misalnya, IQ 126 menurut unit pengukurannya termasuk
anak yang pandai sedangkan 89 termasuk anak dibawah rata-rata.
d.            Ciri keempat yaitu bersifat relatif artinya tidak selalu tetap dari waktu ke waktu
yang di sebabkan banyak faktor. contoh nilai ulangan MTK pertama tia adalah 90
namun ulangan keduanya hanya 40.
e.             Ciri kelima bahwa dalam penilaian pendidikan sering terjadi kesalahan-
kesalahan. Adapun kesalaan-kesalahan itu ditinjau dari berbagai faktor yaitu:

5
1). Terletak pada alat ukurnya.Alat yang digunakan untuk mengukur haruslah baik
namun sering kali terjadi kesalahan di alat ukurnya.
2). Terletak pada orang yang melakukan pengukurannya.Hal ini dapat berupa:
a). kesalahan pada waktu penilaian karena factor subjektif penilai yang telah
terpengarus oleh hasil pengukuran, misalnya tulisan jelek atau tidak jelas itu sering
mempengaruhi subjektif penilaian.
b). kecenderungan dari penilai untuk memberikan nilai secara murah atau mahal.
Ada guru yang mudah memberikan nilai ada yang sulit untuk memberikan nilai.
c). Adanya Hello-effect, yakni adanya kesan penilai terhadap siswa.
d). adanya pengaruh dari hasil sebelumnya.
e). kesalahan yang disebabkan oleh kekeliruan menjumlah angka-angka hasil
penilaian.
3). Terletak pada anak yang dinilai.
a). siswa adalah manusia yang berperasaan dan bersuasana hati. Suasana hati sangat
berpengaruh terhadap hasil penilaian.
b). keadaan fisik ketika siswa sedang dinilai.
c). nasib siswa kadang-kadang mempunyai peranan terhadap hasil penilaian.
4). Terletak pada situasi dimana penilaian berlangsung
a). suasana pada saat terjadinya penilaian. Keadaan yang gaduh akan mempengaruhi
penilaian yang sebenarnya karena siswa tidak dapat konsenterasi.
b). Pengawasan dalam penilaian. Bentuk pengawasan yang tidak sesuai akan
berpengaruh pada keobjektifan hasil dari pengukuran yang ada.

 Bab 2
Subjek dan sasaran Evaluasi
1. Subjek Evaluasi
Dalam keterangan ini yang di maksud dengan subjek evaluasi adalah orang yang melakukan
pekerjaan evaluasi. Siapa yang dapat di sebut sebagai subjek evaluasi untuk setiap tes, di tentukan
oleh suatu aturan pembagian tugas atau ketentuan yang berlaku.
Ada pandangan lain yang mengatakan subjek evaluasi adalah siswa, yakni orang yang di evaluasi,
dalam hal ini yang di pandang sebagai objek evaluasi adalah mata pelajarannya. Pandangan lain
mengatakan siswa sebagai objek evaluasi dan guru sebagai subjek evaluasi.
2. Sasaran Evaluasi
6
Adapun sasaran evaluasi di sini mencakup beberapa sasaran penilaian untuk unsure-
unsurnya, meliputi : Input, Transformasi dan Out put.
a.       In Put
Berkenaan dengan hal ini ada beberapa aspek yang harus di perhatikan untuk mencapai hasil yang
di inginkan, yaitu :
· Kemampuan
Jika sebuah institusi menginginkan out put yang berguna bagi nusa dan bangsa maka haruslah
memperhatikan atau memilah-milah kemampuan dari beberapa calon murid. Adapun tes yang di
gunakan adalah tes kemampuan.
· Kepribadian
Kepribadian adalah sesuatau yang terdapat pada diri manusia serta tampak bentuknya dalam
tingkah laku, sehingga seorang pendidik akan mengetahui satu-persatu calon peserta didiknya.
Adapun alat yang di pakai adalah tes kepribadian.
· Sikap
Sikap adalah bagian dari tingkah laku manusia yang menggambarkan kepribadian seseorang, akan
tetapi karena sikap ini sangat menonjol dalam pergaulan maka banyak orang yang ingin tahu lebih
dalam informasi khusus terkait dengannya. Adapun alat yang di pakai adalah tes sikap.
· Intelegensi
Dalam hal ini para ahli seperti binet dan simon menciptakan tes buatan yang di kenal dengan tes
binet-simon yang dapat mengetahui IQ seseorang, karena IQ bukanlah intelegensi.
b.      Transformasi
Di sini ada beberapa unsur yang dapat menjadi sasaran atau objek pendidikan
demi di perolehnya hasil pendidikan yang di harapkan, yaitu :
· Kurikulum/materi
· Metode dan cara penilaian
· Media
· Sistem administrasi
· Pendidik dan anggotahnya.
c.       Out Put
Penilaian atas lulusan suatu sekolah di lakukan untuk mengetahui seberapa jauh
tingkah pencapaian atau prestasi belajar mereka selama mengikuti program tersebut
dengan menggunakan tes pencapaian.
7
 
Bab 3
PRINSIP DAN ALAT EVALUASI
1.      Prinsip Evaluasi
 Ada satu prinsip umum dan penting dalam kegiatan evaluasi, yaitu adanya triangulasi atau
hubungan erat tiga komponen, yaitu:
 a.    Hubungan antara tujuan dengan KBM
Kegiatan belajar-mengajar yang dirancang dalam bentuk rencana mengajar disusun oleh guru
dengan mengacu pada tujuan yang hendak dicapai. Dengan demikian, anak panah yang
menunjukkan hubungan antara keduanya mengarah pada tujuan dengan makna bahwa KBM
mengacu pada tujuan, tetapi juga mengarah dari tujuan ke KBM, menunjukkan langkah dari tujuan
dilanjutkan pemikirannya ke KBM.
b.    Hubungan antara tujuan dengan evaluasi
Evaluasi adalah kegiatan pengumpulan data untuk mengukur sejauh mana tujuan sudah tercapai.
Dengan makna demikian maka anak panah berasal dari evaluasi menuju ke tujuan. Di lain sisi, jika
dilihat dari langkah, dalam menyusun alat evaluasi ia mengacu pada tujuan yang sudah
dirumuskan.
c.    Hubungan antara KBM dengan evaluasi
Seperti yang sudah disebutkan dalam poin (a), KBM dirancang dan disusun dengan mengacu pada
tujuan yang telah dirumuskan. Telah disebutkan pula dalam poin (b) bahwa alat evaluasi juga
disusun dengan mengacu pada tujuan. Selain mengacu pada tujuan, evaluasi juga harus mengacu
atau disesuaikan dengan KBM yang dilaksanakan. Sebagai misal, jika kegiatan belajar-mengajar
dilakukan oleh guru dengan menitikberatkan pada keterampilan, evaluasinya juga harus mengukur
tingkat keterampilan siswa, bukannya aspek pengetahuan.
3. Alat Evaluasi
Secara garis besar, maka alat-alat evaluasi yang digunakan dapat digolongkan menjadi dua
macam, yaitu tes dan non tes. Dibawah ini akan dijelaskan secara rinci macam-macam tes dan non
tes.
a.       Teknik Non Tes
            Ada beberapa teknik non-tes yaitu:
1) Skala Bertingkat
Skala menggambarkan suatu nilai yang berbentuk angka terhadap suatu hasil
8
pertimbangan. Sebagai contoh adalah skor yang diberikan oleh guru di sekolah untuk
menggambarkan tingkat prestasi belajar siswa.
2) Kuesioner
Kuesioner (questionaire) juga sering dikenal sebagai angket. Pada dasarnya, kuesioner
adalah sebuah daftar pertanyaan yang harus diisi oleh orang yang akan diukur. Tentang macam
kuesioner, dapat ditinjau dari beberapa segi :
a)      Ditinjau dari siapa yang menjawab, maka ada :
  Kuesioner langsung. Kuesioner dikatakan langsung jika kuesioner tersebut dikirimkan
dan diisi langsung oleh orang yang akan dimintai jawaban tentang dirinya.
  Kuesioner tidak langsung. Kuesioner tidak langsung adalah kuesioner yang
dikirimkan dan diisi oleh orang yang bukan diminta keterangannya.
b)      Ditinjau dari segi cara menjawab maka dibedakan atas:
  Kuesioner tertutup. Kuesioner tertutup adalah kuesioner yang disusun dengan
menyediakan pilihan jawaban langkah sehingga pengisi hanya tinggal memberi tanda
pada jawaban yang dipilih.
  Kuesioner terbuka. Kuesioner terbuka adalah kuesioner yang disusun sedemikian rupa
sehingga para pengisi bebas mengemukakan pendapatnya.
3) Daftar cocok (check list).  Yang dimaksud dengan daftar cocok adalah deretan pertanyaan,
dimana responden yang dievaluasi tinggal membubuhkan tanda cocok ( √ ) di tempat
yang sudah disediakan.
4) Wawancara. Wawancara atau interview adalah suatu cara yang digunakan untuk
mendapatkan jawaban dari responden dengan jalan tanya jawab sepihak. Wawancara
dapat dilakuakan dengan 2 cara, yaitu:
  Intervieu bebas, di mana responden mempunyai kebebasan umtuk mengutarakan
pendapatnya, tanpa dibatasi oleh patokan-patokan yang telah dibuat oleh subjek
evaluasi.
  Intervieu terpimpin, yaitu intervieu yang dilakukan oleh subjek evaluasi dengan cara
mengajukan pertanyaan-pertanyaan yang sudah disusun terlebih dahulu.
5) Pengamatan. Pengamatan atau observasi adalah suatu teknik yang dilakukan dengan cara
mengadakan pengamatan secara teliti serta pencatatan secara sistematis. Ada 3 macam
observasi:
  Observasi partisipan, yaitu observasi yang dilakukan oleh pengamat, tetapi dalam
9
pada itu pengamat memasuki dan mengikuti kegiatan kelompok yang sedang diamati.
  Observasi sistematik, yaitu observasi di mana faktor yang diamati sudah didaftar
secara sistematis, dan sudah diatur menurut kategorinya.
  Observasi eksperimental
  Observasi eksperimental terjadi jika pengamat tidak berpartisipasi dalam kelompok
6) Riwayat hidup. Riwayat hidup adalah gambaran tentang keadaan seseorang selama dalam
masa kehidupannya
b.      Teknik Tes
Dibawah ini ada beberapa pendapat dari para ahli mengenai pengertian tes.
1. Dalam bukunya “Evaluasi Pendidikan”, Drs. Amin Daien Indrakusuma mengatakan bahwa
tes adalah suatu alat atau prosedur yang sistematis dan objektif untuk memperoleh data-data
atau keterangan-keterangan yang diinginkan tentang seseorang, dengan cara yang boleh
dikatakan tepat dan cepat.
2. Dalam bukunya “ Teknik-teknik Evaluasi”, Mucthar Bukhori mengatakan tes ialah suatu
percobaan yang diadakan untuk mengetahui ada atau tidaknya hasil-hasil pelajaran tertentu
pada seorang murid atau kelompok murid.
3.  Dalam buku “Encyclopedia of Educational Evaluation”, diterangkan “Test is
comprehensive assessment of an individual or to an entire program evaluation effort” (tes
adalah penilaian yang kompherensif terhadap seorang individu atau keseluruhan usaha evaluasi
program.
Dari beberapa kutipan dan uraian di atas dapat disimpulkan bahwa tes merupakan suatu
alat pengumpul informasi tetapi jika dibandingkan dengan alat-alat yang lain, tes ini bersifat
lebih resmi karena penuh dengan batasan-batasan
Ditinjau dari segi kegunaan untuk mengukur siswa, maka dibedakan atas adanya tiga
macam tes, yaitu: 
1. Tes diagnostic. Tes Diagnostik adalah tes yang digunakan untuk mengetahui kelemahan-
kelemahan siswa sehingga berdasarkan kelemahan-kelemahan tersebut dapat dilakukan
pemberian perlakuan yang tepat.
2. Tes Formatif. Dari kata “form” yang merupakan dasar dari istilah “formatif” maka evaluasi
formatif dimaksudkan untuk mengetahui sejauh mana siswa telah terbentuk setelah mengikuti
sesuatu program tertentu. Dalam kedudukannya seperti ini tes formatif dapat juga dipandang

10
sebagai tes diagnostik pada akhir pelajaran. Evaluasi formatif mempunyai manfaat baik bagi
siswa, guru, maupun bagi program itu sendiri. 
Manfaat bagi siswa:

 Untuk mengetahui apakah siswa sudah menguasai bahan program secara menyeluruh.

 Merupakan penguatan (reinforcement) bagi siswa.

 Usaha perbaikan.

 Sebagai diagnose.

 Manfaat bagi guru

 Mengetahui sejauh mana bahan yang diajarkan sudah dapat diterima oleh siswa

 Mengetahui bagian mana dari bahan pelajaran yang belum menjadi milik siswa.

 Dapat meramalkan sukses dan tidaknya seluruh program yang akan diberikan.
Manfaat bagi program. 
Setelah diadakan test formatif maka diperoleh hasil. Dari hasil tersebut dapat diketahui :

 Apakah program yang telah diberikan merupakan program yang tepat dalam arti sesuai
dengan kecakapan anak.

 Apakah program tersebut membutuhkan pengetahuan-pengetahuan prasyarat yang belum


diperhitungkan.

 Apakah diperlukan alat, sarana dan prasarana untuk mempertinggi hasil yang akan dicapai.

  Apakah metode, pendekatan dan alat evaluasi yang digunakan sudah tepat.
Tes Sumatif
Evaluasi sumatif atau tes sumatif merupakan tes yang dilaksanakan setelah berakhirnya
sekelompok program atau sebuah program yang lebih besar.
Manfaat tes sumatif, ialah:
  Untuk menentukan nilai.
  Untuk menentukan seorang anak dapat atau tidaknya mengikuti kelompok dalam menerima
program berikutnya.
  Untuk mengisi catatan kemajuan belajar siswa yang akan berguna bagi orang tua siswa, pihak
11
bimbingan dan penyuluhan disekolah, serta pihak-pihak lain apabila siswa tersebut akan pindah
ke sekolah lain, akan melanjutkan belajar atau akan memasuki lapangan kerja
3. Perbandingan antara Tes Diagnostik, Formatif, dan Sumatif
            Dalam membandingkan, akan ditinjau dari 9 aspek, yaitu :
a.    Ditinjau dari fungsinya
1)   Tes diagnostik

 Menentukan apakah bahan prasyarat telah dikuasai atau belum.

 Menentukan tingkat penguasaan siswa terhadap bahan yang dipelajari.

 Memisah-misahkan (mengelompokkan) siswa berdasarkan kemampuan dalam menerima


pelajaran yang akan dipelajari.

 Menetukan kesulitan-kesulitan belajar yang dialami untuk menentukan cara yang khusus
untuk mengatasi atau memberikan bimbingan.
2)     Tes formatif
Sebagai umpan balik bagi siswa, guru, maupun program untuk menilai pelaksanaan
satu unit program.
3)      Tes sumatif
Untuk memberikan tanda kepada siswa bahwa telah mengikuti suatu program, serta
menentukan posisi kemampuan siswa dibandingkan dengan kawannya dalam
kelompok.
b.    Ditinjau dari waktu
1)        Tes diagnostik

 Pada waktu penyaringan calon siswa

 Pada waktu membagi kelas atau permulaan memberikan pelajaran.

 Selama pelajaran berlangsung bila guru akan memberikan bantuan siswa.


2)        Tes formatif
Selama pelajaran berlangsung untuk mengetahui kekurangan agar pelajaran dapat
berlangsung sebaik-baiknya.
3)        Tes sumatif. Pada akhir unit caturwulan, semester akhir tahun, atau akhir pendidikan.
c.    Ditinjau dari titik berat penilaian
12
1)      Tes diagnostik
  Tingkah laku kognitif, afektif, dan psikomotor.
  Faktor-faktor fisik, psikologis, dan lingkungan.
2)      Tes formatif. Menekankan pada tingkah laku kognitif.
3)      Tes sumatif. Pada umumnya menekankan pada tingkah laku kognitif, tetapi ada
kalanya pada tingkah laku psikomotor dan kadang-kadang pada afektif.
d.    Ditinjau dari alat evaluasi
1)      Tes diagnostik
  Tes prestasi belajar yang sudah distandarisasikan.
  Tes diagnostik yang sudah distandarisasikan.
  Tes buatan guru.
  Pengamatan dan daftar cocok.
2)      Tes formatif
Tes prestasi belajar yang tersusun secara baik.
3)      Tes sumatif
Tes ujian akhir.
e.    Ditinjau dari cara memilih tujuan yang dievaluasi
1)   Tes diagnostik
  Memilih tiap-tiap keterampilan prasyarat.
  Memilih tujuan setiap program pelajaran secara berimbang.
  Memilih yang berhubungan dengan tingkah laku fisik, mental, dan perasaan.
2)   Tes formatif
Mengukur semua tujuan instruksional khusus.
3)   Tes sumatif
Mengukur tujuan instruksional umum.
f. Ditinjau dari tingkat kesulitan tes
1)      Tes diagnostik
Untuk tes diagnostik mengukur keterampilan dasar, diambil soal tes yang mudah.
2)      Tes formatif
Belum dapat ditentukan
3)      Tes sumatif
Rata-rata mempunyai tingkat kesulitan (indek kesukaran) antara 0,35-0,70.
13
g.    Ditinjau dari scoring (cara menyekor)
1)      Tes diagnostik
Menggunakan standar mutlak dan standar relatif
2)      Tes formatif
Menggunakan standar mutlak
3)      Tes sumatif
Kebanyakan menggunakan standar relatif, tetapi dapat pula dipakai standar
mutlak
h.    Ditinjau dari tingkat pencapaian
                        Yang dimaksud dengan tingkat pencapaian adalah skor yang harus dicapai
siswa dalam setiap tes.
1)      Tes diagnostik
Untuk tes diagnostik yang sifatnya memonitor kemajuan, tingkat pencapaian
yang diperoleh siswa merupakan informasi tentang keberhasilannya.
2)      Tes formatif
Ditinjau dari tujuan, tes formatif digunakan untuk mengetahui apakah siswa
sudah mencapai tujuan insruksional umum yang diuraikan menjadi tujuan
instruksional khusus.
3)      Tes sumatif
Sesuai dengan fungsi tes sumatif yaitu memberikan tanda kepada siswa bahwa
mereka telah mengikuti suatu program dan untuk menentukan posisi kemampuan
siswa dibandingkan dengan kawan dalam kelompoknya, maka tidak diperlukan
suatu tuntutan harus berapa tingkat penguasaan yang dicapai.
i.      Ditinjau dari cara pencatatan hasil
1)   Tes diagnostik
Dicatat dan dilaporkan dalam bentuk profil
2)   Tes formatif
Prestasi tiap siswa dilaporkan dalam bentuk catatan berhasil atau gagal
menguasai suatu tugas.
3)   Tes sumatif
Keseluruhan skor atau sebagian skor dari tujuan-tujuan yang dicapai.
 Bab 4
14
MASALAH TES
1. Pengertian
Istilah tes berasal dari bahasa Prancis Kuno yaitu  “testum” yang berarti piring untuk menyisihkan
logam mulia. Dalam bahasa Indonesia tes diterjemahkan sebagai ujian atau
percobaan.Menurut Arikunto (2010: 53), tes merupakan alat atau prosedur yang digunakan untuk
mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah
ditentukan.

2. Ciri-Ciri Tes yang Baik


Suharsismi Arikunto (2008: 57-62) menyatakan bahwa suatu tes dapat dikatakan baik apabila
memenuhi lima syarat yaitu:
a) Validitas merupakan ketepatan,  tes yang sebagai alat ukur dikatakan valid jika tes
itu tepat pada hasil belajar dan akan menghasilkan yang valid pula.
b) Reliabilitas, jika memberikan hasil yang tetap dari suatu tes, tidak terpengaruh oleh
apapun.
c) Objektifitas berarti tidak ada unsur pribadi yang mempengaruhinya, tidak ada unsur
subjektifitas yang mempengaruhi tes tersebut.
d) Praktikabilitas, tes ini merupakan tes yang praktis, mudah dan tidak mengecoh.
Mudah pelaksanaannya, mudah diperiksa, dan dilengkapi dengan petunjuk sehingga
dapat diberikan kepada orang lain.
e) Ekonomis, bahwa pelaksanaan tes tidak membutuh biaya yang mahal dan tidak
membuang waktu.

Bab 5
VALIDITAS

Validitas adalah suatu ukuran yang menunjukkan tingkat-tingkat kevalidan atau kesahihan suatu
instrument. Suatu instrument yang valid atau sahih mempunyai validitas tinggi, sebaliknya,
instrument yang kurang valid berarti memiliki validitas rendah (Suharsimi Arikunto 2006).
1. Macam -Macam Validitas
Menurut Suharsimi ada dua jenis validitas yaitu validitas logis dan validitas empiris. Sementara
validitas itu terbagi menjadi beberapa4 yaitu validitas isi, validitas konstrak, validitas “ada
sekarang” dan validitas predictive.
15
a.       Validitas isi (content validity)
Yaitu pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Sebuah tes dikatakan
memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi
pelajaran yang diberikan. Validitas isi merupakan validitas yang diperhitungkan melalui pengujian
terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi
ini adalah “sejauh mana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek
yang hendak diukur oleh alat ukur yang bersangkutan?” atau berhubungan dengan representasi dari
keseluruhan kawasan.
Pengertian “mencakup keseluruhan kawasan isi” tidak saja menunjukkan bahwa alat
ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan
dan tidak keluar dari batasan tujuan ukur.
Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur
mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan
ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang
sesungguhnya.Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur,
sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak
melibatkan komputerisasi statistik, melainkan hanya dengan analisis rasional maka tidak
diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi
suatu alat ukur telah tercapai.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci
materi kurikulum atau meteri buku pelajaran. Yaitu sejauh mana tes hasil belajar sebagai alat
pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap
keseluruhan materi atau bahan pelajaran yang harus diuji.
b.      Validitas Konstruksi (Contruct validity)
Secara etimologis, kata kontruksi mengandung arti susunan, kerangka atau rekaan.
Sebuah tes dikatakan memiliki validitas kontruksi apabila butir- butir soal yang membangun
tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam Tujuan Instruksional
Khusus.
Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan
perkembangan konsep mengenai trait yang diukur. Hasil estimasi validitas konstrak tidak
dinyatakan dalam bentuk suatu koefisien validitas.
Dengan kata lain jika butir- butir soal mengukur aspek berfikir tersebut sudah sesuai
16
dengan aspek berfikir yang menjadi tujuan instruksional.
Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK), “Siswa dapat
mengenal tata cara memandikan mayat”, maka butir soal pada tes merupakan perintah
bagaimana cara memandikan mayat dengan baik.
c.       Pengujian Validitas Tes secara Empiris
Istilah “Validitas empiris” memuat kata “empiris” yang artinya “pengalaman” sebuah
instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman.
Yang dimaksud dengan validitas empiris adalah ketepatan mengukur yang didasarkan pada
hasil analisis yang bersifat empirik. Sedangkan menurut Ebel bahwa Empirical Validity adalah
validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut
adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
Jadi empirical validity adalah validitas yang berkenaan dengan hubungan antara skor
dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa
yang ingin diramalkan oleh pengukuran. Bertitik tolak dari itu maka tes hasil belajar dapat
dikatakan telah memiliki validitas empirik apabila berdasarkan hasil analisis yang dilakukan
terhadap data hasil pengamatan dilapangan, terbukti bahwa tes hasil belajar itu dengan secara
tepat telah dapat mengukur hasil belajar yang seharusnya diungkap atau diukur lewat tes hasil
belajar tersebut.
Untuk menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah
belum dapat dilakukan penelusuran dari dua segi, yaitu segi daya ketepatan meramal (prediktif
validity), dan daya ketepatan bandingannya (concurren validity).
d.      Validitas Ramalan (Predictive Validity)
Setiap kali kita menyebutkan istilah “ramalan” maka didalamnya akan terkandung
pengertian mengenai “sesuatu yang bakal terjadi masa yang akan datang “ atau sesuatu yang
pada saat sekarang belum terjadi dan baru akan terjadi pada waktu-waktu yang akan datang.
Apabila istilah ramalan dikaitkan dengan validitas tes maka yang dimaksut dengan validitas
ramalan dari suatu tes adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes
telah dapat dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang
bakal terjadi pada masa yang akan datang.
Menurut Suharsimi meprediksi artinya meramal, dengan meramal selalu mengenai hal
yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi
atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan
17
terjadi masa yang akan datang.
Jadi pada dasarnya tes yang dilakukan adalah dengan memberikan bentuk soal, item
dan sarat yang diberikan harus memiliki tujuan akhir yang akan ditempuh sehingga proses atau
hasil yang dicapai dapat diprediksi sebelumnya.
e.       Validitas Bandingan (concurrent validity)
Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila
tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukkan
adanya hubungan yang searah antara tes pertama dengan tes berikutnya.  Menurut Suharsimi
dalam hal ini tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang
telah lampau sehingga data pengalaman tersebut sekarang sudah ada.

Validitas bandingan juga sering dikenal dengan istilah : validitas sama saat, validitas
pengalaman atau validitas ada sekarang. Dikatakan sama saat sebab validitas tes itu ditentukan
atas dasar data hasil tes yang pelaksanaannya dilakukan pada kurun waktu yang sama.
Dikatakan validitas pengalaman sebab validitas tes tersebut ditentukan atas dasar pengalaman
yang telah diperoleh. Adapun dikatakan sebagai validitas ada sekarang sebab setiap kali kita
menyebut istilah pengalaman maka istilah itu akan selalu kita kaitkan dengan hal-hal yang
telah ada atau hal-hal yang telah terjadi pada waktu yang lalu, sehingga data mengenai
pengalaman masa yang lalu itu pada saat ini sudah ada di tanggan.

Jadi dalam rangka menguji validitas bandingan, data yang mencerminkan pengalaman
yang diperoleh masa yang lalu itu, kita bandingkan dengan data hasil tes yang diperoleh
sekarang ini. Jika hasil tes yang ada sekarang ini mempunyai hubungan searah dengan hasil tes
berdasarkan pengalaman yang lalu, maka tes yang memiliki karakteristik seperti itu dapat
dikatakan telah memiliki validitas bandingan.

Misalnya seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid
atau belum. Untuk itu diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki.
Misalnya nilai ulangan harian atau nilai ulkangan sumatif yang lalu.

Cara mengetahui Validitas Alat Ukur

a) Validitas Butir Soalatau Validitas Item

b) Tes Terstandar Sebagai Kriterium dalam Menentukan Validitas

c) Validitas Faktor
18
Bab 6
REALIBILITAS

1.      Arti Reabilitas Bagi Sebuah Tes


2.      Cara-Cara Mencari Besarnya Realibilitas.
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subyek yang
sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Kriterium yang
digunakan untuk mengetahui ketetapan ada yang berada diluar tes (consistency external) dan pada
tes itu sendiri (consistency internal).
a.       Metode bentuk Paralel (equivalen)
Tes parallel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat
kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa inggris
disebut alternate-forms method (parallel forms).
Dengan metode bentuk parallel ini, dua uah tes yang paralel, misalnya Matematika Seri A yang
akan dicari reliailitasnya dan Seri B di teskan pada sekelompok siswa yang sama, kemudian
hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukan koefisien
reliabilitas tes Seri A. jika oefisiennya tinggi maka tes tersebut sudah reliable dan dapat digunakan
sebagai alat pengetes yang terandalkan.
Dalam menggunakan metode paralel ini pengetes harus menyiapkan dua buah tes, dan masing-
masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang yang menyebutkan
sebagai double tes-daubel-trial method.
b.      Metode tes ulang (test-retest method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam
menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua
kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut
dengan single-test-double-trial method. Kemudian hasil dari kedua tes tersebut dihitung
korelasinya.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini kurang
mengena karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena tenggang waktu
akan pemberian tes pertama dengan kedua menjadi permasalahan tersendiri. jika tenggang waktu
terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalau tenggang waktu terlalu lama,
19
maka faktor-faktor atau kondisi tes sudah akan berbeda, dan siswa senddiri barangkali sudah
mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula terhadap reliabilitas.
c.       Metode belah dua atau split-half method
Kelemahan penggunaan metode dua tes dua kali percobaan dan satu tes dua kali percobaandiatasi
dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya
menggunakan sebuah tes yang dicobakan satu kali. Oleh karena itu, disebut juga single-test-single-
trial method.
Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien korelasi langsung
ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat demikian. Pada
waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui reliabilitas separo tes.
Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-rown .

Bab 7
TAKSONOMI

1.      Arti dan Letak Taksonomi dalam Pendidikan


2.      Taksonomi Bloom
Menurut taksonomi Bloom ini tujuan pendidikan dibagi menjadi
beberapa domain (ranah,kawasan),  dan setiap domain tersebut dibagi kembali ke dalam pembagian
yang lebih rinci berdasarkan hirarkhinya. Domain-domain tersebut antara lain:
a) Cognitive Domain (Ranah Kognitif), yang berisi perilaku-perilaku yang
menekankan aspek intelektual, seperti pengetahuan, pengertian, dan
keterampilan berpikir. Dalam ranah ini hirarkinya adalah
pengetahuan (knowledge), pemahaman (comprehension), aplikasi (application),
analisis (analysis), sintesis (synthesis), dan evaluasi (evaluation).
b) Affective Domain (Ranah Afektif) berisi perilaku-perilaku yang menekankan
aspek perasaan dan emosi, seperti minat, sikap, apresiasi, dan cara penyesuaian
diri. Dalam ranah ini hirarkinya adalah pandangan atau pendapat (opinion) dan
sikap atau nilai (attitude, value)
c) Psychomotor Domain (Ranah Psikomotor) berisi perilaku-perilaku yang
menekankan aspek keterampilan motorik seperti tulisan tangan, mengetik,
berenang, dan mengoperasikan mesin. Ranah ini tersusun atas keterampilan
20
(skill) dan kemampuan ( abilities)
Taksonomi lain-lainnya:
a. Mc Guire dan Klickmann (1963) telah menyusun taksonomi untuk bidang
biologi, Wood (1968) untuk matematika, Leuis (1965) untuk IPA.
b. Guilford telah menciptakan pola yang menggambarkan struktur intelek
dalam bentuk kubus
c. Gagne dan Merrill menyebutkan ada 8 hierarki tingkah laku, antara lain:
  Signal learning
  Stimulus-response learning
  Chaining
  Verbal associating
  Discrimination learning
  Concept learning
  Rule learning
  Problem solving.
d.      Garlach dan Sullivan mencoba mengganti gambaran tentang proses dalam rumusan
yang umum menjadi tingkah laku siswa yang dapat diamati. Kategori yang diajukan
adalah:
  Identify
  Name
  Describe
  Construct
  Order
  Demonstrate.
e.       De Block mengemukakan model yang didasarkan pada tujuan-tujuan mengajar. Dia
mejukan 3 arah dalam kegiatan mengajar:
  From partial to more integral learning
  From limited to fundamental learning
  From special to eneral learning.

Bab 8
TUJUAN INTRUKSIONAL
21
1. Bermacam-Macam Tujuan Pendidikan.
Tujuan Pendidikan Nasional adalah mencerdaskan kehidupan bangsa dan mengembangkan
manusia Indoensia seutuhnya, yaitu manusia yang beriman dan bertaqwa terhadap Tuhan Yang
Maha Esa dan berbudi pekerti luhur, memiliki pengetahuan dan keterampilan, kesehatan jasmani
dan rohani, kepribadian yang mantap dan mandiri serta rasa tanggung jawab kemasyarakatan dan
kebangsaan.
Pengembangan di bidang pendidikan didasarkan atas falsafah negara Pancasila dan
diarahkan untuk membentuk manusia-manusia pembangunan yang ber-Pancasila dan untuk
membentuk manusia Indonesia yang sehat jasmani dan rohaninya memiliki pengetahuan dan
keterampilan, dapat mengembangkan kreativitas dan tanggung jawab, dapat menyuburkan sikap
demokrasi dan penuh tenggang rasa, dapat mengembangkan kecerdasan yang tinggi dan disertai
budi pekerti yang luhur, mencitai bangsanya dan mencintai sesama manusia sesuai dengan
ketentuan termaktub dalam UUD 1945.
Dengan adanya pendidikan, maka akan timbul dalam diri seseorang untuk berlomba-lomba
dan memotivasi diri kita untuk lebih baik dalam segala aspek kehidupan. Pendidikan merupakan
salah satu syarat untuk lebih memajukan pemrintah ini, maka usahakan pendidikan mulai dari
tingkat SD sampai pendidikan di tingkat Universitas.
2. Tujuan Instruksional(Intructional Objectives)
Suharsimi Arikunto menyatakan dalam tujuan instruksional umum menggunakan kata kerja
yang masih umum dan tidak dapat diukur, maka dibutuhkan tujuan instruksional khusus. Jadi ada 2
macam tujuan instruksional:
  tujuan instruksional umum ( TIU)
  tujuan instruksional khusus (TIK)
Adapun manfaat tujuan instruksional adalah:

a. Pendidik mempunyai arah untuk memilih bahan pelajaran dan memilih prosedur
(metode) mangajar, 

b. Peserta didik mengetahui arah belajarnya, 

c. Setiap pendidik mengetahui batas-batas tugas dan wewenang mengajarkan suatu


bahan sehingga diperkecil kemungkinan timbulnya celah (gap) atau saling
menutup (overlap) antar pendidik, 
22
d. Pendidik mempunyai patokan dalam mengadakan penilaian kemajuan belajar
peserta didik, 

e. Pendidik sebagai pelaksana dan petugas-petugas pemegang


kebijaksanaan (decision maker)  mempunyai kriteria untuk mengevaluasi kualitas
maupun efiensi pengajaran.
 
3. Merumuskan Tujuan Intruksional.
Bagaimana cara merumuskan tujuan pembelajaran atau indikator hasil belajar itu?ada
empat komponen pokok yang harus nampak dalam rumusan indikator hasil belajar seperti yang
digambarkan dalam pertanyaan berikut:

a) Siapa yang belajar atau yang diharapkan dapat mencapai tujuan atau mencapai hasil
belajar itu?

b) Tingkah laku atau hasil belajar yang bagaimana yang diharapkan dapat dicapai itu?.

c) Dalam kondisi yang bagaimana hasil belajar itu dapat ditampilkan?

d) Seberapa jauh hasil belajar itu bisa diperoleh.


4. Langkah-LangkahyangDilakukan dalam Merumuskan Tujuan Intruksioanal
Khusus.
a. Membuat sejumlah TIU (Tujuan Instruksional Umum) untuk setiap mata
pelajaran/bidang studi yang akan diajarkan dalam kurikulum 1975 maupun 1984, TIU
sudah ada tercantum dalam buku garis-garis besar program pengajaran. Dalam
merumuskan TIU digunakan kata kerja yang sifatnya masih umum dan tidak dapat di
ukur karena perubahan tingkah laku masih terjadi di dalam diri manusia.
b. Dari masing-masing TIU dijabarkan menjadi sejumlah TIK yang rumusannya jelas,
khusus, dapat dimengerti, terukur, dan menunjukkan perubahan tingkah laku.
Contoh-contoh rumusan untuk TIU:
  Memahami teori evaluasi.
  Mengetahui perbedaan antara skor dan nilai.
  Mengerti cara mencari validita.
  Menghayati perlunya penilaian yang tepat.
  Menyadari pentingnya mengikuti kuliah dengan teratur.

23
  Menghargai kejujuran mahasiswa dalam mengerjakan tes.

5. Tingkah Laku Akhir


Tingkah laku akhir adalah tingkah laku yang diharapkan setelah peserta didik
mengalami proses belajar. Di sini tingkah laku ini harus menampakkan diri dalam suatu
perbuatan yang dapat diamati dan diukur (observable and measurable).
Contoh:
  Menuliskan kalimat perintah,
  Mengalikan pecahan persepuluh,
  Menggambarkan kurva normal,
  Menyebutkan batas-batas Daerah Istimewa Yogyakarta,
  Menceritakan kembali uraian guru,
Dan lain-lain yang berwujud kata kerja perbuatan/operasional (Action Verb) yang
dapat diamati dan diukur.

6. Kata-Kata operasioanal
a.        Kognitif
  Pengetahuan (knowledge). Kata-kata instruksional yang sering digunakan:
Mendefinisikan, mendeskripsikan, mengidentifikasi, mendaftarkan,
menjodohkan, menyebutkan, menyatakan (state), mereproduksi.
  Pemahaman (comprehension). Kata-kata instruksional yang sering digunakan:
mempertahankan, membedakan, menduga (estimate), menerangkan,
memperluas, menyimpulkan, menggeneralisasikan, memberikan, contoh,
menuliskan kembali, menggunakan.
  Aplikasi. Kata-kata instruksional yang sering digunakan: mengubah,
menghitung, mendemonstrasikan, menemukan, memanipulasi, memodifikasi,
mengoperasikan, meramalkan, menyiapkan, menghasilkan, menghubungkan,
menunjukkan, memecahkan, menggunakan.
  Analisis. Kata-kata instruksional yang sering digunakan: memerinci, menyusun
diagram, membedakan, mengidentifikasi, mengilustrasikan, menyimpulkan,
menunjukkan, menghubungkan, memilih, memisahkan, membagi (subdivides).
  Sintesis. Kata-kata instruksional yang sering digunakan: mengategorikan,
mengombinasikan, mengarang, menciptakan, membuat desain, menjelaskan,

24
memodifikasikan, mengorganisasikan, menyusun, membuat rencana, mengatur
kembali, merekronstuksikan, menghubungkan, mereorganisasikan, merevisi,
menuliskan kembali, menuliskan, menceritakan.
  Evaluasi. Kata-kata instruksional yang sering digunakan: menilai,
membandingkan, menyimpulkan, mempertentangkan, mengkritik,
mendeskripsikan, membedakan, menerangkan, memutuskan, menafsirkan,
menghubungkan, membantu (supports).
b.        Afektif
  Reesiving. Kata-kata instruksional yang sering digunakan: menanyakan,
memilih, mendeskripsikan, mengikuti, memberikan, mengidentifikasikan,
menyebutkan, menunjukkan, memilih, menjawab.
  Responding. Kata-kata instruksional yang sering digunakan: menjawab,
membantu, mendiskusikan, menghormat, berbuat, melakukan, membaca,
memberikan, menghafal, melaporkan, memilih, menceritakan, menulis.
  Valuing. Kata-kata instruksional yang sering digunakan: melengkapi,
menggambarkan, membedakan, menerangkan, mengikuti, membentuk,
mengundang, menggabung, mengusulkan, membaca, melaporkan, memilih,
bekerja, mengambil bagian (share), mempelajari.
  Organization. Kata-kata instruksional yang sering digunakan: mengubah,
mengatur, menggabungkan, membandingkan, melengkapi, mempertahankan,
menerangkan, menggeneralisasikan, mengidentifikasikan, mengintregasikan,
memodifikasikan, mengorganisir, menyiapkan, menghubungkan,
mensistesiskan.
  Characterization by value or value complex. Kata-kata instruksional yang sering
digunakan: membedakan, menerapkan, mengusulkan, memperagakan,
mempengaruhi, mendengarkan, memodifikasikan, mempertunjukkan,
menanyakan, merevisi, melayani, memecahkan, menggunakan.
c.         Psikomotorik
  Musclar or motor skills. Kata-kata instruksional yang sering digunakan:
mempertontonkan gerak, menunjukkan hasil (pekerjaan tangan), melompat,
menggerakkan, menampilkan.
  Manipulation of materials or objects. Kata-kata instruksional yang sering
25
digunakan: mereparasi, menyusun, membersihkan, menggeser, memindahkan,
membentuk.
  Neuromusclar coordination. Kata-kata instruksional yang sering digunakan:
mengamati, menerapkan, menghubungkan, menggandeng,  memotong, menarik,
memasang, menarik, menggunakan.
Kata-kata yang telah disajikan di atas merupakan kata-kata kerja yang dipakai dalam
merumuskan tujuan instruksional khusus bagi peserta didik  yang belajar, sehingga rumusan
seutuhnya menjadi pernyataan-pernyataan, sebagai berikut:
1)      Peserta didik dapat menghafal ibu kota negara bagian Jerman.
2)      Peserta didik dapat menunjukkan letak ibu kota negara bagian Jerman.
3)      Peserta didik dapat membuat kalimat dalam Bahasa Jerman.

7. Kondisi Demonstrasi
Kondisi demonstrasi adalah komponen TIK yang menyatakan suatu kondisi atau situasi
yang dikenakan kepadapeserta didik pada saat pendidik mendemonstrasikan tingkah laku akhir.
Standar keberhasilan adalah kelompok TIK yang menunjukkan seberapa jauh tingkat keberhasilan
yang di tuntut oleh penilai bagi tingkah laku pelajar pada situasi akhir.
Tingkat keberhasilan dapat dinyatakan dalam jumlah maupun prsentase, misalnya:
a)      Dengan 75% betul.
b)      Sekurang-kurangnya 5 dari 10.
c)      Tanpa kesalahan.
Dalam pedoman pelaksanaan kurikulum di jelaskan bahwa dalam kegiatan belajar-mengajar
pendidik di haruskan memperhatikan pula keterampilan tentang prosesnya. Pendekatan ini di sebut
dengan istilah pendekatan keterampilan proses. Keterampilan-keterampilan di maksud meliputi
keterampilan dalam hal:
a)      Mengamati.
b)      Menginterprestasikan (menafsirkan) hasil pengamatan.
c)      Merabalkan.
d)      Menerapkan konsep.
e)      Merencanakan penelitian.
f)       Melaksanakan penelitian.
g)      Mengkomunikasikan hasil penemuan.
Sesuai dengan tuntutan tersebut maka pendidik dalam merumuskan tujuan instruksional khusus
26
harus mengandung apa yang dilakukan peserta didik dalam kegiatan belajar-mengajar.
Tujuan instruksional umum yang termuat sudah dirumuskan dalam satu rumusan yang
menjelaskan:
a)        Materi yang dipelajari.
b)        Perilaku mengutarakan hasil.
c)        Proses pencapaiannya.
Bab 9
TES STANDAR DAN TES BUATAN GURU

1. Pengertian Tes Standar

Tes adalah salah satu bentuk instrumen evaluasi untuk mengukur seberapa besar kemampuan
siswa dalam memahami dan menguasai pokok-pokok materi yang sudah diajarkan. Tes ada yang
dibuat oleh seorang guru yang kemudian disebut tes buatan guru dan ada tes yang sudah
memenuhi standar suatu satuan pendidikan maupun lembaga pendidikan yang kemudian disebut
tes terstandar.\

Dalam menilai, baik tes terstandar maupun tes buatan guru ada beberapa hal yang perlu
diperhatikan yang berkaitan dengan validitas dan reliabilitas.
Tes kemampuan pada dasarnya terbagi menjadi dua macam, yaitu :
a.         Aptitude test
b.         Achievement tes
Perbedaan antara dua tes ini sebenearnya tidak tegas, soal – soal mengenai kedua tes tersebut
sering kali saling melingkupi ( overlap ). Untuk kedua macam tes ini biasanya menggunakan
hitung – hitungan dan perbendaharaan kata – kata dan sekelompok tes dari kedua macam tes ini
biasanya juga menguji tentang keterampilan membaca. Kesamaan yang lain adalah bahwa
keduanya telah digunakan untuk meramalkan hasil untuk yang masa akan dating, walaupun pada
umumnya jika kita menggunakan tes prestasi penilai melihat apa yang telah diperoleh setelah siswa
( tercoba ) itu diberi suatu pelajaran.
2.      Tes Prestasi Standar
Di antara tes prestasi yang digunakan di sekolah ada yang dinamakan tes prestasi
standar. Dalam salah satu  kamus, arti kata ”standar” adalah:
“A degree of level of requirement, excellence, or attainment”

27
Standar untuk siswa dapat dimaksudkan sebagai suatu tingkat kemampuan yang harus
dimiliki bagi suatu program tertentu. Mungkin standar bagi suatu kursus A berbeda dengan B. Jadi
standar ini dapat dibuat “keras” maupun “lunak” tergantung dari yang mempunyai  kebijaksanaan.
Suatu tes standar dengan demikian berbeda dengan tes prestasi biasa.
Prosedur yang digunakan untuk menyusun tes standar untuk tes prestasi melalui cara
langsung yang ditumbuhkan dari tes yang digunakan di kelas. Sedangkan spesifikasi yang
digunakan untuk menentukan isi dalam tes bakat biasanya didasarkan atas analisis job (jabatan)
atau analisis tugas yang merupakan tuntutan calon pekerjaannya. Disamping itu juga
mempertimbangkan sifat-sifat yang ada pada manusia. Analisis jabatan analisis tugas yang
dilakukan biasanya tidak tidak didasarkan atas satu kurikulum, tetapi diambil dari masyarakat.
Istilah “standar” dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-
pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk
yang sama dan dalam batasan waktu yang sama pula. Dengan demikian maka seolah-olah ada suatu
standar atau ukuran sehingga diperoleh suatu standar penampilan (performance) dan penampilan
kelompok lain dapat dibandingkan dengan penampilan kelompok standar tersebut.
Istilah “standar” tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan
dapat diajarkan pada suatu tingkat tertentu atau bahwa tes itu menyiapkan suatu standar prestasi
dimana siswa harus dan dapat mencapai suatu tingkat tertentu. Sekali lagi, tes standar dipolakan
untuk penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan
dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan perseorangan
maupun siswa sebagai anggota dari suatu kelompok.
3.      Perbandingan Antara Tes Standar dengan Tes Buatan Guru
Tes standar disusun dalam tipe-tipe soal yang sama yang meliputi bahan atau pengetahuan
yang sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes buatan guru. Lalu apakah
perbedaan antara tes standar dengan tes buatan guru, atau apakah keburukan dan keuntungan tes
standar?
Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru.
Perbedaannya adalah sebagai berikut:

Tes Standar Tes Buatan Guru


a. Didasarkan atas bahan dan tujuan umum a. Didasarkan atas bahan dan tujuan
dari sekolah-sekolah di seluruh Negara. khusus yang dirumuskan oleh guru
Mencakup aspek yang luas dan untuk kelasnya sendiri.
28
b. Dapat terjadi hanya mencakup
pengetahuan atau keterampilan dengan pengetahuan atau keterampilan yang
hanya sedikit butir tes untuk setiap sempit.
keterampilan atau topik. c. Biasanya disusun sendiri oleh guru
c. Disusun dengan kelengkapan staf dengan sedikit atau tanpa bantuan
profesor, pembahas, dan editor butir tes. orang lain/tenaga ahli.
d. Menggunakan butir tes yang sudah
d. Jarang menggunakan butir tes yang
diujicobakan (try out), dianalisis dan sudah diujicobakan, dianalisis dan
direvisi sebelum menjadi sebuah tes. direvisi.
e. Mempunyai reliabilitas yang tinggi. e. Mempunyai reliabilitas sedang atau
f. Dimungkinkan menggunakan norma untuk rendah.
seluruh Negara. f. Norma kelompok terbatas kelas tertentu.
 
Kedua, untuk menyusun tes standar, diutuhkan waktu yang lama. Seperti disebutkan
ahwa untuk memperoleh sebuah tes standar melalui prosedur:
  Penyusunan;
  Uji coba;
  Analisa;
  Revisi;
  Edit.
Kelima kegiatan ini membutuhkan waktu lama.
4.      Kegunaan Tes Standar
Secara singkat dapat dikemukakan bahwa kegunaan tes standar adalah:
  Jika ingin membuat perbandingan,
  Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak tersedia data
tentang calon ini.
Secara garis besar kegunaan tes standar adalah:
  Membandingkan prestasi belajar dengan pembawaan individu atau kelompok.
  Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai bidang
studi untuk individu atau kelompok.
  Membandingkan prestasi siswa antara berbagai sekolah atau kelas.
  Mempelajari perkembangan siswa dalam suatu periode waktu tertentu.

29
5.      Kegunaaan Tes Buatan
Secara singkat dapat dikemukakan bahwa kegunaan tes buatan guru adalah:
Untuk menentukan seberapa baik siswa telah menguasai bahan pelajaran yang
diberikan dalam waktu tertentu.
Untuk menentukan apakah sesuatu tujuan telah tercapai.
Untuk memperoleh suatu nilai.
Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai jika hasilnya
akan digunakan untuk:
         Mengadakan diagnosis terhadap ketidakmampuan siswa.
         Menentukan tempat siswa dalam suatu kelas atau kelompok.
         Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan
jurusan.
         Memilih siswa untuk program-program khusus.
6.      Kelengkapan Tes Standar
Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes standar,
biasanya dilengkapi dengan sebuah manual. Manual ini memuat keterangan-keterangan atau
petunjuk-petunjuk yang perlu terutama yang menjelaskan tentang pelaksanaan, menskor, dan
mengadakan interpretasi.Secara garis besar manual tes standar ini memuat:
a.       Ciri-ciri mengenai tes, misalnya menyebutkan tingkat validitas, tingkat
reliabilitas dan sebagainya.
b.       Tujuan serta keuntungan-keuntungan dari tes. Misalnya yang disebutkan untuk
siapa tes tersebut diberikan dan untuk tujuan apa.
c.        Proses standardisasi tes. Misalnya mengenai hal-hal yang berhubungan dengan
sampel.
o   Besarnya sampel,
o   Teknik sampling,
o   Kelompok mana yang diambil sebagai sampel (sifat sampel).
Juga mengenai taraf kepercayaan yang diambil dan bagaimana kaitannya
dengan hasil tes.
d.        Petunjuk-petunjuk tentang cara melaksanakan tes
Misalnya: dilaksanakan dengan lisan atau tertulis, waktu yang digunakan untuk
mengerjakan setiap bagian, boleh tidaknya tercoba keluar jika sudah selesai
30
mengerjakan soal itu dan sebagainya.
e.        Petunjuk-petunjuk bagaimana cara menskor
Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem hukuman
atau tidak, bagaimana cara menghitung nilai akhir dan sebagainya.
f.         Petunjuk-petunjuk untuk menginterpretasikan hasil
Misalnya:
o   Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi,
o   Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.
g.       Saran-saran lain
Misalnya: siapa harus menjadi pengawas, bagaimana seandainya tidak ada calon
yang mencapai skor tertentu dan sebagainya
 
Bab 10
PENYUSUSNAN TES

1.      Fungsi Tes
Fungsi tes dapat ditinjau dari 3 hal :
a.       fungsi untuk kelas
b.      fungsi untuk bimbingan.
c.       fungsi untuk administrasi
 

a. Fungsi untuk Kelas, tes dapat berfungsi untuk :


1)      mengadakan diagnosis terhadap kesulitan belajar siswa
2)      mengevaluasi celah antara bakat dengan pencapaian
3)      menaikkan tingkat prestasi
4)      mengelompokkan siswa dalam kelas pada waktu metode kelompok
5)      merencanakan kegiatan proses belajar mengajar untuk siswa secara
perseorangan.
6)      menentukan siswa mana yang memerlukan bimbingan khusus
7)      menentukan tingkat pencapaian untuk setiap anak.

b. Fungsi untuk Bimbingan, tes dapat berfungsi untuk :

31
1)      menentukan arah pembicaraan dengan orang tua tentang anak-anak
mereka.
2)      membantu siswa dalam menentukan pilihan.
3)      membantu siswa mencapai tujuan pendidikan dan jurusan.
4)      memberi kesempatan kepada pembimbing, guru, dan orang tua dalam
memahami kesulitan anak.

c. Fungsi untuk Administrasi


1)      memberi petunjuk dalam mengelompokkan siswa.
2)      penempatan siswa baru
3)      membantu siswa memilih kelompok
4)      menilai kurikulum
5)      memperluas hubungan masyarakat
6)      menyediakan informasi untuk badan-badan lain di luar sekolah.
2.      Langkah-Langkah dalam Penyusunan Tes

a. Menentukan tujuan mengadakan tes

b. Mengadakan pembatasan terhadap bahan yang akan diteskan.

c. Merumuskan Tujuan Instruksional Khusus (TIK) dari tiap bagian bahan.

d. Menderetkan semua TIK  dalam tabel persiapan yang memuat pula aspek tingkah
laku dalam terkandung TIK itu, tabel digunakan untuk identifikasi terhadap
tingkah laku yang dikehendaki, agar tidak terlewati.

e. Menyusun tabel spesifikasi yang memuat pokok materi, aspek berfikir yang
diukur beserta imbangan antara kedua hal tersebut.  (Uraian penjelasan tentang
tabel spesifikasi i akan kami jelaskan di sub bab berikutnya)

f. Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah dituliskan pada
tabel TIK dan aspek tingkah laku yang dicakup
3.      Komponen-Komponen Tes
Komponen Test terdiri dari:
a.       Buku tes, yakni lembaran atau buku yang memuat butir-butir soal yang mesti
dikerjakan oleh siswa

32
b.      Lembar jawaban tes, yaitu lembaran yang disediakan oleh penilain bagi testee untuk
mengerjakan tes, untuk bentuk pilihan ganda dibuat lembaran nomor dan huruf  A, B,
C, D, E menurut banyaknya alternative yang disediakan
c.       Kunci  jawaban tes, berisi jawaban-jawaban yang dikehendaki. Kunci jawaban ini
dapat berupa huruf atau kalimat. Untuk test bentuk uraian yang dituliskan adalah kata-
kata kunci atau kalimat seingkat untuk memberikan ancar-ancar jawaban. Ide dari kunci
jawaban ini adalah:
1)      Pemeriksaan tes dapat dilakukan oleh orang lain
2)      Pemeriksaannya betul,
3)      Dilakukan dengan mudah,
4)      Sedikit mungkin masuknya unsur subjektif
d.      Pedoman penilaian, pedoman penilaian atau pedoman skoring, berisi tentang
pedoman perincian tentang skor atau angka yang diberikan kepada siswa bagi soal-soal
yang telah dikerjakan.Contoh pedoman penilaian:
Untuk penilaian dengan contoh soal diatas, tiap soal diberi skor 5.
Jumlah skor : 5×20= 100

Bab 11
TES TERTULIS UNTUK PRESTASI BELAJAR

1. Bentuk-Bentuk Tes
a. Tes subyektif. Secara umum soal subyektif adalah pertanyaan yang menuntut
peserta didik menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan,
membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai dengan
tuntutan pertanyaan dengan menggunakan kata-kata dan bahasa sendiri. Jumlah
soal-soal bentuk subyektif biasanya tidak banyak, hanya sekitar 5-10 buah soal
dalam waktu kurang lebih 90-120 menit. Soal-soal bentuk ini menuntut
kemampuan peserta didik untuk dapat mengorganisir, menginterpretasi, dan
menghubungkan pengertian-pengertian yang telah dimiliki.
b.      Tes objektif. Tes objektif adalah tes yang dalam pemeriksaannya dapat dilakukan
secara objektif (Arikunto, 1995 : 165). Karena sifatnya yang objektif maka
penskorannya dapat dilakukan dengan bantuan mesin. Soal ini tidak memberi
peluang untuk memberikan penilaian yang bergradasi karena dia hanya mengenal
33
benar dan salah. Apabila respons siswa sesuai dengan jawaban yang dikehendaki
maka respons tersebut benar dan biasa diberi skor 1. Apabila kondisi yang terjadi
sebaliknya, maka respons siswa salah dan biasa diberi skor 0. Jawaban siswa
bersifat mengarah kepada satu jawaban yang benar (convergence).
Merujuk kepada berbagai pendapat tentang tes objektif dapat diambil kesimpulan
bahwa tes objektif adalah tes yang semua informasi yang diperlukan peserta tes
untuk memberikan respon telah disediakan oleh penyusun tes, sehingga peserta tes
tinggal memilihnya. Jawaban yang berupa pilihan bersifat deterministik, sehingga
hanya ada dua kemungkinan kebenaran jawaban – benar atau salah.

2. Macam-Macam Tes Objektif


a. Bentuk Tes Benar Salah (True-False Test). Tes benar salah adalah bentuk tes
yang mengajukan beberapa pernyataan yang bernilai benar atau salah. Biasanya
ada dua pilihan jawaban yaitu huruf B yang berarti pernyataan tersebut benar dan
S yang berarti pernyataan tersebut salah. Tugas peserta tes adalah menentukan
apakah pernyataan tersebut benar atau salah.
Contoh salah satu tes bentuk uraian adalah :
B S : Ibukota Peru berjumlah lima buah.
B S : Manado adalah Ibukota propinsi Sulawesi Utara
Kelebihan Tes Benar Salah:
  Dapat mencakup bahan yang luas dan tidak memakan tempat yang banyak
  Mudah dalam penyusunannya
  Petunjuk mengerjakannya mudah dimengerti
  Dapat digunakan berkali-kali
  Objektif
  Praktis
Kelemahan Tes Benar Salah:
o   Mudah ditebak
o   Banyak masalah yang tidak dapat dinyatakan hanya dengan kemungkinan
benar atau salah
o   Reliabilitasnya rendah.
o   Hanya dapat mengungkapkan daya ingat dan pengenalan kembali
Petunjuk Penyusunan:
34
  Hindari kalimat negatif, yakni kalimat yang mengandung kata “tidak” atau
“bukan”.
  Pernyataan harus disusun sedemikian rupa sehingga siswa yang memiliki
pengertian samar-samar dapat terkecoh dalam menjawabnya.
  Dalam menyusun keseluruhan tes, diharapkan item yang mengandung
“salah sedikit” cukup banyak.
Cara Melakukan Penskoran Tes Benar Salah
  Dengan Denda. Skor = Jumlah jawaban benar – Jumlah jawaban Salah
  Tanpa Denda. Skor = Jumlah jawaban yang benar
b. Bentuk Pilihan Ganda (Multiple Choice Test). Tes pilihan ganda merupakan tes
yang menggunakan pengertian/ pernyataan yang belum lengkap dan untuk
melengkapinya maka kita harus memilih satu dari beberapa kemungkinan jawaban
benar yang telah disiapkan.Apabila dilihat konstruksinya maka tes pilihan ganda
terdiri dari dua hal pokok yaitu stem atau pokok soal dengan 4 atau 5 alternatif
jawaban. Satu di antara alternatif jawaban tersebut adalah kunci jawaban.
Alternatif jawaban selain kunci disebut dengan pengecoh (distractor). Semakin
banyak alternatif jawaban yang ada (misalnya 5) maka probabilitas menebaknya
akan semakin kecil
c. Menjodohkan (Matching Test). Menjodohkan terdiri atas satu sisi pertanyaan
dan satu sisi jawaban, setiap pertanyaan mempunyai jawaban pada sisi sebelahnya.
Siswa ditugaskan untuk memasangkan atau mencocokkan, sehingga setiap
pertanyaan mempunyai jawaban yang benar.
  Kelebihan:
o   Dipergunakan untuk menilai bermacam-macam hal, misalnya: problem dan
penyelesaiannya, sebab akibat, istilah dan definisinya, dsb.
o   Relatif mudah disusun.
o   Jika disusun dengan baik, maka faktor menerka-nerka dapat dihilangkan.
o   Dapat dinilai dengan mudah, cepat dan objektif.
  Kelemahan:
o    Sukar menyusun test jenis ini yang benar-benar baik.
o    Untuk menilai ingatan saja.
o    Pengarahan jawaban sering terjadi
35
o    Memakan banyak waktu dan tenaga untuk menyusunnya.
  Saran Penulisan:
  Banyaknya jawaban di sebelah kanan lebih dari jawaban di sebelah kiri
  Lebihnya jawaban hendaknya menunjukkan jawaban yang salah
  Materinya setiap sisi baiknya mengenai satu pokok bahasan saja
  Pisahkan menjadi dua kolom, kolom pertama memuat jawaban, nomor soal
dan pertanyaan. Sedangkan kolom kedua memuat kode dan pilihan
jawaban.
  Cara Memberikan Skor: Penskoran pada tes menjodohkan tidak diberikan
denda terhadap jawaban yang salah. Skor = Jumlah jawaban benar
d. Tes Isian (Complementary Test). Tes isian terdiri dari kalimat yang dihilangkan
(diberi titik-titik). Bagian yang dihilangkan ini yang diisi oleh peserta tes
merupakan pengertian yang diminta agar pernyataan yang dibuat menjadi
pernyataan yang benar. Contoh:
(1)   Yang merupakan nama asli dari Sultan Hamengkubuwono X adalah …..
(2)   Para filsuf zaman modern menegaskan bahwa pengetahuan tidak berasal dari
kitab suci atau ajaran agama, tidak juga dari para penguasa, tetapi dari diri
manusia sendiri. Namun tentang aspek mana yang berperan ada beda
pendapat. Aliran ……………….. beranggapan bahwa sumber pengetahuan
adalah rasio: kebenaran pasti berasal dari rasio (akal). Aliran ……………,
sebaliknya, meyakini pengalamanlah sumber pengetahuan itu, baik yang batin,
maupun yang inderawi.
  Cara Memberikan Skor:
Pada tes ini sulit dilakukan tebakan, sehingga tidak diperlukan denda terhadap
jawaban yang salah. Maka rumus yang digunakan adalah :
Skor = Jumlah jawaban benar

3. Pengukuran Ranah Afektif


Pengukuran ranah afktif tidak dapat diukur seperti halnya ranah kognitif, karena dalam
ranah afektif kemampuan yang diukur adalah, Menerima (memperhatikan), merespon, menghargai,
mengorganisasi, dan karakteristik suatu nilai.Sedangkan tujuan penilaian afektif adalah :
a) Untuk mendapatkan umpan balik (feedback) baik bagi guru maupun siswa sebagai
dasar untuk memperbaiki proses belajar mengajar dan mengadakan program
36
perbaikan (remedial program) bagi anak didiknya.
b) Untuk mengetahui tingkat perubahan tingkah laku anak didik yang dicapai antara
lain diperlukan sebagai bahan bagi : perbaikan tingkah laku anak didik, pemberian
laporan kepada orang tua, dan penentuan lulus tidaknya anak didik.
c) Untuk menempatkan anak didik dalam situasi belajar mengajar yang tepat, sesuai
dengan tingkat pencapaian dan kemampuan serta karakteristik anak didik.
d) Untuk mengenal latar belakang kegiatan belajar dan kelainan tingkah laku anak
didik.
Jenis-jenis skala sikap
a.      Skala Likert
Skala Likert di gunakan untuk mengukur sikap, pendapat, dan resepsi seseorang
atau sekelompok orang tentang fenomena social. Dalam penelitian, fenomena social
ini telah di tetapkan secara spesifik oleh peneliti, yang selanjutnya di sebut sebagai
variable penelitian
b.      Skala pilihan ganda
Skala ini bentuknya seperti soal bentuk pilihan ganda yaitu suatu pernyataan yang
diikuti oleh sejumlah alternative pendapat.
c.       Skala Thurstone
Skala Thurstone merupakan skala sikap yang pertama dikembangkan dalam
pengukuran sikap. Skala ini mempunyai tiga teknik penskalaan sikap, yaitu :
         metode perbandingan pasangan
         metode interval pemunculan sama, dan
         metode interval berurutan.
Ketiga metode ini menggunakan bahan pertimbangan jalur dugaan yang
menganggap kepositifan relatif pernyataan sikap terhadap suatu obyek.
d.      Skala Guttman
Skala pengukuran dengan tipe ini, akan di dapat jawaban yang tegas, yaitu ya atau 
tidak,  benar atau salah, pernah atau tidak, positif atau negative  dan lain – lain. Data
yang di peroleh dapat berupa data interval atau rasio dikhotomi (dua alternatif). Jadi
kalau pada skala likert terdapat 3,4,5,6,7 interval, dari kata “sangat setuju” sampai
“sangat tidak setuju”, maka pada dalam skala Guttman hanya ada dua interval yaitu
“setuju atau tidak setuju”. Penelitian menggunakan sakal Guttman di lakukan bila
37
ingin mendapatkan jawaban yang tegas terhadap suatu permasalahan yang di
tanyakan. Contoh :
1.      Apakah anda setuju dengan kebijakan perusahaan menaikkan harga jual?
a.       Setuju                b. Tidak  Setuju
e.       Semantic Deferensial.
Skala pengukuran yang berbentuk Semantic defferensial di kembangkan oleh
Osgood. Skala ini juga di gunakan untuk mengukur sikap, hanya bentuknya tidak
pilihan ganda maupun checklist, tetapi tersusun dalam satu garis kontinum yang
jawaban “sangat positifnya” terletak di bagian kanan garis, dan jawaban yang
“sangat negatif” terletak di bagian kiri garis, atau sebaliknya. Data yang di peroleh
adalah daya interval, dan biasanya skala ini di gunakan untuk mengukur
sikap/karakteristik tertentu yang di punyai oleh seseorang.

4. Pengkuran Ranah Psikomotor


Ranah psikomotor berhubungan erat dengan kerjaan otot sehingga menyebabkan geraknya
tubuh atau bagian-bagiannya. Yang termasuk dalam klasifikasi gerak disini mulai dari gerak yang
paling sederhana yaitu melipat kertas sampai dengan merakit suku cadang televisi serta komputer.
Secara mendasar perlu dibedakan antara 2 hal yaitu keterampilan (skills) dan
kemampuan (abilities)
Kebanyakkan para guru tidak menuntut pencapaian 100 dari tujuan yang dirumuskan
kecuali hanya berharap bahwa keterampilan yang dicapai oleh siswa-siswanya akan sangat
mendukung mempelajari keterampilan lanjutan atau gerakan-gerakan yang lebih kompleks
sifatnya. Selain yang telah dikemukakan tersebut, Harrow juga memberikan saran yang mengenai
bagaimana melakukan pengukuran terhadap ranah psikomotor ini. Menurutnya penentuan kriteria
untuk mengukur keterampilan siswa harus dilakukan dalam jangka waktu sekurang-kurangnya 30
menit. Kurang dari waktu tersebut diperkirakan para penilai belum dapat menangkap gambaran
tentang pola keterampilan yang mencerinkan kemampuan siswa.
Bab 12
TABEL SPESIFIKASI
1.      Fungsi Tabel Spesifikasi
Fungsi dari tabel spesifikasi ialah untuk menjaga agar tes yang kita susun tidak
menyimpang dari bahan (materi) serta aspek kejiwaan (tingkah laku) yang akan dicakup dalam tes.
Contoh table spesifikasi:
38
Aspek yang diungkap Ingatan Pemahaman Aplikasi
Pokok Materi (I) (P) (A) Jumlah
Bagian I ………… ……………. …………. ………….
Bagian II ………… …………….. …………. …………
Bagian (terakhir) ………… …………….. …………. …………
Jumlah ……….. ……………. ………….. …………
2.      Langkah-Langkah Pembuatan
a.        Untuk materi yang seragam
Yang dimaksud “seragam” disini adalah bahwa antara pokok materi yang
satu dengan pokok materi yang lain mempunyai kesamaan dalam imbangan aspek
tingkah laku. Misalnya 50% untuk ingatan, 30% untuk pemahaman, dan 20% untuk
aplikasi. Selanjutnya banyaknya butir soal untuk setiap sel (kotak kecil) diperoleh
dengan cara menghitung persentase dari banyaknya soal bagi tiap pokok materi
yang sudah tertulis di kolom paling kanan.Contoh:
Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI
Ingata
Aspek yang diungkap n Pemahaman Aplikasi
Pokok Materi (50 %) (30%) (20%) Jumlah
Latar Belakang Berdirinya
Umayyah (20%) [A] [B] [C] 10
Kahalifah-Khalifah Besar
Umayyah (30%) [D] [E] [F] 15
Keberhasilan Umayyah (30%) [G] [H] [I] 15
Keruntuhan Umayyah (20%) [J] [K] [L] 10
Jumlah 50
 
Untuk mengisi/menentukan banyaknya butir soal untuk tiap sel adalah sebagai
berikut:
Sel A = 50 % x 10 soal = 5 (5 soal)        
Sel B = 30%  x 10 soal = 3 (3 soal)
Sel C = 20%  x 10 soal = 2 (3 soal)
Untuk memgisi sel-sel yang lain, dilakukan dengan cara yang sama seperti hal nya
mengisi sel A, B, dan C.
Disamping menggunakan cara seperti diatas, dalam menentukan jumlah butir soal

39
untuk tiap-tiap pokok materi, ada lagi cara lain yang dapat diambil yaitu mulai dari
pengisian sel-sel kemudian baru diperoleh jumlah soal tiap pokok materi.
b.         Untuk materi yang tidak seragam
Untuk membuat tabel spesifikasi pokok-pokok materi yang tidak seragam,
tidak perlu mencantumkan angka persentase imbangan tingkah laku di kepala
kolom. Pemberian imbangan dilakukan tiap pokok materi didasarkan atas
banyaknya soal untuk pokok materi itu dan imbangan yang dikehendaki oleh
penilaian menurut sifat pokok materi yang bersangkutan.Contoh:
Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI
Aspek yang diungkap Ingata
Pokok Materi n Pemahaman Aplikasi Jumlah
Bab I: Daulah Umayyah (30%) [A] [B] [C] 15
Bab II: Daulah Abbasiyah
(40%) [D] [E] [F] 20
Bab III: Islam di Asia       
(30%) [G] [H] [I] 15
Jumlah (100%) 50
Dalam keadaan seperti dicontohkan misalnya: BAB I mayoritas hafalan, BAB II mayoritas
pemahaman, BAB III mayoritas aplikasi. Maka imbangan aspek tingkah laku, tidak dituliskan pada
kepala kolom. Penentuan angka yang menunjukkan banyaknya butir soal pada tiap sel, ditentukan
per BAB. Misalnya: untuk Bab I, Ingatan 60%, pemahaman 20%, aplikasi 20%, maka:
Sel A = 60% x 15 soal = 9 soal
Sel B = 20% x 15 soal = 3 soal
Sel C = 20% x 15 soal = 3 soal
Untuk Bab II, ingatan 20%, pemahaman 50%, aplikasi 30%, maka:
Sel D = 20% x 20 soal = 4 soal
Sel E = 50% x 20 soal = 10 soal
Sel F = 30% x 20 soal = 6 soal
Untuk Bab III, ingatan 20%, pemahaman 20%, aplikasi 60%, maka:
Sel G = 20% x 15 soal = 3 soal
Sel H = 20% x 15 soal = 3 soal
Sel I  = 60% x 15 soal = 9 soal
4)       Tidak Lanjut Sesudah Penyususnan Tabel Spesifikasi

40
Terdapat dua langkah lagi sebagai tindak lanjut sesudah penyususnan tabel spesifikasi
untuk memperoleh seperangkat soal tes yaitu:
a.       Menentukan bentuk soal. Ada dua hal yang harus dipertimbangkan dalam
menentukan bentuk soal yaitu waktu yang tersedia dan sifat materi yang diteskan.
b.      Menuliskan soal-soal. Langkah terakhir dalam penyusunan tes adalah penulisan soal-
soal tes (item writing). Langkah ini merupakan langkah penting karena kegagalan dalam
hal ini dapat berakibat fatal. Hal-hal yang harus diperhatikan dalam menuliskan soal-
soal tes yaitu:
(1)   Bahasanya harus sederhana dan mudah dipahami.
(2)   Suatu soal tidak boleh mengandung penafsiran ganda/membingungkan.
(3)   Cara mengenal kalimat atau meletakkan/menata kata-kata perlu diperhatikan agar
tidak ditafsirkan salah.
(4)   Petunjuk mengerjakan. Petunjuk ini harus dituliskan sedemikian rupa sehingga
jelas, dan siswa tidak bekerja menyimpang dri yang dikehendaki guru.
Untuk memperoleh sebuah tes yang standar, harus dilakukan uji coba (try out)
berkali-kali sehingga diperoleh soal-soal yang baik. Dengan mengadakan uji coba
terhadap soal-soal tes yang sudah disusun, maka akan memperoleh manfaat yaitu:
pengalaman menggunakan tes tersebut, mengetahui kesukaran bahasa, mengetahui
variasi jawaban siswa, mengetahui waktu yang dibutuhkan, dan lain-lain.

Bab 13
MENGANALISISS HASIL TES

1. Menilai Tes yang Dibuat Sendiri


Guru yang sudah banyak berpengalaman, mengajar dan menyusun soal-soal tes, juga masih
sukar menyadari bahwa tesnya masih belum sempurna. Oleh karena itu cara yang paling baik
adalah secara jujur melihat hasil yang diperoleh oleh siswa.
Ada 4 cara untuk menilai tes, yaitu:
a.       Meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang dapat diperoleh
jawaban tentang ketidak jelasan perintah atau bahasa, taraf kesukaran, dan lain-lain
keadaan soal tersebut. Pertanyaan-pertanyaan tersebut antara lain:
(1)   Apakah banyaknya soal untuk tiap topik sudah seimbang ?
41
(2)   Apakah semua soal menanyakan bahan yang telah diajarkan ?
(3)   Apakah soal yang kita susun tidak merupakan pertanyaan yang membingungkan
(dapat disalah tafsirkan)?
(4)   Apakah soal itu tidak sukar untuk dimengerti ?
(5)   Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ?
b.      Mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur Yang
sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap
butir tes yang kita susun. Faedah mengadakan analisis soal:
(1)   Membantu kita dalam mengidentifikasi butir-butir soal yang jelek.
(2)   Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan
soal-soal untuk kepentingan lebih lanjut.
(3)   Memperoleh gambaran secara selintas tentang keadaan yang kita susun.
c.       Mengadakan checking validitas. Validitas yang paling penting dari tes buatan Guru
adalah validitas kurikuler.
d.      Mengadakan checking reliabilita. Salah satu indikator untuk tes yang
Mempunyai realibilitas yang tinggi adalah bahwa kebanyakan dari soal-soal tes itu
mempunyai daya pembeda yang tinggi.

2. Analisis Butir Soal(Item Analysis)


Analisis butir soal yang dalam bahasa inggris disebut item analiysis dilakukan terhadap
empirik.Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan dan hasil
jawaban terhadap butir-butir soal telah kita peroleh.
Untuk mengetahui kapan soal dikatakan baik, kurang baik, dan soal yang jelek sangat
berhubungan dengan analisis soal, yaitu taraf kesukaran, daya pembeda, dan pola jawaban soal.
a)      Taraf Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal
yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha
memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa
menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar
jangkauannya.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks
kesukaran. Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Soal yang
indeks kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0
42
menunjukkan bahwa soalnya terlalu mudah.
Didalam istilah evaluasi, indeks kesukaran diberi simbol P (proporsi). Rumus mencari
P adalah :
P=B
JS
Dimana :
P= indeks kesukaran
B            = Banyaknya siswa yang menjawab soal itu dengan betul
JS           = jumlah seluruh siswa peserta tes
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan
sebagai berikut :
Soal dengan P 1,00 sampai 0,30 adalah soal sukar
Soal dengan P 0,30 sampai 0,70 adalah soal sedang
Soal dengan P 0,70 sampai 1,00 adalah soal mudah
Walaupun demikian ada yang berpendapat bahwa soal – soal yang di anggap baik
yaitu soal – soal sedang, tetapi bukan berarti soal – soal yang terlalu mudah atau
terlalu sukar tidak bisa digunakan, hal ini tergantung dari penggunaannya.
b)      Daya Pembeda.
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa
yang berkemampuan tinggi dengan siswa yang berkemampuan rendah.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi,
indeks diskriminasi ini sama dengan indeks kesukaran yaitu berkisar antara 0,00
sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif tetapi
pada indeks diskriminasi ada tanda negatif.
Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun siswa bodoh,
maka soal itu tidak baik, demikian pula jika semua siswa, baik pandai maupun bodoh
tidak dapat menjawab dengan benar, soal tersebut tidak baik karena keduanya tidak
mempunyai daya pembeda. Soal yang baik adalah soal yang dapat dijawab oleh siswa
pandai saja.
Jika seluruh kelompok atas (pandai) dapat menjawab soal dengan benar, sedang
seluruh kelompok bawah (bodoh) menjawab salah, maka soal tersebut mempunyai
diskriminasi paling besar, yaitu 1,00. Sebaliknya jika semua kelompok atas menjawab
43
salah, tetapi semua kelompok bawah menjawab betul, maka nilai diskriminasinya
adalah -1,00. Tetapi jika siswa kelompok atas dan siswa kelompok bawah sama-sama
menjawab benar atau sama-sama menjawab salah, maka soal tersebut mempunyai
nilai diskriminasi 0,00 karena tidak mempunyai daya pembeda sama sekali.
Rumus mencari nilai Diskriminasi adalah :
D = BA/JA – BB/JB = PA – PB
Dimana :
J = jumlah peserta tes
JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
BA = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar
BB BA/JA = banyaknya peserta kelompok bawah yang menjawab soal itu dengan
benar.
PA = BB/JB = proporsi peserta kelompok atas yang menjawab benar ( P sebagai
indeks kesukaran).
PB = proporsi peserta kelompok bawah yang menjawab benar
c)      Pola Jawaban Soal
Pola jawaban yang dimaksud adalah distribusi testee dalam hal menentukan pilihan
jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan
menghitung banyaknya testee yang memilih pilihan jawaban a, b, c, atau d atau yang
tidak memilih pilihan manapun.
Dari pola jawaban soal dapat ditentukan apakah pengecoh (distractor) berfungsi
sebagai pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali
oleh testee berarti bahwa pengecoh itu jelek, sebaliknya sebuah distraktor dapat
dikatakan berfungsi dengan baik apabila distraktor tersebut mempunyai daya tarik
yang besar bagi pengikut – pengikut tes yang kurang memahami konsep atau kurang
menguasai bahan.
Dengan melihat pola jawaban soal, dapat diketahui :
a. Taraf kesukaran soal
b. Daya pembeda soal
c. Baik dan tidaknya distraktor
Kekurangan suatu soal mungkin hanya terletak pada rumusan kalimatnya sehingga
44
hanya perlu ditulis kembali, dengan perubahan seperlunya.

Bab 14
Model Penelitian Kelas

Pengertian Umum Penilaian Kelas Munculnya kebijakan tentang model penilaian kelas bersaman
atau mengikuti adanya kebijakan tentang Kurikulum Tingkat Satu Pendidikan (KTSP). Sejalan
dengan kemajuan dan tuntutan jaman serba canggih, penilaian atau evaluasi pun harus demikian,
Tu penilaian dalam pelaksanaan KTSP bukan hanya untuk mengeta keberhasilan siswa setelah
mengikuti pembelajaran, tetapi secara risd adalah sebagai berikut.
a.Melacak kemajuan siswa atau peserta didik.
b. Mengecek ketercapaian kemampuan peserta didik.
c Mendeteksi kesalahan ketika siswa belajar.
d. Menyimpulkan beberapa hal yang terkait dengan pembelajaran.
Dengan empat tujuan tersebut maka penilaian harus dilakukan harus bermakna, menyeluruh,
kerkesinambungan, dan sekaligus jug mendidik subjek yang sedang belajar. Menurut istilah
Margareth Pucket dan Janet K. Black(1994), penilaian yang demikian dikenal dengan istlia
Authentic Assessment, yaitu penilaian terarah pada semua kejadian ya terdapat pada diri siswa dan
lingkungannya secara riil. Pusat Pengembangan Kurikulum Badan Penelitian dan Pengembangan.
Beberapa jenis penelitian,
1. Kuis
2. Pertanyaan lisan
3. Ulangan harian
4. Ulangan tengah semester
5. Tugas individu
6. Respon atau ujian praktek
7. Laporan kerja praktek
8. Penilaian portofolio
Bentuk-bentuk penilaian
1. Penilaian melalui tes tertulis
2. Penilaian melalui tes lisan
3. Penilaian unjuk kerja
45
4. Penilaian proyek
5. Penilaian produk
6. Penilaian portofolio
7. Penilaian diri

Bab 15
MENSKOR DAN MENILAI

1. Menskor
Sementara orang berpendapat bahwa bagian yang paling penting dari pekerjaan pengukuran
dengan tes adalah penyusunan tes. Jika alat tesnya sudah disusun sebaik-baiknya maka
anggapannya sudah tercapailah sebagian besar dari maksudnya. Tentu saja anggapan itu tidak
benar sama sekali. Penyusunan tes baru merupakan satu bagian dari serentetan pekerjaan mengetes.
Di samping penyusunan dan pelaksanaan tes itu sendiri, menskor dan menilai merupakan
pekerjaan yang menuntut ketekunan yang luar biasa dari penilai, ditambah dengan kebijaksanan-
kebijaksanaan tertentu. Nama lain menskor adalah memberi angka.
Dalam hal pekerjaan menskor atau menentukan angka, dapat digunakan 3 macam alat bantu
yaitu:
a.       Pembantu menentukan jawaban yang benar, disebut kunci jawaban.
b.      Pembantu menyeleksi jawaban yang benar dan yang salah, disebut kunci scoring.
c.       Pembantu menentukan angka, disebut pedoman penilaian.
Keterangan dan pengunaannya dalam berbagai bentuk tes.

(1)   Kunci jawaban dan kunci pemberian skor untuk tes bentuk betul-salah.
Untuk tes bentuk betul-salah (true-false) yang dimaksud dengan kunci jawaban
adalah deretan jawaban yang kita persiapkan untuk pertanyaan atau soal-soal yang kita
susun, sedangkan kunci scoring adalah alat yang kita gunakan untuk mempercepat
pekerjaan scoring.
Oleh karena dalam hal ini testee (tercoba) hanya diminta melingkari huruf B atau S
maka kunci jawaban yang disediakan hanya berbentuk urutan nomor serta huruf dimana
kita menghendaki untuk melingkari (atau dapat juga diberi tanda X).

Ada baiknya jika kunci jawaban ini ditentukan terlebih dahulu sebelum menyusun
46
soalnya agar:

dapat diketahui imbangan antara jawaban B dan S.


dapat diketahui letak atau pola jawaban B dan S.
Bentuk betul-salah sebaiknya disusun sedemikian rupa sehingga jumlah jawaban B
hampir sama banyaknya dengan jawaban S, dan tidak dapat ditebak karena tidak diketahui
pola jawabannya. Dalam menentukan angka (skor) untuk tes bentuk B-S ini kita dapat
menggunakan 2 cara yaitu:

  Tanpa hukuman atau tanpa denda.


  Dengan hukuman atau dengan denda.
(2)   Kunci jawaban dan kunci pemberian skor untuk tes bentuk pilihan ganda (multiple
choice)
Dengan tes bentuk pilihan ganda, testee diminta melingkari salah satu huruf di
depan pilihan jawaban yang disediakan atau membubuhkan tanda lingkaran atau tanda
silang (x) pada tempat yang sesuai di lembar jawaban.

(3)   Kunci jawaban dan kunci pemberian skor untuk tes bentuk jawab singkat (sort
answer test)
Tes bentuk jawab singkat adalah bentuk tes yang menghendaki jawaban berbentuk
kata atau kalimat pendek. Melihat namanya, maka jawaban untuk tes tersebut tidak boleh
berbentuk kalimat-kalimat panjang, tetapi harus sesingkat mungkin dan mengandung satu
pengertian. Dengan persyaratan inilah maka bentuk tes ini dapat digolongkan ke dalam
bentuk tes objektif.

Kunci jawaban tes bentuk ini merupakan deretan jawaban sesuain dengan
nomornya.

Dengan mengingat jawaban yang hanya satu pengertian saja, maka angka bagi tiap
nomor soal mudah ditebak. Usaha yang dikeluarkan siswa sedikit, tetapi lebih sulit daripada
tes bentuk betul-salah atau bentuk pilihan ganda. Sebaiknya setiap soal diberi angka 2.
Dapat juga angka itu kita samakan dengan angka pada bentuk betul-salah atau pilihan ganda
jika memang jawaban yang diharapkannya ringan atau mudah. Tetapi sebaliknya apabila
jawabannya bervariasi misalnya lengkap sekali, lengkap dan kurang lengkap, maka angka-
angkanya dapat dibuat bervariasi pula misalnya 2; 1,5; dan 1.

47
(4)   Kunci jawaban dan kunci pemberian skor untuk tes bentuk
menjodohkan (matching)
Pada dasarnya tes bentuk menjodohkan adalah tes bentuk pilihan ganda, dimana
jawaban-jawabannya dijadikan satu, demikian pertanyaan-pertanyaannya. Dengan
demikian, maka pilihan jawabannya akan lebih banyak. Satu kesulitan lagi adalah bahwa
jawaban yang dipililh dibuat sedemikian rupa sehingga jawaban yang satu tidak diperlukan
lagi bagi pertanyaan lain.

Kunci jawaban tes bentuk menjodohkan dapat berbentuk deretan jawaban yang
dikehendaki atau deretan nomor yang diikuti oleh huruf-huruf yang terdapat di depan
alternative jawaban.

Telah dijelaskan bahwa tes bentuk menjodohkan adalah tes bentuk pilihan ganda
yang lebih kompleks. Maka angka yang diberikan sebagai imbalan juga harus lebih banyak.
Sebagai ancar-ancar dapat ditentukan bahwa angka untuk tiap nomor adalah 2 (dua).

(5)   Kunci jawaban dan kunci pemberian skor untuk tes bentuk uraian (essay test)
Sebelum menyusun sebuah tes uraian sebaiknya kita tentukan terlebih dahulu
pokok-pokok jawaban yang kita kehendaki. Dengan demikian, maka akan mempermudah
kita dalam pekerjaan mengkoreksi tes itu.

Tidak ada jawaban yang pasti terhadap tes bentuk uraian ini. Jawaban yang kita
peroleh akan sangat beraneka ragam, berada dari siswa satu ke siswa lain. Untuk menetukan
standar terlebih dahulu, tentulah sukar. Berikut adalah saran langkah-langkah apa yang
harus kita lakukan pada waktu kita mengoreksi dan member angka tes bentuk uraian:

a)      Membaca soal pertama dari seluruh siswa untuk mengetahui situasi jawaban.
Dengan membaca seluruh jawaban, kita dapat memperoleh gambaran lengkap
tidaknya jawaban yang diberikan siswa secara keseluruhan.
b)      Menentukan angka untuk soal pertama tersebut. Misalnya jika jawabannya
lengkap diberi angka 5, kurang sedikit diberi angka 4, begitu  seterusnya sampai
kepada jawaban yang paling minim jika jawabannya meleset sama sekali. Dalam
menentukan angka pada hal yang terakhir ini umumnya kita perlu berpikir bahwa
tidak ada unsur tebakan. Dengan demikian maka ada dua pendapat, satu pendapat
menentukan angka 1 atau 2 bagi jawaban yang salah, tetapi pendapat lain
menentukan 0 untuk jawaban itu. Tentu saja bagi jawaban yang kosong (tidak ada
48
jawaban sama sekali), jelas kita berikan angka 0.
c)      Memberikan angka bagi soal pertama.
d)      Membaca soal kedua dari seluruh siswa untuk mengetahui situasi jawaban,
dilanjutkan dengan pemberian angka untuk soal kedua.
e)      Mengulangi langkah-langkah tersebut bagi soal-soal tes ketiga, keempat dan
seterusnya hingga seluruh soal diberi angka.
f)       Menjumlahkan angka-angka yang diperoleh oleh masing-masing siswa untuk
tes bentuk uraian.
Setelah mempelajari langkah-langkah tersebut kita tahu bahwa dengan membaca
terlebih dahulu seluruh jawaban yang duberikan oleh siswa, kita menjadi tahu bahwa
mungkin tidah ada seorang pun dari siswa yang menjawab dengan betul untuk sesuatu
nomor soal.

Menghadapi situasi seperti ini, kita gunakan cara pemberian angka yang relative.
Misalnya untuk satu nomor soal jawaban yang paling lengkap hanya mengandung 3 unsur,
padahal kita menghendaki 5 unsur, maka kepada jawaban yang paling lengkap itulah kita
berikan angka 5, sedangkan untuk menjawab hanya 2 atau 1 unsur, kita beri angka sedikit,
yaitu misalnya 3,4; 2; 1,5.

(6)   Kunci jawaban dan kunci pemberian skor untuk tugas


Kunci jawaban untuk memeriksa tugas merupakan poko-pokok yang harus termuat
di dalam pekerjaan siswa. Hal ini menyangkut criteria tentang isi tugas. Namun sebagai
kelengkapan dalam pemberian skor, digunakan suatu tolok ukur tertentu. Tolok ukur yang
disarankan sebagai ukuran keberhasilan tugas adalah:

a)      Ketepatan waktu penyerahan tugas.


b)      Bentuk fisik pengerjaan tugas yang menandakan keseriusan mahasiswa dalam
mengenakan tugas.
c)      Sistematika yang menunjukkan alur keruntutan pikiran.
d)      Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi.
e)      Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah ditentukan
oleh dosen.
2.      Perbedaan Antara Skor dan Nilai
Apa yang terjadi selama ini, banyak di antara para guru sendiri yang masih

49
mencampuradukkan antara dua pengertian yaitu skor dan nilai.Skor : adalah hasil pekerjaan
menskor yang diperoleh dengan menjumlahkan angka-angka bagi setiap soal tes yang dijawab
betul oleh siswa.Nilai : adalah angka ubahan dari skor dengan menggunakan acuan tertentu, yakni
acuan normal atau acuan standar.Secara rinci skor dapat dibedakan atas tiga macam, yaitu skor
yang diperoleh (obtained score), skor sebenarnya (true score), dan skor kesalahan (error score).
Score yang diperoleh adalah sejumlah biji yang dimiliki oleh testee sebagai hasil
mengerjakan tes. Kelemaham-kelemahan butir tes, situasi yang tidak mendukung, kecemasan dan
lain-lain factor dapat berakibat terhadap skor yang diperoleh ini. Apabila factor yang berpengaruh
ini muncul, baik sebagian atauppun menyeluruh, penilai tidak dapat mengira-ngira seberapa cermat
skor yang diperoleh siswa ini mampu mencerminkan pengetahuan dan keterampilan siswa yang
sesungguhnya.
Skor sebenarnya (true score) sering kali juga disebut dengan istilah skor univers = skor
alam (universe score), adalah nilai hipotesis yang sangat tergantung dari perbedaan individu
berkenaan dengan pengetahuan yang dimiliki secara tetap.
Perbedaan antara skor yang diperoleh dengan skor yang sebenarnya, disebut dengan istilah
kesalahan dalam pengukuran atau kesalahan skor, atau dibalik skor kesalahan. Hubungan antara
ketiga macam skor tersebut adalah sebagai berikut:
Skor yang diperoleh = skor sebenarnya = skor kesalahan
 3.      Norm ReferenceddanCriterion Referenced
Dalam penggunaan Norm – Referenced, prestasi belajar seorang siswa dibandingkan
dengan siswalain dalam kelompoknya. Kualitas seseorang sangat dipengaruhi oleh kualitas
kelompoknya. Dasar pikiran dari penggunaan standar ini adalah adanya asumsi bahwa disetiap
populasi yang heterogen tentu terdapat kelomouk baik, kelompok sedang, dan kelompok kurang.
Apabila standar mutlak dan standar relatif ini dihubungkan dengan pengubahab skor
menjadi nilai, maka akan terlihat demikian.
a.         Dengan standar mutlak
(1)   Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan
yang ditentukan.
(2)   Nilai diperoleh dengan mencari skor rata-rata langsung dari skor asal (skor
mentah). Contoh :
  dari ulangan ke-1, memperoleh skor 60 (mencapai 60 % tujuan)
  dari ulangan ke-2, memperoleh skor 80 (mencapai 80 % tujuan)
50
  dari ulangan ke-3, memperoleh skor 50 (mencapai 50 % tujuan)
maka nilai siswa tersebut : 60 + 80 + 50 = 63,3. Dibulatkan 63.
b.       Dengan standar relatif
(1)   pemberian skor terhadap siswa juga didasakan atas pencapaian siswa terhadap
tujuan yang ditentukan
(2)   nilai diperoleh dengan 2 cara :
  mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya
  menjumlah skor tiap-tiap ulangan, baru diubah ke nilai

Bab 16
MENGOLAH NILAI

1. Beberapa Skala Penilaian


a.       Skala Bebas
Skala bebas yaitu skala yang tidak tetap, ada kalanya skor tertinggi 20, lain kali lagi 50.
Ini semua tergantung dari banyak dan bentuk soal. Jadi, angka tertinggi dari skala yang
di gunakan tidak selalu sama.
b.      Skala 1-10
Dalam skala 1-10, guru jarang memberikan angka pecahan, misalnya 5,5. Angka 5,5
tersebut di bulatkan menjadi 6. Dengan menggunakan skala 1-10 maka bilangan bulat
yang ada masih menunjukan penilaian yang agak kasar.
c.       Skala 1-100
Penilaian dengan menggunakan skala 1-100, di mungkinkan melakukan penilaian yang
lebih halus karena terdapat 100 bilangan bulat. Nilai 5,5 dalam skala 1-10 yang
biasanya di bulatkan menjadi 6, dalam skala 1-100 ini boleh di tuliskan dengan 55.
d.      Skala huruf
Selain menggunakan angka, pemberian nilai dapat di lakukan dengan huruf
A,B,C,D,dan E. Huruf tidak menunjukan kuantitas, tetapi dapat di gunakan sebagai
symbol untuk menggambarkan kualitas.

2. Distribusi Nilai
a.        Distribusi nilai berdasarkan standar mutlak

51
Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan
yang ditentukan. Nilai diperoleh dengan mencari skor rata-rata langsung dari skor asal
(mentah). Apabila soal-soal ulangan yang dibuat oleh guru sangat mudah, sebagian
besar siswa akan dapat berhasil mengerjakan soal-soal itu, dan tingkat pencapaiannya
tinggi.sebagian besar siswa akan memiliki nilai sekitar 8, 9 atau 10 apabila telah diubah
ke skala 10, sebaliknya apabila soal-soal tes yang disusun oleh guru termasuk soal
sukar, maka pencapaian siswa akan sebaliknya pula. Sebagian besar siswa akan
memiliki nilai 3, 4 bahkan mungkin 2 atau  1. Hanya beberapa orang siswa  yang
istimewa saja yang memiliki nilai 6, dan mungkin tidak ada yanig memiliki nilai 7 ke
atas. Namun demikian dengan standar mutlak ini mungkin pula diperoleh gambar kurva
normal jika soal-soal tes disusun oleh guru dengan tepat seperti gambaran kecakapan
siswa-siswanya.
b.        Distribusi nilai berdasarkan standar relative
Pemberian skor terhadap siswa juga didasarkan atas pencapaian siswa terhadap
tujuan yang ditentukan.Nilai diperoleh dengan 2 cara:
  Mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya.
  Menjumlah skor tiap-tiap ulangan, baru diubah ke nilai.
Telah diterangkan, bahwa dalam menggunakan standar relative atau norm
refrenced, kedudukan seseorang sealu dibandingkan dengan kawan-kawannya dalam
kelompok. Dalam hal ini tanpa menghiraukan apakah distribusi skor terletak dalam
kurva juring positif atau juring negative, tetapai dalam norm refrenced selalu tergambar
dalam kurva normal. Hal ini didasarkan atas asumsi bahw apabila distribusi skor
tergambar dalam kurva juring positif, yang kurang sempurna adalah soal-soal tesnya,
yaitu terlalu sukar. Dengan demikian, nilai siswa lalu direntangkan sedemikian rupa
sehingga tersebar dari nilai tinggi ke nilai rendah, dengan sebagian terbesar terletak
pada nilai sedang. Demikian pula sebaliknya apabila skor siswa tergambar dalam kurva
juring negative. Dalam ubahan menjadi nilai, disebar sedemikian rupa sehingga kurva
normal, dengan nilai sedang adalah nilai yang paling banyak.

3. Standar Nilai
a.       Nilai standar berskala Sembilan (stannine), yaitu rentangan atau skala nilai yang
bergerak mulai dari 1 sampai dengan  9,[7] seperti berikut ini:

52
Staines Interpretasi
9  (4%) Tinggi (4%)
8  (7%)
7  (12%) Diatas rata-rata (19%)
6  (17%)
5  (20%)
4  (17%) Rata-rata  (54%)
3  (12%)
2  (7%) Dibawah rata-rata (19%)
1  (4%) Rendah (4%)
Misalnya kita memiliki skor-skor seperti disebutkan dalam hasil ulangan IPS kelas V,
dengan mudah dapat kita tentukan 4% dari siswa yang mendapat nilai 9, selanjutnya
7% mendapat nilai 8, 12% mendapat nilai 7, 17% mendapat nilai 6, dan seterusnya.
b.      Nilai standar berskala sebelas (standar eleven/ stanel= eleven points scale), yaitu
skala nilai yang bergerak mulai  dari nilai 0 sampai dengan nilai 10,[9] yang
dikembangkan oleh Fakultas Ilmu Pendidikan UGM disesuaikan dengan system
penilaian di Indonesia. Dengan stanel ini, system penilaian membagi skala menjadi 11
golongan, yaitu angka-angka  0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, yang satu sama lain berjarak
sama. Tiap-tiap angka menempati  jarak antara
c.       Standar sepuluh. Didalam Buku Pedoman Penilaian (Buku III B Seri Kurikulum
SMA Tahun 1975) ditentukan bahwa untuk mengolah hasil tes, digunakan standar
relative, dengan nilai berskala 1 – 10. Untuk mengubah skor menjadi nilai, diperlukan
dahulu:
  Mean (rata-rata skor)
  Deviasi Standar (Simpangan Baku)
  Tabel Konversi angka ke dalam nilai berskala 1 – 10
Tahap-tahap yang dilalui dalam mengubah skor mentah menjadi nilai berskala 1 – 10
adalah sebagai berikut:
  Menyusun distribusi frekuensi dari angka-angka atau skor-skor mentah
  Menghitung rata-rata skor (mean)
  Menghitung deviasi standar
  Mentransformasi (mengubah) angka-angka mentah ke dalam nilai berskala 1 – 10

Bab 17
53
KEDUDUKAN SISWA DALAM KELOMPOK

1. Pengertian
Pengertian yang dimaksud kedudukan siswa dalam kelompoknya adalah letak seorang
siswa di dalam urutan tingkatan, dalam istilah disebut rangking. Untuk dapat diketahui rangking
dari siswa  di suatu kelas maka harus diadakan pengurutan nilai siswa tersebut dari yang paling atas
sampai ke nilai yang paling bawah.

2. Cara-cara menentukan kedudukan siswa:


a.       Dengan rangking sederhana( simple rank) adalah urutan yang menunjukkan letak
atau kedudukan seseorang dalam kelompoknya dan dinyatakan dengan nomor atau
angka biasa.
b.      Dengan rangking presentase (percentile rank) adalah kedudukan seseorang dalam
kelompok, yang menunjukkan banyaknya persentase yang berada di bawahnya
c.       Standar Deviasi adalah penentuan kedudukan dengan membagi kelas atas kelompok-
kelompok. Tiap kelompok dibatasi oleh suatu standar deviasi tertentu.
d.      Standard score atau z-score adalah angka yang menunjukkan perbandingan perbedaan
score seseorang dari mean dengan standar deviasinya untuk menentukan z-score, harus
diketahui:
  Rata-rata skor dari kelompok.
  Standar deviasi dari skor-skor tersebut
Pengetrapan dari z-score ini banyak digunakan di dalam menentukan kejuaraan
seseorang apabila kebetuan jumlah nilainya sama
Kedudukan seseorang dalam sebuah kelas sangat penting karena dengan begitu
peserta didik akan tahu berapa rangking yang telah dicapainya, jika mendapat rangking
yang bagus maka dia akan merasa bangga dengan hasil yang diperoleh atas usaha yang
telah dilakukan selama ini dalam proses belajar mengajar, sedang apabila rangkingnya jelek
maka peserta didik akan lebih termotivasi untuk memperbaiki dirinya. Dalam bab ini telah
dijelaskan bagaimana cara menentukan kedudukan siswa melalui beberapa standar yang
lazim digunakan.

Bab 18

54
MENCARI NILAI AKHIR

1.      Fungsi Nilai Akhir


a.       Fungsi intruksional bertujuan untuk memberikan suatu balikan yang mencerminkan
seberapa jauh seorang siswa telah mencapai tujuan yang ditetapkan dalam pengajaran
atau system intruksional.
b.      Fungsi informatif bertujuan untuk memberikan nilai siswa kepada orang tuanya
mempunyai arti bahwa orang tua siswa tersebut menjadi tahu akan kemajuan dan
prestasi putranya di sekolah.
c.       Fungsi bimbingan bertujuan untuk mengetahui bagian-bagian mana dari usaha siswa
di sekolah yang masih memerlukan bantuan.
d.      Fungsi administratif:
  Menentukan kenaikan dan kelulusan siswa
  Memindahkan atau menempatkan siswa
  Memberikan beasiswa
  Memberikan rekomendasi untuk melanjutkan belajar
  Memberi gambaran tentang prestasi siswa atau lulusan kepada calon pemakai tenaga
kerja.
2.      Faktor-faktor yang mempengaruhi penilaian:
a.       Prestasi/ pencapaian (achievement)
b.      Usaha (effort)
c.       Aspek pribadi dan social (personal and social characteristics)
d.      Kebiasaan bekerja (working habits).
3.      Cara menentukan nilai akhir:
a.         Untuk memperoleh nilai akhir, perlu diperhitungkan nilai tes formatif dan tes
sumatif.
b.         Nilai akhir diperoleh dari nilai tugas, nilai ulangan harian, dan nilai ulangan umum
dengan bobot 2,3,dan 5.
c.         Nilai akhir untuk STTB diperoleh dari rata-rata nilai ulangan harian (diberi bobot
satu) dan nilai EBTA (diberi bobot dua), kemudian dibagi 3.

Bab 19
55
MEMBUAT LAPORAN

1.      Pentingnya Laporan
Laporan biasanya dibuat oleh seorang guru dibuat pada akhir semester, dibuatnya laporan ini
diperlukan untuk mengetahui hasil akhir dari apa yang dilakukan oleh siswa-siswi serta diperlukan
agar guru dapat mengetahui tingkat keberhasilannya dalam mengajar sudah berhasil atau belum
jika belum maka guru akan meninjau kembali metodenya dalam mengajar.Secara sistematis dapat
dikemukakan disini bahwa laporan tentang siswa bermanfaat bagi beberapa pihak yaitu sebagai
berikut:
a) Siswa sendiri, secara alamiah setiap orang selalu ingin tahu akibat dari apa yang telah
mereka lakukan, dengan mengetahui hasil yang positif dari perbuatannya, maka
pengetahuan yang diperoleh akan dikuatkan dan jika siswa mendapat informasi
bahwa jawwabannya salah, maka lain kali ia tidak akan menjawab seperti itu lagi.
b) Guru yang mengajar akan mengetahui catatan laporan kemajuan siswa.
c) Guru lain, maka guru yang akan mengganti mengajar akan tahu bagaimana meladeni
atau memperlakukan siswa.
d) Petugas lain disekolah.
e) Orang tua akan mengetahui kemajuan anak dari hari ke hari.
f) Pemakai lulusan, laporan pendidikan menunjukkan bahwa seseorang telah memiliki
pengetahuan dan ketrampilan tertentu. Digunakan untuk mencari pekerjaan dan
mencari kelanjutan studi.
2.      Macam dan Cara Membuat Laporan
  Catatan lengkap.
  Catatan tidak lengkap.
  Lulus-belum lulus.
  Nilai siswa.

Bab 20
EVALUASI PROGRAM PENGAJARAN

1. Apakah Evaluasi Program Itu?


Evaluasi merupakan suatu kegiatan yang bertujuan untuk menentukan apakah target
56
progam yang disusun sudah tercapai dengan begitu maka akan diketahui bagaimana kualitas
mengajar seorang guru apakah sudah efektif atau belum berdasarkan tingkat pencapaian yang
sudah dicapai.
Evaluasi  progam merupakan suatu rangkaian kegiatan yang dilakukan dengan sengaja
untuk melihat tingkat keberhasilan progam. Untuk menentukan seberapa jauh target progam sudah
tercapai, yang dijadikan tolak ukur adalah tujuan yang sudah dirumuskan dalam tahap perencanaan
kegiatan.
Pentingnya evaluasi progam yaitu agar guru mengetahui betul apa yang terjadi di dalam
proses belajar-mengajar, guru berkepentingan atas kualitas pengajaran. Untuk memperbaiki proses
pengajaran yang akan dilaksanakan lain waktu, guru perlu mengetahui seberapa tinggi tingkat
pencapaian dari tugas yang telah dikerjakan selama kurun waktu tertentu.
2.      Objek atau sasaran evaluasi progam.
  Input(masukan)
  Materi atau kurikulum.
  Guru.
  Metode atau pendekatan dalam mengajar.
  Sarana: alat pelajaran atau media pendidikan.
  Lingkungan manusia.
  Lingkungan bukan manusia.
3.      Cara melaksanakan evaluasi progam.
            Apabila guru ingin melakukan evaluasi progam dengan lebih seksama, terlebih dahulu
harus menyusun rencana evaluasi sekaligus menyusun instrument pengumpulan data. Mengenai
bagaimana menyiapkan instrumen untuk angket, pedoman wawancar, pedoman pengamatan dapat
dipelajari dari buku-buku penelitian. Sebagai cara yang paling sederhana adalah mengadakan
pencatatan terhadap peristiwa yang dialami dari kegiatan sehari-hari di kelas.
 

2.2. BUKU PEMBANDING


BAB 1 KONSEP DASAR EVALUASI PEMBELAJARAN
Pengukuran, penilaian dan evaluasi bersifat hierarki. Kata dasar pembelajaran adalah belajar.
Dalam arti sempit pembelajaran dapat diartikan sebagai suatu proses atau cara yang dilakukan agar
seseorang dapat melakukan kegiatan belajar, sedangkan belajar adalah suatu proses perubahan
tingkah laku karena interaksi individu dengan lingkungan dan pengalaman.Istilah pembelajaran
57
berbeda dengan istilah pengajaran .
Sistematik artinya keteraturan, dalam hal ini pembelajaran harus dilakukan dengan urutan langkah-
langkah tertentu, mulai dari perencanaan, pelaksanaan sampai dengan penilaian. Setelah
pembelajaran berproses, tentu guru perlu mengetahui ke efektifan dan efisiensi semua komponen
yang ada dalam proses pembelajaran. Untuk itu, guru harus melakukan evaluasi pembelajaran.
Sedangkan komunikatif dimaksudkan bahwa sifat komunikasi antara peserta didik dengan guru
atau sebaliknya.
Dalam proses pembelajaran, guru hendaknya dapat menciptakan kondisi-kondisi yang
memungkinkan terjadinya kegiatan belajar peserta didik. Kondisi-kondisi yang dimaksud antara
lain: memberi tugas, mengadakan diskusi, tanya jawab, mendorong peserta didik untuk berani
mengemukakan pendapat, termasuk melakukan evaluasi atau penilaian.
A. Pengukuran
Pengukuran dalam bahasa Inggris dikenal dengan measurement dan dalam bahasa Arabnya adalah
muqayasah, dapat diartikan sebagai kegiatan yang dilakukan untuk mengukur sesuatu. Proses
pengumpulan ini dilakukan untuk menaksir apa yang telah diperoleh peserta didik setelah
mengikuti kegiatan pembelajaran selama waktu tertentu. Proses ini dapat dilakukan dengan
mengamati kinerja mereka, mendengarkan apa yang mereka katakan serta mengumpulkan
informasi yang sesuai dengan tujuan melalui apa yang telah dilakukan oleh peserta didik. Hal ini
dikarenakan salah satu cara yang sering dipakai untuk mengukur hasil yang telah dicapai peserta
didik adalah dengan tes.
Pengukuran diartikan sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang
dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas. Pengukuran
inilah yang biasa dikenal dalam dunia pendidikan.
Data kuantitatif adalah data yang berupa angka-angka, analis data kuantitatif berpendapat, kalau
data ada ia akan berupa jumlah dan dapat diukur. Kriteria kuantitatif tanpa pertimbangan. Kriteria
yang disusun hanya dengan memperhatikan rentangan bilangan tanpa mempertimbangkan apa-apa
dan dilakukan dengan membagi rentangan bilangan. Kondisi maksimal yang diharapkan untuk
prestasi belajar diperhitungkan 100%. Nilai 5 , jika mencapai 81–100 %b. Nilai 4 , jika mencapai
61–80 %c.
Nilai 3 , jika mencapai 41–60 %d. Nilai 2 , jika mencapai 21–40 %e. Nilai 1 , jika mencapai 0–21
%2. Ada kalanya beberapa hal kurang tepat jika kriteria kuantitatif dikategorikan dengan membagi
begitu saja rentangan yang ada menjadi rentangan sama rata.
58
Hal ini di buat karena adanya pertimbangan tertentu berdasarkan sudut pandang dan pertimbangan
evaluator . Pengukuran pembelajaran adalah suatu pekerjaan professional guru, instruktur atau
dosen. Tanpa kemampuan melakukan pengukuran pendidikan, seorang guru tidak akan dapat
mengetahui dengan persis di mana ia dan peserta didik berada pada suatu saat atau pada suatu
kegiatan .
B. Penilaian
Peningkatan kualitas pendidikan dapat dilihat dari nilai-nilai yang diperoleh peserta didik. Tentu
saja untuk itu diperlukan sistem penilaian yang baik dan tidak bias. Sistem penilaian yang baik
akan mampu memberikan gambaran tentang kualitas pembelajaran sehingga pada gilirannya akan
mampu membantu guru merencanakan strategi pembelajaran. Bagi peserta didik sendiri, sistem
penilaian yang baik akan mampu memberikan motivasi untuk selalu meningkatkan
kemampuannya.
Informasi yang diperoleh dari hasil pengukuran selanjutnya dideskripsikan dan ditafsirkan.
Menurut Mardapi ada dua acuan yang dapat dipergunakan dalam melakukan penilaian yaitu acuan
norma dan acuan kriteria. Misalnya jika seseorang mengikuti tes tertentu, maka hasil tes akan
memberikan gambaran dimana posisinya jika dibandingkan dengan orang lain yang mengikuti tes
tersebut. Adapun acuan kriteria dipergunakan untuk menentukan kelulusan seseorang dengan
membandingkan hasil yang dicapai dengan kriteria yang telah ditetapkan terlebih dahulu.
Seseorang yang dikatakan telah lulus berarti bisa melakukan apa yang terdapat dalam kriteria yang
telah ditetapkan dan sebaliknya. Dengan adanya acuan norma atau kriteria, hasil yang sama yang
didapat dari pengukuran ataupun penilaian akan dapat diinterpretasikan berbeda sesuai dengan
acuan yang digunakan.
C. Evaluasi
Evaluasi adalah suatu proses yang sistematis, bersifat komprehensif yang meliputi pengukuran,
penilaian, analisis dan intrepretasi informasi/data untuk menentukan sejauh mana peserta didik
telah mencapai tujuan pembelajaran yang dilakukan. dengan tujuan untuk mengetahui tingkat
keberhasilan sesuatu program pendidikan, pengajaran, atau pun pelatihan yang dilaksanakan.
D. Jenis-Jenis Evaluasi Pembelajaran
1. Jenis evaluasi berdasarkan tujuan yakni, evaluasi diagnostik, evaluasi formatif dan evaluasi
sumatif.
2. Jenis evaluasi berdasarkan sasaran yakni, evaluasi konteks, evaluasi input, evaluasi proses,
evaluasi hasil atau produk, evaluasi outcome atau lukisan.
59
3. Jenis evaluasi berdasarkan lingkup kegiatan yaitu, evaluasi program pembelajaran, evaluasi
proses pembelajaran dan evaluasi hasil pembelajaran.
4. Jenis evaluasi berdasarkan objek dan subjek dibagi atas 2 yaitu :
a. Berdasarkan objek, terdiri dari evaluasi input, transformasi dan output.
b. Jenis evaluasi berdasarkan sasaran yakni evaluasi konteks, Evaluasi input, evaluasi proses,
evaluasi hasil produk, evaluasi outcome atau lulusan.,
c. Jenis evaluasi berdasarkan hasil pembelajaran yakni, evaluasi program pembelajaran, evaluasi
progres pembelajaran dan evaluasi hasil pembelajaran.
d. Evaluasi berdasarkan Objek dan Subjek
1. Evaluasi objek terdiri dari evaluasi input, evaluasi transformasi dan evaluasi output.
2. Evaluasi subjek terdiri dari evaluasi internal dan eksternal.
F. Prinsip-Prinsip Umum dalam Evaluasi Pembelajaran
Komprehensif, kegiatan evaluasi pembelajaran hendaknya dilaksanakan secara menyeluruh, yakni
dengan mencakup seluruh aspek pribadi peserta didik, baik kognitif, afekif, maupun psikomotirik.
Mengacu kepada tujuan, pelaksaaan evaluasi pembelajaran juga harus mengacu pada tujuan
pembelajaran yang ditetapkan. Artinya apabila evaluasi dilaksanakan memang benar-benar sesuai
dengan kenyataan yang ada. Kooperatif, dalam melaksanakan evaluasi pembelajaran, juga harus
bekerja sama dengan semua pihak yang terlibat dalam kegitan evaluasi.
BAB 10 MENSKOR DAN MENILAI
A. Menskor

Bagian terpenting dalam pengukuran dengan tes adalah penyusunan teks. Apabila semua tes
disusun sebaik-baiknya maka sebagian besar dari tujuan penyusunan tes tercapai, selain itu
menskor dan menilai merupakan pekerjaan yang menuntut ketekunan dari penilai, ditambah
dengan kebijaksanaan.
Sementara orang berpendapat bahwa bagian yang paling penting dari pekerjaan pengukuran dengan
tes adalah penyusunan tes.
1. Kunci jawaban dan kunci pemberian skor untuk tes bentuk Betul-Salah

Alat bantu untuk menentukan jawaban yang benar, disebut kunci jawaban. Alat bantu untuk
menyeleksi jawaban jawaban yang benar dan yang salah, disebut kunci skoring. Alat bantu untuk
menentukan jawaban yang benar, disebut kunci jawaban. Kunci jawaban dan kunci pemberian skor
untuk tes bentuk Betul-Salah. Untuk tes bentuk betul-salah yang dimaksud dengan kunci jawaban
60
adalah sederetan jawaban yang kita persiapkan untuk pertanyaan-pertanyaan atau soal-soal yang
kita susun, sedangkan kunci skoring adalah alat yang kita gunakan untuk mempercepat pekerjaan
skoring.
2. Kunci jawaban dan kunci pemberian skor untuk tes bentuk pilihan ganda (multiple choice)

Dengan tes pilihan ganda, testee diminta melingkari salah satu huruf di depan pilihan jawaban yang
disediakan atau dengan memberi tanda silang pada tempat yang sesuai di lembar jawaban. Hanya
untuk soal yang jumlahnya lebih dari 30 buah sebaiknya menggunakan lembar jawaban dan nomor-
nomor urutannya dibuat sedemikian rupa sehingga tidak memakan tempat. Menurut Arikunto ,
dalam menentukan angka untuk tes bentuk pilihan ganda, juga dikenal 2 macam cara, yakni tanpa
hukuman dan dengan hukuman.
3. Kunci jawaban dan kunci pemberian skor untuk tes

Bentuk jawaban singkat (short answer test). Tes jawaban singkat adalah bentuk tes yang
menghendaki jawaban berbentuk kata atau kalimat.
4. Kunci jawaban dan kunci pemberian skor untuk tes bentuk menjodohkan (matching).

Pada dasarnya tes bentuk menjodohkan adalah tes bentuk pilihan ganda, dimana jawaban-jawaban
dijadikan satu, demikian pula pertanyaan-pertanyaannya. Dengan demikian, maka pilihan
jawabannya akan lebih banyak. Karena soal bentuk menjodohkan adalah tes bentuk pilihan ganda
yang lebih kompleks.
5. Kunci jawaban dan kunci pemberian skor untuk tes

Bentuk uraian (essay test). Sebelum menyusun sebuah tes uraian sebaiknya kita tentukan terlebih
dahulu pokok-pokok jawaban yang kita kehendaki. Dengan demikian, maka akan mempermudah
kita dalam mengoreksi tes tersebut.
Tidak ada jawaban yang pasti terhadap tes bentuk uraian ini. Membaca jawaban soal pertama dari
seluruh jawaban siswa. Dengan membaca seluruh jawaban, kita dapat memperoleh gambaran
lengkap tidaknya jawaban siswa secara keseluruhan.
6. Kunci jawaban dan kunci pemberian skor untuk tugas

Kunci jawaban untuk memeriksa tugas merupakan pokok-pokok yang harus termuat di dalam
pekerjaan siswa. Hal ini menyangkut kriteria tentang isi tugas. Ketepatan waktu penyerahan tugas.
B. Menilai

Sebagai hasil penilaian sifat suatu objek berupa kualitas yang bersifat kuantitatif yang diberi simbol
61
agar lebih dipahami. Simbol yang dipakai dalam penilaian untuk menyatakan nilai tersebut dapat
berupa angka dan huruf.
C. Perbedaan antara Skor dan Nilai

Sebelum melakukan pengolahan dan konversi data hasil penilaian terlebih dahulu harus dibedakan
pengertian skor dan nilai. Pada umumnya antara skor dan nilai dianggap mempunyai pengertian
yang sama, padahal keduanya mempunyai arti yang berbeda.
D. Pengolahan/Analisis Skor
1. Catatan harian keterampilan siswa
Bahan dasar yang seharusnya dimiliki oleh setiap guru untuk membuat penilaian kompetensi
keterampilan di buku rapor adalah catatan harian keterampilan per peserta didik untuk setiap
indikator kompetensi dasar keterampilan. Format ini harus dilengkapi dengan rubrik penilaian,
yang menjadi acuan kerja penilai. Dengan tersedianya rubrik penilaian, memungkinkan peserta
didik mampu mengisi format sehingga menutup keterbatasan waktu guru mengobservasi per siswa.
Dalam silabus tiap mata pelajaran yang sudah disusun oleh pemerintah, pada setiap KD sudah
dituliskan bentuk penilaiannya. Tentunya untuk kompetensi keterampilan akan mengarah ke satu
dari tiga teknik penilaian.
2. Rekap skor per KD keterampilan
Nilai capaian kompetensi keterampilan yang diperoleh dari setiap indikator perlu direkap menjadi
nilai kompetensi keterampilan peserta didiktiap-tiap KD.Nilai ini perlu diupayakan dalam skala 1-4
dan dapat dibandingkan dengan nilai KKM untuk tiap-tiap KD. Apabila peserta didik tidak
mendapatkan nilai sempurna pada KD, harus dilengkapi dengan deskripsi bagain mana yang belum
sempurna.Sehingga dalam rekap skor/nilai per siswa per KD keterampilan berisi angka dengan
skala 1-4 dan deskripsi kompetensi yang mencerminkan dari nilai tiap-tiap peserta didik.
Implikasi dari kriteria ketuntasan belajar keterampilan tersebut adalah sebagai berikut. Jika jumlah
peserta didik yang mengikuti remedial lebih dari 20% tetapi kurang dari 50%, maka tindakan yang
dilakukan adalah pemberian pembelajaran ulang secara klasikal dengan model dan strategi
pembelajaran yang lebih inovatif berbasis pada berbagai kesulitan belajar yang dialami peserta
didik yang berdampak pada peningkatan kemampuan untuk mencapai kompetensi dasar tertentu;
Bagi peserta didik yang memperoleh nilai 75 atau lebih dari 75 diberikan materi pengayaan.
3. Bagan Nilai Rapor
Untuk merekap nilai KD menjadi nilai rapor, setiap nilai KD dapat dibobot dengan lamanya waktu
yang diperlukan untuk menuntaskan 1 KD tersebut. Selanjutnya nilai tersebut dapat dirata-rata
62
dengan memperhitungkan bobot menjadi nilai rata-rata KD untuk 1 semester. Jadi nilai kompetensi
keterampilan per semester per siswa meliputi angka dengan skala 1-4 dan deskripsi kompetensi
yang telah dicapainya.
E. Beberapa skala penilaian
1. Skala bebas.
2. Skala 1-10.
3. Skala 1-100.
4. Skala huruf.
F. Macam-Macam Acuan Penilaian
Macam-macam acuan penilaian yang dipakai dalam suatu penilaian sifat suatu objek dibedakan
menjadi :
a) Penilaian Acuan Patokan atau PAP (Criterion-Referenced Evaluation)
b) Penilaian Acuan Norma atau PAN (Norm-Referenced Evaluation)

BAB 11 TEKNIS PENGELOLAAN NILAI


A. Konversi Kompetensi Pengetahuan, Keterampilan, dan Sikap

Penilaian yang dilakukan untuk mengisi laporan pencapaian kompetensi ada 3 (tiga) macam, yaitu:
1. Penilaian Kompetensi Pengetahuan
2. Penilaian Keterampilan
3. Penilaian Sikap
B. KKM (Kriteria Ketuntasan Minimal)
1. KKM ditentukan oleh Satuan Pendidikan dengan Mempertimbangkan : karakteristik
kompetensi dasar, daya dukung, dan karakteristik peserta didik.
2. KKM tidak dicantumkan dalam buku pencapaian kompetensi, melainkan pada buku
penilaian guru.
3. Peserta didik yang sudah mencapai atau melampaui KKM, diberi program Pengayaan.
4. Keterangan ketuntasan :
a. Kompetensi pengetahuan dan keterampilan dinyatakan tuntas apabila mencapai nilai
2.66
b. Kompetensi sikap spiritual dan sosial dinyatakan tuntas apabila mencapai nilai Baik
5. Implikasi dari ketuntasan belajar tersebut adalah sebagai berikut.

63
a. Untuk KD pada KI-3 dan KI-4: diberikan remedial individual sesuai dengan
kebutuhan kepada peserta didik yang memperoleh nilai kurang dari 2.66;
b. Untuk KD pada KI-3 dan KI-4: diberikan kesempatan
c. Untuk melanjutkan pelajarannya ke KD berikutnya kepada peserta didik yang
memperoleh nilai 2.66 atau lebih dari 2.66; dan
d. Untuk KD pada KI-3 dan KI-4: diadakan remedial klasikal sesuai dengan kebutuhan
apabila lebih dari 75% Peserta didik memperoleh nilai kurang dari 2.66.
e. Untuk KD pada KI-1 dan KI-2, pembinaan terhadap peserta didik yang secara
umum profil sikapnya belum berkategori baik dilakukan secara holistik (paling tidak
oleh guru matapelajaran, guru BK, dan orang tua).
6. Peserta didik dinyatakan tidak naik kelas apabila terdapat minimal salah satu kompetensi
dari tiga mata pelajaran tidak tuntas.

64
BAB III
PEMBAHASAN
3.1 PERBANDINGAN ISI BUKU
1. Perbandingan Bab 1 Buku Utama dengan Bab 1 Buku Pembanding

Materi yang dimuat dalam bab 1 kedua buku memiliki sisi yang seiras. Tetapi pada buku utama ada
membahas tentang pentingnya menilai baik maknanya bagi siswa, makna bagi guru dan makna
bagi sekolah. Pada buku utama juga dijelaskan tentang cara mengajukan pertanyaan-pertanyaan
untuk mencari penilaian baik pada sebelum kegiatan pengajaran, selama kegiatan pengajaran dan
sesudah kegiatan pengajaran dan pada buku pembanding materi ini tidak dimuat.
Sedangkan pada buku pembanding memuat tentang jenis-jenis evaluasi pembelajaran, fungsi
evaluasi pembelajaran dan prinsip prinsip umum evaluasi pembelajaran yang tidak dimuat pada
buku utama.
2. Perbandingan bab 15 buku utama dengan bab 10 buku pembanding.

Pada buku utama membahas tentang Norm-Referenced dan Criterion-Referenced sedangkan pada
buku pembanding materi ini tidak dimuat. Pada buku pembanding memuat pengolahan atau
analisis skor yang dilihat dari catatan harian keterampilan siswa, rekap skor per KD keterampilan
dan bahan nilai rapor serta beberapa skala penilaian dan macam-macam acuan penilaian yang tidak
dimuat pada buku utama.
3. Perbandingan bab 16 buku utama dengan bab 11 buku pembanding.

Pada buku utama membahas tentang beberapa skala penilaian, distribusi nilai dan standar nilai
yang tidak dibahas pada buku pembanding karena komponen yang di buku pembanding adalah
penilaian dari kompetensi pengetahuan keterampilan dan sikap siswa serta memuat tentang KKM
atau kriteria ketuntasan minimal.
3.2. KELEBIHAN DAN KEKURANGAN BUKU
KELEBIHAN BUKU :
BUKU UTAMA
1. Dilihat dari aspek tampilan buku seperti pemilihan warna cover buku sudah cukup lumayan
bagus
2. Dilihat dari aspek tata letak (layout) , serta tata tulis, dan penggunaan font, juga sudah
memenuhi criteria buku, sehingga buku mudah dibaca dan dipahami.

65
3. Dilihat dari aspek isi buku, menurut saya isi buku sudah memaparkan dan menjabarkan
dengan cukup jelas sesuai dengan judul bab serta penulisan. Terdapat contoh-contoh
penghitungan dan table penilaian sehingga lebih mudah di mengerti
4. Dilihat dari aspek tata bahasa, buku tersebut menggunakan bahasa baku yang jelas
5. Memamparkan table - table pembahasan

BUKU PEMBANDING
1. Penyampaian pengertian- pengertian terkait evaluasi pembelajaram dan jenisnya
cukup jelas.
2. Secara keseluruhan setiap bab membahas tentang Evaluasi Hasil Belajar seperti
penilaian dan lain sebagainya.
3. Cover dan bentuk buku ini cukup menarik, sehingga para pembaca akan suka untuk
membacanya.
4. Ada pembahasan Evaluasi Pendidikan dan pemilihan penilaian pembelajaran yang
baik..
5. Buku ini Manjelaskan tentang bagaimana penggunaan penilaian dan pengukuran.

KEKURANGAN BUKU :
BUKU UTAMA
a) Pada buku pembanding di setiap pembahasan tidak ada rangkuman sehingga jika membaca
memiliki waktu yang singkat dalam memahami materi dapat langsung melihat rangkuman
untuk mengetahui isi bab pembahasan secara keseluruhan.
BUKU PEMBANDING
b) Pada buku pembanding di setiap pembahasan tidak ada rangkuman sehingga jika membaca
memiliki waktu yang singkat dalam memahami materi dapat langsung melihat rangkuman
untuk mengetahui isi bab pembahasan secara keseluruhan.
c) Pada buku pembanding setiap bab juga tidak dilengkapi dengan bahan diskusi yang bisa
membantu peningkatan pemahaman dari pembaca.

66
BAB IV PENUTUP
4.1. KESIMPULAN

Terlepas dari kekurangan buku-buku diatas, buku ini sudah sangat bagus dengan
pengkajian yang sangat luas dan mendalam serta menggunakan banyak teori-teori ahli serta
fakta-fakta empiri juga terdapat contoh-contoh yang mudah dipahami. Untuk itu buku diatas
sangat layak dijadikan sebagai pedoman dan sebagai referensi bagi mahasisiwa terlebih
yang ingin memperdalam ilmu mengenai Evaluasi Hasil Belajar. Tidak terkecuali sebagai
sumber belajar dikelas.

4.2. SARAN

Adapun saran yang dapat disampaikan, yaitu diharapkan kedepannya akan


diterbitkan buku yang mengkaji materi yang sama dengan memperhatikan fakta-fakta dan
gejala-gejala lingkungan terbaru serta memenuhi kekurangan-kekurangan yang dipaparkan
diatas sehingga akan hadir buku yang lebih lengkap dan sesuai dengan perkembangan ilmu
pengetahuan.
DAFTAR PUSTAKA
Arikunto, S. (2018). Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
Widiyanto, J. (2018). Evaluasi PEmbelajaran. Madiun: UNIPMA PRESS.

Anda mungkin juga menyukai