Resume Buku Evaluasi PAI Prof Dr. Suhars

Resume Buku Evaluasi PAI Prof. Dr.
Suharsimi Arikunto
25 Tuesday Jun 2013
Posted by Syarifah, M. Pd. I in Evaluasi PAI
≈ 2 Comments
Bab 1 PENDAHULUAN
1. Pengertian Pengukuran, Penilaian dan Evaluasi
Menurut Prof. Dr. Suharsimi Arikunto dalam bukunya dasar-dasar evaluasi pendidikan, yang
menyatakan : kita tidak dapat mengadakan penilain sebelum kita mengadakan pengukuran.
Mengukur adalah membandingkan sesuatu dengan satu ukuran. Pengukuran bersifat

kuantitatif.
Menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik dan buruk.
Penilaian bersifat kuantitatif.
Mengadakan Evaluasi meliputi kedua langkah diatas, yakni mengukur dan menilai
Jadi, dalam istilah asing pengukuran adalah Measurement, sedang penilaian adalah Evaluation.
Dari kata evaluation inilah diperoleh kata evaluasi yang berarti menilai (tetapi dilakukan dengan
mengukur terlebih dahulu). Jadi evaluasi adalah kegiatan untuk mengumpulkan informasi
tentang bekerjanya sesuatu, yang selanjutnya informasi tersebut digunakan untuk menentukan
alternatif yang tepat dalam mengambil keputusan, yang dimaksudkan untuk membantu para guru
dalam pengambil keputusan dalam usaha menjawab pertanyaan atau permasalahan yang ada.
Fungsi utama evaluasi dalam hal ini adalah menyediakan informasi-informasi yang berguna bagi
pihak decision maker untuk menentukan kebijakan yang akan diambil berdasarkan evaluasi yang
telah dilakukan.
2. Penilaian Pendidikan
Dalam pendidikan, ada awalnya pengertian evaluasi pendidikan selalu dikaitkan dengan prestasi
belajar siswa. Definisi yang pertama dikembangkan oleh Ralph Tyler (1950). Ahli ini
mengatakan bahwa evaluasi merupakan sebuah proses pengumpulan data untuk menentukan
sejauh mana, dalam hal apa, dan bagian mana tujuan tercapai. Jika belum, bagaimana yang
belum dan apa sebabnya. Definisi ini diperluaskan oleh dua ahli lain, yakni Cronbach dan
Stufflebeam. Tambahan definisi tersebut adalah bahwa proses evaluasi bukan sekedar mengukur
sejauh mana tujuan tercapai, digunakan untuk membuat keputusan.
3. Mengapa Menilai?
Menurut suharsimi arikunto ada beberapa makna dari proses penilaian antara lain sebagai
berikut:
a. Makna Bagi siswa
Dengan diadakannya penilaian maka siswa dapt mengetahui sejauh man telah berhasil mengikuti
pelajaran yang diberikan oleh guru. Hasil yang diperoleh oleh siswa ada 2 kemungkinan :
1). Memuaskan. Jika siswa memperoleh hasil yang memuaskan siswa akan memiliki motvasi
yang cukup besar agar dapat belajar lebih giat.
2). Tidak Memuaskan. Jika siswa tidak puas dengan hasil yang diperolehnya, maka ia akan
beruaha agar lain kali tidak seperti itu lagi.
b. Makna bagi guru

1). Dengan hasil penilaian guru dapat mengetahui siswa mana saja yang berhak melanjutkan
pelajaran.
2). Guru dapat mengetahui apakah pelajaran yang ia sampaikan tepat sasaran kepada siswa.
3). Guru akan mengetahui apakah metode yang ia gunakan sudah dapat maksimal atau belum.
c. Makna Bagi Sekolah
1). Apabila guru-guru mangadakan penilaian akan diketahui hasil siswa, maka dapat diketahui
pula apakah kondisi belajar disekolah sudah sesuai harapan atau belum.
2). Akan ada informasi tentang tepat tidaknya kurikulum sekolah.
3). Akan ada informasi hasil penilaian dari tahun ke tahun yang bias digunakan sebagai pedoman
dari tahun ke tahun.
4. Tujuan atau Fungsi Penilaian
Dengan diketahuinya makna dari penilaian, maka dapat dikatakan bahwa fungsi penilaian adalah
sebagai berikut:
a. Penilaian berfungsi selektif.
Dengan cara penilaian guru mempunyai cara untuk mengadakan seleksiatau penilaian terhadap
siswanya.
b. Penilaian berfungsi diagnostik.
Apabila alat yang digunakan dalam penilaian cukup memenuhi syarat, maka dengan melihat
hasilnya guru dapat mengetahui kelemahan siswa. Disamping itu akan diketahui pula sebab-
sebab kelemahan itu. Jadi dengan mengadakan penilaian guru sebanarnya melakukan diagnosis
kepada siswanya.
c. Penilaian berfungsi sebagai penempatan
Setiap siswa sejak lahir telah membawa bakat sendiri-sendiri sehingga belajar akan lebih efektif
jika di sesuaikan dengan pembawaan yang ada. Untuk dapat menentukan dengan pasti kelompok
mana yang sesuai dengan kemampuan siswa, maka digunakan suatu penilaian.
d. Penilaian berfungsi sebagai pengukur keberhasilan.
Fungsi ini dimaksudkan untuk mengetahui suatu mana suatu program berhasil diterapkan kepada
siswa.Jadi dapat disimpulkan bahwa penilaian berfungsi sebagai alat ukur keberhasilan dalam
proses belajar.
5. Ciri-Ciri Penilaian dalam Pendidikan
Untuk dapat menentukan kepandaian seseorang, bukan kepandaian yang diukur. Namun kita
dapat melihat dari gejala-gejala yang tampak atau memancar dari kepandaianya. Salah satu
contohnya adalah bahwa anak yang pandai biasanya dapat menyelesaikan soal-soal yang
diberikan oleh gurunya.
Ciri-ciri penilaian antara lain sebagai berikut:

a. Ciri pertama yaitu bahwa penilaian dilakukan secara tidak langsung. Dalam contoh ini
kita menilai kepandaian melalui ukuran menyelesaikan soal.
b. Ciri kedua yaitu pengunaan ukuran kuantitatif. Penilaian bersifat kuantitatif artinya
mengunakan simbol bilangan sebagai hasil pertama pengukuran. Setelah itu lalu
diinterpretasikan ke bentuk kualitatif. Contoh : dari hasil pengukuran tia mempunyai IQ 126
sedangkan budi 89. Maka tia dapat dikatagorikan sebagai anak pandai sedangkan budi anak
dibawah rata-rata.
c. Ciri ketiga yaitu bahwa penilaian pendidikan mengunakan, unit-unit atau satuan-satuan
yang tetap misalnya, IQ 126 menurut unit pengukurannya termasuk anak yang pandai sedangkan
89 termasuk anak dibawah rata-rata.
d. Ciri keempat yaitu bersifat relatif artinya tidak selalu tetap dari waktu ke waktu yang di
sebabkan banyak faktor. contoh nilai ulangan MTK pertama tia adalah 90 namun ulangan
keduanya hanya 40.
e. Ciri kelima bahwa dalam penilaian pendidikan sering terjadi kesalahan-kesalahan.

Adapun kesalaan-kesalahan itu ditinjau dari berbagai faktor yaitu:
1). Terletak pada alat ukurnya.Alat yang digunakan untuk mengukur haruslah baik namun sering
kali terjadi kesalahan di alat ukurnya.
2). Terletak pada orang yang melakukan pengukurannya.Hal ini dapat berupa:
a). kesalahan pada waktu penilaian karena factor subjektif penilai yang telah terpengarus oleh
hasil pengukuran, misalnya tulisan jelek atau tidak jelas itu sering mempengaruhi subjektif
penilaian.
b). kecenderungan dari penilai untuk memberikan nilai secara murah atau mahal. Ada guru yang
mudah memberikan nilai ada yang sulit untuk memberikan nilai.
c). Adanya Hello-effect, yakni adanya kesan penilai terhadap siswa.
d). adanya pengaruh dari hasil sebelumnya.
e). kesalahan yang disebabkan oleh kekeliruan menjumlah angka-angka hasil penilaian.
3). Terletak pada anak yang dinilai.
a). siswa adalah manusia yang berperasaan dan bersuasana hati. Suasana hati sangat berpengaruh
terhadap hasil penilaian.
b). keadaan fisik ketika siswa sedang dinilai.
c). nasib siswa kadang-kadang mempunyai peranan terhadap hasil penilaian.
4). Terletak pada situasi dimana penilaian berlangsung
a). suasana pada saat terjadinya penilaian. Keadaan yang gaduh akan mempengaruhi penilaian
yang sebenarnya karena siswa tidak dapat konsenterasi.
b). Pengawasan dalam penilaian. Bentuk pengawasan yang tidak sesuai akan berpengaruh pada
keobjektifan hasil dari pengukuran yang ada.
Bab 2 Subjek dan sasaran Evaluasi

1. Subjek Evaluasi
Dalam keterangan ini yang di maksud dengan subjek evaluasi adalah orang yang melakukan
pekerjaan evaluasi. Siapa yang dapat di sebut sebagai subjek evaluasi untuk setiap tes, di
tentukan oleh suatu aturan pembagian tugas atau ketentuan yang berlaku.
Ada pandangan lain yang mengatakan subjek evaluasi adalah siswa, yakni orang yang di
evaluasi, dalam hal ini yang di pandang sebagai objek evaluasi adalah mata pelajarannya.
Pandangan lain mengatakan siswa sebagai objek evaluasi dan guru sebagai subjek evaluasi.
2. Sasaran Evaluasi
Adapun sasaran evaluasi di sini mencakup beberapa sasaran penilaian untuk unsure-unsurnya,
meliputi : Input, Transformasi dan Out put.
a. In Put
Berkenaan dengan hal ini ada beberapa aspek yang harus di perhatikan untuk mencapai hasil
yang di inginkan, yaitu :
· Kemampuan
Jika sebuah institusi menginginkan out put yang berguna bagi nusa dan bangsa maka haruslah
memperhatikan atau memilah-milah kemampuan dari beberapa calon murid. Adapun tes yang di
gunakan adalah tes kemampuan.
· Kepribadian
Kepribadian adalah sesuatau yang terdapat pada diri manusia serta tampak bentuknya dalam
tingkah laku, sehingga seorang pendidik akan mengetahui satu-persatu calon peserta didiknya.
Adapun alat yang di pakai adalah tes kepribadian.
· Sikap
Sikap adalah bagian dari tingkah laku manusia yang menggambarkan kepribadian seseorang,
akan tetapi karena sikap ini sangat menonjol dalam pergaulan maka banyak orang yang ingin
tahu lebih dalam informasi khusus terkait dengannya. Adapun alat yang di pakai adalah tes sikap.
· Intelegensi
Dalam hal ini para ahli seperti binet dan simon menciptakan tes buatan yang di kenal dengan tes
binet-simon yang dapat mengetahui IQ seseorang, karena IQ bukanlah intelegensi.
b. Transformasi
Di sini ada beberapa unsur yang dapat menjadi sasaran atau objek pendidikan demi di perolehnya
hasil pendidikan yang di harapkan, yaitu :
· Kurikulum/materi
· Metode dan cara penilaian
· Media
· Sistem administrasi
· Pendidik dan anggotahnya.
c. Out Put
Penilaian atas lulusan suatu sekolah di lakukan untuk mengetahui seberapa jauh tingkah
pencapaian atau prestasi belajar mereka selama mengikuti program tersebut dengan
menggunakan tes pencapaian.
Bab 3 PRINSIP DAN ALAT EVALUASI
1. Prinsip Evaluasi
Ada satu prinsip umum dan penting dalam kegiatan evaluasi, yaitu adanya triangulasi atau
hubungan erat tiga komponen, yaitu:
a. Hubungan antara tujuan dengan KBM
Kegiatan belajar-mengajar yang dirancang dalam bentuk rencana mengajar disusun oleh guru
dengan mengacu pada tujuan yang hendak dicapai. Dengan demikian, anak panah yang
menunjukkan hubungan antara keduanya mengarah pada tujuan dengan makna bahwa KBM
mengacu pada tujuan, tetapi juga mengarah dari tujuan ke KBM, menunjukkan langkah dari
tujuan dilanjutkan pemikirannya ke KBM.
b. Hubungan antara tujuan dengan evaluasi

Evaluasi adalah kegiatan pengumpulan data untuk mengukur sejauh mana tujuan sudah tercapai.
Dengan makna demikian maka anak panah berasal dari evaluasi menuju ke tujuan. Di lain sisi,
jika dilihat dari langkah, dalam menyusun alat evaluasi ia mengacu pada tujuan yang sudah
dirumuskan.
c. Hubungan antara KBM dengan evaluasi
Seperti yang sudah disebutkan dalam poin (a), KBM dirancang dan disusun dengan mengacu
pada tujuan yang telah dirumuskan. Telah disebutkan pula dalam poin (b) bahwa alat evaluasi
juga disusun dengan mengacu pada tujuan. Selain mengacu pada tujuan, evaluasi juga harus
mengacu atau disesuaikan dengan KBM yang dilaksanakan. Sebagai misal, jika kegiatan belajar-
mengajar dilakukan oleh guru dengan menitikberatkan pada keterampilan, evaluasinya juga
harus mengukur tingkat keterampilan siswa, bukannya aspek pengetahuan.
2. Alat Evaluasi
Secara garis besar, maka alat-alat evaluasi yang digunakan dapat digolongkan menjadi dua
macam, yaitu tes dan non tes. Dibawah ini akan dijelaskan secara rinci macam-macam tes dan
non tes.
a. Teknik Non Tes
Ada beberapa teknik non-tes yaitu:
1) Skala Bertingkat
Skala menggambarkan suatu nilai yang berbentuk angka terhadap suatu hasil pertimbangan.
Sebagai contoh adalah skor yang diberikan oleh guru di sekolah untuk menggambarkan tingkat
prestasi belajar siswa.
2) Kuesioner
Kuesioner (questionaire) juga sering dikenal sebagai angket. Pada dasarnya, kuesioner adalah
sebuah daftar pertanyaan yang harus diisi oleh orang yang akan diukur. Tentang macam
kuesioner, dapat ditinjau dari beberapa segi :
a) Ditinjau dari siapa yang menjawab, maka ada :
Ø Kuesioner langsung. Kuesioner dikatakan langsung jika kuesioner tersebut dikirimkan dan
diisi langsung oleh orang yang akan dimintai jawaban tentang dirinya.
Ø Kuesioner tidak langsung. Kuesioner tidak langsung adalah kuesioner yang dikirimkan dan
diisi oleh orang yang bukan diminta keterangannya.
b) Ditinjau dari segi cara menjawab maka dibedakan atas:
Ø Kuesioner tertutup. Kuesioner tertutup adalah kuesioner yang disusun dengan menyediakan
pilihan jawaban langkah sehingga pengisi hanya tinggal memberi tanda pada jawaban yang
dipilih.
Ø Kuesioner terbuka. Kuesioner terbuka adalah kuesioner yang disusun sedemikian rupa
sehingga para pengisi bebas mengemukakan pendapatnya.
3) Daftar cocok (check list). Yang dimaksud dengan daftar cocok adalah deretan pertanyaan,
dimana responden yang dievaluasi tinggal membubuhkan tanda cocok ( √ ) di tempat yang sudah
disediakan.
4) Wawancara. Wawancara atau interview adalah suatu cara yang digunakan untuk
mendapatkan jawaban dari responden dengan jalan tanya jawab sepihak. Wawancara dapat
dilakuakan dengan 2 cara, yaitu:
Ø Intervieu bebas, di mana responden mempunyai kebebasan umtuk mengutarakan
pendapatnya, tanpa dibatasi oleh patokan-patokan yang telah dibuat oleh subjek evaluasi.
Ø Intervieu terpimpin, yaitu intervieu yang dilakukan oleh subjek evaluasi dengan cara
mengajukan pertanyaan-pertanyaan yang sudah disusun terlebih dahulu.
5) Pengamatan. Pengamatan atau observasi adalah suatu teknik yang dilakukan dengan cara
mengadakan pengamatan secara teliti serta pencatatan secara sistematis. Ada 3 macam observasi:
Ø Observasi partisipan, yaitu observasi yang dilakukan oleh pengamat, tetapi dalam pada itu
pengamat memasuki dan mengikuti kegiatan kelompok yang sedang diamati.
Ø Observasi sistematik, yaitu observasi di mana faktor yang diamati sudah didaftar secara
sistematis, dan sudah diatur menurut kategorinya.
Ø Observasi eksperimental
Ø Observasi eksperimental terjadi jika pengamat tidak berpartisipasi dalam kelompok
6) Riwayat hidup. Riwayat hidup adalah gambaran tentang keadaan seseorang selama dalam
masa kehidupannya
b. Teknik Tes
Dibawah ini ada beberapa pendapat dari para ahli mengenai pengertian tes.
Dalam bukunya “Evaluasi Pendidikan”, Drs. Amin Daien Indrakusuma mengatakan bahwa tes
adalah suatu alat atau prosedur yang sistematis dan objektif untuk memperoleh data-data atau
keterangan-keterangan yang diinginkan tentang seseorang, dengan cara yang boleh dikatakan
tepat dan cepat.
Dalam bukunya “ Teknik-teknik Evaluasi”, Mucthar Bukhori mengatakan tes ialah suatu
percobaan yang diadakan untuk mengetahui ada atau tidaknya hasil-hasil pelajaran tertentu pada
seorang murid atau kelompok murid.
Dalam buku “Encyclopedia of Educational Evaluation”, diterangkan “Test is comprehensive

assessment of an individual or to an entire program evaluation effort” (tes adalah penilaian yang
kompherensif terhadap seorang individu atau keseluruhan usaha evaluasi program.
Dari beberapa kutipan dan uraian di atas dapat disimpulkan bahwa tes merupakan suatu alat
pengumpul informasi tetapi jika dibandingkan dengan alat-alat yang lain, tes ini bersifat lebih
resmi karena penuh dengan batasan-batasan
Ditinjau dari segi kegunaan untuk mengukur siswa, maka dibedakan atas adanya tiga macam tes,
yaitu:
Tes diagnostic. Tes Diagnostik adalah tes yang digunakan untuk mengetahui kelemahan-
kelemahan siswa sehingga berdasarkan kelemahan-kelemahan tersebut dapat dilakukan
pemberian perlakuan yang tepat.
Tes Formatif. Dari kata “form” yang merupakan dasar dari istilah “formatif” maka evaluasi
formatif dimaksudkan untuk mengetahui sejauh mana siswa telah terbentuk setelah mengikuti
sesuatu program tertentu. Dalam kedudukannya seperti ini tes formatif dapat juga dipandang
sebagai tes diagnostik pada akhir pelajaran. Evaluasi formatif mempunyai manfaat baik bagi
siswa, guru, maupun bagi program itu sendiri. Manfaat bagi siswa:
Ø Untuk mengetahui apakah siswa sudah menguasai bahan program secara menyeluruh.
Ø Merupakan penguatan (reinforcement) bagi siswa.

Ø Usaha perbaikan.
Ø Sebagai diagnose.
Ø Manfaat bagi guru
Ø Mengetahui sejauh mana bahan yang diajarkan sudah dapat diterima oleh siswa
Ø Mengetahui bagian mana dari bahan pelajaran yang belum menjadi milik siswa.
Ø Dapat meramalkan sukses dan tidaknya seluruh program yang akan diberikan.
Manfaat bagi program. Setelah diadakan test formatif maka diperoleh hasil. Dari hasil tersebut
dapat diketahui :
ü Apakah program yang telah diberikan merupakan program yang tepat dalam arti sesuai dengan
kecakapan anak.
ü Apakah program tersebut membutuhkan pengetahuan-pengetahuan prasyarat yang belum

diperhitungkan.
ü Apakah diperlukan alat, sarana dan prasarana untuk mempertinggi hasil yang akan dicapai.
ü Apakah metode, pendekatan dan alat evaluasi yang digunakan sudah tepat.
Tes Sumatif
Evaluasi sumatif atau tes sumatif merupakan tes yang dilaksanakan setelah berakhirnya
sekelompok program atau sebuah program yang lebih besar.
Manfaat tes sumatif, ialah:
v Untuk menentukan nilai.
v Untuk menentukan seorang anak dapat atau tidaknya mengikuti kelompok dalam menerima
program berikutnya.
v Untuk mengisi catatan kemajuan belajar siswa yang akan berguna bagi orang tua siswa, pihak
bimbingan dan penyuluhan disekolah, serta pihak-pihak lain apabila siswa tersebut akan pindah
ke sekolah lain, akan melanjutkan belajar atau akan memasuki lapangan kerja
3. Perbandingan antara Tes Diagnostik, Formatif, dan Sumatif
Dalam membandingkan, akan ditinjau dari 9 aspek, yaitu :
a. Ditinjau dari fungsinya
1) Tes diagnostik
· Menentukan apakah bahan prasyarat telah dikuasai atau belum.
· Menentukan tingkat penguasaan siswa terhadap bahan yang dipelajari.

· Memisah-misahkan (mengelompokkan) siswa berdasarkan kemampuan dalam menerima
pelajaran yang akan dipelajari.
· Menetukan kesulitan-kesulitan belajar yang dialami untuk menentukan cara yang khusus
untuk mengatasi atau memberikan bimbingan.
2) Tes formatif
Sebagai umpan balik bagi siswa, guru, maupun program untuk menilai pelaksanaan satu unit
program.
3) Tes sumatif
Untuk memberikan tanda kepada siswa bahwa telah mengikuti suatu program, serta menentukan
posisi kemampuan siswa dibandingkan dengan kawannya dalam kelompok.
b. Ditinjau dari waktu
1) Tes diagnostik
o Pada waktu penyaringan calon siswa
o Pada waktu membagi kelas atau permulaan memberikan pelajaran.
o Selama pelajaran berlangsung bila guru akan memberikan bantuan siswa.
2) Tes formatif
Selama pelajaran berlangsung untuk mengetahui kekurangan agar pelajaran dapat
berlangsung sebaik-baiknya.
3) Tes sumatif. Pada akhir unit caturwulan, semester akhir tahun, atau akhir pendidikan.
c. Ditinjau dari titik berat penilaian
1) Tes diagnostik
Ø Tingkah laku kognitif, afektif, dan psikomotor.
Ø Faktor-faktor fisik, psikologis, dan lingkungan.
2) Tes formatif. Menekankan pada tingkah laku kognitif.
3) Tes sumatif. Pada umumnya menekankan pada tingkah laku kognitif, tetapi ada kalanya
pada tingkah laku psikomotor dan kadang-kadang pada afektif.
d. Ditinjau dari alat evaluasi
1) Tes diagnostik
Ø Tes prestasi belajar yang sudah distandarisasikan.
Ø Tes diagnostik yang sudah distandarisasikan.

Ø Tes buatan guru.
Ø Pengamatan dan daftar cocok.
2) Tes formatif
Tes prestasi belajar yang tersusun secara baik.
3) Tes sumatif
Tes ujian akhir.
e. Ditinjau dari cara memilih tujuan yang dievaluasi
1) Tes diagnostik
Ø Memilih tiap-tiap keterampilan prasyarat.
Ø Memilih tujuan setiap program pelajaran secara berimbang.
Ø Memilih yang berhubungan dengan tingkah laku fisik, mental, dan perasaan.
2) Tes formatif
Mengukur semua tujuan instruksional khusus.
3) Tes sumatif
Mengukur tujuan instruksional umum.
f. Ditinjau dari tingkat kesulitan tes
1) Tes diagnostik
Untuk tes diagnostik mengukur keterampilan dasar, diambil soal tes yang mudah.
2) Tes formatif
Belum dapat ditentukan
3) Tes sumatif
Rata-rata mempunyai tingkat kesulitan (indek kesukaran) antara 0,35-0,70.
g. Ditinjau dari scoring (cara menyekor)
1) Tes diagnostik
Menggunakan standar mutlak dan standar relatif

2) Tes formatif
Menggunakan standar mutlak
3) Tes sumatif
Kebanyakan menggunakan standar relatif, tetapi dapat pula dipakai standar mutlak
h. Ditinjau dari tingkat pencapaian
Yang dimaksud dengan tingkat pencapaian adalah skor yang harus dicapai siswa
dalam setiap tes.
1) Tes diagnostik
Untuk tes diagnostik yang sifatnya memonitor kemajuan, tingkat pencapaian yang diperoleh
siswa merupakan informasi tentang keberhasilannya.
2) Tes formatif
Ditinjau dari tujuan, tes formatif digunakan untuk mengetahui apakah siswa sudah mencapai
tujuan insruksional umum yang diuraikan menjadi tujuan instruksional khusus.
3) Tes sumatif
Sesuai dengan fungsi tes sumatif yaitu memberikan tanda kepada siswa bahwa mereka telah
mengikuti suatu program dan untuk menentukan posisi kemampuan siswa dibandingkan dengan
kawan dalam kelompoknya, maka tidak diperlukan suatu tuntutan harus berapa tingkat
penguasaan yang dicapai.
i. Ditinjau dari cara pencatatan hasil
1) Tes diagnostik
Dicatat dan dilaporkan dalam bentuk profil
2) Tes formatif
Prestasi tiap siswa dilaporkan dalam bentuk catatan berhasil atau gagal menguasai suatu tugas.
3) Tes sumatif
Keseluruhan skor atau sebagian skor dari tujuan-tujuan yang dicapai.
Bab 4 MASALAH TES
1. Pengertian
Istilah tes berasal dari bahasa Prancis Kuno yaitu “testum” yang berarti piring untuk
menyisihkan logam mulia. Dalam bahasa Indonesia tes diterjemahkan sebagai ujian atau
percobaan.
Menurut Arikunto (2010: 53), tes merupakan alat atau prosedur yang digunakan untuk
mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah
ditentukan.
2. Ciri-Ciri Tes yang Baik
Suharsismi Arikunto (2008: 57-62) menyatakan bahwa suatu tes dapat dikatakan baik apabila
memenuhi lima syarat yaitu:
a) Validitas merupakan ketepatan, tes yang sebagai alat ukur dikatakan valid jika tes itu tepat
pada hasil belajar dan akan menghasilkan yang valid pula.
b) Reliabilitas, jika memberikan hasil yang tetap dari suatu tes, tidak terpengaruh oleh
apapun.
c) Objektifitas berarti tidak ada unsur pribadi yang mempengaruhinya, tidak ada unsur
subjektifitas yang mempengaruhi tes tersebut.
d) Praktikabilitas, tes ini merupakan tes yang praktis, mudah dan tidak mengecoh. Mudah
pelaksanaannya, mudah diperiksa, dan dilengkapi dengan petunjuk sehingga dapat diberikan
kepada orang lain.
e) Ekonomis, bahwa pelaksanaan tes tidak membutuh biaya yang mahal dan tidak membuang
waktu.
Bab 5 VALIDITAS
Validitas adalah suatu ukuran yang menunjukkan tingkat-tingkat kevalidan atau kesahihan suatu
instrument. Suatu instrument yang valid atau sahih mempunyai validitas tinggi, sebaliknya,
instrument yang kurang valid berarti memiliki validitas rendah (Suharsimi Arikunto 2006).
1. Macam -Macam Validitas
Menurut Suharsimi ada dua jenis validitas yaitu validitas logis dan validitas empiris. Sementara
validitas itu terbagi menjadi beberapa4 yaitu validitas isi, validitas konstrak, validitas “ada
sekarang” dan validitas predictive.
a. Validitas isi (content validity)
Yaitu pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Sebuah tes
dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan
materi atau isi pelajaran yang diberikan. Validitas isi merupakan validitas yang diperhitungkan
melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari
jawabannya dalam validasi ini adalah “sejauh mana item-item dalam suatu alat ukur mencakup
keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?” atau
berhubungan dengan representasi dari keseluruhan kawasan.
Pengertian “mencakup keseluruhan kawasan isi” tidak saja menunjukkan bahwa alat ukur
tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan
tidak keluar dari batasan tujuan ukur.
Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur mengikutsertakan pula
item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas
alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya.Apakah
validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada
penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputerisasi
statistik, melainkan hanya dengan analisis rasional maka tidak diharapkan bahwa setiap orang
akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci materi
kurikulum atau meteri buku pelajaran. Yaitu sejauh mana tes hasil belajar sebagai alat pengukur
hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan
materi atau bahan pelajaran yang harus diuji.
b. Validitas Konstruksi (Contruct validity)
Secara etimologis, kata kontruksi mengandung arti susunan, kerangka atau rekaan. Sebuah tes
dikatakan memiliki validitas kontruksi apabila butir- butir soal yang membangun tes tersebut
mengukur setiap aspek berfikir seperti yang disebutkan dalam Tujuan Instruksional Khusus.
Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan
perkembangan konsep mengenai trait yang diukur. Hasil estimasi validitas konstrak tidak
dinyatakan dalam bentuk suatu koefisien validitas.
Dengan kata lain jika butir- butir soal mengukur aspek berfikir tersebut sudah sesuai dengan
aspek berfikir yang menjadi tujuan instruksional.
Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK), “Siswa dapat mengenal tata
cara memandikan mayat”, maka butir soal pada tes merupakan perintah bagaimana cara
memandikan mayat dengan baik.
c. Pengujian Validitas Tes secara Empiris
Istilah “Validitas empiris” memuat kata “empiris” yang artinya “pengalaman” sebuah instrumen
dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Yang dimaksud
dengan validitas empiris adalah ketepatan mengukur yang didasarkan pada hasil analisis yang
bersifat empirik. Sedangkan menurut Ebel bahwa Empirical Validity adalah validitas yang
berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran
yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
Jadi empirical validity adalah validitas yang berkenaan dengan hubungan antara skor dengan
suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin
diramalkan oleh pengukuran. Bertitik tolak dari itu maka tes hasil belajar dapat dikatakan telah
memiliki validitas empirik apabila berdasarkan hasil analisis yang dilakukan terhadap data hasil
pengamatan dilapangan, terbukti bahwa tes hasil belajar itu dengan secara tepat telah dapat
mengukur hasil belajar yang seharusnya diungkap atau diukur lewat tes hasil belajar tersebut.
Untuk menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum
dapat dilakukan penelusuran dari dua segi, yaitu segi daya ketepatan meramal (prediktif
validity), dan daya ketepatan bandingannya (concurren validity).
d. Validitas Ramalan (Predictive Validity)
Setiap kali kita menyebutkan istilah “ramalan” maka didalamnya akan terkandung pengertian
mengenai “sesuatu yang bakal terjadi masa yang akan datang “ atau sesuatu yang pada saat
sekarang belum terjadi dan baru akan terjadi pada waktu-waktu yang akan datang. Apabila istilah
ramalan dikaitkan dengan validitas tes maka yang dimaksut dengan validitas ramalan dari suatu
tes adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah dapat dengan
secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa
yang akan datang.
Menurut Suharsimi meprediksi artinya meramal, dengan meramal selalu mengenai hal yang akan
datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau
validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi masa
yang akan datang.
Jadi pada dasarnya tes yang dilakukan adalah dengan memberikan bentuk soal, item dan sarat
yang diberikan harus memiliki tujuan akhir yang akan ditempuh sehingga proses atau hasil yang
dicapai dapat diprediksi sebelumnya.
e. Validitas Bandingan (concurrent validity)

Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes tersebut
dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukkan adanya hubungan
yang searah antara tes pertama dengan tes berikutnya. Menurut Suharsimi dalam hal ini tes
dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau
sehingga data pengalaman tersebut sekarang sudah ada.
Validitas bandingan juga sering dikenal dengan istilah : validitas sama saat, validitas pengalaman
atau validitas ada sekarang. Dikatakan sama saat sebab validitas tes itu ditentukan atas dasar data
hasil tes yang pelaksanaannya dilakukan pada kurun waktu yang sama. Dikatakan validitas
pengalaman sebab validitas tes tersebut ditentukan atas dasar pengalaman yang telah diperoleh.
Adapun dikatakan sebagai validitas ada sekarang sebab setiap kali kita menyebut istilah
pengalaman maka istilah itu akan selalu kita kaitkan dengan hal-hal yang telah ada atau hal-hal
yang telah terjadi pada waktu yang lalu, sehingga data mengenai pengalaman masa yang lalu itu
pada saat ini sudah ada di tanggan.
Jadi dalam rangka menguji validitas bandingan, data yang mencerminkan pengalaman yang
diperoleh masa yang lalu itu, kita bandingkan dengan data hasil tes yang diperoleh sekarang ini.
Jika hasil tes yang ada sekarang ini mempunyai hubungan searah dengan hasil tes berdasarkan
pengalaman yang lalu, maka tes yang memiliki karakteristik seperti itu dapat dikatakan telah
memiliki validitas bandingan.
Misalnya seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau
belum. Untuk itu diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki.
Misalnya nilai ulangan harian atau nilai ulkangan sumatif yang lalu.
Cara mengetahui Validitas Alat Ukur
3. Validitas Butir Soalatau Validitas Item
4. Tes Terstandar Sebagai Kriterium dalam Menentukan Validitas
5. Validitas Faktor
Bab 6 REALIBILITAS
1. Arti Reabilitas Bagi Sebuah Tes
2. Cara-Cara Mencari Besarnya Realibilitas.
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subyek yang sama.
Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil.
Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada diluar tes (consistency
external) dan pada tes itu sendiri (consistency internal).
a. Metode bentuk Paralel (equivalen)
Tes parallel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat
kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa inggris disebut
alternate-forms method (parallel forms).
Dengan metode bentuk parallel ini, dua uah tes yang paralel, misalnya Matematika Seri A yang
akan dicari reliailitasnya dan Seri B di teskan pada sekelompok siswa yang sama, kemudian
hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukan koefisien
reliabilitas tes Seri A. jika oefisiennya tinggi maka tes tersebut sudah reliable dan dapat
digunakan sebagai alat pengetes yang terandalkan.
Dalam menggunakan metode paralel ini pengetes harus menyiapkan dua buah tes, dan masing-
masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang yang
menyebutkan sebagai double tes-daubel-trial method.
b. Metode tes ulang (test-retest method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam
menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua
kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut
dengan single-test-double-trial method. Kemudian hasil dari kedua tes tersebut dihitung
korelasinya.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini kurang
mengena karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena tenggang waktu
akan pemberian tes pertama dengan kedua menjadi permasalahan tersendiri. jika tenggang waktu
terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalau tenggang waktu terlalu lama,
maka faktor-faktor atau kondisi tes sudah akan berbeda, dan siswa senddiri barangkali sudah
mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula terhadap reliabilitas.
c. Metode belah dua atau split-half method
Kelemahan penggunaan metode dua tes dua kali percobaan dan satu tes dua kali
percobaandiatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode
ini pengetes hanya menggunakan sebuah tes yang dicobakan satu kali. Oleh karena itu, disebut
juga single-test-single-trial method.
Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien korelasi
langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat
demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui
reliabilitas separo tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus
Spearman-rown .
Bab 7 TAKSONOMI
1. Arti dan Letak Taksonomi dalam Pendidikan

2. Taksonomi Bloom
Menurut taksonomi Bloom ini tujuan pendidikan dibagi menjadi beberapa domain (ranah,
kawasan), dan setiap domain tersebut dibagi kembali ke dalam pembagian yang lebih rinci
berdasarkan hirarkhinya. Domain-domain tersebut antara lain:
a) Cognitive Domain (Ranah Kognitif), yang berisi perilaku-perilaku yang menekankan

aspek intelektual, seperti pengetahuan, pengertian, dan keterampilan berpikir. Dalam ranah ini
hirarkinya adalah pengetahuan (knowledge), pemahaman (comprehension), aplikasi
(application), analisis (analysis), sintesis (synthesis), dan evaluasi (evaluation).
b) Affective Domain (Ranah Afektif) berisi perilaku-perilaku yang menekankan aspek

perasaan dan emosi, seperti minat, sikap, apresiasi, dan cara penyesuaian diri. Dalam ranah ini
hirarkinya adalah pandangan atau pendapat (opinion) dan sikap atau nilai (attitude, value)
c) Psychomotor Domain (Ranah Psikomotor) berisi perilaku-perilaku yang menekankan

aspek keterampilan motorik seperti tulisan tangan, mengetik, berenang, dan mengoperasikan
mesin. Ranah ini tersusun atas keterampilan (skill) dan kemampuan ( abilities)
Taksonomi lain-lainnya:
a. Mc Guire dan Klickmann (1963) telah menyusun taksonomi untuk bidang biologi, Wood
(1968) untuk matematika, Leuis (1965) untuk IPA.
b. Guilford telah menciptakan pola yang menggambarkan struktur intelek dalam bentuk kubus
c. Gagne dan Merrill menyebutkan ada 8 hierarki tingkah laku, antara lain:
ü Signal learning
ü Stimulus-response learning
ü Chaining
ü Verbal associating
ü Discrimination learning
ü Concept learning
ü Rule learning
ü Problem solving.
d. Garlach dan Sullivan mencoba mengganti gambaran tentang proses dalam rumusan yang
umum menjadi tingkah laku siswa yang dapat diamati. Kategori yang diajukan adalah:
ü Identify
ü Name
ü Describe
ü Construct
ü Order
ü Demonstrate.
e. De Block mengemukakan model yang didasarkan pada tujuan-tujuan mengajar. Dia

mejukan 3 arah dalam kegiatan mengajar:
ü From partial to more integral learning
ü From limited to fundamental learning
ü From special to eneral learning.
Bab 8 TUJUAN INTRUKSIONAL
1. Bermacam-Macam Tujuan Pendidikan.

Tujuan Pendidikan Nasional adalah mencerdaskan kehidupan bangsa dan mengembangkan
manusia Indoensia seutuhnya, yaitu manusia yang beriman dan bertaqwa terhadap Tuhan Yang
Maha Esa dan berbudi pekerti luhur, memiliki pengetahuan dan keterampilan, kesehatan jasmani
dan rohani, kepribadian yang mantap dan mandiri serta rasa tanggung jawab kemasyarakatan dan
kebangsaan.
Pengembangan di bidang pendidikan didasarkan atas falsafah negara Pancasila dan diarahkan
untuk membentuk manusia-manusia pembangunan yang ber-Pancasila dan untuk membentuk
manusia Indonesia yang sehat jasmani dan rohaninya memiliki pengetahuan dan keterampilan,
dapat mengembangkan kreativitas dan tanggung jawab, dapat menyuburkan sikap demokrasi dan
penuh tenggang rasa, dapat mengembangkan kecerdasan yang tinggi dan disertai budi pekerti
yang luhur, mencitai bangsanya dan mencintai sesama manusia sesuai dengan ketentuan
termaktub dalam UUD 1945.
Dengan adanya pendidikan, maka akan timbul dalam diri seseorang untuk berlomba-lomba dan
memotivasi diri kita untuk lebih baik dalam segala aspek kehidupan. Pendidikan merupakan
salah satu syarat untuk lebih memajukan pemrintah ini, maka usahakan pendidikan mulai dari
tingkat SD sampai pendidikan di tingkat Universitas.
2. Tujuan Instruksional(Intructional Objectives)
Suharsimi Arikunto menyatakan dalam tujuan instruksional umum menggunakan kata kerja yang
masih umum dan tidak dapat diukur, maka dibutuhkan tujuan instruksional khusus. Jadi ada 2
macam tujuan instruksional:
ü tujuan instruksional umum ( TIU)
ü tujuan instruksional khusus (TIK)
Adapun manfaat tujuan instruksional adalah:

a. Pendidik mempunyai arah untuk memilih bahan pelajaran dan memilih prosedur (metode)
mangajar,
b. Peserta didik mengetahui arah belajarnya,
c. Setiap pendidik mengetahui batas-batas tugas dan wewenang mengajarkan suatu bahan
sehingga diperkecil kemungkinan timbulnya celah (gap) atau saling menutup (overlap) antar
pendidik,
d. Pendidik mempunyai patokan dalam mengadakan penilaian kemajuan belajar peserta didik,
e. Pendidik sebagai pelaksana dan petugas-petugas pemegang kebijaksanaan (decision

maker) mempunyai kriteria untuk mengevaluasi kualitas maupun efiensi pengajaran.
3. Merumuskan Tujuan Intruksional.
Bagaimana cara merumuskan tujuan pembelajaran atau indikator hasil belajar itu?ada empat
komponen pokok yang harus nampak dalam rumusan indikator hasil belajar seperti yang
digambarkan dalam pertanyaan berikut:
a) Siapa yang belajar atau yang diharapkan dapat mencapai tujuan atau mencapai hasil belajar
itu?
b) Tingkah laku atau hasil belajar yang bagaimana yang diharapkan dapat dicapai itu?.
c) Dalam kondisi yang bagaimana hasil belajar itu dapat ditampilkan?

d) Seberapa jauh hasil belajar itu bisa diperoleh.
4. Langkah-LangkahyangDilakukan dalam Merumuskan Tujuan Intruksioanal Khusus.
a. Membuat sejumlah TIU (Tujuan Instruksional Umum) untuk setiap mata pelajaran/bidang
studi yang akan diajarkan dalam kurikulum 1975 maupun 1984, TIU sudah ada tercantum dalam
buku garis-garis besar program pengajaran. Dalam merumuskan TIU digunakan kata kerja yang
sifatnya masih umum dan tidak dapat di ukur karena perubahan tingkah laku masih terjadi di
dalam diri manusia.
b. Dari masing-masing TIU dijabarkan menjadi sejumlah TIK yang rumusannya jelas, khusus,
dapat dimengerti, terukur, dan menunjukkan perubahan tingkah laku.
Contoh-contoh rumusan untuk TIU:
Ø Memahami teori evaluasi.
Ø Mengetahui perbedaan antara skor dan nilai.
Ø Mengerti cara mencari validita.
Ø Menghayati perlunya penilaian yang tepat.
Ø Menyadari pentingnya mengikuti kuliah dengan teratur.
Ø Menghargai kejujuran mahasiswa dalam mengerjakan tes.

5. Tingkah Laku Akhir
Tingkah laku akhir adalah tingkah laku yang diharapkan setelah peserta didik mengalami proses
belajar. Di sini tingkah laku ini harus menampakkan diri dalam suatu perbuatan yang dapat
diamati dan diukur (observable and measurable).
Contoh:
ü Menuliskan kalimat perintah,
ü Mengalikan pecahan persepuluh,
ü Menggambarkan kurva normal,
ü Menyebutkan batas-batas Daerah Istimewa Yogyakarta,
ü Menceritakan kembali uraian guru,
Dan lain-lain yang berwujud kata kerja perbuatan/operasional (Action Verb) yang dapat diamati
dan diukur.
6. Kata-Kata operasioanal
a. Kognitif
ü Pengetahuan (knowledge). Kata-kata instruksional yang sering digunakan: Mendefinisikan,
mendeskripsikan, mengidentifikasi, mendaftarkan, menjodohkan, menyebutkan, menyatakan
(state), mereproduksi.
ü Pemahaman (comprehension). Kata-kata instruksional yang sering digunakan:

mempertahankan, membedakan, menduga (estimate), menerangkan, memperluas,
menyimpulkan, menggeneralisasikan, memberikan, contoh, menuliskan kembali, menggunakan.
ü Aplikasi. Kata-kata instruksional yang sering digunakan: mengubah, menghitung,

mendemonstrasikan, menemukan, memanipulasi, memodifikasi, mengoperasikan, meramalkan,
menyiapkan, menghasilkan, menghubungkan, menunjukkan, memecahkan, menggunakan.
ü Analisis. Kata-kata instruksional yang sering digunakan: memerinci, menyusun diagram,

membedakan, mengidentifikasi, mengilustrasikan, menyimpulkan, menunjukkan,
menghubungkan, memilih, memisahkan, membagi (subdivides).
ü Sintesis. Kata-kata instruksional yang sering digunakan: mengategorikan, mengombinasikan,

mengarang, menciptakan, membuat desain, menjelaskan, memodifikasikan, mengorganisasikan,
menyusun, membuat rencana, mengatur kembali, merekronstuksikan, menghubungkan,
mereorganisasikan, merevisi, menuliskan kembali, menuliskan, menceritakan.
ü Evaluasi. Kata-kata instruksional yang sering digunakan: menilai, membandingkan,

menyimpulkan, mempertentangkan, mengkritik, mendeskripsikan, membedakan, menerangkan,
memutuskan, menafsirkan, menghubungkan, membantu (supports).
b. Afektif
ü Reesiving. Kata-kata instruksional yang sering digunakan: menanyakan, memilih,

mendeskripsikan, mengikuti, memberikan, mengidentifikasikan, menyebutkan, menunjukkan,
memilih, menjawab.
ü Responding. Kata-kata instruksional yang sering digunakan: menjawab, membantu,
mendiskusikan, menghormat, berbuat, melakukan, membaca, memberikan, menghafal,
melaporkan, memilih, menceritakan, menulis.
ü Valuing. Kata-kata instruksional yang sering digunakan: melengkapi, menggambarkan,

membedakan, menerangkan, mengikuti, membentuk, mengundang, menggabung, mengusulkan,
membaca, melaporkan, memilih, bekerja, mengambil bagian (share), mempelajari.
ü Organization. Kata-kata instruksional yang sering digunakan: mengubah, mengatur,

menggabungkan, membandingkan, melengkapi, mempertahankan, menerangkan,
menggeneralisasikan, mengidentifikasikan, mengintregasikan, memodifikasikan, mengorganisir,
menyiapkan, menghubungkan, mensistesiskan.
ü Characterization by value or value complex. Kata-kata instruksional yang sering digunakan:

membedakan, menerapkan, mengusulkan, memperagakan, mempengaruhi, mendengarkan,
memodifikasikan, mempertunjukkan, menanyakan, merevisi, melayani, memecahkan,
menggunakan.
c. Psikomotorik
ü Musclar or motor skills. Kata-kata instruksional yang sering digunakan: mempertontonkan

gerak, menunjukkan hasil (pekerjaan tangan), melompat, menggerakkan, menampilkan.
ü Manipulation of materials or objects. Kata-kata instruksional yang sering digunakan:

mereparasi, menyusun, membersihkan, menggeser, memindahkan, membentuk.
ü Neuromusclar coordination. Kata-kata instruksional yang sering digunakan: mengamati,

menerapkan, menghubungkan, menggandeng, memotong, menarik, memasang, menarik,
menggunakan.
Kata-kata yang telah disajikan di atas merupakan kata-kata kerja yang dipakai dalam
merumuskan tujuan instruksional khusus bagi peserta didik yang belajar, sehingga rumusan
seutuhnya menjadi pernyataan-pernyataan, sebagai berikut:
1) Peserta didik dapat menghafal ibu kota negara bagian Jerman.
2) Peserta didik dapat menunjukkan letak ibu kota negara bagian Jerman.
3) Peserta didik dapat membuat kalimat dalam Bahasa Jerman.
7. Kondisi Demonstrasi
Kondisi demonstrasi adalah komponen TIK yang menyatakan suatu kondisi atau situasi yang
dikenakan kepadapeserta didik pada saat pendidik mendemonstrasikan tingkah laku akhir.
Standar keberhasilan adalah kelompok TIK yang menunjukkan seberapa jauh tingkat
keberhasilan yang di tuntut oleh penilai bagi tingkah laku pelajar pada situasi akhir.
Tingkat keberhasilan dapat dinyatakan dalam jumlah maupun prsentase, misalnya:
a) Dengan 75% betul.
b) Sekurang-kurangnya 5 dari 10.
c) Tanpa kesalahan.
Dalam pedoman pelaksanaan kurikulum di jelaskan bahwa dalam kegiatan belajar-mengajar
pendidik di haruskan memperhatikan pula keterampilan tentang prosesnya. Pendekatan ini di
sebut dengan istilah pendekatan keterampilan proses. Keterampilan-keterampilan di maksud
meliputi keterampilan dalam hal:
a) Mengamati.
b) Menginterprestasikan (menafsirkan) hasil pengamatan.
c) Merabalkan.
d) Menerapkan konsep.
e) Merencanakan penelitian.
f) Melaksanakan penelitian.
g) Mengkomunikasikan hasil penemuan.
Sesuai dengan tuntutan tersebut maka pendidik dalam merumuskan tujuan instruksional khusus
harus mengandung apa yang dilakukan peserta didik dalam kegiatan belajar-mengajar.
Tujuan instruksional umum yang termuat sudah dirumuskan dalam satu rumusan yang
menjelaskan:
a) Materi yang dipelajari.

b) Perilaku mengutarakan hasil.
c) Proses pencapaiannya.
Bab 9 TES STANDAR DAN TES BUATAN GURU
1. Pengertian Tes Standar
Tes adalah salah satu bentuk instrumen evaluasi untuk mengukur seberapa besar kemampuan
siswa dalam memahami dan menguasai pokok-pokok materi yang sudah diajarkan. Tes ada yang
dibuat oleh seorang guru yang kemudian disebut tes buatan guru dan ada tes yang sudah
memenuhi standar suatu satuan pendidikan maupun lembaga pendidikan yang kemudian disebut
tes terstandar.
Dalam menilai, baik tes terstandar maupun tes buatan guru ada beberapa hal yang perlu
diperhatikan yang berkaitan dengan validitas dan reliabilitas.
Tes kemampuan pada dasarnya terbagi menjadi dua macam, yaitu :
a. Aptitude test
b. Achievement tes
Perbedaan antara dua tes ini sebenearnya tidak tegas, soal – soal mengenai kedua tes tersebut
sering kali saling melingkupi ( overlap ). Untuk kedua macam tes ini biasanya menggunakan
hitung – hitungan dan perbendaharaan kata – kata dan sekelompok tes dari kedua macam tes ini
biasanya juga menguji tentang keterampilan membaca. Kesamaan yang lain adalah bahwa
keduanya telah digunakan untuk meramalkan hasil untuk yang masa akan dating, walaupun pada
umumnya jika kita menggunakan tes prestasi penilai melihat apa yang telah diperoleh setelah
siswa ( tercoba ) itu diberi suatu pelajaran.
2. Tes Prestasi Standar
Di antara tes prestasi yang digunakan di sekolah ada yang dinamakan tes prestasi standar. Dalam
salah satu kamus, arti kata ”standar” adalah:
“A degree of level of requirement, excellence, or attainment”
Standar untuk siswa dapat dimaksudkan sebagai suatu tingkat kemampuan yang harus dimiliki
bagi suatu program tertentu. Mungkin standar bagi suatu kursus A berbeda dengan B. Jadi
standar ini dapat dibuat “keras” maupun “lunak” tergantung dari yang mempunyai
kebijaksanaan.
Suatu tes standar dengan demikian berbeda dengan tes prestasi biasa.
Prosedur yang digunakan untuk menyusun tes standar untuk tes prestasi melalui cara langsung
yang ditumbuhkan dari tes yang digunakan di kelas. Sedangkan spesifikasi yang digunakan
untuk menentukan isi dalam tes bakat biasanya didasarkan atas analisis job (jabatan) atau analisis
tugas yang merupakan tuntutan calon pekerjaannya. Disamping itu juga mempertimbangkan
sifat-sifat yang ada pada manusia. Analisis jabatan analisis tugas yang dilakukan biasanya tidak
tidak didasarkan atas satu kurikulum, tetapi diambil dari masyarakat.
Istilah “standar” dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-pertanyaan
yang sama dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk yang sama
dan dalam batasan waktu yang sama pula. Dengan demikian maka seolah-olah ada suatu standar
atau ukuran sehingga diperoleh suatu standar penampilan (performance) dan penampilan
kelompok lain dapat dibandingkan dengan penampilan kelompok standar tersebut.
Istilah “standar” tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan dapat
diajarkan pada suatu tingkat tertentu atau bahwa tes itu menyiapkan suatu standar prestasi
dimana siswa harus dan dapat mencapai suatu tingkat tertentu. Sekali lagi, tes standar dipolakan
untuk penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan
dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan perseorangan
maupun siswa sebagai anggota dari suatu kelompok.
3. Perbandingan Antara Tes Standar dengan Tes Buatan Guru
Tes standar disusun dalam tipe-tipe soal yang sama yang meliputi bahan atau pengetahuan yang
sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes buatan guru. Lalu apakah
perbedaan antara tes standar dengan tes buatan guru, atau apakah keburukan dan keuntungan tes
standar?
Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru. Perbedaannya
adalah sebagai berikut:
Tes Standar
Tes Buatan Guru
a. Didasarkan atas bahan dan tujuan umum dari sekolah-sekolah di seluruh Negara.
Mencakup aspek yang luas dan pengetahuan atau keterampilan dengan hanya sedikit butir tes
untuk setiap keterampilan atau topik.
c. Disusun dengan kelengkapan staf profesor, pembahas, dan editor butir tes.
d. Menggunakan butir tes yang sudah diujicobakan (try out), dianalisis dan direvisi sebelum
menjadi sebuah tes.
e. Mempunyai reliabilitas yang tinggi.
f. Dimungkinkan menggunakan norma untuk seluruh Negara.
a. Didasarkan atas bahan dan tujuan khusus yang dirumuskan oleh guru untuk kelasnya sendiri.
b. Dapat terjadi hanya mencakup pengetahuan atau keterampilan yang sempit.
c. Biasanya disusun sendiri oleh guru dengan sedikit atau tanpa bantuan orang lain/tenaga ahli.
d. Jarang menggunakan butir tes yang sudah diujicobakan, dianalisis dan direvisi.
e. Mempunyai reliabilitas sedang atau rendah.
f. Norma kelompok terbatas kelas tertentu.
Kedua, untuk menyusun tes standar, diutuhkan waktu yang lama. Seperti disebutkan ahwa untuk
memperoleh sebuah tes standar melalui prosedur:
§ Penyusunan;
§ Uji coba;
§ Analisa;
§ Revisi;
§ Edit.
Kelima kegiatan ini membutuhkan waktu lama.
4. Kegunaan Tes Standar
Secara singkat dapat dikemukakan bahwa kegunaan tes standar adalah:
§ Jika ingin membuat perbandingan,
§ Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak tersedia data tentang calon
ini.
Secara garis besar kegunaan tes standar adalah:
Ø Membandingkan prestasi belajar dengan pembawaan individu atau kelompok.
Ø Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai bidang studi untuk
individu atau kelompok.
Ø Membandingkan prestasi siswa antara berbagai sekolah atau kelas.
Ø Mempelajari perkembangan siswa dalam suatu periode waktu tertentu.
5. Kegunaaan Tes Buatan
Secara singkat dapat dikemukakan bahwa kegunaan tes buatan guru adalah:
vUntuk menentukan seberapa baik siswa telah menguasai bahan pelajaran yang diberikan dalam
waktu tertentu.
vUntuk menentukan apakah sesuatu tujuan telah tercapai.
vUntuk memperoleh suatu nilai.
Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai jika hasilnya akan digunakan
untuk:
· Mengadakan diagnosis terhadap ketidakmampuan siswa.
· Menentukan tempat siswa dalam suatu kelas atau kelompok.
· Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan jurusan.
· Memilih siswa untuk program-program khusus.

6. Kelengkapan Tes Standar
Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes standar, biasanya
dilengkapi dengan sebuah manual. Manual ini memuat keterangan-keterangan atau petunjuk-
petunjuk yang perlu terutama yang menjelaskan tentang pelaksanaan, menskor, dan mengadakan
interpretasi.Secara garis besar manual tes standar ini memuat:
a. Ciri-ciri mengenai tes, misalnya menyebutkan tingkat validitas, tingkat reliabilitas dan
sebagainya.
b. Tujuan serta keuntungan-keuntungan dari tes. Misalnya yang disebutkan untuk siapa tes
tersebut diberikan dan untuk tujuan apa.
c. Proses standardisasi tes. Misalnya mengenai hal-hal yang berhubungan dengan sampel.
o Besarnya sampel,
o Teknik sampling,
o Kelompok mana yang diambil sebagai sampel (sifat sampel).
Juga mengenai taraf kepercayaan yang diambil dan bagaimana kaitannya dengan hasil tes.
d. Petunjuk-petunjuk tentang cara melaksanakan tes

Misalnya: dilaksanakan dengan lisan atau tertulis, waktu yang digunakan untuk mengerjakan
setiap bagian, boleh tidaknya tercoba keluar jika sudah selesai mengerjakan soal itu dan
sebagainya.
e. Petunjuk-petunjuk bagaimana cara menskor
Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem hukuman atau tidak,
bagaimana cara menghitung nilai akhir dan sebagainya.
f. Petunjuk-petunjuk untuk menginterpretasikan hasil
Misalnya:
o Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi,
o Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.
g. Saran-saran lain
Misalnya: siapa harus menjadi pengawas, bagaimana seandainya tidak ada calon yang mencapai
skor tertentu dan sebagainya
Bab 10 PENYUSUSNAN TES
1. Fungsi Tes
Fungsi tes dapat ditinjau dari 3 hal :
a. fungsi untuk kelas
b. fungsi untuk bimbingan.
c. fungsi untuk administrasi
a. Fungsi untuk Kelas, tes dapat berfungsi untuk :
1) mengadakan diagnosis terhadap kesulitan belajar siswa
2) mengevaluasi celah antara bakat dengan pencapaian
3) menaikkan tingkat prestasi
4) mengelompokkan siswa dalam kelas pada waktu metode kelompok
5) merencanakan kegiatan proses belajar mengajar untuk siswa secara perseorangan.
6) menentukan siswa mana yang memerlukan bimbingan khusus

7) menentukan tingkat pencapaian untuk setiap anak.
b. Fungsi untuk Bimbingan, tes dapat berfungsi untuk :
1) menentukan arah pembicaraan dengan orang tua tentang anak-anak mereka.
2) membantu siswa dalam menentukan pilihan.
3) membantu siswa mencapai tujuan pendidikan dan jurusan.
4) memberi kesempatan kepada pembimbing, guru, dan orang tua dalam memahami kesulitan
anak.
c. Fungsi untuk Administrasi
1) memberi petunjuk dalam mengelompokkan siswa.
2) penempatan siswa baru
3) membantu siswa memilih kelompok
4) menilai kurikulum
5) memperluas hubungan masyarakat

6) menyediakan informasi untuk badan-badan lain di luar sekolah.
2. Langkah-Langkah dalam Penyusunan Tes
a. Menentukan tujuan mengadakan tes
b. Mengadakan pembatasan terhadap bahan yang akan diteskan.
c. Merumuskan Tujuan Instruksional Khusus (TIK) dari tiap bagian bahan.
d. Menderetkan semua TIK dalam tabel persiapan yang memuat pula aspek tingkah laku
dalam terkandung TIK itu, tabel digunakan untuk identifikasi terhadap tingkah laku yang
dikehendaki, agar tidak terlewati.
e. Menyusun tabel spesifikasi yang memuat pokok materi, aspek berfikir yang diukur beserta
imbangan antara kedua hal tersebut. (Uraian penjelasan tentang tabel spesifikasi i akan kami
jelaskan di sub bab berikutnya)
f. Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah dituliskan pada tabel
TIK dan aspek tingkah laku yang dicakup
3. Komponen-Komponen Tes
Komponen Test terdiri dari:
a. Buku tes, yakni lembaran atau buku yang memuat butir-butir soal yang mesti dikerjakan
oleh siswa
b. Lembar jawaban tes, yaitu lembaran yang disediakan oleh penilain bagi testee untuk
mengerjakan tes, untuk bentuk pilihan ganda dibuat lembaran nomor dan huruf A, B, C, D, E
menurut banyaknya alternative yang disediakan
c. Kunci jawaban tes, berisi jawaban-jawaban yang dikehendaki. Kunci jawaban ini dapat
berupa huruf atau kalimat. Untuk test bentuk uraian yang dituliskan adalah kata-kata kunci atau
kalimat seingkat untuk memberikan ancar-ancar jawaban. Ide dari kunci jawaban ini adalah:
1) Pemeriksaan tes dapat dilakukan oleh orang lain
2) Pemeriksaannya betul,
3) Dilakukan dengan mudah,
4) Sedikit mungkin masuknya unsur subjektif
d. Pedoman penilaian, pedoman penilaian atau pedoman skoring, berisi tentang pedoman
perincian tentang skor atau angka yang diberikan kepada siswa bagi soal-soal yang telah
dikerjakan.Contoh pedoman penilaian:
Untuk penilaian dengan contoh soal diatas, tiap soal diberi skor 5.
Jumlah skor : 5×20= 100
Bab 11 TES TERTULIS UNTUK PRESTASI BELAJAR

1. Bentuk-Bentuk Tes
a. Tes subyektif. Secara umum soal subyektif adalah pertanyaan yang menuntut peserta didik
menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan, membandingkan,
memberikan alasan, dan bentuk lain yang sejenis sesuai dengan tuntutan pertanyaan dengan
menggunakan kata-kata dan bahasa sendiri. Jumlah soal-soal bentuk subyektif biasanya tidak
banyak, hanya sekitar 5-10 buah soal dalam waktu kurang lebih 90-120 menit. Soal-soal bentuk
ini menuntut kemampuan peserta didik untuk dapat mengorganisir, menginterpretasi, dan
menghubungkan pengertian-pengertian yang telah dimiliki.
b. Tes objektif. Tes objektif adalah tes yang dalam pemeriksaannya dapat dilakukan secara
objektif (Arikunto, 1995 : 165). Karena sifatnya yang objektif maka penskorannya dapat
dilakukan dengan bantuan mesin. Soal ini tidak memberi peluang untuk memberikan penilaian
yang bergradasi karena dia hanya mengenal benar dan salah. Apabila respons siswa sesuai
dengan jawaban yang dikehendaki maka respons tersebut benar dan biasa diberi skor 1. Apabila
kondisi yang terjadi sebaliknya, maka respons siswa salah dan biasa diberi skor 0. Jawaban siswa
bersifat mengarah kepada satu jawaban yang benar (convergence).
Merujuk kepada berbagai pendapat tentang tes objektif dapat diambil kesimpulan bahwa tes
objektif adalah tes yang semua informasi yang diperlukan peserta tes untuk memberikan respon
telah disediakan oleh penyusun tes, sehingga peserta tes tinggal memilihnya. Jawaban yang
berupa pilihan bersifat deterministik, sehingga hanya ada dua kemungkinan kebenaran jawaban –
benar atau salah.
2. Macam-Macam Tes Objektif
a. Bentuk Tes Benar Salah (True-False Test). Tes benar salah adalah bentuk tes yang
mengajukan beberapa pernyataan yang bernilai benar atau salah. Biasanya ada dua pilihan
jawaban yaitu huruf B yang berarti pernyataan tersebut benar dan S yang berarti pernyataan
tersebut salah. Tugas peserta tes adalah menentukan apakah pernyataan tersebut benar atau salah.
Contoh salah satu tes bentuk uraian adalah :

B S : Ibukota Peru berjumlah lima buah.
B S : Manado adalah Ibukota propinsi Sulawesi Utara
Kelebihan Tes Benar Salah:
Ø Dapat mencakup bahan yang luas dan tidak memakan tempat yang banyak
Ø Mudah dalam penyusunannya
Ø Petunjuk mengerjakannya mudah dimengerti
Ø Dapat digunakan berkali-kali
Ø Objektif
Ø Praktis
Kelemahan Tes Benar Salah:
o Mudah ditebak
o Banyak masalah yang tidak dapat dinyatakan hanya dengan kemungkinan benar atau salah
o Reliabilitasnya rendah.
o Hanya dapat mengungkapkan daya ingat dan pengenalan kembali
Petunjuk Penyusunan:
ü Hindari kalimat negatif, yakni kalimat yang mengandung kata “tidak” atau “bukan”.
ü Pernyataan harus disusun sedemikian rupa sehingga siswa yang memiliki pengertian samar-
samar dapat terkecoh dalam menjawabnya.
ü Dalam menyusun keseluruhan tes, diharapkan item yang mengandung “salah sedikit” cukup
banyak.
Cara Melakukan Penskoran Tes Benar Salah
v Dengan Denda. Skor = Jumlah jawaban benar – Jumlah jawaban Salah
v Tanpa Denda. Skor = Jumlah jawaban yang benar
b. Bentuk Pilihan Ganda (Multiple Choice Test). Tes pilihan ganda merupakan tes yang
menggunakan pengertian/ pernyataan yang belum lengkap dan untuk melengkapinya maka kita
harus memilih satu dari beberapa kemungkinan jawaban benar yang telah disiapkan.
Apabila dilihat konstruksinya maka tes pilihan ganda terdiri dari dua hal pokok yaitu stem atau
pokok soal dengan 4 atau 5 alternatif jawaban. Satu di antara alternatif jawaban tersebut adalah
kunci jawaban. Alternatif jawaban selain kunci disebut dengan pengecoh (distractor). Semakin
banyak alternatif jawaban yang ada (misalnya 5) maka probabilitas menebaknya akan semakin
kecil
c. Menjodohkan (Matching Test). Menjodohkan terdiri atas satu sisi pertanyaan dan satu sisi
jawaban, setiap pertanyaan mempunyai jawaban pada sisi sebelahnya. Siswa ditugaskan untuk
memasangkan atau mencocokkan, sehingga setiap pertanyaan mempunyai jawaban yang benar.
ü Kelebihan:
o Dipergunakan untuk menilai bermacam-macam hal, misalnya: problem dan penyelesaiannya,

sebab akibat, istilah dan definisinya, dsb.
o Relatif mudah disusun.
o Jika disusun dengan baik, maka faktor menerka-nerka dapat dihilangkan.
o Dapat dinilai dengan mudah, cepat dan objektif.
ü Kelemahan:
o Sukar menyusun test jenis ini yang benar-benar baik.
o Untuk menilai ingatan saja.
o Pengarahan jawaban sering terjadi
o Memakan banyak waktu dan tenaga untuk menyusunnya.

ü Saran Penulisan:
v Banyaknya jawaban di sebelah kanan lebih dari jawaban di sebelah kiri
v Lebihnya jawaban hendaknya menunjukkan jawaban yang salah
v Materinya setiap sisi baiknya mengenai satu pokok bahasan saja
v Pisahkan menjadi dua kolom, kolom pertama memuat jawaban, nomor soal dan pertanyaan.
Sedangkan kolom kedua memuat kode dan pilihan jawaban.
ü Cara Memberikan Skor: Penskoran pada tes menjodohkan tidak diberikan denda terhadap
jawaban yang salah. Skor = Jumlah jawaban benar
d. Tes Isian (Complementary Test). Tes isian terdiri dari kalimat yang dihilangkan (diberi
titik-titik). Bagian yang dihilangkan ini yang diisi oleh peserta tes merupakan pengertian yang
diminta agar pernyataan yang dibuat menjadi pernyataan yang benar. Contoh:
(1) Yang merupakan nama asli dari Sultan Hamengkubuwono X adalah …..
(2) Para filsuf zaman modern menegaskan bahwa pengetahuan tidak berasal dari kitab suci atau
ajaran agama, tidak juga dari para penguasa, tetapi dari diri manusia sendiri. Namun tentang
aspek mana yang berperan ada beda pendapat. Aliran ……………….. beranggapan bahwa
sumber pengetahuan adalah rasio: kebenaran pasti berasal dari rasio (akal). Aliran ……………,
sebaliknya, meyakini pengalamanlah sumber pengetahuan itu, baik yang batin, maupun yang
inderawi.
ü Cara Memberikan Skor:
Pada tes ini sulit dilakukan tebakan, sehingga tidak diperlukan denda terhadap jawaban yang
salah. Maka rumus yang digunakan adalah :
Skor = Jumlah jawaban benar
3. Pengukuran Ranah Afektif
Pengukuran ranah afktif tidak dapat diukur seperti halnya ranah kognitif, karena dalam ranah
afektif kemampuan yang diukur adalah, Menerima (memperhatikan), merespon, menghargai,
mengorganisasi, dan karakteristik suatu nilai.Sedangkan tujuan penilaian afektif adalah :
a) Untuk mendapatkan umpan balik (feedback) baik bagi guru maupun siswa sebagai dasar
untuk memperbaiki proses belajar mengajar dan mengadakan program perbaikan (remedial
program) bagi anak didiknya.
b) Untuk mengetahui tingkat perubahan tingkah laku anak didik yang dicapai antara lain
diperlukan sebagai bahan bagi : perbaikan tingkah laku anak didik, pemberian laporan kepada
orang tua, dan penentuan lulus tidaknya anak didik.
c) Untuk menempatkan anak didik dalam situasi belajar mengajar yang tepat, sesuai dengan
tingkat pencapaian dan kemampuan serta karakteristik anak didik.
d) Untuk mengenal latar belakang kegiatan belajar dan kelainan tingkah laku anak didik.
Jenis-jenis skala sikap

a. Skala Likert
Skala Likert di gunakan untuk mengukur sikap, pendapat, dan resepsi seseorang atau
sekelompok orang tentang fenomena social. Dalam penelitian, fenomena social ini telah di
tetapkan secara spesifik oleh peneliti, yang selanjutnya di sebut sebagai variable penelitian
b. Skala pilihan ganda
Skala ini bentuknya seperti soal bentuk pilihan ganda yaitu suatu pernyataan yang diikuti oleh
sejumlah alternative pendapat.
c. Skala Thurstone
Skala Thurstone merupakan skala sikap yang pertama dikembangkan dalam pengukuran sikap.
Skala ini mempunyai tiga teknik penskalaan sikap, yaitu :
· metode perbandingan pasangan
· metode interval pemunculan sama, dan
· metode interval berurutan.
Ketiga metode ini menggunakan bahan pertimbangan jalur dugaan yang menganggap kepositifan
relatif pernyataan sikap terhadap suatu obyek.
d. Skala Guttman
Skala pengukuran dengan tipe ini, akan di dapat jawaban yang tegas, yaitu ya atau tidak, benar
atau salah, pernah atau tidak, positif atau negative dan lain – lain. Data yang di peroleh dapat
berupa data interval atau rasio dikhotomi (dua alternatif). Jadi kalau pada skala likert terdapat
3,4,5,6,7 interval, dari kata “sangat setuju” sampai “sangat tidak setuju”, maka pada dalam skala
Guttman hanya ada dua interval yaitu “setuju atau tidak setuju”. Penelitian menggunakan sakal
Guttman di lakukan bila ingin mendapatkan jawaban yang tegas terhadap suatu permasalahan
yang di tanyakan. Contoh :
1. Apakah anda setuju dengan kebijakan perusahaan menaikkan harga jual?
a. Setuju b. Tidak Setuju
e. Semantic Deferensial.
Skala pengukuran yang berbentuk Semantic defferensial di kembangkan oleh Osgood. Skala ini
juga di gunakan untuk mengukur sikap, hanya bentuknya tidak pilihan ganda maupun checklist,
tetapi tersusun dalam satu garis kontinum yang jawaban “sangat positifnya” terletak di bagian
kanan garis, dan jawaban yang “sangat negatif” terletak di bagian kiri garis, atau sebaliknya.
Data yang di peroleh adalah daya interval, dan biasanya skala ini di gunakan untuk mengukur
sikap/karakteristik tertentu yang di punyai oleh seseorang.
4. Pengkuran Ranah Psikomotor
Ranah psikomotor berhubungan erat dengan kerjaan otot sehingga menyebabkan geraknya tubuh
atau bagian-bagiannya. Yang termasuk dalam klasifikasi gerak disini mulai dari gerak yang
paling sederhana yaitu melipat kertas sampai dengan merakit suku cadang televisi serta
komputer. Secara mendasar perlu dibedakan antara 2 hal yaitu keterampilan (skills) dan
kemampuan (abilities)
Kebanyakkan para guru tidak menuntut pencapaian 100 dari tujuan yang dirumuskan kecuali
hanya berharap bahwa keterampilan yang dicapai oleh siswa-siswanya akan sangat mendukung
mempelajari keterampilan lanjutan atau gerakan-gerakan yang lebih kompleks sifatnya. Selain
yang telah dikemukakan tersebut, Harrow juga memberikan saran yang mengenai bagaimana
melakukan pengukuran terhadap ranah psikomotor ini. Menurutnya penentuan kriteria untuk
mengukur keterampilan siswa harus dilakukan dalam jangka waktu sekurang-kurangnya 30
menit. Kurang dari waktu tersebut diperkirakan para penilai belum dapat menangkap gambaran
tentang pola keterampilan yang mencerinkan kemampuan siswa.
Bab 12 TABEL SPESIFIKASI
1. Fungsi Tabel Spesifikasi
Fungsi dari tabel spesifikasi ialah untuk menjaga agar tes yang kita susun tidak menyimpang dari
bahan (materi) serta aspek kejiwaan (tingkah laku) yang akan dicakup dalam tes.
Contoh table spesifikasi:
Aspek yang diungkap
Pokok Materi
Ingatan
(I)
Pemahaman
(P)
Aplikasi
(A)
Jumlah
Bagian I
Bagian II
Bagian (terakhir)
…………
…………
…………
…………….
……………..
……………..
………….
………….
………….
………….
…………
…………
Jumlah
………..
…………….
…………..
…………
2. Langkah-Langkah Pembuatan
a. Untuk materi yang seragam
Yang dimaksud “seragam” disini adalah bahwa antara pokok materi yang satu dengan pokok
materi yang lain mempunyai kesamaan dalam imbangan aspek tingkah laku. Misalnya 50%
untuk ingatan, 30% untuk pemahaman, dan 20% untuk aplikasi. Selanjutnya banyaknya butir
soal untuk setiap sel (kotak kecil) diperoleh dengan cara menghitung persentase dari banyaknya
soal bagi tiap pokok materi yang sudah tertulis di kolom paling kanan.Contoh:
Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI
Aspek yang diungkap
Pokok Materi
Ingatan
(50 %)
Pemahaman
(30%)
Aplikasi
(20%)
Jumlah
Latar Belakang Berdirinya Umayyah (20%)
[A]
[B]
[C]
10
Kahalifah-Khalifah Besar Umayyah (30%)
[D]
[E]
[F]
15
Keberhasilan Umayyah (30%)
[G]
[H]
[I]
15
Keruntuhan Umayyah (20%)
[J]
[K]
[L]
10
Jumlah
50
Untuk mengisi/menentukan banyaknya butir soal untuk tiap sel adalah sebagai berikut:
Sel A = 50 % x 10 soal = 5 (5 soal)
Sel B = 30% x 10 soal = 3 (3 soal)
Sel C = 20% x 10 soal = 2 (3 soal)
Untuk memgisi sel-sel yang lain, dilakukan dengan cara yang sama seperti hal nya mengisi sel
A, B, dan C.
Disamping menggunakan cara seperti diatas, dalam menentukan jumlah butir soal untuk tiap-tiap
pokok materi, ada lagi cara lain yang dapat diambil yaitu mulai dari pengisian sel-sel kemudian
baru diperoleh jumlah soal tiap pokok materi.
b. Untuk materi yang tidak seragam
Untuk membuat tabel spesifikasi pokok-pokok materi yang tidak seragam, tidak perlu
mencantumkan angka persentase imbangan tingkah laku di kepala kolom. Pemberian imbangan
dilakukan tiap pokok materi didasarkan atas banyaknya soal untuk pokok materi itu dan
imbangan yang dikehendaki oleh penilaian menurut sifat pokok materi yang
bersangkutan.Contoh:
Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI

Aspek yang diungkap
Pokok Materi
Ingatan
Pemahaman
Aplikasi
Jumlah
Bab I: Daulah Umayyah (30%)
[A]
[B]
[C]
15
Bab II: Daulah Abbasiyah (40%)
[D]
[E]
[F]
20
Bab III: Islam di Asia (30%)
[G]
[H]
[I]
15
Jumlah (100%)
50
Dalam keadaan seperti dicontohkan misalnya: BAB I mayoritas hafalan, BAB II mayoritas
pemahaman, BAB III mayoritas aplikasi. Maka imbangan aspek tingkah laku, tidak dituliskan
pada kepala kolom. Penentuan angka yang menunjukkan banyaknya butir soal pada tiap sel,
ditentukan per BAB. Misalnya: untuk Bab I, Ingatan 60%, pemahaman 20%, aplikasi 20%,
maka:
Sel A = 60% x 15 soal = 9 soal
Sel B = 20% x 15 soal = 3 soal
Sel C = 20% x 15 soal = 3 soal
Untuk Bab II, ingatan 20%, pemahaman 50%, aplikasi 30%, maka:
Sel D = 20% x 20 soal = 4 soal
Sel E = 50% x 20 soal = 10 soal
Sel F = 30% x 20 soal = 6 soal
Untuk Bab III, ingatan 20%, pemahaman 20%, aplikasi 60%, maka:
Sel G = 20% x 15 soal = 3 soal
Sel H = 20% x 15 soal = 3 soal
Sel I = 60% x 15 soal = 9 soal
4) Tidak Lanjut Sesudah Penyususnan Tabel Spesifikasi
Terdapat dua langkah lagi sebagai tindak lanjut sesudah penyususnan tabel spesifikasi untuk
memperoleh seperangkat soal tes yaitu:
a. Menentukan bentuk soal. Ada dua hal yang harus dipertimbangkan dalam menentukan
bentuk soal yaitu waktu yang tersedia dan sifat materi yang diteskan.
b. Menuliskan soal-soal. Langkah terakhir dalam penyusunan tes adalah penulisan soal-soal
tes (item writing). Langkah ini merupakan langkah penting karena kegagalan dalam hal ini dapat
berakibat fatal. Hal-hal yang harus diperhatikan dalam menuliskan soal-soal tes yaitu:
(1) Bahasanya harus sederhana dan mudah dipahami.

(2) Suatu soal tidak boleh mengandung penafsiran ganda/membingungkan.
(3) Cara mengenal kalimat atau meletakkan/menata kata-kata perlu diperhatikan agar tidak
ditafsirkan salah.
(4) Petunjuk mengerjakan. Petunjuk ini harus dituliskan sedemikian rupa sehingga jelas, dan
siswa tidak bekerja menyimpang dri yang dikehendaki guru.
Untuk memperoleh sebuah tes yang standar, harus dilakukan uji coba (try out) berkali-kali
sehingga diperoleh soal-soal yang baik. Dengan mengadakan uji coba terhadap soal-soal tes yang
sudah disusun, maka akan memperoleh manfaat yaitu: pengalaman menggunakan tes tersebut,
mengetahui kesukaran bahasa, mengetahui variasi jawaban siswa, mengetahui waktu yang
dibutuhkan, dan lain-lain.
Bab 13 MENGANALISISS HASIL TES
1. Menilai Tes yang Dibuat Sendiri
Guru yang sudah banyak berpengalaman, mengajar dan menyusun soal-soal tes, juga masih
sukar menyadari bahwa tesnya masih belum sempurna. Oleh karena itu cara yang paling baik
adalah secara jujur melihat hasil yang diperoleh oleh siswa.
Ada 4 cara untuk menilai tes, yaitu:
a. Meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang dapat diperoleh
jawaban tentang ketidak jelasan perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal
tersebut. Pertanyaan-pertanyaan tersebut antara lain:
(1) Apakah banyaknya soal untuk tiap topik sudah seimbang ?
(2) Apakah semua soal menanyakan bahan yang telah diajarkan ?
(3) Apakah soal yang kita susun tidak merupakan pertanyaan yang membingungkan (dapat
disalah tafsirkan)?
(4) Apakah soal itu tidak sukar untuk dimengerti ?
(5) Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ?
b. Mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur Yang
sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes
yang kita susun. Faedah mengadakan analisis soal:
(1) Membantu kita dalam mengidentifikasi butir-butir soal yang jelek.
(2) Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal untuk
kepentingan lebih lanjut.
(3) Memperoleh gambaran secara selintas tentang keadaan yang kita susun.
c. Mengadakan checking validitas. Validitas yang paling penting dari tes buatan Guru adalah
validitas kurikuler.
d. Mengadakan checking reliabilita. Salah satu indikator untuk tes yang

Mempunyai realibilitas yang tinggi adalah bahwa kebanyakan dari soal-soal tes itu mempunyai
daya pembeda yang tinggi.
2. Analisis Butir Soal(Item Analysis)
Analisis butir soal yang dalam bahasa inggris disebut item analiysis dilakukan terhadap
empirik.Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan dan
hasil jawaban terhadap butir-butir soal telah kita peroleh.
Untuk mengetahui kapan soal dikatakan baik, kurang baik, dan soal yang jelek sangat
berhubungan dengan analisis soal, yaitu taraf kesukaran, daya pembeda, dan pola jawaban soal.
a) Taraf Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu
mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal
yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat
untuk mencoba lagi karena di luar jangkauannya.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks kesukaran.
Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Soal yang indeks kesukaran 0,0
menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soalnya
terlalu mudah.
Didalam istilah evaluasi, indeks kesukaran diberi simbol P (proporsi). Rumus mencari P adalah :
P=B
JS
Dimana :
P= indeks kesukaran
B = Banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa peserta tes
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut :
Soal dengan P 1,00 sampai 0,30 adalah soal sukar
Soal dengan P 0,30 sampai 0,70 adalah soal sedang
Soal dengan P 0,70 sampai 1,00 adalah soal mudah
Walaupun demikian ada yang berpendapat bahwa soal – soal yang di anggap baik yaitu soal –
soal sedang, tetapi bukan berarti soal – soal yang terlalu mudah atau terlalu sukar tidak bisa
digunakan, hal ini tergantung dari penggunaannya.
b) Daya Pembeda.
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa yang
berkemampuan tinggi dengan siswa yang berkemampuan rendah.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, indeks
diskriminasi ini sama dengan indeks kesukaran yaitu berkisar antara 0,00 sampai 1,00. Hanya
bedanya, indeks kesukaran tidak mengenal tanda negatif tetapi pada indeks diskriminasi ada
tanda negatif.
Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun siswa bodoh, maka soal itu
tidak baik, demikian pula jika semua siswa, baik pandai maupun bodoh tidak dapat menjawab
dengan benar, soal tersebut tidak baik karena keduanya tidak mempunyai daya pembeda. Soal
yang baik adalah soal yang dapat dijawab oleh siswa pandai saja.
Jika seluruh kelompok atas (pandai) dapat menjawab soal dengan benar, sedang seluruh
kelompok bawah (bodoh) menjawab salah, maka soal tersebut mempunyai diskriminasi paling
besar, yaitu 1,00. Sebaliknya jika semua kelompok atas menjawab salah, tetapi semua kelompok
bawah menjawab betul, maka nilai diskriminasinya adalah -1,00. Tetapi jika siswa kelompok
atas dan siswa kelompok bawah sama-sama menjawab benar atau sama-sama menjawab salah,
maka soal tersebut mempunyai nilai diskriminasi 0,00 karena tidak mempunyai daya pembeda
sama sekali.
Rumus mencari nilai Diskriminasi adalah :
D = BA/JA – BB/JB = PA – PB
Dimana :
J = jumlah peserta tes
JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah

BA = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar
BB BA/JA = banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar.
PA = BB/JB = proporsi peserta kelompok atas yang menjawab benar ( P sebagai indeks
kesukaran).
PB = proporsi peserta kelompok bawah yang menjawab benar
c) Pola Jawaban Soal
Pola jawaban yang dimaksud adalah distribusi testee dalam hal menentukan pilihan jawaban
pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan menghitung banyaknya
testee yang memilih pilihan jawaban a, b, c, atau d atau yang tidak memilih pilihan manapun.
Dari pola jawaban soal dapat ditentukan apakah pengecoh (distractor) berfungsi sebagai
pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh testee berarti
bahwa pengecoh itu jelek, sebaliknya sebuah distraktor dapat dikatakan berfungsi dengan baik
apabila distraktor tersebut mempunyai daya tarik yang besar bagi pengikut – pengikut tes yang
kurang memahami konsep atau kurang menguasai bahan.
Dengan melihat pola jawaban soal, dapat diketahui :
a. Taraf kesukaran soal
b. Daya pembeda soal
c. Baik dan tidaknya distraktor

Kekurangan suatu soal mungkin hanya terletak pada rumusan kalimatnya sehingga hanya perlu
ditulis kembali, dengan perubahan seperlunya.
Bab 14 MENSKOR DAN MENILAI
1. Menskor
Sementara orang berpendapat bahwa bagian yang paling penting dari pekerjaan pengukuran
dengan tes adalah penyusunan tes. Jika alat tesnya sudah disusun sebaik-baiknya maka
anggapannya sudah tercapailah sebagian besar dari maksudnya. Tentu saja anggapan itu tidak
benar sama sekali. Penyusunan tes baru merupakan satu bagian dari serentetan pekerjaan
mengetes.
Di samping penyusunan dan pelaksanaan tes itu sendiri, menskor dan menilai merupakan
pekerjaan yang menuntut ketekunan yang luar biasa dari penilai, ditambah dengan kebijaksanan-
kebijaksanaan tertentu. Nama lain menskor adalah memberi angka.
Dalam hal pekerjaan menskor atau menentukan angka, dapat digunakan 3 macam alat bantu
yaitu:
a. Pembantu menentukan jawaban yang benar, disebut kunci jawaban.
b. Pembantu menyeleksi jawaban yang benar dan yang salah, disebut kunci scoring.
c. Pembantu menentukan angka, disebut pedoman penilaian.
Keterangan dan pengunaannya dalam berbagai bentuk tes.

(1) Kunci jawaban dan kunci pemberian skor untuk tes bentuk betul-salah.
Untuk tes bentuk betul-salah (true-false) yang dimaksud dengan kunci jawaban adalah deretan
jawaban yang kita persiapkan untuk pertanyaan atau soal-soal yang kita susun, sedangkan kunci
scoring adalah alat yang kita gunakan untuk mempercepat pekerjaan scoring.
Oleh karena dalam hal ini testee (tercoba) hanya diminta melingkari huruf B atau S maka kunci
jawaban yang disediakan hanya berbentuk urutan nomor serta huruf dimana kita menghendaki
untuk melingkari (atau dapat juga diberi tanda X).
Ada baiknya jika kunci jawaban ini ditentukan terlebih dahulu sebelum menyusun soalnya agar:
üdapat diketahui imbangan antara jawaban B dan S.
üdapat diketahui letak atau pola jawaban B dan S.
Bentuk betul-salah sebaiknya disusun sedemikian rupa sehingga jumlah jawaban B hampir sama
banyaknya dengan jawaban S, dan tidak dapat ditebak karena tidak diketahui pola jawabannya.
Dalam menentukan angka (skor) untuk tes bentuk B-S ini kita dapat menggunakan 2 cara yaitu:
ü Tanpa hukuman atau tanpa denda.
ü Dengan hukuman atau dengan denda.
(2) Kunci jawaban dan kunci pemberian skor untuk tes bentuk pilihan ganda (multiple choice)
Dengan tes bentuk pilihan ganda, testee diminta melingkari salah satu huruf di depan pilihan
jawaban yang disediakan atau membubuhkan tanda lingkaran atau tanda silang (x) pada tempat
yang sesuai di lembar jawaban.
(3) Kunci jawaban dan kunci pemberian skor untuk tes bentuk jawab singkat (sort answer test)
Tes bentuk jawab singkat adalah bentuk tes yang menghendaki jawaban berbentuk kata atau
kalimat pendek. Melihat namanya, maka jawaban untuk tes tersebut tidak boleh berbentuk
kalimat-kalimat panjang, tetapi harus sesingkat mungkin dan mengandung satu pengertian.
Dengan persyaratan inilah maka bentuk tes ini dapat digolongkan ke dalam bentuk tes objektif.
Kunci jawaban tes bentuk ini merupakan deretan jawaban sesuain dengan nomornya.
Dengan mengingat jawaban yang hanya satu pengertian saja, maka angka bagi tiap nomor soal
mudah ditebak. Usaha yang dikeluarkan siswa sedikit, tetapi lebih sulit daripada tes bentuk
betul-salah atau bentuk pilihan ganda. Sebaiknya setiap soal diberi angka 2. Dapat juga angka itu
kita samakan dengan angka pada bentuk betul-salah atau pilihan ganda jika memang jawaban
yang diharapkannya ringan atau mudah. Tetapi sebaliknya apabila jawabannya bervariasi
misalnya lengkap sekali, lengkap dan kurang lengkap, maka angka-angkanya dapat dibuat
bervariasi pula misalnya 2; 1,5; dan 1.
(4) Kunci jawaban dan kunci pemberian skor untuk tes bentuk menjodohkan (matching)
Pada dasarnya tes bentuk menjodohkan adalah tes bentuk pilihan ganda, dimana jawaban-
jawabannya dijadikan satu, demikian pertanyaan-pertanyaannya. Dengan demikian, maka pilihan
jawabannya akan lebih banyak. Satu kesulitan lagi adalah bahwa jawaban yang dipililh dibuat
sedemikian rupa sehingga jawaban yang satu tidak diperlukan lagi bagi pertanyaan lain.
Kunci jawaban tes bentuk menjodohkan dapat berbentuk deretan jawaban yang dikehendaki atau
deretan nomor yang diikuti oleh huruf-huruf yang terdapat di depan alternative jawaban.
Telah dijelaskan bahwa tes bentuk menjodohkan adalah tes bentuk pilihan ganda yang lebih
kompleks. Maka angka yang diberikan sebagai imbalan juga harus lebih banyak. Sebagai ancar-
ancar dapat ditentukan bahwa angka untuk tiap nomor adalah 2 (dua).
(5) Kunci jawaban dan kunci pemberian skor untuk tes bentuk uraian (essay test)
Sebelum menyusun sebuah tes uraian sebaiknya kita tentukan terlebih dahulu pokok-pokok
jawaban yang kita kehendaki. Dengan demikian, maka akan mempermudah kita dalam pekerjaan
mengkoreksi tes itu.
Tidak ada jawaban yang pasti terhadap tes bentuk uraian ini. Jawaban yang kita peroleh akan
sangat beraneka ragam, berada dari siswa satu ke siswa lain. Untuk menetukan standar terlebih
dahulu, tentulah sukar. Berikut adalah saran langkah-langkah apa yang harus kita lakukan pada
waktu kita mengoreksi dan member angka tes bentuk uraian:
a) Membaca soal pertama dari seluruh siswa untuk mengetahui situasi jawaban. Dengan
membaca seluruh jawaban, kita dapat memperoleh gambaran lengkap tidaknya jawaban yang
diberikan siswa secara keseluruhan.
b) Menentukan angka untuk soal pertama tersebut. Misalnya jika jawabannya lengkap diberi
angka 5, kurang sedikit diberi angka 4, begitu seterusnya sampai kepada jawaban yang paling
minim jika jawabannya meleset sama sekali. Dalam menentukan angka pada hal yang terakhir ini
umumnya kita perlu berpikir bahwa tidak ada unsur tebakan. Dengan demikian maka ada dua
pendapat, satu pendapat menentukan angka 1 atau 2 bagi jawaban yang salah, tetapi pendapat
lain menentukan 0 untuk jawaban itu. Tentu saja bagi jawaban yang kosong (tidak ada jawaban
sama sekali), jelas kita berikan angka 0.
c) Memberikan angka bagi soal pertama.
d) Membaca soal kedua dari seluruh siswa untuk mengetahui situasi jawaban, dilanjutkan
dengan pemberian angka untuk soal kedua.
e) Mengulangi langkah-langkah tersebut bagi soal-soal tes ketiga, keempat dan seterusnya
hingga seluruh soal diberi angka.
f) Menjumlahkan angka-angka yang diperoleh oleh masing-masing siswa untuk tes bentuk
uraian.
Setelah mempelajari langkah-langkah tersebut kita tahu bahwa dengan membaca terlebih dahulu
seluruh jawaban yang duberikan oleh siswa, kita menjadi tahu bahwa mungkin tidah ada seorang
pun dari siswa yang menjawab dengan betul untuk sesuatu nomor soal.
Menghadapi situasi seperti ini, kita gunakan cara pemberian angka yang relative. Misalnya untuk
satu nomor soal jawaban yang paling lengkap hanya mengandung 3 unsur, padahal kita
menghendaki 5 unsur, maka kepada jawaban yang paling lengkap itulah kita berikan angka 5,
sedangkan untuk menjawab hanya 2 atau 1 unsur, kita beri angka sedikit, yaitu misalnya 3,4; 2;
1,5.
(6) Kunci jawaban dan kunci pemberian skor untuk tugas
Kunci jawaban untuk memeriksa tugas merupakan poko-pokok yang harus termuat di dalam
pekerjaan siswa. Hal ini menyangkut criteria tentang isi tugas. Namun sebagai kelengkapan
dalam pemberian skor, digunakan suatu tolok ukur tertentu. Tolok ukur yang disarankan sebagai
ukuran keberhasilan tugas adalah:
a) Ketepatan waktu penyerahan tugas.
b) Bentuk fisik pengerjaan tugas yang menandakan keseriusan mahasiswa dalam mengenakan
tugas.
c) Sistematika yang menunjukkan alur keruntutan pikiran.

d) Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi.
e) Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah ditentukan oleh
dosen.
2. Perbedaan Antara Skor dan Nilai
Apa yang terjadi selama ini, banyak di antara para guru sendiri yang masih mencampuradukkan
antara dua pengertian yaitu skor dan nilai.Skor : adalah hasil pekerjaan menskor yang diperoleh
dengan menjumlahkan angka-angka bagi setiap soal tes yang dijawab betul oleh siswa.Nilai :
adalah angka ubahan dari skor dengan menggunakan acuan tertentu, yakni acuan normal atau
acuan standar.Secara rinci skor dapat dibedakan atas tiga macam, yaitu skor yang diperoleh
(obtained score), skor sebenarnya (true score), dan skor kesalahan (error score).
Score yang diperoleh adalah sejumlah biji yang dimiliki oleh testee sebagai hasil mengerjakan
tes. Kelemaham-kelemahan butir tes, situasi yang tidak mendukung, kecemasan dan lain-lain
factor dapat berakibat terhadap skor yang diperoleh ini. Apabila factor yang berpengaruh ini
muncul, baik sebagian atauppun menyeluruh, penilai tidak dapat mengira-ngira seberapa cermat
skor yang diperoleh siswa ini mampu mencerminkan pengetahuan dan keterampilan siswa yang
sesungguhnya.
Skor sebenarnya (true score) sering kali juga disebut dengan istilah skor univers = skor alam
(universe score), adalah nilai hipotesis yang sangat tergantung dari perbedaan individu berkenaan
dengan pengetahuan yang dimiliki secara tetap.
Perbedaan antara skor yang diperoleh dengan skor yang sebenarnya, disebut dengan istilah
kesalahan dalam pengukuran atau kesalahan skor, atau dibalik skor kesalahan. Hubungan antara
ketiga macam skor tersebut adalah sebagai berikut:
Skor yang diperoleh = skor sebenarnya = skor kesalahan

3. Norm ReferenceddanCriterion Referenced
Dalam penggunaan Norm – Referenced, prestasi belajar seorang siswa dibandingkan dengan
siswalain dalam kelompoknya. Kualitas seseorang sangat dipengaruhi oleh kualitas
kelompoknya. Dasar pikiran dari penggunaan standar ini adalah adanya asumsi bahwa disetiap
populasi yang heterogen tentu terdapat kelomouk baik, kelompok sedang, dan kelompok kurang.
Apabila standar mutlak dan standar relatif ini dihubungkan dengan pengubahab skor menjadi
nilai, maka akan terlihat demikian.
a. Dengan standar mutlak
(1) Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan yang
ditentukan.
(2) Nilai diperoleh dengan mencari skor rata-rata langsung dari skor asal (skor mentah). Contoh
:
ü dari ulangan ke-1, memperoleh skor 60 (mencapai 60 % tujuan)
maka nilai siswa tersebut : 60 + 80 + 50 = 63,3. Dibulatkan 63.

b. Dengan standar relatif
(1) pemberian skor terhadap siswa juga didasakan atas pencapaian siswa terhadap tujuan yang
ditentukan
(2) nilai diperoleh dengan 2 cara :
Ø mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya
Ø menjumlah skor tiap-tiap ulangan, baru diubah ke nilai
Bab 15 MENGOLAH NILAI
1. Beberapa Skala Penilaian
a. Skala Bebas
Skala bebas yaitu skala yang tidak tetap, ada kalanya skor tertinggi 20, lain kali lagi 50. Ini
semua tergantung dari banyak dan bentuk soal. Jadi, angka tertinggi dari skala yang di gunakan
tidak selalu sama.
b. Skala 1-10
Dalam skala 1-10, guru jarang memberikan angka pecahan, misalnya 5,5. Angka 5,5 tersebut di
bulatkan menjadi 6. Dengan menggunakan skala 1-10 maka bilangan bulat yang ada masih
menunjukan penilaian yang agak kasar.
c. Skala 1-100
Penilaian dengan menggunakan skala 1-100, di mungkinkan melakukan penilaian yang lebih
halus karena terdapat 100 bilangan bulat. Nilai 5,5 dalam skala 1-10 yang biasanya di bulatkan
menjadi 6, dalam skala 1-100 ini boleh di tuliskan dengan 55.
d. Skala huruf
Selain menggunakan angka, pemberian nilai dapat di lakukan dengan huruf A,B,C,D,dan E.
Huruf tidak menunjukan kuantitas, tetapi dapat di gunakan sebagai symbol untuk
menggambarkan kualitas.
2. Distribusi Nilai
a. Distribusi nilai berdasarkan standar mutlak
Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan yang
ditentukan. Nilai diperoleh dengan mencari skor rata-rata langsung dari skor asal (mentah).
Apabila soal-soal ulangan yang dibuat oleh guru sangat mudah, sebagian besar siswa akan dapat
berhasil mengerjakan soal-soal itu, dan tingkat pencapaiannya tinggi.sebagian besar siswa akan
memiliki nilai sekitar 8, 9 atau 10 apabila telah diubah ke skala 10, sebaliknya apabila soal-soal
tes yang disusun oleh guru termasuk soal sukar, maka pencapaian siswa akan sebaliknya pula.
Sebagian besar siswa akan memiliki nilai 3, 4 bahkan mungkin 2 atau 1. Hanya beberapa orang
siswa yang istimewa saja yang memiliki nilai 6, dan mungkin tidak ada yanig memiliki nilai 7
ke atas. Namun demikian dengan standar mutlak ini mungkin pula diperoleh gambar kurva
normal jika soal-soal tes disusun oleh guru dengan tepat seperti gambaran kecakapan siswa-
siswanya.
b. Distribusi nilai berdasarkan standar relative

Pemberian skor terhadap siswa juga didasarkan atas pencapaian siswa terhadap tujuan yang
ditentukan.Nilai diperoleh dengan 2 cara:
§ Mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya.
§ Menjumlah skor tiap-tiap ulangan, baru diubah ke nilai.
Telah diterangkan, bahwa dalam menggunakan standar relative atau norm refrenced, kedudukan
seseorang sealu dibandingkan dengan kawan-kawannya dalam kelompok. Dalam hal ini tanpa
menghiraukan apakah distribusi skor terletak dalam kurva juring positif atau juring negative,
tetapai dalam norm refrenced selalu tergambar dalam kurva normal. Hal ini didasarkan atas
asumsi bahw apabila distribusi skor tergambar dalam kurva juring positif, yang kurang sempurna
adalah soal-soal tesnya, yaitu terlalu sukar. Dengan demikian, nilai siswa lalu direntangkan
sedemikian rupa sehingga tersebar dari nilai tinggi ke nilai rendah, dengan sebagian terbesar
terletak pada nilai sedang. Demikian pula sebaliknya apabila skor siswa tergambar dalam kurva
juring negative. Dalam ubahan menjadi nilai, disebar sedemikian rupa sehingga kurva normal,
dengan nilai sedang adalah nilai yang paling banyak.
3. Standar Nilai
a. Nilai standar berskala Sembilan (stannine), yaitu rentangan atau skala nilai yang bergerak
mulai dari 1 sampai dengan 9,[7] seperti berikut ini:
Staines
Interpretasi
9 (4%)
Tinggi (4%)
8 (7%)
7 (12%)
Diatas rata-rata (19%)
6 (17%)
5 (20%)
4 (17%)
Rata-rata (54%)
3 (12%)
2 (7%)
Dibawah rata-rata (19%)
1 (4%)
Rendah (4%)
Misalnya kita memiliki skor-skor seperti disebutkan dalam hasil ulangan IPS kelas V, dengan
mudah dapat kita tentukan 4% dari siswa yang mendapat nilai 9, selanjutnya 7% mendapat nilai
8, 12% mendapat nilai 7, 17% mendapat nilai 6, dan seterusnya.
b. Nilai standar berskala sebelas (standar eleven/ stanel= eleven points scale), yaitu skala nilai
yang bergerak mulai dari nilai 0 sampai dengan nilai 10,[9] yang dikembangkan oleh Fakultas
Ilmu Pendidikan UGM disesuaikan dengan system penilaian di Indonesia. Dengan stanel ini,
system penilaian membagi skala menjadi 11 golongan, yaitu angka-angka 0, 1, 2, 3, 4, 5, 6, 7, 8,
9, 10, yang satu sama lain berjarak sama. Tiap-tiap angka menempati jarak antara
c. Standar sepuluh. Didalam Buku Pedoman Penilaian (Buku III B Seri Kurikulum SMA
Tahun 1975) ditentukan bahwa untuk mengolah hasil tes, digunakan standar relative, dengan
nilai berskala 1 – 10. Untuk mengubah skor menjadi nilai, diperlukan dahulu:
Ø Mean (rata-rata skor)
Ø Deviasi Standar (Simpangan Baku)
Ø Tabel Konversi angka ke dalam nilai berskala 1 – 10

Tahap-tahap yang dilalui dalam mengubah skor mentah menjadi nilai berskala 1 – 10 adalah
sebagai berikut:
v Menyusun distribusi frekuensi dari angka-angka atau skor-skor mentah
v Menghitung rata-rata skor (mean)
v Menghitung deviasi standar
v Mentransformasi (mengubah) angka-angka mentah ke dalam nilai berskala 1 – 10
Bab 16 KEDUDUKAN SISWA DALAM KELOMPOK
1. Pengertian
Pengertian yang dimaksud kedudukan siswa dalam kelompoknya adalah letak seorang siswa di
dalam urutan tingkatan, dalam istilah disebut rangking. Untuk dapat diketahui rangking dari
siswa di suatu kelas maka harus diadakan pengurutan nilai siswa tersebut dari yang paling atas
sampai ke nilai yang paling bawah.
2. Cara-cara menentukan kedudukan siswa:
a. Dengan rangking sederhana( simple rank) adalah urutan yang menunjukkan letak atau
kedudukan seseorang dalam kelompoknya dan dinyatakan dengan nomor atau angka biasa.
b. Dengan rangking presentase (percentile rank) adalah kedudukan seseorang dalam

kelompok, yang menunjukkan banyaknya persentase yang berada di bawahnya
c. Standar Deviasi adalah penentuan kedudukan dengan membagi kelas atas kelompok-
kelompok. Tiap kelompok dibatasi oleh suatu standar deviasi tertentu.
d. Standard score atau z-score adalah angka yang menunjukkan perbandingan perbedaan
score seseorang dari mean dengan standar deviasinya untuk menentukan z-score, harus
diketahui:
Ø Rata-rata skor dari kelompok.
Ø Standar deviasi dari skor-skor tersebut
Pengetrapan dari z-score ini banyak digunakan di dalam menentukan kejuaraan seseorang
apabila kebetuan jumlah nilainya sama
Kedudukan seseorang dalam sebuah kelas sangat penting karena dengan begitu peserta didik
akan tahu berapa rangking yang telah dicapainya, jika mendapat rangking yang bagus maka dia
akan merasa bangga dengan hasil yang diperoleh atas usaha yang telah dilakukan selama ini
dalam proses belajar mengajar, sedang apabila rangkingnya jelek maka peserta didik akan lebih
termotivasi untuk memperbaiki dirinya. Dalam bab ini telah dijelaskan bagaimana cara
menentukan kedudukan siswa melalui beberapa standar yang lazim digunakan.
Bab 17 MENCARI NILAI AKHIR
1. Fungsi Nilai Akhir
a. Fungsi intruksional bertujuan untuk memberikan suatu balikan yang mencerminkan

seberapa jauh seorang siswa telah mencapai tujuan yang ditetapkan dalam pengajaran atau
system intruksional.
b. Fungsi informatif bertujuan untuk memberikan nilai siswa kepada orang tuanya
mempunyai arti bahwa orang tua siswa tersebut menjadi tahu akan kemajuan dan prestasi
putranya di sekolah.
c. Fungsi bimbingan bertujuan untuk mengetahui bagian-bagian mana dari usaha siswa di
sekolah yang masih memerlukan bantuan.
d. Fungsi administratif:
Ø Menentukan kenaikan dan kelulusan siswa
Ø Memindahkan atau menempatkan siswa
Ø Memberikan beasiswa
Ø Memberikan rekomendasi untuk melanjutkan belajar
Ø Memberi gambaran tentang prestasi siswa atau lulusan kepada calon pemakai tenaga kerja.
2. Faktor-faktor yang mempengaruhi penilaian:
a. Prestasi/ pencapaian (achievement)
b. Usaha (effort)
c. Aspek pribadi dan social (personal and social characteristics)
d. Kebiasaan bekerja (working habits).
3. Cara menentukan nilai akhir:
a. Untuk memperoleh nilai akhir, perlu diperhitungkan nilai tes formatif dan tes sumatif.
b. Nilai akhir diperoleh dari nilai tugas, nilai ulangan harian, dan nilai ulangan umum
dengan bobot 2,3,dan 5.
c. Nilai akhir untuk STTB diperoleh dari rata-rata nilai ulangan harian (diberi bobot satu)
dan nilai EBTA (diberi bobot dua), kemudian dibagi 3.
Bab 18 MEMBUAT LAPORAN
1. Pentingnya Laporan
Laporan biasanya dibuat oleh seorang guru dibuat pada akhir semester, dibuatnya laporan ini
diperlukan untuk mengetahui hasil akhir dari apa yang dilakukan oleh siswa-siswi serta
diperlukan agar guru dapat mengetahui tingkat keberhasilannya dalam mengajar sudah berhasil
atau belum jika belum maka guru akan meninjau kembali metodenya dalam mengajar.Secara
sistematis dapat dikemukakan disini bahwa laporan tentang siswa bermanfaat bagi beberapa
pihak yaitu sebagai berikut:
a) Siswa sendiri, secara alamiah setiap orang selalu ingin tahu akibat dari apa yang telah
mereka lakukan, dengan mengetahui hasil yang positif dari perbuatannya, maka pengetahuan
yang diperoleh akan dikuatkan dan jika siswa mendapat informasi bahwa jawwabannya salah,
maka lain kali ia tidak akan menjawab seperti itu lagi.
b) Guru yang mengajar akan mengetahui catatan laporan kemajuan siswa.
c) Guru lain, maka guru yang akan mengganti mengajar akan tahu bagaimana meladeni atau
memperlakukan siswa.
d) Petugas lain disekolah.
e) Orang tua akan mengetahui kemajuan anak dari hari ke hari.
f) Pemakai lulusan, laporan pendidikan menunjukkan bahwa seseorang telah memiliki

pengetahuan dan ketrampilan tertentu. Digunakan untuk mencari pekerjaan dan mencari
kelanjutan studi.
2. Macam dan Cara Membuat Laporan
ü Catatan lengkap.
ü Catatan tidak lengkap.
ü Lulus-belum lulus.
ü Nilai siswa.
Bab 19 EVALUASI PROGRAM PENGAJARAN

1. Apakah Evaluasi Program Itu?
Evaluasi merupakan suatu kegiatan yang bertujuan untuk menentukan apakah target progam
yang disusun sudah tercapai dengan begitu maka akan diketahui bagaimana kualitas mengajar
seorang guru apakah sudah efektif atau belum berdasarkan tingkat pencapaian yang sudah
dicapai.
Evaluasi progam merupakan suatu rangkaian kegiatan yang dilakukan dengan sengaja untuk
melihat tingkat keberhasilan progam. Untuk menentukan seberapa jauh target progam sudah
tercapai, yang dijadikan tolak ukur adalah tujuan yang sudah dirumuskan dalam tahap
perencanaan kegiatan.
Pentingnya evaluasi progam yaitu agar guru mengetahui betul apa yang terjadi di dalam proses
belajar-mengajar, guru berkepentingan atas kualitas pengajaran. Untuk memperbaiki proses
pengajaran yang akan dilaksanakan lain waktu, guru perlu mengetahui seberapa tinggi tingkat
pencapaian dari tugas yang telah dikerjakan selama kurun waktu tertentu.
2. Objek atau sasaran evaluasi progam.
Ø Input(masukan)
Ø Materi atau kurikulum.
Ø Guru.
Ø Metode atau pendekatan dalam mengajar.
Ø Sarana: alat pelajaran atau media pendidikan.

Ø Lingkungan manusia.
Ø Lingkungan bukan manusia.
3. Cara melaksanakan evaluasi progam.
Apabila guru ingin melakukan evaluasi progam dengan lebih seksama, terlebih dahulu
harus menyusun rencana evaluasi sekaligus menyusun instrument pengumpulan data. Mengenai
bagaimana menyiapkan instrumen untuk angket, pedoman wawancar, pedoman pengamatan
dapat dipelajari dari buku-buku penelitian. Sebagai cara yang paling sederhana adalah
mengadakan pencatatan terhadap peristiwa yang dialami dari kegiatan sehari-hari di kelas.

Resume Buku Evaluasi PAI Prof Dr. Suhars

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Resume Buku Evaluasi PAI Prof Dr. Suhars

Diunggah oleh

Hak Cipta:

Format Tersedia

Resume Buku Evaluasi PAI Prof. Dr.

25 Tuesday Jun 2013

Posted by Syarifah, M. Pd. I in Evaluasi PAI

1. Pengertian Pengukuran, Penilaian dan Evaluasi

Mengukur adalah membandingkan sesuatu dengan satu ukuran. Pengukuran bersifat

a. Makna Bagi siswa

b. Makna bagi guru

c. Makna Bagi Sekolah

2). Akan ada informasi tentang tepat tidaknya kurikulum sekolah.

4. Tujuan atau Fungsi Penilaian

a. Penilaian berfungsi selektif.

c. Penilaian berfungsi sebagai penempatan

d. Penilaian berfungsi sebagai pengukur keberhasilan.

5. Ciri-Ciri Penilaian dalam Pendidikan

Ciri-ciri penilaian antara lain sebagai berikut:

e. Ciri kelima bahwa dalam penilaian pendidikan sering terjadi kesalahan-kesalahan.

c). Adanya Hello-effect, yakni adanya kesan penilai terhadap siswa.

d). adanya pengaruh dari hasil sebelumnya.

3). Terletak pada anak yang dinilai.

b). keadaan fisik ketika siswa sedang dinilai.

c). nasib siswa kadang-kadang mempunyai peranan terhadap hasil penilaian.

4). Terletak pada situasi dimana penilaian berlangsung

Bab 2 Subjek dan sasaran Evaluasi

· Metode dan cara penilaian

Bab 3 PRINSIP DAN ALAT EVALUASI

a. Hubungan antara tujuan dengan KBM

b. Hubungan antara tujuan dengan evaluasi

c. Hubungan antara KBM dengan evaluasi

a. Teknik Non Tes

Ada beberapa teknik non-tes yaitu:

a) Ditinjau dari siapa yang menjawab, maka ada :

b) Ditinjau dari segi cara menjawab maka dibedakan atas:

Ø Observasi eksperimental terjadi jika pengamat tidak berpartisipasi dalam kelompok

Dalam buku “Encyclopedia of Educational Evaluation”, diterangkan “Test is comprehensive

Ø Merupakan penguatan (reinforcement) bagi siswa.

Ø Manfaat bagi guru

ü Apakah program tersebut membutuhkan pengetahuan-pengetahuan prasyarat yang belum

Manfaat tes sumatif, ialah:

v Untuk menentukan nilai.

3. Perbandingan antara Tes Diagnostik, Formatif, dan Sumatif

Dalam membandingkan, akan ditinjau dari 9 aspek, yaitu :

a. Ditinjau dari fungsinya

· Menentukan apakah bahan prasyarat telah dikuasai atau belum.

· Menentukan tingkat penguasaan siswa terhadap bahan yang dipelajari.

b. Ditinjau dari waktu

o Pada waktu penyaringan calon siswa

o Pada waktu membagi kelas atau permulaan memberikan pelajaran.

o Selama pelajaran berlangsung bila guru akan memberikan bantuan siswa.

c. Ditinjau dari titik berat penilaian

Ø Tingkah laku kognitif, afektif, dan psikomotor.

Ø Faktor-faktor fisik, psikologis, dan lingkungan.

2) Tes formatif. Menekankan pada tingkah laku kognitif.

d. Ditinjau dari alat evaluasi

Ø Tes prestasi belajar yang sudah distandarisasikan.

Ø Tes diagnostik yang sudah distandarisasikan.

Ø Pengamatan dan daftar cocok.

Tes prestasi belajar yang tersusun secara baik.

Tes ujian akhir.

e. Ditinjau dari cara memilih tujuan yang dievaluasi

Ø Memilih tiap-tiap keterampilan prasyarat.

Ø Memilih tujuan setiap program pelajaran secara berimbang.

Mengukur tujuan instruksional umum.

f. Ditinjau dari tingkat kesulitan tes