CBR Pap - Tera Andriani Gurusinga - 4201121028 - PSPF20C

CRITICAL BOOK REVIEW
MK.PENGUKURAN DAN
ASSESMENT PEMB.FISIKA
PRODI S1 PENDIDIKAN FISIKA
FMIPA-UNIMED
Skor Nilai:
SCIENCE FORMATIF ASSESMENT
NAMA MAHASISWA : TERA ANDRIANI GURUSINGA

NIM : 4201121028
KELAS : PSPF C 2020
DOSEN PENGAMPU : Drs.ABUBAKAR
MATA KULIAH : PENGUKURAN DAN ASSESMENT
PROGRAM STUDI PENDIDIKAN FISIKA

FAKULTAS MATEMATIKA DAN PENGETAHUAN ALAM
UNIVERSITAS NEGERI MEDAN
APRIL 2022
i
EXECUTIVE SUMMARY
Penilaian merupakan suatu kegiatan untuk memberikan berbagai informasi

secara berkesinambungan dan menyeluruh tentang proses dan hasil yang telah dicapai
siswa. Kata “menyeluruh” mengandung arti bahwa penilaian mencakup aspek
pengetahuan, keterampilan, sikap, dan nilai-nilai. Sehingga, penilaian berfungsi sebagai
suatu proses yang sistematis dari pengumpulan, analisis, dan interpretasi informasi
atau data dalam menentukan sejauh mana peserta didik telah mencapai tujuan
pembelajaran. Hasil penilaian tidak identik dengan hasil kognitif saja, namun juga
keterampilan-keterampilan yang menunjang pembelajaran dari siswa. Penggunaan
instrumen yang tepat akan memberikan hasil penilaian yang maksimal.
ii
KATA PENGANTAR
Pertama-tama penulis ucapkan rasa syukur kami kepada Tuhan Yang Maha Esa
yang telah memberikan kemudahan sehingga penulis dapat menyelesaikan Critical Book
Review ini dengan waktu yang telah ditetapkan. Critical Book Review ini disusun untuk
memenuhi sebagian tugas mata kuliah Pengukuran dan Asesmen Pembelajaran Fisika.
Penulis mengucapkan terimakasih kepada Bapak selaku dosen pengampu mata kuliah
Pengukuran dan Asesmen Pembelajaran Fisika, yang telah membimbing penulis,
sehingga kami dapat menyelesaikan tugas Critical Book Review yang berjudul
“Pengembangan Instrumen, Kisi-kisi dan Rubrik Instrumen Penilaian”.
Dalam penulisan Critical Book Review ini, penulis menyadari masih banyak
kekurangan- kekurangan, baik dalam konteks penulisan. Oleh karena itu, kritik dan
saran sangat penulis harapkan demi penyempurnaan makalah ini. Tak lupa, penulis juga
menyampaikan ucapan terima kasih kepada semua pihak yang telah membantu penulis
dalam proses penyusunan Critical Book Review ini. Akhirnya, penulis berharap semoga
makalah ini dapat bermanfaat khususnya penulis dan bagi para pembaca. Atas
perhatian nya penulis mengucapkan terima kasih .
Medan, 6 Maret 2022
Tera Andriani Gurusinga
iii
DAFTAR ISI
EXECUTIVE SUMMARY ............................................................................................................................. i

KATA PENGANTAR ..................................................................................................................................iii
DAFTAR ISI ..............................................................................................................................................iv
BAB I........................................................................................................................................................ 1
PENDAHULUAN ....................................................................................................................................... 1
1.1 Rasionalisasi Pentingnya CBR ................................................................................................... 1
1.2 Tujuan Penulisan CBR................................................................................................................ 2
1.3 Manfaat CBR ............................................................................................................................... 2
1.4. Identitas Buku yang Direview ...................................................................................................... 2
BAB II....................................................................................................................................................... 3
RINGKASAN ISI BUKU .............................................................................................................................. 3
2.1 Buku Utama .................................................................................................................................. 3
2.2. Buku Kedua .................................................................................................................................. 7
2.3. Buku Ketiga ................................................................................................................................ 15
BAB III.................................................................................................................................................... 21
PEMBAHASAN ....................................................................................................................................... 21
1.1. Pembahasan Isi Buku .............................................................................................................. 21
1.2. Kelebihan dan Kekurangan Buku........................................................................................... 22
BAB IV ................................................................................................................................................... 23
PENUTUP .............................................................................................................................................. 23
4.1. Kesimpulan ................................................................................................................................ 23
4.2. Rekomendasi ............................................................................................................................. 23
DAFTAR PUSTAKA ................................................................................................................................. 24
iv
BAB I
PENDAHULUAN
1.1 Rasionalisasi Pentingnya CBR

Dalam Permendiknas No 16 Tahun 2007 tentang Kualifikasi Akademik dan
Standar Kompetensi Guru dinyatakan bahwa salah satu kompetensi inti guru adalah
menyelenggarakan penilaian dan evaluasi proses dan hasil belajar. Kompetensi inti
tersebut dijabarkan dalam tujuh kompetensi, yaitu: 1) memahami prinsip-prinsip
penilaian dan evaluasi proses dan hasil belajar sesuai dengan karakteristik mata
pelajaran yang diampu, 2) menentukan aspek-aspek proses dan hasil belajar yang
penting untuk dinilai dan dievaluasi sesuai dengan karakteristik mata pelajaran yang
diampu, 3) menentukan prosedur penilaian dan evaluasi proses dan hasil belajar, 4)
mengembangkan instrumen penilaian dan evaluasi proses dan hasil belajar, 5)
mengadministrasikan penilaian proses dan hasil belajar secara berkesinambungan
dengan mengunakan berbagai instrumen, 6) menganalisis hasil penilaian proses dan
hasil belajar untuk berbagai tujuan, dan 7) melakukan evaluasi proses dan hasil belajar.
Memperhatikan tuntutan kompetensi guru pada Permendiknas di atas, dapat
diketahui bahwa salah satu kompetensi yang harus dimiliki guru adalah menguasai
teknik evaluasi dalam proses dan hasil belajar. Kompetensi ini tidak terpisah dengan
kompetensi lainnya. Penguasaan teknik evaluasi dengan baik juga mutlak diperlukan
guru. Dengan penguasaan teknik evaluasi, guru dapat melakukan penilaian dengan
benar terhadap proses dan hasil belajar mengajar. Di dalam kenyataan beberapa hal
yang menjadi ciri praktik pendidikan di Indonesia selama ini adalah pembelajaran
berpusat pada guru. Guru menyampaikan pelajaran dengan menggunakan metode
cramah atau ekspositori sementara para siswa mencatat pada buku catatan. Pengajaran
dianggap sebagai proses penyampaian fakta-fakta kepada para siswa. Siswa dianggap
berhasil dalam belajar apabila mampu mengingat banyak fakta, dan mampu
menyampaikan kembali faktafakta tersebut kepada orang lain, atau menggunakanya
untuk menjawab soal-soal dalam ujian. Guru sendiri merasa belum mengajar kalau
belum menjelaskan materi kepada siswa.
Berdasarkan uraian diatas, CBR merupakan salah satu wadah bagi mahasiswa
sebagai calon guru untuk mengembangkan diri dan pengetahuannya. Oleh sebab itu,
1
CBR merupakan salah satu tugas yang penting untuk dikaji dan depenuhi dalam proses
pembelajaran.
1.2 Tujuan Penulisan CBR

1. Untuk mengetahui pengertian pengembangan instrument, kisi-kisi dan rubrik
instrument penilaian
2. Untuk mengetahui manfaat pengembangan instrument, kisi-kisi dan rubrik
3. Untuk mengetahui tujuan pengembangan instrument, kisi-kisi dan rubrik
1.3 Manfaat CBR

1. Dapat memenuhi salah satu tugas KKNI.
2. Dapat menambah pengetahuan mahasiswa terkait materi pengembangan
instrumen, kisi-kisi dan rubrik instrument penilaian
1.4. Identitas Buku yang Direview

Judul : science formatif assesment
Edisi : Pertama
Pengarang : Cathy Hernandez
Penerbit : Page Keeley
Kota Terbit : United States of America

Tahun Terbit : 1996
ISBN : 978-1-4129-4180-8
2
BAB II
RINGKASAN BUKU
2.1 Buku Utama

Mengintegrasi FACTs dengan Instruksi dan Belajar
Teknik kelas penilaian formatif (FACTs) berakar pada praktik pengajaran yang
baik. Mereka menawarkan berbagai cara untuk mengintegrasikan penilaian dan
instruksi yang membantu guru mempelajari lebih lanjut tentang apa yang dibutuhkan
siswa untuk menjadi pelajar sains yang sukses. Pengajar yang FACTs memulai pelajaran
mereka di mana ide-ide siswanya, mengidentifikasi, memetakan, dan memantau jalur
pembelajaran yang pada akhirnya akan menuntun siswa untuk menemukan,
memahami, dan menggunakan ide-ide penting dan proses ilmu pengetahuan.
Mengadaptasi praktik mengajar untuk menyelaraskan dengan penelitian yang muncul
tentang penilaian informatif dan bagaimana siswa belajar memiliki efek timbal balik
pada pengajaran dan pembelajaran. Saat guru memasukkan lebih banyak FACT ke
dalam praktik mereka, pemahaman mereka tentang pembelajaran siswa meningkat,
yang pada gilirannya meningkatkan kualitas pengajaran mereka dan meningkatkan
prestasi siswa.
Penilaian formatif meningkatkan interaksi sehari-hari antara siswa dan antara
siswa dan guru dengan memberikan berbagai kesempatan untuk muncul ke permukaan,
memeriksa, mengerjakan, dan merefleksikan ide-ide ilmiah.
FACTs memberikan informasi berharga kepada guru untuk digunakan dalam
membuat keputusan instruksional, mereka juga mengaktifkan, mendorong, dan
memperdalam pemikiran siswa. Siswa menggunakan ide-ide yang ada dan
mengembangkannya untuk memahami dan menjelaskan objek, proses, dan fenomena
sehari-hari. FACT mendorong penggunaan keterampilan berpikir seperti memprediksi,
berhipotesis, menggunakan analogi, mengevaluasi bukti, mengajukan pertanyaan, dan
membenarkan ide. Melalui tindakan berpikir tentang gagasan yang muncul melalui
penilaian formatif, siswa secara aktif terlibat dalam proses membangun, memodifikasi,
atau memperdalam pengetahuan mereka. Oleh karena itu, penilaian tidak hanya
3
berfungsi untuk mencari tahu apa yang dipelajari siswa tetapi juga mendorong
pembelajaran. Metakognisi adalah komponen kunci dari penilaian yang mendorong
pembelajaran. Metakognisi melibatkan pemikiran tentang pemikiran seseorang,
termasuk pengetahuan tentang diri seseorang sebagai pemroses konsep dan gagasan.
Siswa terlibat dalam proses metakognitif. . .

 mengetahui apa yang mereka atau guru perlu lakukan agar mereka dapat
belajar
secara efektif,
 memantau pemahaman mereka saat ini dan mengenali dasar gagasan
mereka, mengenali bagaimana pengetahuan baru berhubungan dengan atau
menantang konsepsi mereka yang ada,
 mengetahui pertanyaan apa untuk meminta untuk memajukan pemahaman
seseorang, mampu mengevaluasi klaim dan gagasan orang lain, dan / atau
 dapat memantau sejauh mana mereka dapat berkontribusi untuk
pembelajaran orang lain.
Jenis pemantauan diri yang tepat melalui teknik metakognitif dan refleksi telah
dibuktikan untuk mendukung pembelajaran dengan pemahaman di berbagai bidang.
Membantu siswa menjadi lebih kognitif tentang pemikiran dan pembelajaran mereka
sendiri terkait erat dengan praktik instruksional yang mendorong umpan balik dan
penilaian diri. Namun, penting untuk disimpulkan bahwa menanggapi umpan balik yang
diberikan oleh guru atau siswa lain berbeda dengan siswa yang secara aktif mencari
umpan balik dari guru atau siswa lain untuk menilai pemikiran dan tingkat pemahaman
mereka saat ini.
• Eksplorasi dan Penemuan

Tahap eksplorasi dan penemuan dapat melibatkan pengalaman langsung dengan
objek atau proses fisik, membaca teks, atau mengungkap ide dalam diskusi dengan
teman sebaya. Tahap ini dapat mencakup FAKTA yang meminta siswa membuat
prediksi yang memulai inkuiri ilmiah. Memberikan kesempatan untuk membenarkan
dan menguji ide memberi siswa bukti untuk digunakan dalam mempertimbangkan ide
ilmiah selama tahap pengembangan konsep. Periode eksploitasi dan penemuan ini
memungkinkan guru untuk menentukan jenis pemahaman dan pertanyaan yang
dimiliki siswa sebelum mengembangkan lebih banyak kesempatan terstruktur untuk
4
memformalkan pembelajaran. Selama tahap ini, FACT juga dapat mengungkapkan
seberapa baik siswa menanggapi aktivitas, mempertimbangkan ide orang lain, dan
apakah ide orisinal mereka telah ditantang berdasarkan bukti yang dikumpulkan
selama eksperimen eksplorasi mereka. Penilaian selama tahap ini memberi siswa
kesempatan untuk mengembangkan ideide mereka dalam lingkungan yang tidak
menghakimi untuk mendapatkan umpan balik dari guru dan teman sebaya. FACT yang
dipilih memaparkan siswa pada ide-ide orang lain dan dengan demikian membantu
mereka merefleksikan pemikiran mereka sendiri, yang selanjutnya menginformasikan
instruksi ketika dibagikan dengan guru.
• Memiligh dan Menggunakan Fakta Untuk Memperkuat Hubungan Antara

Penilaian, Instruksi, dan Pembelajaran
Memilih FAKTA yang menginformasikan pengajaran dan mendorong pemikiran
adalah langkah pertama dalam menggunakan penilaian forteaching and learning.
Berikut ini adalah daftar saran untuk menggunakan FACT untuk memperkuat hubungan
antara penilaian, instruksi, dan pembelajaran.
1. Berpikir seperti seorang ahli diagnosa. Karena prasangka siswa memiliki
pengaruh yang sangat kuat pada pembelajaran mereka, guru perlu
terusmenerus memilih FACT dan memikirkan cara untuk memastikan ide siswa
sedemikian rupa sehingga menjadi sifat kedua bagi guru (Osborne & Freyberg,
1985). Guru perlu memanfaatkan setiap kesempatan baik dalam kelompok kecil
dan pengaturan seluruh kelas untuk mengeksplorasi ide-ide siswa secara
mendalam dan menganalisis pemikiran mereka.
2. Jadikan pemikiran siswa eksplisit selama penyelidikan ilmiah. UseFACTs untuk
menarik pemikiran siswa sebelum dan selama kegiatan berbasis inkuiri. Dorong
siswa untuk berkomitmen pada prediksi atau hasil, didukung oleh bukti dari
pengetahuan dan pengalaman sebelumnya, untuk membangun penjelasan
mereka sebelum menguji ide-ide mereka. Setelah berkomitmen pada prediksi
atau hasil yang dibenarkan, siswa menguji ide mereka dan membandingkan
pengamatan mereka dengan ide awal mereka. Ketika bukti tidak mendukung
pemikiran asli mereka, disonansi yang dihasilkan adalah poin penting dalam
mendorong siswa untuk mengejar lebih banyak informasi yang dapat membantu
mereka melepaskan ide-ide lama mereka untuk mengakomodasi ide-ide baru.
5
3. Ciptakan budaya kelas ide, bukan jawaban. FAKTA untuk mendorong siswa
membagikan gagasan mereka, terlepas dari apakah itu benar atau salah. Banyak
siswa yang dibesarkan dalam budaya kelas di mana mereka diharapkan
memberikan "jawaban yang benar". Oleh karena itu, mereka raguragu untuk
membagikan ide-ide mereka sendiri ketika mereka pikir mereka mungkin
"salah". Tahan untuk memberi tahu siswa apakah mereka "benar atau salah" dan
berikan waktu bagi mereka untuk mengerjakan ide-ide mereka, menimbang
berbagai sudut pandang dan bukti, sampai mereka siap untuk membangun
pemahaman baru. Penjelasan harus didahulukan daripada jawaban yang benar.
Mengeluarkan semua ide di atas meja terlebih dahulu mungkin membuat
frustasi dan memakan waktu lebih lama, tetapi dalam jangka panjang, itu akan
mengembangkan kepercayaan diri dalam kemampuan penalaran serta
pemahaman yang lebih dalam dan bertahan.Selain itu, siswa akan kurang
cenderung untuk kembali ke prasangka awal mereka setelah pelajaran atau unit
instruksi berakhir.
4. Kembangkan komunitas wacana.
5. Dorong siswa untuk mengambil risiko.
6. Imbaulah siswa untuk mendengarkan dengan cermat.
7. Gunakan berbagai FAKTA dengan berbagai cara.
8. Gunakan berbagai konfigurasi pengelompokan
9. Dorong refleksi terus menerus
10. elah menggunakan FACT untuk menghubungkan penilaian, instruksi, dan
pembelajaran sangat positif. PenggunaanFACTs telah sangat meningkatkan
ekspektasi guru terhadap diri mereka sendiri dan siswanya. Penelitian tentang
keefektifan penilaian formatif dalam meningkatkan pembelajaran telah
dikonfirmasi oleh para guru melalui pengamatan empiris mereka sendiri karena
mereka melihat bukti bahwa siswanya menjadi lebih terlibat dan metakognitif
dalam sains, meningkatkan kepercayaan diri mereka pada ideide mereka,
menggunakan kemampuan berpikir dan merespons yang lebih tinggi, dan
menghargai umpan balik dan refleksi. Seorang guru berbagi keterkejutannya
ketika siswa memintanya untuk menggunakan lebih banyak probe penilaian
dalam pelajaran sainsnya. Komentarnya— “Saya tidak percaya siswa saya
meminta lebih banyak penilaian! Mereka bahkan berbicara tentang probe
6
penilaian dalam perjalanan mereka keluar dari pintu dan terus berdebat tentang
ide-ide mereka di lorong ”—adalah indikasi kekuatan penilaian formatif dalam
meningkatkan keterlibatan siswa dan keinginan untuk menjadi pembelajar sains
2.2. Buku Kedua

Kesalahan Pengukuran
Kesalahan pengukuran dapat secara sederhana dijelaskan sebagai
penyimpangan skor penguji dalam serangkaian item tes. Jika penguji diuji dalam jumlah
tak terbatas dalam kondisi yang sama, penyimpangan akan ditampilkan. Semakin
banyak skor didistribusikan, semakin besar kesalahan pengukurannya. Tentu saja,
dalam kehidupan nyata, tidak ada kandidat yang mendapatkan jumlah item tes yang
tidak terbatas, sehingga kesalahan pengukuran harus diperkirakan dari otoritas yang
kompeten. Namun, ini dapat diperkirakan secara akurat. Keakuratan estimasi skor
dinyatakan dalam kesalahan standar pengukuran. Para ahli teori memahami hubungan
ini dengan Persamaan berikut ini:
Skor sebenarnya = Skor yang diamati - Kesalahan pengukuran di mana: Skor
sebenarnya adalah skor yang akan diperoleh peserta ujian jika tidak ada kesalahan, dan
skor yang diamati adalah skor yang benar-benar diterima peserta ujian selama
administrasi tes kehidupan nyata.
Skor sebenarnya dikonseptualisasikan sebagai skor rata-rata yang akan diterima

peserta ujian dengan merata-ratakan skornya dari jumlah tak terbatas penyelenggara
tes yang secara teoritis dilakukan. Kesalahan standar pengukuran dapat
direpresentasikan secara grafis sebagai distribusi skor di sekitar skor sebenarnya untuk
seorang individu. Gambar 8.1 menampilkan representasi grafis ini untuk dua peserta
ujian, satu berkemampuan rendah dan satu berkemampuan tinggi.
Gambar 8.1 Tampilan kesalahan standar pengukuran untuk kemampuan yang berbeda.
Menjaga Kesalahan Pengukuran dalam Perspektif
7
Namun, harus disadari bahwa adanya kesalahan dalam penilaian psikologis tidak
seserius seperti yang terlihat pertama kali . Ada banyak alasan untuk ini. Pertama-tama,
mudah untuk melebih-lebihkan pentingnya kesalahan dalam pengukuran psikologis,
karena tampaknya sangat sedikit pemahaman tentang proses psikologis dan metode
penilaiannya. Ketika orang mengira bahwa pemahaman kita tentang banyak aspek
bidang fisika juga terbatas, itu sendiri bukanlah masalah besar. Faktanya, pengukuran
psikologis mungkin tidak terlalu terganggu oleh kesalahan daripada pengukuran di
bidang ilmiah lainnya. Selain itu, dalam bidang fisik dan psikologis, sejumlah kecil
kesalahan pengukuran mungkin tidak membahayakan sebagian besar penelitian ilmiah.
Alasan lain mengapa pentingnya kesalahan dalam pengukuran sering
dibesarbesarkan adalah bahwa terminologi dan metode yang digunakan untuk
menggambarkannya dapat memiliki penampilan yang mengesankan bagi orang yang
tidak terbiasa dengan statistik yang terlibat. Karena banyak aspek kesalahan
pengukuran dapat diekspresikan dengan mudah dalam istilah matematika — dan nanti
dalam bab ini kita akan mengeksplorasi beberapa teknik untuk melakukannya — sulit
bagi orang yang tidak terlatih untuk menganggap angka-angka tersebut dengan
perspektif. Penting untuk memahami masalah kesalahan pengukuran dengan benar,
tetapi pengembang produk yang terampil dapat mengidentifikasi dan mengurangi
sumber kesalahan selama proses konstruksi produk. Dengan mengidentifikasi dan
mengurangi sumber kesalahan pengukuran, kualitas proyek dapat ditingkatkan. Oleh
karena itu, penting untuk memahami kesalahan dalam situasi ini dan menemukan
strategi yang membantu mengurangi kesalahan, dengan tetap mempertahankan
pemahaman tentang konsep kesalahan pengukuran.
Memahami Analisis Item

Analisis item adalah proses pemeriksaan item tes secara ketat. Tujuannya untuk
mengidentifikasi dan mengurangi sumber kesalahan dalam pengukuran. Penulis
melakukan analisis proyek secara rutin sehingga mereka dapat mengukur kualitas
proyek dan membuang proyek yang tidak dapat diterima, memperbaiki proyek yang
dapat diperbaiki, dan mempertahankan proyek yang memenuhi kriteria pencapaian.
Analisis item dilakukan melalui salah satu dari dua metode berikut: melalui analisis
numerik dengan metode penilaian. Dalam analisis soal digital, sifat statistik dari soal tes
tertentu diperiksa dalam kaitannya dengan distribusi tanggapan. Definisi ini
mengharuskan seseorang untuk menyiapkan deskripsi digital dari item tes setelah
8
diberikan kepada sekelompok inspektur, seperti yang dilakukan dalam uji coba
lapangan untuk pengembangan tes. Tentu saja, tujuan utama dari uji coba lapangan
pada item adalah untuk mengumpulkan data yang sesuai untuk meninjaunya.
Memvalidasi Isi Item
Sebuah studi validasi konten biasanya berusaha untuk membangun konsensus

pendapat yang diinformasikan tentang tingkat kesesuaian antara item tes tertentu dan
deskripsi spesifik dari domain konten yang dimaksudkan untuk dinilai oleh item
tersebut. Hal ini biasanya memerlukan dewan juri ahli yang menilai kesesuaian itemke-
konten menurut beberapa kriteria yang ditetapkan. Dua metode utama digunakan
untuk mengumpulkan pendapat ahli tentang penerapan antara domain konten dan item
tes tertentu. Pada metode pertama, dewan juri dideskripsikan secara obyektif, dan soal
tes sesuai dengan niat penulis. Dengan kata lain, penulis artikel akan dengan sengaja
menyusun artikel untuk mencerminkan bidang atau tujuan tertentu, dan dia akan
memberi tahu juri artikel mana yang harus sesuai dengan deskripsi yang mana. Oleh
karena itu, peran juri adalah untuk mengkonfirmasi atau menyangkal pandangan
penulis tentang Item tersebut. kebanyakan kasus, empat atau lima juri menilai setiap
item tes sudah cukup; akan tetapi, jika sejumlah besar item akan dinilai, item tersebut
dapat dipecah menjadi dua atau lebih kelompok, dan empat atau lima juri untuk setiap
kelompok item akan dibutuhkan. Untuk tes yang memiliki skor cut-off dan konsekuensi
signifikan bagi peserta ujian, maka lebih banyak juri — mungkin sebanyak sepuluh atau
bahkan lima belas — direkomendasikan. Dalam situasi apa pun tidak boleh satu orang
menjadi hakim tunggal dalam studi validasi konten, terutama orang yang menulis item
tes.
Mengukur Hasil Pendapat Hakim
Meskipun tabulasi jumlah pendapat yang setuju tidak diragukan lagi merupakan
metode yang paling populer, prosedur lain terkadang lebih disukai. Beberapa dari
metode ini membutuhkan pendekatan kuantitatif dan mungkin lebih tepat daripada
penghitungan. Misalnya, jika ada anggapan (sering dibuat) bahwa untuk setiap item tes
harus ada satu, dan hanya satu, kecocokan yang jelas dengan keterampilan atau tujuan,
indeks kesesuaian item-objektif dapat diturunkan (Rovinelli dan Hambleton, 1977;
9
Hambleton, 1980). Untuk prosedur ini, juri akan diinstruksikan untuk memberikan +1
jika ada kecocokan yang kuat antara item dan tujuan, 0 jika juri tidak yakin apakah ada
kesesuaian, dan -1 jika item tersebut tidak sesuai dengan tujuan. Formulir penilaian
yang ditampilkan pada Tabel 8.1 adalah contoh formulir.
Rumus yang menunjukkan bahwa item tertentu, k, kongruen dengan a
keterampilan atau tujuan tertentu, i, dapat diterapkan pada penilaian juri. Rumusnya
adalah:
Dalam rumus ini adalah nilai indeks, i dan k seperti yang dijelaskan di atas, N adalah
jumlah keterampilan atau tujuan, dan n adalah jumlah juri. ia hanyalah peringkat yang
diberikan oleh juri tertentu untuk kesesuaian antara item tertentu dan tujuan tertentu.
Ini tentu saja merupakan simbol penjumlahan.
Skema Kuantifikasi Alternatif

Klein dan Kosecoff (1975) menjelaskan variasi dari metode penghitungan yang
mencakup data kinerja peserta ujian dalam proses kesesuaian. Prosedur ini mungkin
sedikit lebih ketat daripada sekadar menghitung peringkat hakim; Namun, ini mungkin
kurang tepat dibandingkan menghitung indeks tujuan item. Juga, Polin dan Baker
(1979) menawarkan skala tinjauan item yang terdiri dari enam dimensi: deskripsi
domain, batas konten, batas pengalih, domain pengalih atau kriteria respons, format,
dan arahan ditambah item sampel. Penilai meninjau item dan memberi skor pada
masing-masing dari enam dimensi sesuai dengan kriteria yang ditentukan. Prosedur ini
dimaksudkan untuk memberikan informasi yang berguna untuk menemukan hubungan
antara "apa yang penulis uji tempa dan spesifikasi uji asli". Meskipun studi eksplorasi
dari metodologi ini menghasilkan hasil yang beragam, pendekatan tersebut mewakili
upaya yang berguna untuk menilai validitas bukti terkait konten.
Menggunakan Pertanyaan Terkemuka Dalam Analisis Item

Metode evaluasi dalam menganalisis proyek dapat menjadi cara yang sangat
efektif untuk meningkatkan item. Jelas, indeks kesesuaian item yang dibahas di bagian
sebelumnya adalah metode penilaian, tetapi ada metode lain yang melibatkan penilaian,
seperti teknik mengajukan pertanyaan panduan kepada orang yang tepat. Misalnya, jika
10
sebuah item disertakan dalam tes yang mengevaluasi anak sekolah, sering kali
membantu untuk meminta guru meninjau dan mendiskusikan item tersebut secara
informal dengan penulis item tersebut. Diskusi ini tidak memerlukan format khusus,
tetapi beberapa pertanyaan panduan mungkin berfokus pada tugas ini. Teknik diskusi
informal ini memiliki dua kelemahan utama. Pertama, seringkali sulit untuk mengelola
logistik untuk kunjungan semacam itu. Mungkin sulit bagi mereka untuk mengaturnya
di sekolah, karena guru dan administrator mungkin berpikir bahwa ini mengganggu
waktu mengajar yang berharga. Atau, jika tes tersebut akan digunakan untuk perizinan,
biasanya seseorang biasanya tidak mengetahui terlebih dahulu tes mana yang akan
diambil, dan tidak mudah untuk menentukan kelompok yang sesuai. Kerugian kedua
dari teknik diskusi informal adalah membutuhkan banyak waktu. Menurut pengalaman
penulis, dalam periode kelas 50 menit yang khas, hanya tiga hingga empat item tes yang
dapat dicakup. Kekurangan ini dapat diatasi jika penulis memilih hanya beberapa dari
sekelompok item yang baru disiapkan untuk diskusi, dan kemudian
mempertimbangkan item lain berdasarkan evaluasi siswa terhadap item yang dipilih.
Statistik Item
Sejumlah statistik dapat digunakan untuk menunjukkan ciri-ciri tertentu dari
butirbutir tes. Peneliti (Crocker & Algina, 1986) mengkategorikan indeks ini
berdasarkan parameter yang biasa diteliti:
1. Indeks yang menggambarkan distribusi respons ke satu item (yaitu, mean dan
varians dari respons item),
2. Indeks yang menggambarkan tingkat hubungan antara respons terhadap item
dan beberapa kriteria yang diminati, dan
3. Indeks yang merupakan fungsi dari varian item dan hubungan dengan kriteria.
• Indeks yang Benar Proporsi

Aspek rujukan kelompok dari nilai-p disebut ketergantungan sampel,
yang berarti bahwa nilai-p yang diberikan bergantung pada kelompok tertentu
kepada siapa item tersebut diberikan. Karakteristik ketergantungan sampel
untuk indeks ini dapat dengan mudah dilihat dengan membayangkan bahwa
suatu item diberikan kepada siswa kelas tiga dan sekali lagi kepada siswa kelas
enam. Karena kedua kelompok ini bukan dari populasi total yang sama, nilai p
11
yang dihasilkan oleh kedua kelompok mungkin akan berbeda. Item tersebut
akan memiliki dua nilai p, satu menunjukkan kesulitannya relatif terhadap siswa
kelas tiga, dan yang lainnya menunjukkan kesulitannya untuk siswa di kelas
enam. Setiap nilai p tergantung pada sampel peserta ujian mana yang diuji. Inilah
yang dimaksud dengan mengatakan nilai-p bergantung pada sampel.
• Menggunakan nilai-P untuk Analisis Item

Nilai-P sangat membantu penulis selama analisis item. Dengan
memahami nilai-p dan menafsirkannya dengan benar, penulis dapat melihat
bagaimana kinerja suatu item dalam kaitannya dengan kelompok peserta ujian
tertentu. Biasanya dalam evaluasi kinerja akademik yang paling umum, untuk
pengembang tes untuk menentukan batas kesulitan proyek. Secara umum,
batasan dari nilai-p adalah bahwa satu set item dalam pengujian dapat berkisar
dari yang terendah 0,40 hingga setinggi 0,80. Tentu saja, dalam banyak kasus,
pembatasan lain pada tingkat kesulitan proyek akan sesuai.
Penulis harus mewaspadai keterbatasan pengembang tes dalam kesulitan
penilaian proyek, karena mereka dapat memandu penulis dalam menentukan
proyek yang akan ditinjau.
• Item Salah Kuncinya

Fungsi lain yang berguna dari nilai-p untuk pekerjaan pengembangan
proyek adalah untuk mengidentifikasi item dengan kesalahan ketik. Sayangnya,
terlalu umum untuk memasukkan proyek secara tidak benar selama persiapan
proyek. Dalam kebanyakan kasus, ini adalah penyimpangan yang bisa
dimengerti. Terkadang membosankan membuat banyak proyek, yang dapat
menyebabkan penulis mengabaikan perhatian terhadap detail, yang dapat
menyebabkan proyek yang salah. Di lain waktu, orang tidak segera
memperhatikan ambiguitas item yang tidak dipahami atau ditulis dengan kata-
kata yang buruk, dan jawaban yang benar mungkin tidak jelas. Terkadang, ketika
item tertentu dirancang untuk menilai keterampilan pemrosesan kognitif yang
kompleks, nuansa bahasa atau kesulitan konten dapat menyebabkan item kunci
yang salah.
12
• Membandingkan nilai-p untuk Subpopulasi Berprestasi Tinggi dan Rendah
Seringkali dalam analisis item beberapa segmen dari populasi peserta
ujian dibandingkan. Setiap segmen, atau subpopulasi, dari total kelompok
peserta ujian mewakili strata kemampuan. Idealnya, peserta ujian
dikelompokkan ke dalam segmen, atau subpopulasi, berdasarkan kinerja mereka
pada kriteria luar, seperti ukuran lain dari konten analog dengan keandalan
serupa. Namun dalam praktiknya, tindakan eksternal semacam itu jarang
tersedia; Oleh karena itu, tes itu sendiri biasanya digunakan sebagai ukuran
kemampuan peserta ujian. Untuk tujuan ini, skor tes total digunakan.
• Koefisien Phi
Koefisien korelasi phi adalah perkiraan lain dari hubungan korelasional
yang dapat digunakan untuk menganalisis item tes. Seperti koefisien korelasi
lainnya, ini menghasilkan perkiraan antara +1 dan -1.
Fokus utama dari koefisien phi adalah untuk menentukan tingkat hubungan
antara item dan beberapa kriteria, seperti fitur program, jenis kelamin, atau
karakteristik demografis lainnya. Koefisien korelasi phi adalah perkiraan lain
dari hubungan korelasional yang dapat digunakan untuk menganalisis item tes.
Seperti koefisien korelasi lainnya, ini menghasilkan perkiraan antara +1 dan -1.
Namun, ini berbeda dari dua perkiraan korelasi yang telah dibahas sebelumnya
karena mengasumsikan dikotomi asli di kedua variabel untuk dikorelasikan.
Fokus utama dari koefisien phi adalah untuk menentukan tingkat hubungan
antara item dan beberapa kriteria, seperti fitur program, jenis kelamin, atau
karakteristik demografis lainnya.
• Indeks Diskriminasi Item

Diskriminasi adalah konsep penting lainnya untuk menilai kualitas
barang. Sebenarnya, kami memeriksa diskriminasi untuk item di bagian
sebelumnya, tetapi mungkin belum dipahami secara konseptual. Diskriminasi
untuk item dapat dipahami secara konseptual sebagai hubungan antara
kesulitan item dan kemampuan peserta ujian. Sederhananya, diskriminasi item
adalah indeks untuk menentukan perbedaan antara peserta ujian individu pada
materi pelajaran atau konstruksi psikologis yang dinilai. Ini bergantung pada
13
asumsi mendasar, yaitu bahwa peserta ujian yang menunjukkan penguasaan
subjek atau kemampuan tinggi dalam konstruksi dianggap lebih mungkin untuk
menjawab item tertentu tentang subjek atau konstruksi daripada peserta ujian
yang menunjukkan penguasaan atau kemampuan rendah. secara umum,
diskriminasi adalah atribut item positif, penilaian harus digunakan dalam
memutuskan kapan suatu item didiskriminasi secara optimal.
• Parameter Item
Garis pelacakan material biasanya disebut kurva karakteristik material (ICC),
dan mereka menampilkan informasi tentang satu, dua atau tiga parameter atau
batas matematika untuk setiap material.
A. Parameter A, yang menunjukkan "kecuraman" baris jejak item dan mewakili
probabilitas untuk merespons dengan benar item yang meningkat saat
seseorang menaikkan skala sebagai ukuran diskriminasi di antara berbagai
tingkat kemampuan,
B. Parameter B, mendefinisikan kesulitan item dengan mencatat titik di mana
variabel laten (misalnya, konstruksi psikologis) jatuh — ini juga pergeseran
kurva dari kiri ke kanan — dan, terkadang,
C. Parameter C, menunjukkan awal, atau dasar, kurva, menyarankan
kemungkinan menebak (juga disebut "peluang" atau "pseudochance")
tanggapan yang benar pada item untuk peserta ujian berkemampuan sangat
rendah.
• Bias Item
Bias item adalah topik yang sangat penting untuk meninjau kualitas
proyek pengujian, karena mereka yang menganggap pengujian tidak adil, tidak
stabil, terkontaminasi oleh faktor eksternal dan dapat disalahgunakan. Oleh
karena itu, selain biasanya fokus pada perbaikan item , penulis proyek yang
cermat juga memberikan perhatian khusus pada penyimpangan proyek. Seperti
banyak konsep lain dalam penulisan proyek, bias tidak melekat pada proyek uji.
Sebaliknya, ini berasal dari sumber variabel kesalahan tertentu. Oleh karena itu,
mengatasi penyimpangan dalam proyek melibatkan pencarian jenis varian
14
kesalahan tertentu dan kemudian berusaha untuk menghilangkan atau
mengurangi sumber kesalahan.
Dalam teori tes, bagi peserta tes dengan kemampuan yang sama, terlepas
dari keanggotaan kelompok tertentu, selama probabilitas keberhasilan proyek
sama, dapat dikatakan proyek tersebut tidak bias. Dengan kata lain, jika sebuah
proyek bertujuan untuk menilai pemahaman bacaan semua siswa kelas V, maka
dua anak dari kelompok dengan kemampuan yang sama harus memiliki
kesempatan yang sama untuk menjawab proyek dengan benar. Mereka semua
adalah siswa tahun kedua, dan terlepas dari jenis kelamin, warisan etnis atau
faktor lainnya, karakteristik lain tidak relevan. Jika skor anggota satu
subkelompok secara konsisten lebih rendah atau lebih rendah daripada anggota
subkelompok lain (tentu saja, dengan asumsi bahwa anggota individu antar
kelompok memiliki kemampuan yang sama), ada distorsi yang konsisten, dan
ada bias.
2.3. Buku Ketiga

A. Pengukuran Ranah Kognitif
Ranah kognitif adalah ranah yang mencakup kegiatan mental (otak). Bloom
mengelompokkan ranah kognitif ke dalam enam kategori dari yang sederhana sampai
kepada yang paling kompleks dan diasumsikan bersifat hirarkis, yang berarti tujuan
pada level yang tinggi dapat dicapai apabila tujuan pada level yang rendah telah
dikuasai.
Tingkatan pengetahuan ialah kemampuan mengingat kembali, misalnya,
pengetahuan mengenai istilah-istilah, pengetahuan mengenai klasifikasi dan sejenisnya.
Jadi, tingkatan pengetahuan mencakup ingatan akan hal-hal yang pernah dipelajari dan
disimpan dalam ingatan. Singkatnya dapat dikatakan bahwa pengetahuan yang
disimpan dalam ingatan itu, dapat digali kembali pada saat dibutuhkan melalui bentuk
ingatan (recall) atau mengingatkan kembali (recognition).
Tingkat Contoh kata kerja operasional
Kompetensi
Pengetahuan Mengenali, mendeskripsikan, menanamkan, memasangkan,

(Knowledge) membuat daftar, memilih
15
Pemahaman Mengklasifikasi, menjelaskan, mengikhtisarkan, membedakan
(comprehensi
on)
Penerapan Mendemonstrasikan, menghitung, menyelesaikan, menyesuaikan,

(aplication) mengoperasikan, menghubungkan, menyusun
Analisis Menemukan perbedaan, memisahkan, membuat diagram, membuat

(analysis) estimasi, menjabarkan ke dalam bagian-bagian, menyusun urutan.
Sintesis Menggabungkan, menciptakan, merumuskan, merancang, membuat

(synthesis) komposisi
Evaluasi Menimbang, mengkritik, membandingkan, memberi alasan,

(evaluation) menyimpulkan, memberi dukungan
Untuk mengukur kognitif dapat dilakukan dengan tes, yaitu: tes lisan di kelas,
pilihan berganda, uraian obyektif, uraian non obyektif, jawaban singkat, menjodohkan,
unjuk karya dan portofolio.
B. Pengukuran ranah Afektif
Ranah afektif adalah ranah yang berkaitan dengan sikap dan nilai. Sikap adalah
salah satu istilah bidang psikologi yang berhubungan dengan persepsi dan tingkah laku.
Istilah sikap dalam bahasa Inggris disebut attitude. Attitude adalah suatu cara bereaksi
terhadap suatu perangsang. Suatu kecenderungan untuk bereaksi terhadap suatu
perangsang atau situasi yang dihadapi. Ellis mengatakan bahwa sikap melibatkan
beberapa pengetahuan tentang situasi, namun aspek yang paling esensial dalam sikap
adalah adanya perasaan atau emosi, kecenderungan terhadap perbuatan yang
berhubungan dengan pengetahuan.
Krathwohl, Bloom dan Masria (1964) mengembangkan taksonomi ini yang

berorientasi kepada perasaan atau afektif. Taksonomi ini menggambarkan proses
seseorang di dalam mengenali dan mengadopsi suatu nilai dan sikap tertentu yang
menjadi pedoman baginya dalam bertingkah laku.
16
Domain afektif, Krathwohl membaginya atas lima kategori/ tingkatan yaitu;
Pengenalan (receiving), pemberian respon (responding), penghargaan terhadap niali
(valuing), pengorganisasian (organization) dan pengamalan (characterization).
Ranah Afektif
Kompetensi
Pengenalan Mendengarkan,menghindari,memperhatikan
Pemberian Mengikuti,mendiskusikan,berpartisipasi,mematuhi
respon
Penghargaan Memilih, meyakinkan, bertindak, mengemukakan argumentasi

terhadap nilai
Pengorganisasian Memilih, memutuskan, memformulasikan,

membandingkan, membuat sistematis
Pengalaman Menunjukkan sikap, menolak, mendemonstrasikan, menghindari

Pengukuran ranah afektif tidaklah semudah mengukur ranah Afektif karena
tidak dapat dilakukan setiap selesai menyajikan materi pelajaran. Pengubahan sikap
seseorang memerlukan waktu yang relatif lama, demikian juga pengembangan minat
dan penghargaan serta nilai-nilai.
Ada beberapa bentuk skala yang dapat digunakan untuk mengukur sikap afektif
yaitu:
(1) Skala likert
Langkah-langkah untuk membuat skala likert untuk menilai afektif antara lain
adalah:
a pilih variabel afektif yang akan diukur
b buat pernyataan positif terhadap variabel yang diukur
c minta pertimbangan kepada beberapa orang tentang pernyataan positif dan

negatif yang dirumuskan
d tentukan alternatif jawaban yang digunakan
17
e tentukan pensekorannya dan
f tentukan dan hilangkan pernyataan yang tidak berfungsi dengan pernyataan

lainnya.
(2) Skala pilihan ganda
Skala ini bentuknya seperti soal bentuk pilihan ganda yaitu suatu
pernyataan yang diikuti oleh sejumlah alternatif pendapat.
(3) Skala thurstone

Skala ini mirip dengan skala likert karena merupakan instrumen yang
jawabannya menunjukkan adanya tingkatan thurstone
menyarankan pernyataan yang diajukan + 10 item
(4) Skala guttman
Skala ini sama dengan skala yang disusun Bogardus yaitu pernyataan
yang di rumuskan empat atau tiga pernyataan. Pernyataan tersebut
menunjukkan tingkatan yang berurutan, apabila responden setuju persyaratan
2, diduga setuju pernyataan 1, selanjutnya setuju pernyataan 3 diduga setuju
pernyataan 1 dan 2 dan apabila setuju pernyataan 4 diduga setuju pernyataan
1,2 dan 3.
(5) Skala differential
Skala ini bertujuan untuk mengukur konsep-konsep untuk tiga dimensi.

Dimensi yang akan diukur dalam kategori :
baik – tidak baik
kuat – lemah cepat –
lambat aktif – pasif
(6) Pengukuran minat
Untuk mengetahui/mengukur minat siswa terhadap mata pelajaran terlebih

dahulu ditentukan indikatornya misalnya : kehadiran di kelas, keaktifan
bertanya, tepat waktu mengumpulkan tugas, kerapian. Catatan, mengerjakan
18
latihan, mengulan pelajaran dan mengunjungi perpustakaan dan lain-lain. Untuk
mengukur minat ini lebih tepat digunakan kuesioner skala likert dengan skala
lima yaitu; sangat sering, sering, netral, jarang dan tidak pernah.
C. Pengukuran Ranah Psikomotorik

Ranah psikomosotorik menurut Dave’s adalah: (a) imitasi, (b) manipulasi, (c)
ketepatan, (d) artikulasi, dan (e) naturalisasi. Imitasi: mengamati dan menjadikan
perilaku orang lain sebagai pola. Apa yang ditampilkan mungkin kualitas rendah.
Harrow (1972) menyusun tujuan psikomotor secara hierarkhis dalam lima tingkat
sebagai berikut:
(1) Meniru
Tujuan pembelajaran pada tingkat ini diharapkan peserta didik dapat meniru
suatu perilaku yang dilihatnya
(2) Manipulasi
Tujuan pembelajaran pada tingkat ini menuntut peserta didik untuk melakukan
suatu perilaku tanpa bantuan visual, sebagaimana pada tingkat meniru.
Tetapi diberi petunjuk berupa tulisan atau instruksi verbal
(3) Ketepatan Gerakan
Tujuan pembelajaran pada level ini peserta didik mampu melakukan suatu
perilaku tanpa menggunakan contoh visual maupun petunjuk tertulis, dan
melakukannya dengan lancar, tepat, seimbang dan akurat
(4) Artikulasi
Tujuan pembelajaran pada level ini peserta didik mampu menunjukkan

serangkaian gerakan dengan akurat, urutan yang benar, dan kecepatan yang tepat
(5) Naturalisasi
Tujuan pembelajaran pada tingkat ini peserta didik mampu melakukan gerakan
tertentu secara spontan tanpa berpikir lagi cara melakukannya dan urutannya.
19
Kompetensi
Meniru Mengulangi, mengikuti, memegang, menggambar, mengucapkan,

melakukan
Manipulasi Mengulang, mengikuti, memegang, menggambar, mengucapkan,

melakukan, (tidak melihat contoh/tidak mendengar suara)
Ketepatan Mengulangi, mengikuti, memegang, menggambar, mengucapkan,

gerakan melakukan (tepat, lancar tanpa kesalahan)
Artikulasi Menunjukkan gerakan,akurat benar, kecepatan yang tepat, sifatnya:

selaras, stabil dan sebagainya
Naturalisasi Gerakan spontan/otomatis, tanpa berpikir melakukan

dan urutannya
Pengukuran ranah psikomotorik perlu memperhatikan hal-hal berikut:
a. Langkah-langkah kinerja yang diharapkan dilakukan peserta didik untuk

menunjukkan kinerja dari suatu kompetensi.
b. Kelengkapan dan ketepatan aspek yang akan dinilai dalam kinerja tersebut.
c. kemampuan-kemampuan khusus yang diperlukan untuk menyelesaikan tugas.
d. Upayakan kemampuan yang akan dinilai tidak terlalu banyak, sehingga semua dapat
diamati
e. kemampuan yang akan dinilai diurutkan berdasarkan urutan yang akan diamati
20
BAB III
PEMBAHASAN
1.1. Pembahasan Isi Buku
Pada buku pertama, menjelasakan bagaimana mengintegrasikan FACTs (teknik
kelas penilaian formatif ) yang berakar pada praktik pengajaran yang baik dengan
instruksi dan belajar. Penilaian ini memberikan informasi kepada guru untuk membuat
keputusan intruksional, yang nantinya akan mengaktifkan, mendorong, dan
memperdalam pemikiran siswa. Dalam buku ini diajarkan agar siswa terlibat dalam
proses metakognisi yang mana agar mereka atau guru mengetahui apa yang perlu
dilakukan agar mencapai pembelajaran yang efektif dan konseptual. Jenis penilaian ini
merupakan pemantauan diri dengan teknik metakognitif dan refleksi. Setiap
pengalaman diekspolarisasi dan ditemukan melalui pengalaman langsung terhadap
suatu objek. Tahap tersebut mengungkapkan seberapa baiknya siswa menaggapi
aktivitas, mempertimbangkan ide orang lain serta ide orisinal mereka yang ditantang
dengan bukti. Hubungan antara penilaian, instruksi dan pembelajaran dapat diperkuat
dengan memilih dan menggunakan fakta.
Pada buku kedua, pengembangan instrument, kisi-kisi dan rubrik instrumen

penilaian dijelaskan melalui penjabaran langkah awal penilaian yakni mengetahui
bagaimana sistem pengukuran yang tepat, kesalahan pengukuran, pendeskripsian
kesalahan pengukuran, menghindari kesalahan pengukuran secara perspektif.
Kemudian penilaian dilanjutkan dengan memahami analisis item, dan memvalidasi isi
item tersebut, serta mengukur hasil yang didapat. Pengukuran dilakukan secara
kuantitatif alternatif yang mana mempunyai skala tertentu sebagai rubrik penilaian
terhadap setiap pertanyaan yang diberikan. Butir-butir tes dianalisis secara statistik
bersadarkan parameter respons, tingkat hubungan antara respons terhadap item dan
kriteria yang diminati, serta indeks yang merupakan fungsi dari varian item. Analisis
dilakukan dengan menggunakan indeks yang proporsional, dengan menggunakan nilai-
P. Dalam proses penilaian, nilai-p untuk subpopulasi berprestasi tinggi dibandingkan
dengan berprestasi rendah. Dalam analisis tes, digunakan korelasional yakni koefisien
phi. Dalam pembuatan item dilakukan sistem indeks diskriminasi yakni untuk menilai
kualitas item secara konseptual. Proses penilaian menggunakan parameter item dan
21
bias item untuk mengetahui tingkat kemampuan siswa serta kualitas proyek
pengujiannya, sehingga menghasilkan data penilaian yang adil
Pada buku ketiga. Menjelaskan penilaian dengan menggunakan pengukuran

ranah kognitif yang meninjau mental dan level kemampuan siswa. Dimana, penilaian
yang dilakukan melihat tingkat kompetensi, pengetahuan, pemahaman, penerapan,
sintetis dan evaluasi. Selain itu, penilaian juga dilakukan berdasarkan pengukuran pada
ranah afektif yang berkaitan dengan nilai dan sikap siswanya. Dalam hal ini, terdapat
beberapa skala penilaian, yakni skala likert, skala thurstone, skala pilihan ganda, skala
guttman, skala differential dan pengukuran minat. Dan yang terakhir adalah penilaian
berdasarkan pengukuran ranah psikomotorik yang meliputi meniru, manipulasi,
ketepatan gerakan, artikulasi, dan naturalisasi.
1.2. Kelebihan dan Kekurangan Buku

Berdasarkan paparan dari ketiga buku, buku yang paling sesuai dengan materi
yang dikaji dan mampu mengkajinya dengan cukup dalam adalah buku utama. Dimana,
buku tersebut fokus menjelaskan sisem penilaian melalui teknik FACTs. Dimana buku
ini mengajarkan sistem penilaian dengan instrumennya sebagai assesmen as learning.
Sementara, buku kedua dan buku ketiga kurang mampu menjelaskan instrumen dan
rubrik penilaian dengan baik. Kedua buku tersebut lebih memaparkan pengukuran
sebagai proses penilaian terhadap hasil belajar siswa. Namun, ketiga buku saling
melengkapi, sehingga proses penilaian, instrumen, dan rubrik penilaian menjadi lebih
jelas.
22
BAB IV
PENUTUP
4.1. Kesimpulan
Pengembangan penilaian dapat dilakukan dengan menggunakan teknik kelas
penilaian formatif (FACTs). Penilaian yang konstruktif adalah penilaian yang melibatkan
siswa melakukan metakognisi. Dengan kata lain, yaitu penilaian sebagai proses
pembelajaran. Penilaian yang baik adalah penilaian yang membandingkan item-item
pengukuran dengan potensi, bakat, dan keterampilan siswa, dengan disertai peninjauan
kesalahan pengukuran, perbaikan, dan melakukan tinjauan ulang tehadap penilaian
yang dilakukan. Sehingga, penilaian bukanlah sekedar menilai, melainkan mengetahui
karakteristik dan potensi siswa lebih dalam.
4.2. Rekomendasi
Materi pengembangan instrumen, kisi-kisi dan rubrik penilaian merupakan

materi yang dasar bagi mahasiswa program studi pendidikan sebagai bekal menjadi
guru dikemudian hari. Sehingga, perlu sekali untuk mendalami materi ini dan
menguasainya. Tujuan utama dari materi ini adalah menjelaskan bahwa guru harus
mampu menilai, mengembangkan dan mengevaluasi kemajuan maupun kemunduran
hasil belajar siswa secara optimal.
23
DAFTAR PUSTAKA
Asrul, Ananda, R., Rosnita. 2014. Evaluasi Pembelajaran. Bandung: Citapustaka Media.
Hernandez, Cathy. 1996. Science Formatif Assesment. United States of America: Page
Keelay.
Osterlind,SJ. 2002. Constructing Test Items: Multiple – choice, contructed – response,

performance and other formats. Amerika: Kluwer Academic publishers
24
25

CBR Pap - Tera Andriani Gurusinga - 4201121028 - PSPF20C

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

CBR Pap - Tera Andriani Gurusinga - 4201121028 - PSPF20C

Diunggah oleh

Hak Cipta:

Format Tersedia

CRITICAL BOOK REVIEW

SCIENCE FORMATIF ASSESMENT

NAMA MAHASISWA : TERA ANDRIANI GURUSINGA

PROGRAM STUDI PENDIDIKAN FISIKA

Penilaian merupakan suatu kegiatan untuk memberikan berbagai informasi

Medan, 6 Maret 2022

Tera Andriani Gurusinga

EXECUTIVE SUMMARY ............................................................................................................................. i

1.1 Rasionalisasi Pentingnya CBR

1.2 Tujuan Penulisan CBR

1.3 Manfaat CBR

1.4. Identitas Buku yang Direview

Pengarang : Cathy Hernandez

Penerbit : Page Keeley

Kota Terbit : United States of America

2.1 Buku Utama

Siswa terlibat dalam proses metakognitif. . .

• Eksplorasi dan Penemuan

• Memiligh dan Menggunakan Fakta Untuk Memperkuat Hubungan Antara

2.2. Buku Kedua

Skor sebenarnya dikonseptualisasikan sebagai skor rata-rata yang akan diterima

Menjaga Kesalahan Pengukuran dalam Perspektif

Memahami Analisis Item

Memvalidasi Isi Item

Sebuah studi validasi konten biasanya berusaha untuk membangun konsensus

Mengukur Hasil Pendapat Hakim

Skema Kuantifikasi Alternatif

Menggunakan Pertanyaan Terkemuka Dalam Analisis Item

• Indeks yang Benar Proporsi

• Menggunakan nilai-P untuk Analisis Item

• Item Salah Kuncinya

• Indeks Diskriminasi Item

2.3. Buku Ketiga

Pengetahuan Mengenali, mendeskripsikan, menanamkan, memasangkan,

Penerapan Mendemonstrasikan, menghitung, menyelesaikan, menyesuaikan,

Analisis Menemukan perbedaan, memisahkan, membuat diagram, membuat

Sintesis Menggabungkan, menciptakan, merumuskan, merancang, membuat

Evaluasi Menimbang, mengkritik, membandingkan, memberi alasan,

B. Pengukuran ranah Afektif

Krathwohl, Bloom dan Masria (1964) mengembangkan taksonomi ini yang

Penghargaan Memilih, meyakinkan, bertindak, mengemukakan argumentasi

Pengorganisasian Memilih, memutuskan, memformulasikan,

Pengalaman Menunjukkan sikap, menolak, mendemonstrasikan, menghindari

(1) Skala likert

a pilih variabel afektif yang akan diukur

b buat pernyataan positif terhadap variabel yang diukur

c minta pertimbangan kepada beberapa orang tentang pernyataan positif dan

d tentukan alternatif jawaban yang digunakan

f tentukan dan hilangkan pernyataan yang tidak berfungsi dengan pernyataan

(2) Skala pilihan ganda

(3) Skala thurstone

(4) Skala guttman

(5) Skala differential

Skala ini bertujuan untuk mengukur konsep-konsep untuk tiga dimensi.

baik – tidak baik

kuat – lemah cepat –

lambat aktif – pasif

(6) Pengukuran minat

Untuk mengetahui/mengukur minat siswa terhadap mata pelajaran terlebih

C. Pengukuran Ranah Psikomotorik

(3) Ketepatan Gerakan

Tujuan pembelajaran pada level ini peserta didik mampu menunjukkan

Meniru Mengulangi, mengikuti, memegang, menggambar, mengucapkan,