MK.PENGUKURAN DAN
ASSESMENT PEMB.FISIKA
PRODI S1 PENDIDIKAN FISIKA
FMIPA-UNIMED
Skor Nilai:
i
EXECUTIVE SUMMARY
ii
KATA PENGANTAR
Pertama-tama penulis ucapkan rasa syukur kami kepada Tuhan Yang Maha Esa
yang telah memberikan kemudahan sehingga penulis dapat menyelesaikan Critical Book
Review ini dengan waktu yang telah ditetapkan. Critical Book Review ini disusun untuk
memenuhi sebagian tugas mata kuliah Pengukuran dan Asesmen Pembelajaran Fisika.
Penulis mengucapkan terimakasih kepada Bapak selaku dosen pengampu mata kuliah
Pengukuran dan Asesmen Pembelajaran Fisika, yang telah membimbing penulis,
sehingga kami dapat menyelesaikan tugas Critical Book Review yang berjudul
“Pengembangan Instrumen, Kisi-kisi dan Rubrik Instrumen Penilaian”.
Dalam penulisan Critical Book Review ini, penulis menyadari masih banyak
kekurangan- kekurangan, baik dalam konteks penulisan. Oleh karena itu, kritik dan
saran sangat penulis harapkan demi penyempurnaan makalah ini. Tak lupa, penulis juga
menyampaikan ucapan terima kasih kepada semua pihak yang telah membantu penulis
dalam proses penyusunan Critical Book Review ini. Akhirnya, penulis berharap semoga
makalah ini dapat bermanfaat khususnya penulis dan bagi para pembaca. Atas
perhatian nya penulis mengucapkan terima kasih .
iii
DAFTAR ISI
iv
BAB I
PENDAHULUAN
1
CBR merupakan salah satu tugas yang penting untuk dikaji dan depenuhi dalam proses
pembelajaran.
ISBN : 978-1-4129-4180-8
2
BAB II
RINGKASAN BUKU
3
berfungsi untuk mencari tahu apa yang dipelajari siswa tetapi juga mendorong
pembelajaran. Metakognisi adalah komponen kunci dari penilaian yang mendorong
pembelajaran. Metakognisi melibatkan pemikiran tentang pemikiran seseorang,
termasuk pengetahuan tentang diri seseorang sebagai pemroses konsep dan gagasan.
4
memformalkan pembelajaran. Selama tahap ini, FACT juga dapat mengungkapkan
seberapa baik siswa menanggapi aktivitas, mempertimbangkan ide orang lain, dan
apakah ide orisinal mereka telah ditantang berdasarkan bukti yang dikumpulkan
selama eksperimen eksplorasi mereka. Penilaian selama tahap ini memberi siswa
kesempatan untuk mengembangkan ideide mereka dalam lingkungan yang tidak
menghakimi untuk mendapatkan umpan balik dari guru dan teman sebaya. FACT yang
dipilih memaparkan siswa pada ide-ide orang lain dan dengan demikian membantu
mereka merefleksikan pemikiran mereka sendiri, yang selanjutnya menginformasikan
instruksi ketika dibagikan dengan guru.
5
3. Ciptakan budaya kelas ide, bukan jawaban. FAKTA untuk mendorong siswa
membagikan gagasan mereka, terlepas dari apakah itu benar atau salah. Banyak
siswa yang dibesarkan dalam budaya kelas di mana mereka diharapkan
memberikan "jawaban yang benar". Oleh karena itu, mereka raguragu untuk
membagikan ide-ide mereka sendiri ketika mereka pikir mereka mungkin
"salah". Tahan untuk memberi tahu siswa apakah mereka "benar atau salah" dan
berikan waktu bagi mereka untuk mengerjakan ide-ide mereka, menimbang
berbagai sudut pandang dan bukti, sampai mereka siap untuk membangun
pemahaman baru. Penjelasan harus didahulukan daripada jawaban yang benar.
Mengeluarkan semua ide di atas meja terlebih dahulu mungkin membuat
frustasi dan memakan waktu lebih lama, tetapi dalam jangka panjang, itu akan
mengembangkan kepercayaan diri dalam kemampuan penalaran serta
pemahaman yang lebih dalam dan bertahan.Selain itu, siswa akan kurang
cenderung untuk kembali ke prasangka awal mereka setelah pelajaran atau unit
instruksi berakhir.
4. Kembangkan komunitas wacana.
5. Dorong siswa untuk mengambil risiko.
6. Imbaulah siswa untuk mendengarkan dengan cermat.
7. Gunakan berbagai FAKTA dengan berbagai cara.
8. Gunakan berbagai konfigurasi pengelompokan
9. Dorong refleksi terus menerus
10. elah menggunakan FACT untuk menghubungkan penilaian, instruksi, dan
pembelajaran sangat positif. PenggunaanFACTs telah sangat meningkatkan
ekspektasi guru terhadap diri mereka sendiri dan siswanya. Penelitian tentang
keefektifan penilaian formatif dalam meningkatkan pembelajaran telah
dikonfirmasi oleh para guru melalui pengamatan empiris mereka sendiri karena
mereka melihat bukti bahwa siswanya menjadi lebih terlibat dan metakognitif
dalam sains, meningkatkan kepercayaan diri mereka pada ideide mereka,
menggunakan kemampuan berpikir dan merespons yang lebih tinggi, dan
menghargai umpan balik dan refleksi. Seorang guru berbagi keterkejutannya
ketika siswa memintanya untuk menggunakan lebih banyak probe penilaian
dalam pelajaran sainsnya. Komentarnya— “Saya tidak percaya siswa saya
meminta lebih banyak penilaian! Mereka bahkan berbicara tentang probe
6
penilaian dalam perjalanan mereka keluar dari pintu dan terus berdebat tentang
ide-ide mereka di lorong ”—adalah indikasi kekuatan penilaian formatif dalam
meningkatkan keterlibatan siswa dan keinginan untuk menjadi pembelajar sains
7
Namun, harus disadari bahwa adanya kesalahan dalam penilaian psikologis tidak
seserius seperti yang terlihat pertama kali . Ada banyak alasan untuk ini. Pertama-tama,
mudah untuk melebih-lebihkan pentingnya kesalahan dalam pengukuran psikologis,
karena tampaknya sangat sedikit pemahaman tentang proses psikologis dan metode
penilaiannya. Ketika orang mengira bahwa pemahaman kita tentang banyak aspek
bidang fisika juga terbatas, itu sendiri bukanlah masalah besar. Faktanya, pengukuran
psikologis mungkin tidak terlalu terganggu oleh kesalahan daripada pengukuran di
bidang ilmiah lainnya. Selain itu, dalam bidang fisik dan psikologis, sejumlah kecil
kesalahan pengukuran mungkin tidak membahayakan sebagian besar penelitian ilmiah.
Alasan lain mengapa pentingnya kesalahan dalam pengukuran sering
dibesarbesarkan adalah bahwa terminologi dan metode yang digunakan untuk
menggambarkannya dapat memiliki penampilan yang mengesankan bagi orang yang
tidak terbiasa dengan statistik yang terlibat. Karena banyak aspek kesalahan
pengukuran dapat diekspresikan dengan mudah dalam istilah matematika — dan nanti
dalam bab ini kita akan mengeksplorasi beberapa teknik untuk melakukannya — sulit
bagi orang yang tidak terlatih untuk menganggap angka-angka tersebut dengan
perspektif. Penting untuk memahami masalah kesalahan pengukuran dengan benar,
tetapi pengembang produk yang terampil dapat mengidentifikasi dan mengurangi
sumber kesalahan selama proses konstruksi produk. Dengan mengidentifikasi dan
mengurangi sumber kesalahan pengukuran, kualitas proyek dapat ditingkatkan. Oleh
karena itu, penting untuk memahami kesalahan dalam situasi ini dan menemukan
strategi yang membantu mengurangi kesalahan, dengan tetap mempertahankan
pemahaman tentang konsep kesalahan pengukuran.
8
diberikan kepada sekelompok inspektur, seperti yang dilakukan dalam uji coba
lapangan untuk pengembangan tes. Tentu saja, tujuan utama dari uji coba lapangan
pada item adalah untuk mengumpulkan data yang sesuai untuk meninjaunya.
Meskipun tabulasi jumlah pendapat yang setuju tidak diragukan lagi merupakan
metode yang paling populer, prosedur lain terkadang lebih disukai. Beberapa dari
metode ini membutuhkan pendekatan kuantitatif dan mungkin lebih tepat daripada
penghitungan. Misalnya, jika ada anggapan (sering dibuat) bahwa untuk setiap item tes
harus ada satu, dan hanya satu, kecocokan yang jelas dengan keterampilan atau tujuan,
indeks kesesuaian item-objektif dapat diturunkan (Rovinelli dan Hambleton, 1977;
9
Hambleton, 1980). Untuk prosedur ini, juri akan diinstruksikan untuk memberikan +1
jika ada kecocokan yang kuat antara item dan tujuan, 0 jika juri tidak yakin apakah ada
kesesuaian, dan -1 jika item tersebut tidak sesuai dengan tujuan. Formulir penilaian
yang ditampilkan pada Tabel 8.1 adalah contoh formulir.
Rumus yang menunjukkan bahwa item tertentu, k, kongruen dengan a
keterampilan atau tujuan tertentu, i, dapat diterapkan pada penilaian juri. Rumusnya
adalah:
Dalam rumus ini adalah nilai indeks, i dan k seperti yang dijelaskan di atas, N adalah
jumlah keterampilan atau tujuan, dan n adalah jumlah juri. ia hanyalah peringkat yang
diberikan oleh juri tertentu untuk kesesuaian antara item tertentu dan tujuan tertentu.
Ini tentu saja merupakan simbol penjumlahan.
10
sebuah item disertakan dalam tes yang mengevaluasi anak sekolah, sering kali
membantu untuk meminta guru meninjau dan mendiskusikan item tersebut secara
informal dengan penulis item tersebut. Diskusi ini tidak memerlukan format khusus,
tetapi beberapa pertanyaan panduan mungkin berfokus pada tugas ini. Teknik diskusi
informal ini memiliki dua kelemahan utama. Pertama, seringkali sulit untuk mengelola
logistik untuk kunjungan semacam itu. Mungkin sulit bagi mereka untuk mengaturnya
di sekolah, karena guru dan administrator mungkin berpikir bahwa ini mengganggu
waktu mengajar yang berharga. Atau, jika tes tersebut akan digunakan untuk perizinan,
biasanya seseorang biasanya tidak mengetahui terlebih dahulu tes mana yang akan
diambil, dan tidak mudah untuk menentukan kelompok yang sesuai. Kerugian kedua
dari teknik diskusi informal adalah membutuhkan banyak waktu. Menurut pengalaman
penulis, dalam periode kelas 50 menit yang khas, hanya tiga hingga empat item tes yang
dapat dicakup. Kekurangan ini dapat diatasi jika penulis memilih hanya beberapa dari
sekelompok item yang baru disiapkan untuk diskusi, dan kemudian
mempertimbangkan item lain berdasarkan evaluasi siswa terhadap item yang dipilih.
Statistik Item
Sejumlah statistik dapat digunakan untuk menunjukkan ciri-ciri tertentu dari
butirbutir tes. Peneliti (Crocker & Algina, 1986) mengkategorikan indeks ini
berdasarkan parameter yang biasa diteliti:
1. Indeks yang menggambarkan distribusi respons ke satu item (yaitu, mean dan
varians dari respons item),
2. Indeks yang menggambarkan tingkat hubungan antara respons terhadap item
dan beberapa kriteria yang diminati, dan
3. Indeks yang merupakan fungsi dari varian item dan hubungan dengan kriteria.
11
yang dihasilkan oleh kedua kelompok mungkin akan berbeda. Item tersebut
akan memiliki dua nilai p, satu menunjukkan kesulitannya relatif terhadap siswa
kelas tiga, dan yang lainnya menunjukkan kesulitannya untuk siswa di kelas
enam. Setiap nilai p tergantung pada sampel peserta ujian mana yang diuji. Inilah
yang dimaksud dengan mengatakan nilai-p bergantung pada sampel.
12
• Membandingkan nilai-p untuk Subpopulasi Berprestasi Tinggi dan Rendah
Seringkali dalam analisis item beberapa segmen dari populasi peserta
ujian dibandingkan. Setiap segmen, atau subpopulasi, dari total kelompok
peserta ujian mewakili strata kemampuan. Idealnya, peserta ujian
dikelompokkan ke dalam segmen, atau subpopulasi, berdasarkan kinerja mereka
pada kriteria luar, seperti ukuran lain dari konten analog dengan keandalan
serupa. Namun dalam praktiknya, tindakan eksternal semacam itu jarang
tersedia; Oleh karena itu, tes itu sendiri biasanya digunakan sebagai ukuran
kemampuan peserta ujian. Untuk tujuan ini, skor tes total digunakan.
• Koefisien Phi
Koefisien korelasi phi adalah perkiraan lain dari hubungan korelasional
yang dapat digunakan untuk menganalisis item tes. Seperti koefisien korelasi
lainnya, ini menghasilkan perkiraan antara +1 dan -1.
Fokus utama dari koefisien phi adalah untuk menentukan tingkat hubungan
antara item dan beberapa kriteria, seperti fitur program, jenis kelamin, atau
karakteristik demografis lainnya. Koefisien korelasi phi adalah perkiraan lain
dari hubungan korelasional yang dapat digunakan untuk menganalisis item tes.
Seperti koefisien korelasi lainnya, ini menghasilkan perkiraan antara +1 dan -1.
Namun, ini berbeda dari dua perkiraan korelasi yang telah dibahas sebelumnya
karena mengasumsikan dikotomi asli di kedua variabel untuk dikorelasikan.
Fokus utama dari koefisien phi adalah untuk menentukan tingkat hubungan
antara item dan beberapa kriteria, seperti fitur program, jenis kelamin, atau
karakteristik demografis lainnya.
13
asumsi mendasar, yaitu bahwa peserta ujian yang menunjukkan penguasaan
subjek atau kemampuan tinggi dalam konstruksi dianggap lebih mungkin untuk
menjawab item tertentu tentang subjek atau konstruksi daripada peserta ujian
yang menunjukkan penguasaan atau kemampuan rendah. secara umum,
diskriminasi adalah atribut item positif, penilaian harus digunakan dalam
memutuskan kapan suatu item didiskriminasi secara optimal.
• Parameter Item
Garis pelacakan material biasanya disebut kurva karakteristik material (ICC),
dan mereka menampilkan informasi tentang satu, dua atau tiga parameter atau
batas matematika untuk setiap material.
A. Parameter A, yang menunjukkan "kecuraman" baris jejak item dan mewakili
probabilitas untuk merespons dengan benar item yang meningkat saat
seseorang menaikkan skala sebagai ukuran diskriminasi di antara berbagai
tingkat kemampuan,
B. Parameter B, mendefinisikan kesulitan item dengan mencatat titik di mana
variabel laten (misalnya, konstruksi psikologis) jatuh — ini juga pergeseran
kurva dari kiri ke kanan — dan, terkadang,
C. Parameter C, menunjukkan awal, atau dasar, kurva, menyarankan
kemungkinan menebak (juga disebut "peluang" atau "pseudochance")
tanggapan yang benar pada item untuk peserta ujian berkemampuan sangat
rendah.
• Bias Item
Bias item adalah topik yang sangat penting untuk meninjau kualitas
proyek pengujian, karena mereka yang menganggap pengujian tidak adil, tidak
stabil, terkontaminasi oleh faktor eksternal dan dapat disalahgunakan. Oleh
karena itu, selain biasanya fokus pada perbaikan item , penulis proyek yang
cermat juga memberikan perhatian khusus pada penyimpangan proyek. Seperti
banyak konsep lain dalam penulisan proyek, bias tidak melekat pada proyek uji.
Sebaliknya, ini berasal dari sumber variabel kesalahan tertentu. Oleh karena itu,
mengatasi penyimpangan dalam proyek melibatkan pencarian jenis varian
14
kesalahan tertentu dan kemudian berusaha untuk menghilangkan atau
mengurangi sumber kesalahan.
Dalam teori tes, bagi peserta tes dengan kemampuan yang sama, terlepas
dari keanggotaan kelompok tertentu, selama probabilitas keberhasilan proyek
sama, dapat dikatakan proyek tersebut tidak bias. Dengan kata lain, jika sebuah
proyek bertujuan untuk menilai pemahaman bacaan semua siswa kelas V, maka
dua anak dari kelompok dengan kemampuan yang sama harus memiliki
kesempatan yang sama untuk menjawab proyek dengan benar. Mereka semua
adalah siswa tahun kedua, dan terlepas dari jenis kelamin, warisan etnis atau
faktor lainnya, karakteristik lain tidak relevan. Jika skor anggota satu
subkelompok secara konsisten lebih rendah atau lebih rendah daripada anggota
subkelompok lain (tentu saja, dengan asumsi bahwa anggota individu antar
kelompok memiliki kemampuan yang sama), ada distorsi yang konsisten, dan
ada bias.
15
Pemahaman Mengklasifikasi, menjelaskan, mengikhtisarkan, membedakan
(comprehensi
on)
Untuk mengukur kognitif dapat dilakukan dengan tes, yaitu: tes lisan di kelas,
pilihan berganda, uraian obyektif, uraian non obyektif, jawaban singkat, menjodohkan,
unjuk karya dan portofolio.
Ranah afektif adalah ranah yang berkaitan dengan sikap dan nilai. Sikap adalah
salah satu istilah bidang psikologi yang berhubungan dengan persepsi dan tingkah laku.
Istilah sikap dalam bahasa Inggris disebut attitude. Attitude adalah suatu cara bereaksi
terhadap suatu perangsang. Suatu kecenderungan untuk bereaksi terhadap suatu
perangsang atau situasi yang dihadapi. Ellis mengatakan bahwa sikap melibatkan
beberapa pengetahuan tentang situasi, namun aspek yang paling esensial dalam sikap
adalah adanya perasaan atau emosi, kecenderungan terhadap perbuatan yang
berhubungan dengan pengetahuan.
16
Domain afektif, Krathwohl membaginya atas lima kategori/ tingkatan yaitu;
Pengenalan (receiving), pemberian respon (responding), penghargaan terhadap niali
(valuing), pengorganisasian (organization) dan pengamalan (characterization).
Ranah Afektif
Tingkat Contoh kata kerja operasional
Kompetensi
Pengenalan Mendengarkan,menghindari,memperhatikan
Pemberian Mengikuti,mendiskusikan,berpartisipasi,mematuhi
respon
Ada beberapa bentuk skala yang dapat digunakan untuk mengukur sikap afektif
yaitu:
Langkah-langkah untuk membuat skala likert untuk menilai afektif antara lain
adalah:
17
e tentukan pensekorannya dan
Skala ini bentuknya seperti soal bentuk pilihan ganda yaitu suatu
pernyataan yang diikuti oleh sejumlah alternatif pendapat.
Skala ini sama dengan skala yang disusun Bogardus yaitu pernyataan
yang di rumuskan empat atau tiga pernyataan. Pernyataan tersebut
menunjukkan tingkatan yang berurutan, apabila responden setuju persyaratan
2, diduga setuju pernyataan 1, selanjutnya setuju pernyataan 3 diduga setuju
pernyataan 1 dan 2 dan apabila setuju pernyataan 4 diduga setuju pernyataan
1,2 dan 3.
18
latihan, mengulan pelajaran dan mengunjungi perpustakaan dan lain-lain. Untuk
mengukur minat ini lebih tepat digunakan kuesioner skala likert dengan skala
lima yaitu; sangat sering, sering, netral, jarang dan tidak pernah.
(1) Meniru
Tujuan pembelajaran pada tingkat ini diharapkan peserta didik dapat meniru
suatu perilaku yang dilihatnya
(2) Manipulasi
Tujuan pembelajaran pada tingkat ini menuntut peserta didik untuk melakukan
suatu perilaku tanpa bantuan visual, sebagaimana pada tingkat meniru.
Tetapi diberi petunjuk berupa tulisan atau instruksi verbal
Tujuan pembelajaran pada level ini peserta didik mampu melakukan suatu
perilaku tanpa menggunakan contoh visual maupun petunjuk tertulis, dan
melakukannya dengan lancar, tepat, seimbang dan akurat
(4) Artikulasi
(5) Naturalisasi
Tujuan pembelajaran pada tingkat ini peserta didik mampu melakukan gerakan
tertentu secara spontan tanpa berpikir lagi cara melakukannya dan urutannya.
19
Tingkat Contoh kata kerja operasional
Kompetensi
b. Kelengkapan dan ketepatan aspek yang akan dinilai dalam kinerja tersebut.
d. Upayakan kemampuan yang akan dinilai tidak terlalu banyak, sehingga semua dapat
diamati
e. kemampuan yang akan dinilai diurutkan berdasarkan urutan yang akan diamati
20
BAB III
PEMBAHASAN
1.1. Pembahasan Isi Buku
Pada buku pertama, menjelasakan bagaimana mengintegrasikan FACTs (teknik
kelas penilaian formatif ) yang berakar pada praktik pengajaran yang baik dengan
instruksi dan belajar. Penilaian ini memberikan informasi kepada guru untuk membuat
keputusan intruksional, yang nantinya akan mengaktifkan, mendorong, dan
memperdalam pemikiran siswa. Dalam buku ini diajarkan agar siswa terlibat dalam
proses metakognisi yang mana agar mereka atau guru mengetahui apa yang perlu
dilakukan agar mencapai pembelajaran yang efektif dan konseptual. Jenis penilaian ini
merupakan pemantauan diri dengan teknik metakognitif dan refleksi. Setiap
pengalaman diekspolarisasi dan ditemukan melalui pengalaman langsung terhadap
suatu objek. Tahap tersebut mengungkapkan seberapa baiknya siswa menaggapi
aktivitas, mempertimbangkan ide orang lain serta ide orisinal mereka yang ditantang
dengan bukti. Hubungan antara penilaian, instruksi dan pembelajaran dapat diperkuat
dengan memilih dan menggunakan fakta.
21
bias item untuk mengetahui tingkat kemampuan siswa serta kualitas proyek
pengujiannya, sehingga menghasilkan data penilaian yang adil
22
BAB IV
PENUTUP
4.1. Kesimpulan
Pengembangan penilaian dapat dilakukan dengan menggunakan teknik kelas
penilaian formatif (FACTs). Penilaian yang konstruktif adalah penilaian yang melibatkan
siswa melakukan metakognisi. Dengan kata lain, yaitu penilaian sebagai proses
pembelajaran. Penilaian yang baik adalah penilaian yang membandingkan item-item
pengukuran dengan potensi, bakat, dan keterampilan siswa, dengan disertai peninjauan
kesalahan pengukuran, perbaikan, dan melakukan tinjauan ulang tehadap penilaian
yang dilakukan. Sehingga, penilaian bukanlah sekedar menilai, melainkan mengetahui
karakteristik dan potensi siswa lebih dalam.
4.2. Rekomendasi
23
DAFTAR PUSTAKA
Asrul, Ananda, R., Rosnita. 2014. Evaluasi Pembelajaran. Bandung: Citapustaka Media.
Hernandez, Cathy. 1996. Science Formatif Assesment. United States of America: Page
Keelay.
24
25