Anda di halaman 1dari 10

Machine Translated by Google

Kajian Evaluasi Pendidikan 74 (2022) 101184

Daftar isi tersedia di ScienceDirect

Studi dalam Evaluasi Pendidikan


beranda jurnal: www.elsevier.com/loc/stueduc

Dampak penilaian terhadap prestasi belajar siswa terhadap program


pengembangan profesi guru
JA de Vries a,*,1, A. Dimosthenous B , K.Schildkamp A , AJ Visscher A

A
Fakultas Ilmu Perilaku, Manajemen dan Sosial, Bagian ELAN, Universitas Twente, Enschede, Belanda
B
Departemen Pendidikan, Universitas Siprus, Nicosia, Siprus

INFO PASAL ABSTRAK

Kata kunci: Assessment for Learning (AfL) dapat meningkatkan prestasi belajar siswa. Namun, para guru merasa penerapan AfL
Penilaian untuk pembelajaran
sulit dilakukan karena memerlukan kompetensi profesional yang kompleks. Dalam studi eksperimental ini, kami
Pengembangan profesional guru
menyelidiki pengaruh pengembangan profesional guru terhadap pencapaian siswa untuk AfL berdasarkan pendekatan
Pendekatan dinamis
Siswa berprestasi
dinamis (nteachers = 41, nstudents = 599). Pendekatan dinamis mencakup empat prinsip: (1) pendekatan berbasis
kompetensi, (2) menyesuaikan dengan kebutuhan guru, (3) menjelaskan mekanisme yang mendasarinya, dan (4)
mendukung guru dalam memperoleh kompetensi. Kami menemukan pengaruh positif (d = 0,27) terhadap prestasi
siswa. Rekomendasi untuk pengembangan profesional guru dan penelitian masa depan disajikan.

1. Perkenalan Mampu menilai dan menganalisis kemajuan pembelajaran siswa, dan selanjutnya
memutuskan tindakan tindak lanjut yang sesuai oleh guru dan siswa untuk
Penilaian dengan tujuan memberikan nilai kepada pelajar merupakan praktik meningkatkan pembelajaran siswa memerlukan keterampilan yang kompleks dari
yang sering dilakukan di sekolah menengah (Kippers, Wolterinck, Schild-kamp, guru (Brooks et al., 2021; Heitink, Van der Kleij, Veldkamp , Schildkamp, & Kippers,
Poortman, & Visscher, 2018). Namun, ketika guru hanya menekankan tujuan 2016). Selain itu, peningkatan keterlibatan siswa dalam kemajuan pembelajaran
penilaian yang sumatif dan berisiko tinggi, potensi belajar siswa tidak sepenuhnya mereka sendiri, yang merupakan salah satu komponen inti AfL, terbukti merupakan
terwujud (Wiliam & Leahy, 2015). Oleh karena itu, penggunaan penilaian untuk salah satu keterampilan guru yang lebih maju (Chris-toforidou et al., 2014). Sejalan
tujuan formatif dan bukan hanya tujuan sumatif semakin mendapat perhatian di dengan kompleksitas AfL, implementasinya tidak terjadi secara alami bagi semua
sekolah (Harrison et al., 2017). guru, dan kemampuan guru saat ini untuk menerapkan AfL di kelas sangat beragam
Penilaian formatif, juga dikenal sebagai “Penilaian untuk Pembelajaran” (AfL), dapat (Kippers, Wolterinck, Schildkamp, Poortman, & Visscher, 2018) .
didefinisikan sebagai:
Oleh karena itu, manfaat AfL yang menjanjikan bagi siswa seringkali belum terwujud
penilaian sejauh bukti tentang pencapaian siswa diperoleh, ditafsirkan, dan
(Kingston & Nash, 2011).
digunakan oleh guru, pelajar, atau teman sejawat mereka, untuk membuat
Program pengembangan profesional guru (TPD) telah disusun untuk membantu
keputusan tentang langkah selanjutnya dalam pengajaran yang mungkin lebih
guru dalam mengembangkan AfL di kelas mereka (Heitink, Van der Kleij, Veldkamp,
baik, atau lebih didasarkan pada keputusan mereka sendiri. telah mengambil
Schildkamp, & Kippers, 2016; Schildkamp, van der Kleij, Heitink, Kippers, &
tanpa adanya bukti yang diperoleh. (Wiliam & Leahy, 2015, hal.8)
Veldkamp, 2020). Pengembangan profesional guru mengacu pada “kegiatan
terstruktur dan terfasilitasi bagi guru yang dimaksudkan untuk meningkatkan
Selain itu, AfL sejalan dengan pendekatan umpan balik yang berpusat pada kemampuan mengajar mereka” (Sims & Fletcher-Wood, 2021, hlm. 7). Dalam
siswa “di mana siswa secara aktif mencari, menghasilkan, dan menggunakan umpan menyelidiki efektivitas berbagai bentuk TPD, berbagai tinjauan terhadap TPD (Darling-
balik untuk meningkatkan hasil belajar mereka” (Brooks et al., 2021, hal. 2). Penelitian Hammond et al., 2017; Desi-mone, 2009; Garet et al., 2001) telah menetapkan
telah menunjukkan bahwa kinerja siswa dapat ditingkatkan ketika upaya belajar faktor-faktor penting yang terkait dengan efektivitasnya. Misalnya, TPD secara umum
mengajar diarahkan kembali berdasarkan hasil penilaian (misalnya, Hattie, 2012; lebih efektif dalam meningkatkan keterampilan guru bila dilakukan dalam jangka
Wiliam et al., 2004). waktu yang lebih lama

* Penulis yang sesuai.


Alamat email: giokvries@utwente.nl (JA de Vries).
1
Universiteit Twente, Fakultas Perilaku, Manajemen dan Ilmu Sosial, Ravelijn 5436, Postbus 217, 7500 AE Enschede.

https://doi.org/10.1016/j.stueduc.2022.101184
Diterima 14 September 2021; Diterima dalam bentuk revisi 21 April 2022; Diterima 5 Juli 2022
Tersedia online 13 Juli 2022
0191-491X/© 2022 Diterbitkan oleh Elsevier Ltd.
Machine Translated by Google

JA de Vries dkk. Kajian Evaluasi Pendidikan 74 (2022) 101184

waktu (setidaknya satu tahun), ketika guru secara kolaboratif, dari satu sekolah dan satu tugas penilaian (Schildkamp, van der Kleij, Heitink, Kippers, & Veld-kamp, 2020).
mata pelajaran secara kolaboratif berpartisipasi dalam TPD khusus mata pelajaran, dan
ketika guru secara aktif bekerja untuk meningkatkan praktik mengajar mereka (Desimone,
2009) . Namun, bukti bahwa program TPD di AfL juga dapat berdampak pada prestasi 2.1.3. Menggunakan umpan balik yang menggerakkan upaya belajar mengajar ke depan
siswa masih kurang (Sims & Fletcher-Wood, 2021). Setelah memperoleh bukti pembelajaran siswa, bukti ini dapat digunakan sebagai
umpan balik yang menggerakkan upaya belajar mengajar ke depan.
Tujuan dari penelitian ini adalah untuk mengetahui apakah program TPD, berdasarkan Informasi yang dikumpulkan melalui strategi kedua dapat digunakan sebagai umpan balik
Pendekatan Dinamis (misalnya, Christoforidou & Kyriakides, 2021; Kyriakides et al., 2017), mengenai status belajar siswa. Dengan umpan balik ini, guru mungkin akan lebih mampu
untuk AfL dapat membantu meningkatkan prestasi siswa. Kami berharap jika guru didukung mengarahkan praktik pengajaran mereka sendiri dibandingkan tanpa umpan balik (Black &
dalam penerapan AfL di kelasnya berdasarkan pendekatan dinamis, maka prestasi siswa Wiliam, 2009). Memberikan umpan balik kepada siswa bukanlah strategi yang mudah,
akan meningkat lebih besar dibandingkan siswa dari guru tanpa dukungan apa pun, seperti seperti yang mungkin diilustrasikan dengan baik dalam meta-analisis Hattie dan Timperley
yang akan kami jelaskan lebih lanjut dalam kerangka teori kami. (2007), yang mengevaluasi berbagai jenis umpan balik dan penggunaannya yang paling
efektif. Misalnya, terdapat indikasi bahwa lebih baik memberikan umpan balik direktif kepada
siswa yang berprestasi rendah dan umpan balik yang lebih fasilitatif kepada siswa yang
Penelitian ini merupakan bagian dari Proyek Erasmus+, yang bertujuan untuk berprestasi tinggi (Shute, 2008). Siswa yang berprestasi tinggi mungkin sudah memiliki
mempromosikan penilaian formatif di kelas. Dalam studi ini, kami akan fokus pada evaluasi strategi pembelajaran yang lebih luas, sedangkan siswa yang berprestasi rendah mungkin
program TPD di Belanda. memerlukan lebih banyak bimbingan langkah demi langkah dari guru atau teman sebaya.
Selain itu, untuk setiap bentuk umpan balik, penting agar pesan atau aktivitas dikaitkan
2. Kerangka teori langsung dengan kriteria keberhasilan (Carless & Boud, 2018): bagaimana umpan balik ini
menutup kesenjangan antara keberadaan siswa saat ini dan tujuan siswa. ?
2.1. Penilaian untuk pembelajaran

Ketika AfL diterapkan, guru dan siswa terus-menerus melakukan tiga pertanyaan
formatif: (1) “Kemana tujuan siswa?”, (2) 2.1.4. Melibatkan dan mengaktifkan siswa sebagai pemilik pembelajarannya sendiri dan
“Di manakah pelajar tersebut sekarang?”, dan (3) “Bagaimana kabar pelajar tersebut di sana?” sebagai sumber belajar satu sama lain
(William & Leahy, 2015). Untuk menjawab pertanyaan-pertanyaan ini, guru dan siswa Sepanjang penerapan strategi AfL, guru dapat melibatkan siswa dan mengaktifkan
dapat menggunakan empat strategi AfL: mereka sebagai pemilik pembelajarannya sendiri dan sebagai sumber belajar satu sama
lain. Hal ini dapat dilakukan misalnya dengan memberikan kriteria keberhasilan kepada
2.1.1. Berbagi niat belajar dan kriteria keberhasilan siswa yang dapat digunakan oleh siswa untuk memberikan umpan balik kepada teman
Agar dapat menilai dan (kembali) mengarahkan upaya belajar mengajar dengan sejawatnya terhadap pekerjaannya. Melalui penggunaan kriteria keberhasilan dalam menilai
sengaja, penting untuk menyampaikan maksud belajar dan kriteria keberhasilan kepada pekerjaan mereka sendiri, siswa dapat mengarahkan pembelajaran mereka tanpa campur
siswa. Niat belajar mengacu pada apa yang perlu dipelajari siswa, dan kriteria keberhasilan tangan guru. Dengan melibatkan siswa dalam pembelajarannya sendiri, motivasi intrinsik
selanjutnya digunakan untuk melihat sejauh mana keberhasilan siswa dalam mencapai niat yang merupakan prediktor belajar siswa dapat ditingkatkan (Cauley & McMillan, 2010).
belajar tersebut (Wiliam & Leahy, 2015). Guru harus memastikan apakah kriteria Rasa kepemilikan siswa meningkat dengan cara ini (Nicol dan Macfarlane-Dick, 2006).
keberhasilannya jelas bagi siswa. Hal ini bukan perkara mudah: ketidaksesuaian antara
kriteria guru dan kriteria siswa bukan tidak mungkin terjadi (Nicol dan Macfarlane-Dick, Seperti yang terlihat dari fakta bahwa masing-masing dari tiga strategi AfL pertama

2006). Hal ini bermasalah, karena niat belajar mengarahkan upaya siswa. Selain itu, proses merupakan prasyarat untuk melaksanakan strategi AfL berikutnya, penerapan AfL di kelas
berbagi niat belajar dan kriteria keberhasilan dapat menciptakan motivasi intrinsik peserta menuntut keterampilan guru yang kompleks (Heitink, Van der Kleij, Veldkamp, Schildkamp ,
didik, karena guru dapat melibatkan mereka dalam merumuskan niat dan kriteria & Kippers, 2016; Schildkamp, van der Kleij, Heitink, Kippers, & Veldkamp, 2020). Guru tidak
keberhasilan belajar. Hal itu dapat dicapai misalnya dengan membandingkan keteladanan hanya harus kompeten dalam strategi yang mereka perlukan sendiri, manfaat AfL tampaknya
dengan siswa. Contohnya adalah “sampel karya siswa yang dipilih dengan cermat dan akan lebih besar jika semua strategi AfL diterapkan sebagai satu kesatuan yang koheren
digunakan untuk menggambarkan dimensi kualitas” (Car-less et al., 2018). Melalui dan terintegrasi (Wiliam & Leahy, 2015) .
membandingkan dan mendiskusikan contoh dengan siswa, guru dapat membantu siswa
mengembangkan pemahaman yang lebih baik tentang apa itu pembelajaran berkualitas Hal ini semakin meningkatkan kompleksitas AfL.
tinggi.
2.2. Pengembangan profesional guru untuk penilaian pembelajaran: pendekatan
dinamis

2.1.2. Merekayasa diskusi, tugas, dan aktivitas yang efektif untuk memperoleh bukti Pendekatan dinamis terhadap TPD, yaitu pendekatan TPD (Christo-foridou &
pembelajaran siswa Ketika tujuan Kyriakides, 2021), telah menunjukkan potensinya untuk meningkatkan keterampilan guru
pembelajaran dan kriteria keberhasilan ditetapkan dan dibagikan, guru dapat merancang lainnya (misalnya, Creemers et al., 2013). Pendekatan berbasis kompetensi menggunakan
diskusi, tugas, dan aktivitas yang efektif untuk memperoleh bukti pembelajaran siswa. Untuk standar keterampilan guru sebagai indikator titik awal dan hasil TPD yang diinginkan (Day,
memperoleh kesan valid mengenai pemahaman siswa terhadap materi pelajaran yang akan 2017).
dipelajari, guru dapat menggunakan beberapa metode penilaian. Penilaian tidak hanya Kesesuaian pendekatan ini dengan AfL dapat dijelaskan dengan menyajikan prinsip-prinsip
mengacu pada tes kertas dan pensil, namun pada semua instrumen yang dapat digunakan dasar pendekatan dinamis, yang telah terbukti efektif dalam meningkatkan keterampilan
guru dan siswa untuk memperoleh bukti pembelajaran dan memberikan wawasan tentang yang menuntut (Antoniou & Kyriakides, 2013).
kebutuhan pembelajaran ( Van der Kleij, Vermeulen, Schildkamp, & Eggen, 2015 ), baik
secara formal (misalnya penilaian tertulis) maupun informal (misalnya melalui diskusi
dengan siswa). Selain itu, teknik penilaian dapat menggunakan cara respons yang berbeda: 2.2.1. Pendekatan berbasis kompetensi
tertulis, lisan, kinerja (misalnya demonstrasi), dan penilaian diri sendiri dan rekan kerja Untuk meningkatkan keterampilan guru, keterampilan tersebut perlu diajarkan secara
(Christoforidou et al., 2014). Untuk memperoleh bukti pembelajaran siswa dengan baik, terpadu dan bukan keterampilan yang terpisah-pisah dan parsial (Christoforidou &
guru mengambil manfaat dari pengetahuan tentang apa saja tugas penilaian yang baik bila Kyriakides, 2021). Terdapat bukti bahwa guru mungkin dapat mengembangkan keterampilan
dipadukan dengan niat belajar tertentu, karena hal ini akan berpengaruh pada kegunaan kompleks dengan lebih baik, seperti keterampilan yang diperlukan untuk AfL, dan
informasi yang dihasilkan dari pembelajaran tersebut. mentransfer keterampilan ini ke situasi kehidupan nyata ketika pengajaran difokuskan pada
pengelompokan keterampilan dibandingkan dengan keterampilan yang terisolasi (Creemers
dkk. , 2013; Merrill, 2012). Pendekatan berbasis kompetensi, dalam konteks AfL, adalah solusi terbaik

2
Machine Translated by Google

JA de Vries dkk. Kajian Evaluasi Pendidikan 74 (2022) 101184

dianggap sebagai kemajuan kompetensi guru (Christoforidou & Kyriakides, 2021). 2008). Dalam hal ini, kemungkinan besar guru akan benar-benar mengubah
Misalnya, guru hanya dapat mulai mengembangkan teknik penilaian ketika mereka praktik pengajarannya, dibandingkan hanya menambahkan beberapa teknik baru
mempunyai kejelasan mengenai apa tujuan pembelajaran dan kriteria keberhasilan ke dalam praktiknya saat ini (Darling-Hammond dkk., 2017).
siswanya; oleh karena itu, strategi awal AfL harus selalu dibenahi terlebih dahulu Hal terakhir ini sering terjadi ketika guru mencoba menerapkan AfL, seperti ketika
sebelum melanjutkan. guru hanya memasukkan teknik ke dalam pelajaran mereka (yaitu, AfL “secara
Pendekatan berbasis kompetensi dapat diselaraskan dengan fokus yang berpusat harfiah”) alih-alih mempertimbangkan keselarasan teknik tersebut dalam pelajaran
pada tugas: “pengalaman belajar harus dipusatkan pada tugas-tugas pembelajaran, mereka (yaitu, AfL “dengan semangat” ; Brooks dkk., 2021).
yang didasarkan pada masalah atau prosedur dunia nyata yang diharapkan akan
ditemui oleh pembelajar di dunia nyata” (Francom & Gardner , 2014, hal. 2.2.4. Mendukung guru
30). Pentingnya tugas-tugas kehidupan nyata ditekankan oleh perlunya program Meskipun guru bertanggung jawab secara profesional untuk benar-benar
TPD untuk mengintegrasikan AfL dengan pengetahuan konten (misalnya, mencoba dan menerapkan AfL, dalam proses ini mereka dapat dibantu oleh
Desimone, 2009). Tanpa pengetahuan konten, akan sangat sulit bagi guru untuk pelatih ahli TPD (Christoforidou & Kyriakides, 2021). Dengan bantuan dari pakar
mendapatkan wawasan tentang proses berpikir siswa, dan bahkan lebih sulit lagi yang berpengetahuan luas, seperti umpan balik terpandu, guru mungkin dapat
untuk dapat menyesuaikan pembelajaran mereka (Heitink, Van der Kleij, mengambil langkah-langkah yang diperlukan untuk mengubah pembelajaran
Veldkamp, Schildkamp, & Kippers, 2016) mereka dengan mengintegrasikan AfL di dalamnya (Darling-Hammond et al.,
2017; Desimone, 2009; Garet et al., 2001 ). Pemantauan terus-menerus terhadap
2.2.2. Menyesuaikan dengan kebutuhan guru kemajuan guru juga dapat menghasilkan informasi yang berguna tentang
Dalam konteks keterampilan kompleks tertentu, seperti yang diperlukan untuk bagaimana meningkatkan dan melanjutkan program TPD (yaitu penilaian formatif).
AfL, kemampuan guru mungkin juga sangat bervariasi (misalnya, Christoforidou Hal ini juga dapat memungkinkan kesesuaian yang lebih dekat antara isi TPD dan
dkk., 2014). Misalnya saja dalam hal niat belajar berbagi, diketahui bahwa praktik guru (Timperley dkk., 2008). Penting untuk dicatat bahwa tidak hanya
sebagian guru hanya menyebutkan topik pembelajarannya, sedangkan sebagian pelatih TPD, tetapi juga guru itu sendiri yang mempunyai peran dalam proses
lainnya berusaha merumuskan maksud belajar tersebut melalui kerja sama perbaikan, terutama ketika beberapa guru dari sekolah dan mata pelajaran yang
dengan siswa (Kippers, Wolterinck, Schildkamp, Poortman, & Visscher, 2018 ). sama berpartisipasi (yaitu, partisipasi kolaboratif; Desimone, 2009 ; Darling-
Selain itu, sejalan dengan kompleksitas AfL, pemahaman guru tentang AfL dapat -Hammond dkk., 2017; Timperley dkk., 2008). Refleksi kritis dan kolaborasi
mencakup banyak kesalahpahaman mengenai AfL, seperti gagasan bahwa tes itu dengan rekan-rekan merupakan elemen penting dari TPD, karena guru dapat
sendiri dapat bersifat formatif atau sumatif. lebih memahami strategi apa yang dapat digunakan untuk meningkatkan
(William & Leahy, 2015). Kesalahpahaman tersebut dapat mempengaruhi pengajaran mereka melalui berbagi pengalaman pembelajaran untuk menerapkan
kemampuan guru untuk meningkatkan praktiknya, karena pengetahuan yang baru AfL (Timperley et al., 2008) .
dipelajari tidak akan terhubung dengan baik dengan pengetahuan sebelumnya
(yaitu kesalahpahaman). Berbeda dengan kebanyakan pendekatan TPD yang 2.3. Studi saat ini
berorientasi “satu untuk semua”, pendekatan dinamis menyarankan agar program
TPD disesuaikan dengan kebutuhan guru yang berbeda-beda. Dengan Saat ini, sebagian besar guru masih berorientasi pada sumatif, dan masih
mendiagnosis kebutuhan profesional guru, konten TPD dapat disesuaikan dengan sedikit ruang bagi AfL dalam praktik mengajar mereka (Kippers, Wolterinck,
kebutuhan tersebut, dan pada gilirannya, mendekati Zona Perkembangan Schildkamp, Poortman, & Visscher, 2018). Bahkan dengan dukungan melalui
Proksimal guru (Vygotsky dkk., 1994). Ketika kebutuhan profesional guru dianalisis program TPD, penerapan AfL oleh guru sering kali masih terbatas pada versi AfL
sebelum dimulainya TPD, PD dapat lebih terhubung dengan praktik mereka yang mekanistik, yang mana strategi ditambahkan ke dalam pembelajaran mereka,
(Darling-Hammond et al., 2017, hal. 21). Bukti menunjukkan potensi namun tidak benar-benar terintegrasi (Schildkamp, van der Kleij, Heitink, Kippers,
mempertimbangkan kebutuhan profesional guru (Christoforidou et al., 2014). & Veldkamp, 2020 ). Selain itu, masih sedikit bukti bahwa TPD mengubah prestasi
siswa (Sims & Fletcher-Wood, 2021).
Hal ini sejalan dengan kenyataan bahwa perjalanan untuk meningkatkan
2.2.3. Menjelaskan mekanisme di balik keterampilan guru kemampuan guru dalam melakukan penilaian formatif masih panjang hingga
Guru dapat belajar dan meningkatkan kemampuannya dengan baik jika benar-benar mengubah praktik mengajar mereka, dan pada akhirnya, meningkatkan
mereka memahami mekanisme yang mendasari di balik pengaruh keterampilan prestasi siswa. Dalam penelitian ini, kami menyelidiki pengaruh program TPD
mengajar tertentu terhadap hasil siswa. Artinya, guru perlu mengetahui tidak yang menangani AfL terhadap prestasi siswa yang didasarkan pada prinsip-prinsip
hanya apa itu AfL, tapi juga alasan dan cara kerjanya. Hal ini berbeda dengan yang disajikan sehubungan dengan pembelajaran guru (yaitu, pendekatan
hanya “memberi tahu” guru apa yang harus dilakukan (yaitu model transmisi dinamis). Pendekatan ini telah terbukti efektif untuk keterampilan guru lainnya
pengajaran), yang dapat menurunkan motivasi guru untuk mengubah praktik (misalnya, Anto-niou & Kyriakides, 2013; Kyriakides et al., 2017). Pertanyaan
mereka saat ini (Timperley et al., 2008). Hal ini sebagian dapat dilakukan melalui penelitian pada
pemodelan: penelitian ini adalah: Apa pengaruh program pengembangan profesi guru
Asesmen Pembelajaran Berbasis Pendekatan Dinamis terhadap prestasi belajar
Model kurikuler dan pemodelan pengajaran memberi guru visi yang jelas
siswa?
tentang seperti apa praktik terbaiknya. Guru dapat melihat model yang
mencakup rencana pembelajaran, rencana satuan, contoh pekerjaan siswa,
3. Metode
pengamatan guru sejawat, dan video atau kasus pengajaran tertulis.
(Darling-Hammond dkk., 2017, hal. 5)
Untuk menjawab pertanyaan penelitian, kami menggunakan uji coba terkontrol
Pembelajaran yang lebih banyak dapat diharapkan oleh guru melalui melihat contoh-contoh secara acak, yang akan kami uraikan lebih rinci di bawah.
keterampilan yang kompleks, karena contoh-contoh tersebut dapat menunjukkan cara terbaik untuk
mendekati suatu masalah (Merrill, 2012). 3.1. Desain penelitian dan peserta
Model perilaku ahli juga dapat memberikan masukan untuk pembelajaran
aktif, seperti “mengamati guru ahli atau diamati, diikuti dengan umpan balik Para guru matematika yang berpartisipasi dalam penelitian ini melakukannya
interaktif dan diskusi; meninjau pekerjaan siswa dalam bidang topik yang dibahas; atas dasar sukarela. Setiap sekolah menengah di Belanda yang menawarkan
dan memimpin diskusi” (Desimone, 2009, hal. 184). tingkat pendidikan menengah tingkat bawah (yaitu kelas 7, 8 dan 9) dari
Selain itu, dengan memperjelas perbedaan antara keberadaan guru dan tujuan pendidikan menengah umum senior dan pra-universitas dihubungi melalui email
mereka (misalnya, model AfL), model perilaku ahli dapat membantu guru mencapai dengan informasi tentang pelatihan dan studi ini. Selain itu, guru matematika
rencana tindakan yang memadai dan berbasis teori mengenai AfL yang sesuai didekati melalui seruan untuk berpartisipasi dalam majalah pendidikan (matematika)
dengan persepsi diri mereka. kebutuhan yang teridentifikasi (Timperley dkk., dan buletin (matematika). Akhirnya, a

3
Machine Translated by Google

JA de Vries dkk. Kajian Evaluasi Pendidikan 74 (2022) 101184

total 33 sekolah memutuskan untuk berpartisipasi sebelum batas waktu penerimaan Tabel
(empat bulan sebelum dimulainya program TPD), sebagian besar dengan dua hingga 2 Karakteristik siswa pada kelompok eksperimen dan kontrol yang berpartisipasi
tiga guru per sekolah, sehingga total 77 guru berpartisipasi. Sekolah guru secara dalam tes sebelum dan sesudah.
acak ditugaskan ke kelompok eksperimen (38 guru) atau kelompok kontrol (39 guru). Ciri-ciri Kelompok Eksperimen Kelompok kontrol

Pra- Pos- Sebelum dan sesudah Pra- Pos- Sebelum dan sesudah
Guru yang ditempatkan dalam kelompok kontrol tidak dapat diberikan pelatihan penuh
Total 705 394 371 650 243 228
karena alasan anggaran, namun diberikan semua materi dan setelah itu
Pria 284 162 151 156 56 49
berkesempatan untuk berpartisipasi dalam lokakarya sehari penuh, termasuk hal-hal Perempuan 421 232 220 494 187 179
penting dari program TPD secara penuh (yaitu, pengobatan tertunda). Setelah Kelas 7 157 63 162 415 158 151
memberi tahu guru tentang kelompok mana mereka ditugaskan, lima guru dari Kelas 8 253 146 135 166 55 52
Kelas 9 295 185 178 69 30 25
kelompok eksperimen dan 10 guru dari kelompok kontrol keluar. Alasan utama
peserta tidak melanjutkan pada saat itu adalah karena prioritas guru telah berubah
karena sakit, atau, yang lebih sering, penurunan motivasi (misalnya, “Kami cukup menunjukkan perbedaan yang signifikan secara statistik, t(597) = 2,84, p = 0,005,
sibuk dengan pengajaran kami, sehingga kami tidak dapat berpartisipasi lagi”) . untuk prestasi siswa pada pre-test antara kelompok eksperimen dan kelompok kontrol
Sayangnya, menjelang akhir pelaksanaan program TPD kami, pandemi COVID-19 lebih menguntungkan kelompok kontrol. Namun, karena besarnya perbedaan pra-tes
merebak. Hal ini menyebabkan banyak guru yang drop out pada saat post-test ini berada dalam standar deviasi 0,25, kami masih dapat membandingkan kelompok-
(sembilan guru pada kelompok eksperimen dan 12 guru pada kelompok kontrol), kelompok ini secara bermakna (What Works Clearinghouse, 2020).
menyisakan 24 guru pada kelompok eksperimen dan 17 guru pada kelompok kontrol
(lihat Tabel 1 ) . Meskipun para guru ini masih termotivasi untuk berpartisipasi dalam
penelitian, mereka mengalami kesulitan dalam menjangkau siswanya dan memotivasi 3.2. Instrumen
mereka untuk menyelesaikan tes, karena pendidikan menengah sepenuhnya bersifat
digital pada saat pasca pengukuran. 3.2.1. Kuesioner guru Kuesioner
guru yang dikembangkan oleh Christoforidou dkk. (2014) digunakan untuk
mengevaluasi tahapan perkembangan guru dalam hal keterampilan penilaian mereka.
Pada awal TPD, setiap guru berpartisipasi dengan kurang lebih 20 siswa, Kuesioner tersebut berjumlah total 108 item, dan digunakan untuk mengukur tujuan
sehingga total siswa pada kelompok eksperimen berjumlah 740 siswa dan kelompok guru dalam menilai pembelajaran siswa (3 item), dan frekuensi (1 = Tidak Pernah
kontrol berjumlah 667 siswa. Karena ada guru yang putus sekolah, ada juga siswa hingga 5 = Selalu) penggunaan berbagai bentuk teknik penilaian untuk menilai
yang putus sekolah. Akhirnya, 49,9% siswa pada kelompok eksperimen dan 65,8% pembelajaran siswa di kelas (diterjemahkan dari bahasa Belanda):
siswa pada kelompok kontrol putus sekolah. Ini menyisakan kumpulan data 371
siswa yang terdiri dari 24 guru pada kelompok eksperimen dan 228 siswa yang terdiri
dari 17 guru pada kelompok kontrol, dengan total n sebesar 599 untuk siswa dan 41 (1) penilaian tertulis (24 item), misalnya: “Saya menyusun item/latihan/soal untuk
untuk guru. Persentase siswa yang berpartisipasi dalam sebelum dan sesudah tes tertulis dengan mempertimbangkan materi yang dipelajari selama saya
pengukuran adalah 58,9% untuk 24 guru di kelompok eksperimen yang tetap mengajar”;
bertahan selama penelitian, dan 58,9% untuk 17 guru di kelompok kontrol yang tetap (2) penilaian lisan (14 item), misalnya: “Saya mengetahui sebelumnya siswa mana
tinggal. yang akan saya nilai secara lisan dan pertanyaan mana yang akan saya
ajukan kepada setiap siswa”; (3)
penilaian kinerja (9 item), misalnya: “Ketika saya menggunakan observasi untuk
• Nilai yang lebih rendah mengacu pada guru yang diperbolehkan mengajar di kelas menilai kerja kelompok, saya fokus pada mengidentifikasi kontribusi setiap
7, 8, dan 9, sedangkan nilai yang lebih tinggi mengacu pada guru yang telah siswa terhadap tim”;
memiliki pendidikan guru tambahan di tingkat universitas dan juga diperbolehkan (4) penilaian diri (17 item), misalnya: “Siswa diminta
mengajar di kelas 10, 11, dan 12. menghasilkan kriteria untuk penilaian diri”;
• Sebaran karakteristik guru, dinilai dengan (5) penilaian teman sejawat (5 item), misalnya: “Siswa diharapkan membagikan
Uji eksak Fisher untuk independensi, tidak menunjukkan perbedaan yang catatan penilaian teman sejawatnya kepada teman sekelas lainnya”;
signifikan secara statistik antara eksperimen dan kontrol (6) melaporkan hasil umpan balik (36 item), misalnya: “Saya meminta siswa saya
kelompok. untuk melakukan koreksi/penambahan pada pekerjaannya berdasarkan
umpan balik yang diberikan”.
Dalam sampel siswa akhir kami (lihat Tabel 2), distribusi jenis kelamin, ÿ2 (1, N
= 599) = 23,43, p =.00, dan nilai, ÿ2 (2, N = 599) = 169.03, p =.00 , tidak sebanding 3.2.2. Tes matematika
antar kelompok. Uji -t sampel independen Prestasi siswa diukur melalui empat tes matematika yang dikembangkan dan
divalidasi dalam penelitian ini, dengan tujuan mengukur peningkatan pengetahuan
Tabel 1 matematika siswa di tiga kelas yang lebih rendah (yaitu, 12-14 tahun) sekolah umum
Karakteristik latar belakang guru pada kelompok eksperimen dan kontrol. senior dan pra-sekolah. -tingkat pendidikan universitas pendidikan menengah.
Keempat tes tersebut digunakan untuk tes sebelum dan sesudah, lihat Tabel 3.
Karakteristik Kelompok eksperimen (n Kelompok kontrol
latar belakang = 24) (n = 17)
Soal-soal untuk keempat tes matematika ini dikembangkan berdasarkan analisis
Jenis kelamin Pria 16 (66,7%) 13 (76,5%)
tujuan pembelajaran untuk nilai-nilai pendidikan menengah di empat negara yang
Perempuan 8 (33,3%) 4 (23,5%)
Tugas mengajar L 13 (54,2%) 8 (47,1%) berpartisipasi dalam studi utama Proyek Erasmus+. Berdasarkan analisis tersebut,
(L = nilai lebih rendah, L+H 6 (25,0%) 8 (47,1%) 13 hingga 30 item terbuka per tes dikembangkan untuk mengukur tujuan pembelajaran
H = nilai lebih tinggi, L+D 1 (4,2%) 0 (0%) tersebut. Dari semua itu
D = pemimpin L+H+ 4 (16,7%) 1 (5,9%)
departemen) D
Pengalaman mengajar <5 1 (0,4%) 3 (17,6%)
Tabel
bertahun-tahun 5-9 4 (1,7%) 3 (17,6%) 3 Pemberian empat tes matematika untuk tes sebelum dan sesudah.
10-14 4 (1,7%) 4 (23,5%)
Kelas 7 Kelas 8 Kelas 9
15-19 7 (29,2%) 2 (11,8%)
20 atau 8 (33,3%) 5 (29,4%) Pra-tes Tes matematika 1 Tes matematika 2 Tes matematika 3
lagi Pasca tes Tes matematika 2 Tes matematika 3 Tes matematika 4

4
Machine Translated by Google

JA de Vries dkk. Kajian Evaluasi Pendidikan 74 (2022) 101184

item, 15% merupakan item yang umum di keempat tes, sehingga memungkinkan untuk melibatkan siswa dalam proses penilaian dan tanpa membedakan praktik penilaian
menyamakan keempat tes tersebut (yaitu, untuk membandingkan tingkat kelas yang berbeda). mereka.

Berdasarkan tahapan ini, kami menetapkan titik awal yang berbeda dan hasil yang
3.3. Prosedur diinginkan untuk setiap kelompok guru. Misalnya, kelompok A akan memulai dengan
menciptakan budaya kelas yang aman, sedangkan kelompok B memulai dengan
3.3.1. Pengumpulan data merumuskan niat belajar dan kriteria keberhasilan, dan kelompok C memulai secara
Program AfL TPD mencakup lima sesi (masing-masing sesi terdiri dari enam langsung dengan berbagi niat belajar. Kelompok A kemudian dijadwalkan untuk
minggu). Ini dimulai pada bulan September 2019 dan dijadwalkan berakhir pada bulan melanjutkan merumuskan maksud pembelajaran dan kriteria keberhasilan berdasarkan
April 2020. Dampak dari program TPD diselidiki melalui penilaian prestasi siswa dalam materi pelajaran dan metode penilaian yang ada. Kelompok B dijadwalkan untuk
matematika, yang merupakan mata pelajaran yang diajarkan oleh guru mereka yang melangkah lebih jauh dengan mengembangkan teknik penilaian mereka sendiri, dan
berpartisipasi dalam program TPD kami. Kuesioner guru diberikan secara digital selama kelompok C juga dijadwalkan untuk melibatkan siswa dalam praktik mereka sendiri.
sesi pendahuluan dan membutuhkan waktu sekitar 30 menit untuk menyelesaikannya.
Pre-test prestasi matematika siswa dimulai setelah sesi pendahuluan dan berakhir Selama keseluruhan program TPD, para pelatih TPD memperoleh bukti tentang (a)
sebelum sesi pertama. Tes matematika dilaksanakan oleh guru sendiri pada kelompok kemajuan guru dalam mencapai tujuan pembelajaran, dan (b) kualitas program TPD.
eksperimen, dan oleh asisten mahasiswa pada kelompok kontrol. Alasannya adalah Beberapa metode informal dan formal digunakan untuk memperoleh bukti-bukti
untuk meminimalkan angka putus sekolah guru pada kelompok kontrol. tersebut: (1) observasi dan diskusi, dan (2) exit ticket dengan pertanyaan seperti
“Elemen program TPD apa yang telah membantu Anda meningkatkan praktik AfL
Anda?”. Berdasarkan bukti yang diperoleh setelah perkenalan dan sesi pertama, kami
Penyelenggaraan tes matematika memakan waktu sekitar 30 menit. Post-tes prestasi memutuskan untuk mengubah cara kami menerapkan prinsip program yang dibedakan.
matematika direncanakan dimulai setelah sesi kelima pada bulan April dan berakhir Guru pada tahap perkembangan pertama, pemula, menyatakan ketidakpuasannya
sebelum liburan musim panas pada bulan Juni. terhadap pendekatan yang dibedakan. Para guru ini mempunyai gagasan bahwa
Namun karena ditutupnya sekolah-sekolah di Belanda, sesi terakhir program TPD konten pemula tidak memberikan mereka alat yang cukup konkrit untuk meningkatkan
ditunda hingga September 2020. Post-test prestasi matematika tetap berlangsung praktik mengajar mereka sendiri. Perasaan ini juga dirasakan oleh para pelatih TPD,
sebelum libur musim panas, namun dalam bentuk digital yang harus dilakukan. dikelola karena beberapa konten pemula kurang spesifik pada mata pelajaran, seperti
oleh guru sendiri dalam pembelajaran online. Alasan tidak menunda ujian akhir “menciptakan lingkungan belajar yang aman”. Karena alasan ini, kami memutuskan
matematika adalah untuk meminimalkan angka putus sekolah, karena siswa sekolah untuk mengubah dari pembedaan antar kelompok menjadi pembedaan dalam satu
menengah di Belanda sering berganti guru setelah liburan musim panas. Timeline sesi kelompok guru yang semuanya menerima konten yang sama: lima strategi AfL. Namun,
TPD dan pengumpulan data dapat dilihat pada Gambar 1. diferensiasi pada tahap perkembangan dapat dicapai, karena guru menerima umpan
balik pada tingkat tahap perkembangan mereka dan ketika mereka sedang mengerjakan
pengembangan instrumen dan (integrasi instrumen ini ke dalam) rencana aksi mereka.

3.3.2. Program TPD


Berdasarkan prinsip pendekatan dinamis bahwa dalam setiap upaya untuk melatih Misalnya, guru merancang pertanyaan diagnostik selama sesi kedua.
guru, penting untuk mendiagnosis kebutuhan profesional guru (yaitu, prinsip “pendekatan Selama proses ini, guru pada tahap pemula menerima umpan balik tambahan mengenai
yang berbeda”), kami memulai dengan penilaian awal terhadap keterampilan AfL guru konten yang terkait dengan kebutuhan profesional mereka, seperti bagaimana mereka
selama sesi perkenalan. dari program TPD (Creemers et al., 2013). Selain itu, hasil dapat “menciptakan lingkungan belajar yang aman” sambil memberikan pertanyaan
penilaian diri mengenai penilaian tersebut dijadikan sebagai indikator tahapan diagnostik.
perkembangan guru. Hal ini mengungkapkan tiga tahapan guru pada saat sesi Menurut prinsip pendekatan dinamis “menjelaskan mekanismenya”, penting untuk
perkenalan: memulai dengan pemahaman yang jelas tentang tujuan AfL dan seperti apa AfL yang
berkualitas tinggi. Hal ini juga sesuai dengan pendekatan berbasis kompetensi dimana
standar kompetensi guru menjadi titik awal TPD. Oleh karena itu, setiap sesi dimulai
– Tahap A (“pemula”) terdiri dari 11 guru, yang menunjukkan bahwa mereka terutama dengan menetapkan kejelasan dan konsensus mengenai maksud dan tujuan sesi
menggunakan penilaian tertulis untuk mengukur prestasi matematika untuk tujuan tersebut. Selain itu, bagaimana (penggunaan gabungan) strategi AfL dapat meningkatkan
sumatif. prestasi siswa ditekankan di setiap sesi. Hal ini mungkin juga membantu meningkatkan
– Tahap B (“lanjutan”) melibatkan 14 guru, yang menunjukkan bahwa mereka keyakinan guru mengenai AfL, dan untuk melawan kesalahpahaman (misalnya, “Siswa
menggunakan teknik penilaian yang berbeda untuk mengukur pencapaian dalam hanya dapat termotivasi untuk belajar ketika mereka mendapat nilai.”). Hal ini
matematika, namun tanpa menentukan kriteria keberhasilan yang sesuai atau merupakan upaya untuk mencapai komitmen guru yang berpartisipasi dalam
memberikan umpan balik yang konstruktif. meningkatkan praktik AfL mereka.
– Tahap C (“ahli”) terdiri dari 8 guru, yang menunjukkan bahwa mereka menggunakan
teknik penilaian untuk mengukur niat belajar yang lebih kompleks untuk memberikan
umpan balik yang konstruktif, namun belum

Gambar 1. Timeline sesi TPD dan pengumpulan data.

5
Machine Translated by Google

JA de Vries dkk. Kajian Evaluasi Pendidikan 74 (2022) 101184

Selama sesi TPD, guru didukung (yaitu prinsip “guru pendukung”) oleh para Tabel
ahli dan guru sejawat. Di awal setiap sesi TPD, pertama-tama kami merefleksikan 4 Statistik kecocokan kuesioner guru dalam studi validasi.
strategi AfL yang telah dipelajari sebelumnya. Statistik Berarti Deviasi tidak cocok Pakaian tidak cocok Pakaian
Pelatih ahli TPD menanyakan bagaimana guru telah mengintegrasikan strategi ras standar berarti berarti T T

AfL yang telah dipelajari sebelumnya ke dalam pelajaran mereka (misalnya, “Apa skor persegi persegi

manfaat penerapan strategi AfL yang telah dibahas sebelumnya bagi Anda?”), Item (n = 0,00 0,61 0,99 1,00 -0,03 0,04
dan meminta guru untuk bertukar tips dan trik tentang hal ini, dan untuk 115)
Orang (n = -0,39 0,36 1.03 1.02 -0,02 0,01
mempersiapkan pelajaran selanjutnya. Selanjutnya, kami memperkenalkan
186)
strategi AfL yang spesifik melalui demonstrasi strategi tersebut, dan dengan
mengembangkan instrumen (misalnya, sebuah rubrik di mana niat belajar
diurutkan dan dihubungkan dengan tugas siswa), untuk memfasilitasi penerapan Pada saat pembelajaran validasi dan pembelajaran utama, jawaban seluruh
strategi AfL yang spesifik. Setelah itu, guru diminta untuk mengintegrasikan butir soal tes matematika diberi kode dengan menggunakan kunci jawaban yang
konten yang baru dipelajari ke dalam pelajaran mendatang yang sesuai dalam telah dikembangkan untuk setiap tes matematika. Sayangnya, karena penutupan
bentuk rencana tindakan. Dalam proses ini, pelatih TPD memberikan dukungan sekolah pada saat pasca pengukuran, pasca-tes harus diubah dari tes fisik pena
individu kepada guru pada tahap perkembangannya dalam bentuk umpan balik, literatur,
dantemuan
kertaspenelitian, dan digital
menjadi versi buklet.di Qual-trics. Peralihan ke mode tes yang
berbeda dapat mempunyai dampak yang sangat kecil terhadap prestasi siswa;
namun, kemungkinan besar hasilnya masih sebanding, terutama karena kelompok
3.4. Analisis data eksperimen dan kelompok kontrol menggunakan mode pengujian yang sama
selama sebelum dan sesudah pengukuran (Buerger et al., 2019). Karena kami
Sebelum memulai penelitian ini, semua instrumen yang digunakan telah memiliki lebih sedikit siswa untuk setiap tingkat kelas dan setiap guru karena
divalidasi. Kuesioner diberikan kepada 186 guru matematika di Belanda. Data putus sekolah setelah pengukuran penelitian kami, kami memilih untuk
yang dihasilkan dianalisis menggunakan model extended logistic Rasch dan menyamakan nilai siswa. Dengan cara ini kami dapat menggabungkan siswa dari
model Saltus untuk memberikan jawaban mengenai penskalaan dan struktur ketiga kelas menjadi satu kelompok dan memiliki kekuatan yang cukup untuk
pengembangan kemampuan guru dalam penilaian (cf. Christoforidou & Kyriakides, mendeteksi dampak program TPD.
2021; Demetriou & Kyriakides, 2006). Dengan analisis Rasch, kita dapat Kami menggunakan teknik teori respon item untuk (secara vertikal)
menunjukkan bahwa guru dan item dapat direduksi menjadi skala unidimensi menyamakan skor siswa pada tes matematika dan untuk membuat skala yang
yang sama (Andrich, 1988). Semua keterampilan penilaian ditemukan memiliki sebanding. Hal ini disebabkan karena ulangan matematika untuk tingkatan kelas
nilai item infit dan item outfit yang memuaskan (Tabel 4). Statistik infit sensitif atas lebih sulit dibandingkan dengan ujian matematika untuk tingkatan kelas
terhadap pola respons orang yang tidak terduga terhadap suatu item (dan bawah. Metode penyetaraan ini mirip dengan metode penyetaraan yang
sebaliknya), sedangkan statistik pakaian mengacu pada respons orang yang digunakan dalam studi Program of International Student Assessment (PISA)
tidak terduga terhadap item yang relatif mudah bagi mereka (Linacre, 2002) . (Organisation for Eco-nomic Co-operation and Development, 2017), misalnya.
Kedua statistik kecocokan berada pada tingkat yang sesuai, karena statistik Karena data tersarang (level 1: siswa dan level 2: guru), analisis multilevel
kecocokan rata-rata mendekati 1 dan statistik t mendekati 0. Semua nilai digunakan untuk menyelidiki efektivitas program TPD terhadap prestasi siswa,
kecocokan t untuk orang dan keterampilan penilaian lebih besar dari -2,00 dan yang diukur dengan perolehan siswa pada post-test. Analisis ini dilakukan dengan
kurang dari 2,00. Selanjutnya, kemampuan pemisahan kuesioner diuji menggunakan perangkat lunak MLwiN (Charlton et al., 2017). Pertama, model
menggunakan Cronbach's alpha (ÿ = 0,96). tanpa variabel penjelas untuk menyelidiki variasi prestasi siswa di tingkat guru
dan siswa (model nol), dianalisis. Model ini diberikan oleh:
Selanjutnya, prosedur untuk mendeteksi pengelompokan pola dalam desain
pengukuran yang dikembangkan oleh Marcoulides dan Drezner (1999) digunakan untuk
mengelompokkan keterampilan item dengan berbagai tingkat kesulitan dalam kelompok perilaku guru.

Yij(skor posttest siswa i dari guru j) = ÿ0j(rata-rata umum)+ U0j(efek acak tingkat guru)+ Rij(efek acak tingkat siswa)

Dengan menggunakan model Saltus, kita dapat menguji kesenjangan antara


kelompok perilaku guru (lih. Christoforidou & Kyriakides, 2021). Dengan solusi 3-
cluster, 55% varians dalam keseluruhan hasil kuesioner guru dapat dijelaskan, Yij mewakili hasil post-test siswa i dari guru j. Hasil ini bergantung pada
yang dianggap memuaskan (Romesburg, 1984). jumlah rata-rata umum (ÿ0), pengaruh acak pada tingkat guru (U0j), dan pengaruh
acak pada tingkat siswa (Rij). Dalam model berikutnya, variabel penjelas berikut
Keempat tes matematika tersebut divalidasi dengan memberikannya kepada ditambahkan ke model nol: pencapaian sebelumnya sebagai skor Z dengan rata-
siswa di Belanda (n = 392), Belgia (n = 391), Yunani (n = rata 0 dan deviasi standar 1 (yaitu, cara untuk memusatkan pada rata-rata utama,
360) dan Siprus (n = 385) pada tahun sebelum penelitian ini (Hasil 10 proyek yang pada gilirannya, menghasilkan efek yang sebanding; Bryk & Raudenbush,
Erasmus+ FORMAS, 2021). Semua statistik, termasuk kemampuan pemisahan, 1992) dan gender sebagai variabel dummy (0 = laki-laki, 1 = perempuan). Model
berada pada tingkat yang sesuai. Kami memeriksanya lagi untuk penelitian utama 1 diberikan oleh:
ini, dan menemukan hasil serupa (Tabel 5).

Yij(skor posttest siswa i dari guru j) = ÿ0j(rata-rata umum) + ÿ1X1ij( prestasi sebelumnya ) + ÿ2X2ij(gender)+U0j( efek acak tingkat guru)
+Rij (tingkat siswa efek acak)

6
Machine Translated by Google

JA de Vries dkk. Kajian Evaluasi Pendidikan 74 (2022) 101184

Tabel
5 Hasil analisis Rasch tes matematika untuk studi utama sampel Belanda.
Tingkat Statistik Berarti skor Rasch Deviasi standar Keandalan Infit berarti persegi Pakaian berarti persegi Infit t Pakaian t

Pra-Tes Kelas 7 Barang (n = 30) 0,00 1.28 0,99 1,00 1.06 -0,22 0,12
Orang (n =577) 0,69 0,98 0,76 0,99 1.06 -0,02 0,16
Kelas 8 Barang (n = 28) 0,00 1.82 0,98 1,00 0,95 0,03 -0,12
Orang (n =422) 0,03 1.12 0,79 1,00 0,95 0,01 0,33
Kelas 9 Barang (n = 13) 0,00 0,91 0,96 1,00 0,98 0,07 -0,04
Orang (n =402) -1.14 0,96 0,46 1.01 0,99 0,11 0,15
Pasca Tes Kelas 7 Barang (n = 28) 0,00 1.62 0,99 1,00 0,98 -0,04 0,00
Orang (n = 229) -0,20 1.31 0,84 1,00 0,98 -0,02 0,09
Kelas 8 Barang (n = 13) 0,00 0,74 0,93 0,99 0,91 0,07 -0,04
Orang (n = 220) -0,91 1,09 0,58 0,99 0,91 0,07 0,41
Kelas 9 Barang (n = 21) 0,00 1,72 0,93 1,00 0,90 0,20 -0,14
Orang (n =228) -2.12 1.19 0,64 0,99 0,89 0,11 0,47

Tabel 6
Model bertingkat memprediksi prestasi siswa.
Faktor Model 0 Model 1 Model 2

Bagian yang diperbaiki Parameter (standar deviasi) 0,05 Parameter (deviasi standar) -0,05 Parameter (deviasi standar) -0,21
Mencegat (0,076) (0,082) (0,11)
tingkat siswa
Prestasi sebelumnya 0,40 (0,04) 0,41 (0,04)
Jenis Kelamin (0 = laki-laki, 1 = perempuan) 0,15 (0,08) 0,17 (0,08)
Pendekatan dinamis (0 = kontrol, 1 = eksperimental) 0,24 (0,12)
Komponen varians
Guru 15,81% 8,54% 6,79%
Murid 84,19% 73,71% 73,71%
Dijelaskan 17,75% 19,50%

Uji signifikansi ÿ2
1769.688 1575.891 1572.229
Pengurangan 193.797 3.662
Derajat kebebasan nilai 2 1
p .001 .001

Dalam model 2, kami menyelidiki apakah TPD berdasarkan pendekatan besarnya variansi pada tingkat guru relatif kecil (15,8%).
dinamis mempunyai pengaruh yang signifikan secara statistik terhadap prestasi siswa. Selanjutnya, model 1, yang menambahkan variabel penjelas prestasi sebelumnya
Oleh karena itu, variabel dummy untuk pendekatan dinamis (0 = kontrol, 1= dan gender, menjelaskan 17,75% dari total varian. Model pertama ini menunjukkan
eksperimental) ditambahkan ke Model 1. Model level 2 diberikan oleh: pengaruh yang kuat antara prestasi sebelumnya (yaitu, skor pra-tes) terhadap
skor prestasi siswa pasca-tes (ÿ = 0,40, p < 0,001), yang berarti bahwa siswa
dengan skor pra-tes yang lebih tinggi kemungkinan besar juga mempunyai A

Yij( nilai posttest siswa i dari guru j) = ÿ0j(rata-rata umum) + ÿ1X1ij( prestasi sebelumnya ) + ÿ2X2ij(gender)+ÿ3X3ij(kelompok)
+Uoj(tingkat guru efek acak )+Rij( tingkat siswa efek acak)

Setelah menjalankan model terakhir ini, ukuran efek standar untuk TPD skor pasca tes yang lebih tinggi. Selain itu, penelitian ini menunjukkan adanya pengaruh
berdasarkan pendekatan dinamis dihitung menggunakan rumus berikut: gender terhadap hasil belajar siswa (ÿ = 0,17, p < 0,05) yang berarti bahwa anak perempuan
dalam penelitian ini mengalami peningkatan yang lebih besar selama tahun ajaran
dibandingkan anak laki-laki. Terakhir, model 2 yang merupakan variabel penjelas pendekatan dinamis

2 ÿ (estimasi parameter pendekatan dinamik variabel) ÿ (SD pendekatan dinamik variabel)


(varians skor standar pasca-tes) ÿ (varians pada tingkat siswa)

4. Hasil ditambahkan, menjelaskan 19,5% dari total varians. Model kedua ini
mengungkapkan pengaruh yang signifikan secara statistik dari program TPD
Hasil analisis multilevel dapat dilihat pada Tabel 6. Model null dari analisis terhadap hasil belajar siswa, ÿ = 0,24, p < 0,05. Hal ini menunjukkan bahwa siswa
multilevel menunjukkan bahwa varians skor post-test paling banyak dijelaskan dari guru yang mengikuti program TPD (yang didasarkan pada pendekatan
pada level siswa (84,19%), dan a dinamis), secara statistik mempunyai hasil belajar siswa yang jauh lebih tinggi.

7
Machine Translated by Google

JA de Vries dkk. Kajian Evaluasi Pendidikan 74 (2022) 101184

dibandingkan siswa yang gurunya tidak mengikuti program TPD. Ada baiknya untuk membedakan antara kebutuhan dan keinginan dalam instrumen
Ukuran efek standar program TPD terhadap hasil siswa adalah d = 0,27, yang dapat pengukuran tersebut, karena hal ini kemungkinan besar akan memotivasi kesediaan
diartikan sebagai tambahan pembelajaran selama empat bulan (Lipsey et al., 2012). mereka untuk berpartisipasi dalam program TPD (Timperley et al., 2008).

6. Keterbatasan
5. Kesimpulan dan pembahasan
Studi ini juga mengungkapkan beberapa kesulitan terkait penggunaan pendekatan
Melalui penelitian ini, kami bertujuan untuk berkontribusi pada penelitian efektivitas dinamis dalam TPD di AfL. Lebih khusus lagi, angket persepsi diri guru yang digunakan
pengembangan profesional guru AfL dalam meningkatkan prestasi siswa, melalui untuk mengelompokkan guru ke dalam tiga tahap perkembangan sebagian besar
penelitian dengan desain penelitian eksperimental. Lebih khusus lagi, penelitian kami berfokus pada keterampilan guru mengenai penggunaan teknik penilaian. Namun, kita
berfokus pada efektivitas TPD berdasarkan pendekatan dinamis (Kyriakides et al., tahu bahwa AfL lebih luas dari sekedar penggunaan berbagai teknik penilaian. Selain
2017) sebagaimana diterapkan pada AfL. Hasilnya menunjukkan pengaruh TPD yang itu, kami melihat guru merasa kesulitan karena apa yang kami ukur tidak selalu sesuai
positif dan signifikan secara statistik terhadap prestasi belajar siswa, d = 0,27. Temuan dengan kepentingan mereka. Hal ini mungkin terjadi akibat penilaian berlebihan
ini melengkapi hasil penelitian sebelumnya mengenai efektivitas pendekatan dinamis terhadap kemampuan mereka sendiri, yang disebut efek “Dunning-Kruger” (Dunning,
terhadap TPD untuk kompetensi profesional yang kompleks, seperti AfL (misalnya, 2011). Selain itu, hal ini dapat menyebabkan asimilasi berlebihan: “ketika guru percaya
Antoniou & Kyriakides, 2013). Pendekatan dinamis memiliki beberapa prinsip yang bahwa mereka menerapkan praktik baru padahal, pada kenyataannya, mereka hanya
mungkin terkait dengan hasil positif penelitian ini. melakukan perubahan yang dangkal”

Pendekatan dinamis sejalan dengan prinsip berbasis kompetensi: sepanjang (Timperley et al., 2008, hal. 41), yang terkadang kami temui dalam diskusi dengan
program TPD, kompetensi yang diperlukan untuk AfL dijelaskan dan dicontohkan guru yang memulai AfL (“Saya tidak tahu bahwa saya sudah menggunakan sebagian
(“pemodelan”; Darling-Hammond et al., 2017). Penjelasan tentang apa itu AfL, besar strategi ini”) dalam program TPD kami. Alasan-alasan ini mungkin juga
dilengkapi dengan demonstrasi ekstensif, pengembangan alat, dan diskusi mendalam berdampak pada keengganan guru untuk meminta masukan mengenai rencana aksi
yang dipimpin oleh pelatih ahli TPD (misalnya, “Mengapa strategi AfL ini (tidak) berhasil mereka.
untuk Anda?”) tentang berbagai AfL strategi mungkin telah membantu memperjelas Penelitian ini sangat terdampak oleh merebaknya COVID-19. Wabah ini berarti
ekspektasi mengenai AfL (Timperley et al., 2008). Penjelasan mekanisme AfL perubahan pada metode kami, seperti penjadwalan ulang sesi TPD, perubahan mode
didasarkan pada prinsip pendekatan dinamis: dapat menghilangkan resistensi dan pengujian pasca pengukuran, dan keluarnya peserta. Misalnya saja, wabah ini
menciptakan sikap terbuka terhadap AfL. Setelah melihat contoh AfL, guru mulai menyebabkan tingkat putus sekolah yang sangat tinggi, yakni sebesar 55,6%, yang
mempersiapkan pembelajaran bersama dengan guru matematika lainnya (“kolaborasi” menyebabkan beberapa kesulitan sehubungan dengan perbandingan antara kelompok
dan “pengetahuan konten”; Desimone, 2009), untuk mengintegrasikan strategi AfL eksperimen dan kelompok kontrol. Tingkat pengurangan pada kelompok kontrol kami
dalam pembelajaran mereka sendiri (“pembelajaran aktif”, Darling-Hammond dkk. al., hampir dua kali lipat jumlah pengurangan pada kelompok eksperimen. Hal ini
2017; Desimone, 2009). Strategi AfL diterapkan secara terpadu dan progresif, yang kemungkinan juga dipengaruhi oleh fakta bahwa model yang menyertakan variabel
merupakan prinsip lain dari pendekatan dinamis (yaitu berbasis kompetensi). program TPD hanya dapat menjelaskan tambahan 2% varians. Karena struktur data
Ketergantungan strategi AfL satu sama lain ditekankan secara terus menerus dan yang bertingkat dalam penelitian ini, jalur dari (perubahan) kompetensi profesional
untuk semua tugas pembelajaran. Misalnya, guru diminta tidak hanya untuk guru hingga prestasi siswa adalah perjalanan yang panjang (dan kemungkinan besar
mengembangkan pertanyaan diagnostik, namun juga untuk memutuskan tindakan akan “terganggu” oleh banyak variasi sekunder dan kesalahan. ).
tindak lanjut yang tepat untuk setiap opsi respons.
Selain itu, baik tingkat guru maupun siswa mempunyai tantangan pengukurannya
masing-masing, seperti kesulitan terkait kuesioner guru yang dibahas di atas.
Selama program TPD, sejauh mana guru mampu mengembangkan kompetensinya
dipantau. Pelatih ahli TPD melakukan hal ini pada momen informal (misalnya diskusi,
observasi) dan momen formal (misalnya rencana aksi). Mereka menyesuaikan 7. Penelitian lebih lanjut
kontennya, dan memberikan umpan balik jika diperlukan (“dukungan ahli”, “pelatihan
dan dukungan ahli”; Darling-Hammond dkk., 2017; Desimone, 2009). Misalnya, setelah Disarankan untuk lebih mengoptimalkan dan menyempurnakan pendekatan
sesi pertama, diketahui bahwa guru lebih termotivasi untuk mencoba strategi ketika dinamis terhadap TPD, karena penelitian ini merupakan proyek percontohan untuk
aktivitas dalam program sangat terkait dengan mata pelajaran spesifik mereka, menindaklanjuti penelitian yang sebagian dilakukan selama masa COVID-19. Saat
matematika, dibandingkan dengan aktivitas yang lebih luas, seperti menciptakan kami menggunakan convenience sampling, guru yang berpartisipasi adalah semua
budaya kelas yang positif. Setelah ini, kami memasukkan aktivitas yang sangat relevan guru (matematika) yang mendaftar untuk berpartisipasi karena mereka (atau sekolah
dengan matematika, seperti pengembangan pertanyaan diagnostik (Wylie dan Wiliam, mereka) tertarik dengan topik penilaian formatif. Selain itu, karena keterbatasan
2006). Hal ini sejalan dengan kriteria TPD (misalnya, Garet et al., 2001; Desimone, anggaran, kami tidak dapat memasukkan lebih banyak guru daripada yang kami
2009) terkait dengan koherensi dan pengetahuan konten: integrasi dalam kehidupan lakukan pada intervensi TPD saat ini. Kesimpulan yang lebih final mengenai efektivitas
sehari-hari, serta fokus pada AfL dalam matematika, mata pelajaran yang diajarkan intervensi mungkin dapat dirumuskan jika lebih banyak guru (dan siswa), dari berbagai
oleh semua guru dalam program TPD ini. mata pelajaran, berpartisipasi dalam studi lanjutan. Salah satu pilihannya adalah
dengan mengorganisir varian campuran dari Pendekatan Dinamis (sebagian), karena
hal ini juga memungkinkan untuk melibatkan lebih banyak peserta.
Hal ini juga berarti bahwa, meskipun mengakui nilai prinsip diferensiasi dari
pendekatan dinamis (“menangani kebutuhan profesional”; Darling-Hammond et al., Hal perbaikan lainnya adalah dengan membedakan pengembangan profesional
2017), kami berubah dari program yang membedakan antar kelompok menjadi program guru berdasarkan data lain dan tambahan. Dalam penelitian ini, kami melihat bahwa
yang membedakannya dalam satu kelompok. kelompok, karena guru pada kelompok mendiagnosis kebutuhan profesional terlebih dahulu melalui instrumen pengukuran,
tahap perkembangan bawah menjelaskan bahwa mereka merasa kebutuhan mereka seperti kuesioner, memiliki potensi. Namun demikian, penting agar kuesioner yang
tidak terpenuhi dengan baik. Hal ini mungkin disebabkan oleh fakta bahwa kuesioner digunakan diganti dengan kuesioner yang mengukur AfL secara lebih komprehensif.
guru, yang menjadi dasar pembedaan antar kelompok, tidak mengevaluasi seluruh Salah satu cara untuk melakukan hal ini adalah dengan menggunakan kuesioner AfL
keterampilan AfL, namun berfokus terutama pada penggunaan berbagai teknik yang dikembangkan dan divalidasi oleh Kippers, Wolterinck, Schildkamp, Poortman, &
penilaian. Visscher, 2018 atau Assessment Practice Survey oleh Lyon et al. (2011), karena
Program TPD lebih lanjut yang didasarkan pada pendekatan dinamis dapat memperoleh keduanya menyertakan konstruksi untuk mengukur setiap strategi AfL. Selain itu, data
manfaat dari instrumen pengukuran yang lebih komprehensif untuk digunakan sebagai ini dapat dilengkapi dengan observasi kelas. Pengamatan seperti itu juga bisa
dasar pembedaan antara kebutuhan profesional guru. Mungkin juga demikian

8
Machine Translated by Google

JA de Vries dkk. Kajian Evaluasi Pendidikan 74 (2022) 101184

digunakan untuk menyelidiki ketepatan penerapan AfL di kelas: sejauh mana guru melakukan Christoforidou, M., & Kyriakides, L. (2021). Mengembangkan keterampilan penilaian guru: Dampak
pendekatan dinamis terhadap pengembangan profesional guru. Studi dalam Evaluasi Pendidikan,
apa yang diharapkan? Instrumen observasi yang telah divalidasi dapat digunakan untuk
70, Pasal 101051. https://doi.org/10.1016/j. studi.2021.101051
tujuan ini, dikombinasikan dengan wawancara (misalnya, FARROP; Wylie & Lyon, 2016).
Dengan cara ini, kita juga bisa mendapatkan gambaran yang lebih baik mengenai kemajuan Christoforidou, M., Kyriakides, L., Antoniou, P., & Creemers, BP (2014). Mencari tahapan keterampilan guru
dalam penilaian. Studi dalam Evaluasi Pendidikan, 40, 1–11. https://doi.org/10.1016/
aktual guru dalam penggunaan AfL di kelas mereka, yang merupakan saran perbaikan
j.stueduc.2013.11.006
lainnya. Dalam penerapan pendekatan dinamis, kami hanya memiliki rencana pembelajaran Creemers, BP, Kyriakides, L., & Antoniou, P. (2013). Pendekatan dinamis terhadap peningkatan sekolah:
dan diskusi selama sesi pelatihan untuk memantau kemajuan guru. Jenis data ini mungkin Ciri-ciri utama dan dampaknya. Kepemimpinan & Manajemen Sekolah, 33(2), 114–132. https://
terlalu terbatas untuk menarik kesimpulan komprehensif tentang kemajuan pembelajaran doi.org/10.1080/13632434.2013.773883
Sayang-Hammond, L., Hyler, SAYA, & Gardner, M. (2017). Pengembangan profesional guru
guru. Namun, pelaksanaan observasi akan memakan waktu yang intensif dan mahal; oleh yang efektif . Institut Kebijakan Pembelajaran.
karena itu, mungkin masuk akal untuk menggunakan observasi hanya pada bagian TPD, Hari, C. (2017). Pendidikan berbasis kompetensi dan pengembangan profesional guru. Dalam M. Mulder
atau dikombinasikan dengan pelatihan video oleh guru sejawat. Hal terakhir ini telah berhasil (Ed.), Pendidikan vokasi dan profesi berbasis kompetensi (pp.
165–182). New York, NY: Peloncat.
dilakukan dalam penelitian lain (misalnya, Major dan Watson, 2018). Video-video tersebut
Hasil kerja 10 proyek Erasmus+ FORMAS (2021). ÿhttp://www.ucy.ac.cy/f
mungkin menjelaskan bagaimana kualitas pengajaran terkait AfL dipengaruhi oleh program ormas/en/ÿ.
TPD berdasarkan pendekatan dinamis, dan bagaimana hal ini dapat mempengaruhi prestasi Demetriou, A., & Kyriakides, L. (2006). Organisasi fungsional dan perkembangan dari rangkaian
perkembangan kognitif. Jurnal Psikologi Pendidikan Inggris, 76 (2), 209–242. https://doi.org/
siswa.
10.1348/000709905X43256 Desimone, LM (2009). Meningkatkan kajian
dampak profesional guru
pengembangan: Menuju konseptualisasi dan tindakan yang lebih baik. Peneliti Pendidikan,
38(3), 181–199. https://doi.org/10.3102/0013189X08331140 Dunning, D. (2011). Efek
Dunning–Kruger: Ketidaktahuan terhadap diri sendiri
ketidaktahuan. Dalam JM Olson, & MP Zanna (Eds.), Vol. 44. Kemajuan dalam psikologi sosial
Pendanaan eksperimental (hlm. 247–296). Pers Akademik. https://doi.org/10.1016/B978-0-12-385522-0.00005-6 .

Francom, GM, & Gardner, J. (2014). Apa itu pembelajaran yang berpusat pada tugas? Tren Teknologi, 58(5),
Pekerjaan ini didukung oleh Proyek Erasmus+ Uni Eropa di bawah Hibah 27–35.
2017-3118/001-001. Dukungan Komisi Eropa terhadap produksi publikasi ini bukan Garet, MS, Porter, AC, Desimone, L., Birman, BF, & Yoon, KS (2001). Apa yang membuat pengembangan
profesional efektif? Hasil dari sampel guru nasional.
merupakan dukungan terhadap isinya, yang hanya mencerminkan pandangan penulis, dan
Jurnal Penelitian Pendidikan Amerika, 38(4), 915–945. https://doi.org/10.3102/ 00028312038004915
Komisi tidak bertanggung jawab atas segala penggunaan informasi yang terkandung di Harrison, CJ, Konings,
¨
dalamnya. KD, Schuwirth, LW, Wass, V., & Van der Vleuten, CP
(2017). Mengubah budaya penilaian: dominasi paradigma penilaian sumatif. Pendidikan
Kedokteran BMC, 17(1), 1–14. https://doi.org/ 10.1186/s12909-017-0912-5

Hattie, J. (2012). Pembelajaran yang terlihat bagi guru: Memaksimalkan dampak pembelajaran. Routledge.
Konflik kepentingan
Hattie, J., & Timperley, H. (2007). Kekuatan umpan balik. Review Penelitian Pendidikan, 77(1), 81–
112. https://doi.org/10.3102/003465430298487 Heitink, MC, Van der Kleij, FM,
Veldkamp, BP, Schildkamp, K., & Kippers, WB
Para penulis menyatakan bahwa mereka tidak memiliki konflik kepentingan.
(2016). Tinjauan sistematis terhadap prasyarat penerapan penilaian pembelajaran dalam
praktik kelas. Tinjauan Penelitian Pendidikan, 17, 50–62. https://doi. org/10.1016/j.edurev.2015.12.002.
Ucapan Terima Kasih
Kingston, N., & Nash, B. (2011). Penilaian formatif: Sebuah meta-analisis dan panggilan untuk penelitian.
Pengukuran Pendidikan: Masalah dan Praktek, 30(4), 28–37. https://doi.org/10.1111/
Kami menghargai dukungan finansial untuk proyek ini dari Komisi Eropa. Selain itu, j.1745-3992.2011.00220.x _ Kippers, WB,
kami ingin mengucapkan terima kasih kepada semua guru matematika yang berpartisipasi Wolterinck, CHD, Schildkamp, K., Poortman, CL, & Visscher, AJ
(2018). Pandangan guru tentang penggunaan penilaian untuk pembelajaran dan pengambilan
atas upaya mereka dalam berpartisipasi dalam penelitian ini.
keputusan berbasis data dalam praktik kelas. Pengajaran dan Pendidikan Guru, 75, 199–213. https://
doi.org/10.1016/j.tate.2018.06.015.
Referensi Kyriakides, L., Christoforidou, M., Panayiotou, A., & Creemers, BPM (2017). Dampak kursus
pengembangan profesional guru selama tiga tahun terhadap kualitas pengajaran: Kekuatan
dan keterbatasan pendekatan dinamis. Jurnal Pendidikan Guru Eropa, 40(4), 465–486. https://
Andrich, D. (1988). Bentuk umum model logistik Rasch yang diperluas untuk penilaian kredit parsial.
doi.org/10.1080/ 02619768.2017.1349093
Pengukuran Terapan dalam Pendidikan, 1(4), 363–378. https://doi.org/10.1207/s15324818ame0104_7
_ Antoniou, P., & Kyriakides,
Linacre, JM (2002). Mengoptimalkan efektivitas kategori skala penilaian. Jurnal Terapan
L. (2013). Pendekatan terpadu yang dinamis terhadap guru
Pengukuran, 3(1), 85–106.
pengembangan profesional: Dampak dan keberlanjutan dampak terhadap peningkatan perilaku
Lipsey, MW, Puzio, K., Yun, C., Hebert, MA, Steinka-Fry, K., Cole, MW, Roberts, M., Anthony, KS, Busick,
guru dan hasil siswa. Pengajaran dan Pendidikan Guru, 29, 1–12. https://doi.org/10.1016/
MD (2012). Menerjemahkan Representasi Statistik Dampak Intervensi Pendidikan ke dalam Bentuk
j.tate.2012.08.001
yang Lebih Mudah Ditafsirkan. (NCSER 2013-3000). Washington, DC: Pusat Penelitian Pendidikan
Hitam, P., & William, D. (2009). Mengembangkan teori penilaian formatif.
Khusus Nasional, Institut Ilmu Pendidikan, Departemen Pendidikan AS. Laporan ini tersedia di
Penilaian Pendidikan, Evaluasi dan Akuntabilitas, 21(1), 5–31. https://doi.org/10.1007/
situs web IES di http://ies.ed.gov/ncser/.
s11092-008-9068-5 _
Brooks, C., Burton, R., van der Kleij, F., Ablaza, C., Carroll, A., Hattie, J., & Neill, S.
Lyon, CJ, Miller, S., & Wylie, C. (2011). Argumen validitas untuk penilaian
(2021). Guru mengaktifkan pelajar: Efek dari pendekatan umpan balik yang berpusat pada siswa
survei praktik: Ukuran pemberlakuan penilaian formatif oleh guru. Makalah dipresentasikan pada
terhadap prestasi menulis. Pengajaran dan Pendidikan Guru, 105, Pasal 103387. https://doi.org/
pertemuan tahunan American Educational Research Association dan National Council on Measurement
10.1016/j.tate.2021.103387 Bryk, AS, & Raudenbush, SW (1992).
in Education, New Orleans, LA.
Model linier hierarki: Aplikasi dan metode analisis data. Sage Publications, Inc.
Mayor, L., & Watson, S. (2018). Menggunakan video untuk mendukung pengembangan profesional guru
dalam jabatan: Keadaan lapangan, keterbatasan dan kemungkinan. Teknologi, Pedagogi dan
Buerger, S., Kroehne, U., Koehler, C., & Goldhammer, F. (2019). Apa yang membuat
Pendidikan, 27(1), 49–68. https://doi.org/10.1080/ 1475939X.2017.1361469
perbedaan? Dampak properti item pada efek mode dalam penilaian membaca.
Studi dalam Evaluasi Pendidikan, 62, 1–9. https://doi.org/10.1016/j.
Marcoulides, GA, & Drezner, Z. (1999). Prosedur untuk mendeteksi pengelompokan pola dalam desain
steeduc.2019.04.005
pengukuran. Pengukuran Objektif: Teori menjadi Praktek, 5, 261–277.
Carless, D., & Boud, D. (2018). Pengembangan literasi umpan balik siswa: Memungkinkan penyerapan
Merrill, MD (2012). Prinsip pengajaran yang pertama. John Wiley & Putra.
umpan balik. Penilaian & Evaluasi Pendidikan Tinggi, 43(8), 1315–1325. https://doi.org/
Nicol, DJ, & Macfarlane-Dick, D. (2006). Penilaian formatif dan mengatur diri sendiri
10.1080/02602938.2018.1463354 Carless, D., Chan, KKH,
pembelajaran: Sebuah model dan tujuh prinsip praktik umpan balik yang baik. Studi di Pendidikan
To, J., Lo, M., & Barrett, E. (2018). Mengembangkan kapasitas siswa untuk penilaian evaluatif melalui
Tinggi, 31(2), 199–218. https://doi.org/10.1080/03075070600572090 Organisasi untuk
analisis contoh. Dalam D. Boud, R. Ajjawi, P. Dawson, & J. Tai (Eds.), Mengembangkan
Kerja Sama dan Pembangunan Ekonomi (2017). Laporan teknis PISA 2015. ÿhttp://www.oecd.org/pisa/data/
penilaian evaluatif dalam pendidikan tinggi: Penilaian untuk mengetahui dan menghasilkan
2015-technical-report/ÿ.
pekerjaan yang berkualitas (hlm. 108–116).
Romesburg, HC (1984). Analisis cluster untuk peneliti. Publikasi Pembelajaran Seumur Hidup.
Routledge.
Schildkamp, K., van der Kleij, FM, Heitink, MC, Kippers, WB, & Veldkamp, BP
Cauley, KM, & McMillan, JH (2010). Teknik penilaian formatif untuk menunjang motivasi dan prestasi
(2020). Penilaian formatif: Tinjauan sistematis terhadap prasyarat penting guru untuk praktik kelas.
siswa. Lembaga Kliring, 83(1), 1–6. https://doi. org/10.1080/00098650903267784 Charlton, C.,
Jurnal Internasional Penelitian Pendidikan, 103. https://doi. org/10.1016/j.ijer.2020.101602.
Rasbash, J., Browne, WJ, Healy, M.,
Cameron, B. (2017). MLwiN Versi 3.00. Pusat Pemodelan Bertingkat, Universitas Bristol.

9
Machine Translated by Google

JA de Vries dkk. Kajian Evaluasi Pendidikan 74 (2022) 101184

Diam, VJ (2008). Fokus pada umpan balik formatif. Review Penelitian Pendidikan, 78(1), Pusat Evaluasi Pendidikan dan Bantuan Daerah. ÿhttps://ies.ed.gov/ncee/wwc/handbooks ÿ.
153–189. https://doi.org/10.3102/0034654307313795
Sims, S., & Fletcher-Wood, H. (2021). Mengidentifikasi karakteristik pengembangan profesional William, D., & Leahy, S. (2015). Menanamkan penilaian formatif: Teknik praktis untuk K-
guru yang efektif: Sebuah tinjauan kritis. Efektivitas Sekolah dan Peningkatan 12 ruang kelas. Pembelajaran Ilmu Internasional.
Sekolah, 32(1), 47–63. https://doi.org/10.1080/09243453.2020.1772841 Timperley, H., William, D., Lee, C., Harrison, C., & Hitam, P. (2004). Guru mengembangkan penilaian untuk
Wilson, A., Barrar, H., & Fung, I. (2008). Pembelajaran profesional guru dan pembelajaran: Dampak terhadap prestasi siswa. Penilaian dalam Pendidikan: Prinsip,
perkembangan. Akademi Pendidikan Internasional. Kebijakan & Praktek, 11(1), 49–65. https://doi.org/10.1080/0969594042000208994
Van der Kleij, FM, Vermeulen, JA, Schildkamp, K., & Eggen, TJHM (2015). Wylie, EC, & William, D. (2006). Pertanyaan diagnostik: Apakah ada manfaatnya hanya dalam satu
Mengintegrasikan pengambilan keputusan berbasis data, Penilaian Pembelajaran dan pertanyaan? Makalah dipresentasikan pada Pertemuan Tahunan Dewan Nasional Pengukuran Pendidikan.
pengujian diagnostik dalam penilaian formatif, Penilaian dalam Pendidikan: Prinsip. San Fransisco, CA.
Kebijakan & Praktek, 22(3), 324–343. https://doi.org/10.1080/0969594X.2014.999024 Wylie, C., & Lyon, C. (2016). Menggunakan rubrik penilaian formatif, refleksi dan
Vygotsky, LS, van der Veer, RE, Valsiner, JE, & Prout, TT (1994). Pembaca Vygotsky . Kemangi alat observasi untuk mendukung refleksi profesional dalam praktik (direvisi). ÿhttps://res
Blackwell. ources.ats2020.eu/resource-details/LITR/professional-reflectionÿ.
Apa yang Berhasil Clearinghouse (2020). Buku pegangan standar What Works Clearinghouse,
versi 4.1. Departemen Pendidikan AS, Institut Ilmu Pendidikan, Nasional

10

Anda mungkin juga menyukai