Anda di halaman 1dari 14

Pada abad ke-21, ilmu pengetahuan dan informasi berbasis

masyarakat direpresentasikan dengan kata kunci seperti perubahan secara


mendadak,diversifikasi dan pluralisme yang membutuhkan anggota
masyarakat yang memiliki kemampuan untuk menghasilkan ide-ide kreatif,
mengatasi dan memecahkan masalah dan beradaptasi dengan perubahan
masyarakat. Untuk mecapai tujuan tersebut, peran pendidikan adalah
mengajar warga untuk memenuhi peran mereka sebagai anggota
masyarakat dan lebih jauh lagi, dapat mengembangkan sebuah sistem
dimana potensi mereka dapat dibudidayakan. Dalam hal ini, mulai dari
desain kurikulum hingga evaluasi, harus saling melengkapi satu sama lain.
Secara keseluruhan, penilaian pendidikan melaksanakan peran utama
(Wiliam, 2007) seperti mendukung pembelajaran (formatif), menyatakan
prestasi (sumatif) dan mengevaluasi program pendidikan (evaluatif).
Penilaian formatif adalah penilaian untuk belajar, sedangkan penilaian
sumatif adalah pembelajaran (NCTM, 2011b; Slavin, 2009). Penilaian formatif
menyediakan informasi guru tentang tingkat belajar siswa untuk membuat
keputusan tentang bagaimana untuk melanjutkan ke langkah berikutnya.
Evaluasi yang dilakukan di sekolah dapat mendiagnosa dan mengusahakan
proses pertumbuhan siswa serta menumbuhkan potensi dan bakat mereka.
Dewasa ini, evaluasi yang dilakukan di sekolah cenderung untuk
menggabungkan penilaian kuantitatif dengan penilaian kualitatif. Penilaian
kuantitatif dilakukan dalam rangka untuk memilih, mengklasifikasikan dan
mengalokasikan siswa; Penilaian tersebut cukup menarik di masa lalu.
Adapun penilaian kualitatif dapat memberikan nasihat tentang pertumbuhan
dan perkembangan dengan mengumpulkan dan menganalisis informasi
mengenai kemajuan serta hasil belajar-mengajar. Perubahan ini juga telah
diterapkan pada evaluasi pendidikan matematika di sekolah. Dengan
demikian, evaluasi mencakup keterampilan pemecahan masalah dan berpikir
tingkat tinggi, termasuk penalaran, komunikasi dan keterampilan koneksi.
Dengan
munculnya
teori-teori
pembelajaran
baru,
seperti
konstruktivisme, pembaruan kurikulum matematika mengambil tempat di
sebagian besar negara. Kurikulum baru menekankan pada proses
pembelajaran,yang juga memerlukan penilaian alternatif. Kecenderungan
saat ini dalam penilaian dimulai dari penilaian belajar melalui penilaian
untuk belajar ke penilaian sebagai pembelajaran(Black, Harrison, Lee,
Marshall & Williams, 2003; Brookhart, 2005; Leahy, Lyon, Thompson &
Wiliam, 2005). Saat ini, penilaian tersebut memungkinkan untuk
memberikan umpan balik antara siswa dan guru dan juga motivasi siswa.

Selanjutnya, dievaluasi secara kualitiatif dengan lebih memfokuskan pada


kemampuan berfikir tingkat tinggi, yang meliputi kemampuan pemecahan
masalah, kemampuan penalaran matematika, kemampuan komunikasi
matematika, dan kreativitas dalam menghubungkan pengetahuan
matematika dengan pengetahuan lainnya.
Penilaian tradisional seperti pilihan ganda, benar-salah, pertanyaanjawaban singkat, dan lain-lain mendapat kritikan karena tidak tepat dalam
mengevaluasi belajar siswa, dimana penilaian tersebut hanya mengukur
keterampilan mengerjakan tes. Selain itu, penilaian tersebut hanya meliputi
pertanyaan yang berdasar pada pengetahuan compartmentalized, dimana
siswa bisa menjawab dengan menghafal atau recall. Akhirnya, siswa yang
sudah terbiasa dengan penilaian ini menjadi pembelajar pasif (Diane, 1994).
Untuk mengatasi kritik tersebut, sejumlah pendekatan baru terhadap
penilaian telah diperkenalkan seperti penilaian alternatif, penilaian kinerja,
penilaian autentik, dll. Seperti yang dikatakan oleh As Gearhart & Saxe
(2004) bahwa untuk mengetahui apa yang siswa ketahui adalah komponen
penting dari praktek kelas yang efektif.
Banyak negara menggunakan penilaian constructed-response dalam
matematika karena dapat mengevaluasi proses pemecahan masalah siswa
dan lebih jauh lagi, lebih mudah untuk menciptakan pertanyaan terbuka
dibandingkan dengan jenis penilaian lainnya untuk tes (Hur et al, 1999;.
Seong, 2000). Bell & Isaacs (2007) merupakan pengembang kurikulum
matematika SD yang mencatat bahwa penilaian constructed-response
adalah jenis yang tepat, yang dapat mengevaluasi proses berpikir siswa
dengan meminta mereka untuk menuliskan bagaimana siswa memahami
masalah dan bagaimana mereka memecahkan masalah. Park & Pang (2008)
juga menyajikan beberapa jenis tertentu penilaian constructed-response
seperti menjelaskan konsep-konsep matematika dan prinsip-prinsip dengan
bukti logis beserta arti dari rumus matematika dengan diagram atau tulisan,
menjelaskan urutan matematika dan keterhubungan, problem posing,
menjelaskan strategi pemecahan masalah, menggunakan kata-kata
matematika dalam situasi kehidupan nyata dalam rangka memecahkan
masalah, dan menuliskan bagaimana siswa menafsirkan data dengan
diagram atau kalimat, dll, dalam rangka mendukung kesesuaian penilaian
constructed-response untuk mengevaluasi proses berpikir.
Metode penilaian tradisional yang ada saat ini tidak memungkinkan
untuk memahami proses pembelajaran matematika siswa. Selain itu, metode
tersebut tidak cocok untuk menerapkan dan memperkuat kreativitas.

Dengan kurikulum berbasis kepribadian yang baru dirilis, penilaian


constructed-response dibuat untuk mengukur seberapa besar siswa
peningkatan siswa dalam pembelajaran matematika. Penilaian adalah proses
pengumpulan informasi yang berkaitan dengan matematika, pengetahuan
konseptual dan procedural serta sikap yang dimiliki siswa (NCTM). Hal ini
berarti bahwa penilaian adalah faktor yang melengkapi kelas matematika
serta kriteria penting yang meningkatkan belajar matematika siswa. (NCTM,
1995, 2000). Sejauh ini, penilaian telah dipahami sebagai alat untuk
mendiagnosis prestasi matematika siswa melalui kertas ujian bukan sebagai
elemen kunci dari kelas matematika. dokumen NCTM (1995, 2000) yang
berisi sejumlah "prinsip-prinsip dan standar" menyarankan apa yang harus
diajarkan di kelas matematika sekolah serta bagaimana mengajarkannya.
Secara khusus, mereka menekankan proses pembelajaran matematika,
seperti kemampuan memecahkan masalah peserta didik, kemampuan
penalaran, kemampuan komunikasi, keterampilan representasi, dan
keterampilan koneksi.
Perubahan ini tercermin dalam tes prestasi akademik internasional.
Pada TIMSS 2007, 45,6% masalah adalah masalah penilaian constructedresponse dalam bentuk soal uraian (pertanyaan terbuka)
dan
beberapa diantaranya dikonstruksi dengan beberapa bagian yang meminta
untuk menjelaskan proses pemecahan masalah sesuai dengan situasi
masalah. Tujuan yang berkaitan dengan penilaian constructed-response
terus meningkat sejak tahun 2008. Lebih jauh lagi, soal uraian(pertanyaan
terbuka) memiliki kecenderungan pertanyaan yang diperlukan untuk
menerapkan pengetahuan matematika tertentu atau prinsip dalam
kehidupan situasi nyata serta untuk alasan logis. Selain itu, soal uraian
(pertanyaan terbuka) juga terdiri dari beberapa sub-masalah yang dapat
menyampaikan strategi pemecahan masalah siswa dan kemampuan berfikir
logis selangkah-demi selangkah. (Cho et al., 2011).
TIMSS terdiri dari constructed-response item yang mengaitkan
kehidupan sehari-hari atau penalaran berdasarkan pemahaman tentang
konsep-konsep
matematika
atau
prinsip-prinsip.
Sistem
penilaian
constructed-response item terdiri dari mencatat apa yang siswa jelaskan
dalam proses pemecahan masalah, sehingga apa yang mereka ketahui dan
apa yang bisa mereka lakukan akan diperhitungkan dalam proses pemikiran
mereka (Mullis & Martin, 2011). Dalam kasus siswa kelas IV, constructedresponse item terdiri 45,6% (tahun 2007) dan 47,2% (tahun 2011) dari
masalah (Cho et al., 2011), dan pada tahun 2015, angka tersebut akan
meningkat menjadi 50 % (Martin, Mullis, & Foy, 2013).

Pada PISA 2009, 31,5% dari masalah(soal) yang diberikan adalah


constructed-response item, termasuk jenis closed constructedresponse items dan yang lainnya terdiri dari open constructedresponse items yang diperlukan keterampilan untuk menghubungkan
informasi dan ide-ide dari bagian masalah dengan pengalaman atau
pendapat siswa untuk memecahkan masalah ( Kim et al., 2010). PISA 2012
mecakup 63,5% open constructed-response items. Secara keseluruhan,
karena siswa perlu memecahkan item respon dibangun constructedresponse item menggunakan pengetahuan dan pengalaman dari konsepkonsep matematika dan keterampilan mereka, item yang sesuai sebagai
metode untuk menyelidiki bagaimana menghubungkan pengetahuan yang
diperoleh di sekolah untuk kehidupan sehari-hari.
A. Implementasi Penilaian constructed-response di Korea
Dalam rangka menjawab tuntutan, Departemen Pendidikan, Sains dan
Teknologi [MOEST] (2009) di Korea baru-baru ini merevisi kurikulum
matematika sekolah nasional untuk matematika, yang sekarang lebih
berfokus pada memungkinkan siswa untuk menggunakan definisi
matematika dan simbol dengan benar dan menjelaskan ide-ide matematika
dengan berbicara atau menulis. Metode ini memungkinkan siswa untuk
mengekspresikan atau berdebat tentang ide-ide mereka sendiri untuk
memperpanjang kemampuan komunikasi matematika mereka.
Penilaian ini mendorong penggunaan berbagai jenis penilaian serta
menekankan karakteristik masalah. Selain itu mendukung gagasan yang
mencakup masalah yang berkualitas tinggi pada tes karena dapat
mengevaluasi proses berpikir siswa dan output. Secara khusus , siswa
memerlukan umpan balik pada saat mengatur beberapa factor yang
diperlukan untuk pemecahan masalah dan membuat keputusan serta
menerapkannya untuk masalah (Slavin, 2009). Oleh karena itu, memahami
kelebihan dari penilaian constructed-response dan menyelidiki bagaimana
penerapannya di lingkungan sekolah sangatlah penting.
Penilaian constructed-response mengevaluasi bagaimana siswa
memahami, menjelaskan dan menafsirkan situasi masalah dengan informasi
dan pengetahuan yang mereka sudah ketahui; Selain itu, mengukur
bagaimana mereka memecahkan masalah secara kreatif, tidak seperti tes
tradisional, yang hanya mengukur berapa banyak siswa bisa menghafal
pengetahuan. Revisi kurikulum matematika sekolah yang ketujuh di Korea
menyatakan bahwa tidak hanya proses pemecahan masalah siswa tetapi

hasilnya juga harus dievaluasi untuk meningkatkan kemampuan berpikir


matematis mereka dalam domain kognitif. Selanjutnya, tujuan khususnya
adalah sebagai berikut; kemampuan memahami dan menerapkan konsep
dasar, prinsip-prinsip dan aturan matematika; kemampuan menggunakan
definisi matematika dan simbol dengan benar; kemampuan penalaran
dengan benar; kemampuan memecahkan masalah dengan memahami
situasi masalah matematis; kemampuan pemecahan masalah dengan
berpikir matematis dalam situasi kehidupan nyata, Fenomena social dan
fenomena alam; dan kemampuan matematika dalam mengkomunikasikan
proses berpikir dan output yang cukup (MOEST 2009, Seoul Metropolitan
Dinas Pendidikan, 2010, 2011). Sebuah penilaian constructed-response
membantu untuk mengevaluasi bagaimana siswa merumuskan, mengatur,
berinternalisasi dan menjelaskan konsep-konsep matematika dan proses
berpikir (Baek, 2000). Selain itu, membantu untuk memahami 'tingkat
pemahaman masalah serta memperbaiki kesalahan dengan menganalisis
jawaban siswa dan proses pemecahan masalah (NCTM, 2001). Penelitian ini
difokuskan pada karakteristik masalah atau tugas. Lappan, Phillips & Frey
(2007) menekankan bahwa 'masalah yang baik' harus dikembangkan, dan
mendefinisikan masalah yang baik seperti ide-ide matematika yang penting
dan perlu untuk menggunakan pola keterampilan berpikir tingkat tinggi dan
berbagai metode pemecahan. Di Korea, guru harus menggambarkan
karakteristik 'masalah yang baik' dalam rangka untuk mengembangkan
masalah penilaian constructed-response.
Revisi kurikulum matematika sekolah yang ketujuh di Korea
menyatakan bahwa hasil penilaian harus memberikan informasi yang
berguna bagi guru dan siswa, dan harus memberikan kontribusi untuk proses
belajar-mengajar. Dalam kata lain, Hasil penilaian harus menyampaikan
kelebihan dan kelemahan siswa setelah belajar, diikuti dengan menganalisis
hasil kesalahan, yang akan membantu untuk menentukan arah dari kelas
berikutnya (MOEST, 2009).
Hal yang paling penting di sini adalah hubungan antara proses belajarmengajar dan penilaian. Secara tradisional, siswa diklasifikasikan menurut
skor mereka dan membandingkan prestasi mereka. Namun, saat ini, adalah
penting untuk memverifikasi apakah siswa memahami apa yang telah
mereka pelajari atau tidak dan apakah mereka dapat mencapai tujuan
mereka atau tidak.
Dengan pandangan penilaian ini, di Korea bentuk penilaian tradisional
seperti sebagai ujian jangka menengah atau ujian akhir, telah berubah

menjadi penilaian formatif yang dapat membantu guru untuk memverifikasi


pemahaman siswa saat kelas berlangsung dan selanjutnya, ujian ini sering
dapat diimplementasikan ketika guru memerlukannya. Hal Ini didukung
dalam konteks yang sama dari Kim, Cho & Joo (2012) dan Kim, Cho, Kim, Kim
& Noh (2012) bahwa penilaian constructed-response bisa membantu
untuk memverifikasi hasil dari proses belajar-mengajar dan melakukan
perbaikan di kelas matematika. Karena penilaian constructed-response
adalah metode di mana mahasiswa diwajibkan untuk mengekspos jenis
konsep dan strategi yang digunakan dalam mengekspresikan proses
pemecahan masalah mereka, penilaian ini akan menjadi jenis metode untuk
melaksanakan penilaian formatif.

B. Pengembangan dan Penerapan Penilaian constructed-response


1. Prinsip Butir Penilaian constructed-response
Melalui hasil penelaahan terhadap studi yang ada berkaitan dengan
penilaian constructed-response. penelitian ini mendefinisikannya sebagai
'penilaian di mana berbagai strategi dapat digunakan dengan masalah
dengan
cara
mengevaluasi
bagaimana
siswa
mengatur
dan
menginternalisasi konsep atau proses bukannya meminta pengetahuan
fragmentaris mereka.
Perkembangan proses penilaian constructed-response masalah dan
rubriknya dirancang seperti yang ditunjukkan pada gambar 1.dari sudut
pandang yang komprehensif pandangan penelitian awal. Berdasarkan proses
perkembangan, butir awal yang dikembangkan diperiksa untuk validasi isi ,
relevansi waktu dan bagaimana penerapan butir tersebut oleh para ahli
pendidikan matematika SD dan guru yang memiliki pengalaman mengajar
yang luas. Selain itu, kategori dan rubrik skala diselesaikan setelah
konferensi profesional, menyelesaikan rubrik konkret untuk setiap masalah
melalui pengembangan kriteria prestasi, untuk membagi kasus dan
karakteristik dengan mengukur dengan kertas contoh jawaban berdasarkan
kategori. Hasil dari survey yang dilakukan ke guru SD (Kim, Cho & Joo, 2012),
butir yang sulit dari constructed-response item menunjukkan ratarata
sebesar 45,1%. Oleh karena itu, tingkat pertanyaan yang dikembangkan
telah disesuaikan sebagai Rata-rata -menengah - lanjutan. Tiga item yang
dikembangkan untuk setiap unit, dan kesesuaian diperiksa melalui kajian ahli
dan uji coba.

Dewasa ini, terdapat beberapa masalah yang terkait dengan tujuan


intstruksional yang tidak jelas dan dan beberapa kegiatan kelas yang terus
berjalan tanpa tujuan pendidikan. Masalah tersebut dapat diatasi dengan
mengatur pelajaran dengan terfokus pada ide-ide besar dan pertanyaan
penting, yang didasarkan pada konsep inti dan prinsip kedisiplinan. Metode
ini akan memungkinkan siswa untuk bertahan pada proses untuk
mendapatkan pemahaman (Wiggins & McTighe, 2005). NCTM (2011a)
membahas pemahaman penting yang sentral dalam topik matematika untuk
membantu siswa dengan pemahaman yang mendalam tentang konsep
menyeluruh untuk menghubungkan ide-ide besar untuk beberapa ide-ide
matematika yang sedikit.
Dengan perspektif ini, penelitian ini mengembangkan butir penilaian
constructed-response dan kriteria yang bisa diselesaikan ketika siswa
memahami relasi antara tujuan dan ide-ide matematika, yang akhirnya akan
membantu siswa untuk mendapatkan pemahaman matematika yang
mendalam.
2. Kerangka rubric penilaian constructed-response
Penelitian ini dimaksudkan untuk mengembangkan butir penilaian
constructed-response sesuai dengan tujuan revisi kurikulum matematika
di Korea dalam rangka meningkatkan daya matematika serta pendekatan
berkelanjutan secara menyeluruh instruksi pemecahan masalah yang
berkaitan dengan isi ajaran setiap lingkup. Untuk mengembangkan rubrik,
dalam penelitian tahun 2008, diperoleh kerangka penilaian constructedresponse dengan mengacu pada Spesifikasi dan Penilaian kerangka
penilaian TIMSS 2013 sebuah laporan riset teladan di pengembangan dan
evaluasi item tes prestasi matematika yang akan digunakan untuk TIMSS2003 oleh Mullis et al. (2003), mengatur 3 lingkup penilaian analitik, masalah
pemahaman, proses pemecahan masalah dan komunikasi, sebagai kerangka
rubrik (Cho et al., 2008).
Seperti kasus yang terjadi di Amerika Serikat, misalnya. Negara bagian
Alaska menetapkan daftar kelas kinerja yang analitik termasuk lingkup
pemahaman konsep, strategi pemecahan masalah, komunikasi, logika dan
kesimpulan, dan kemudian masalah disajikan kepada siswa setelah
mengawali mereka dengan hal-hal yang dimiliki siswa untuk membantunya
memahami masalah tersebut. Selain itu, terdapat kasus untuk setiap Negara
dalam menggunakan table rubric pengskoran analitik untuk mencakup setiap
sub-lingkup dalam rubric penilaian proes pemecahan masalah. Namun, ada

juga banyak kasus menggunakan tabel rubric skor holistik, seperti di negara
bagian Maryland, Kentucky, California, North Carolina dan Maine (Chicago
Public Schools, t.t.).

Perkembangan Rubric Penilaian constructed-resp


Perkembangan Item Penilaian constructed-response

Analisis Kurikulum Matematika


Analisis Rubrik Penskoran
gan Item Penilaian constructed-response
Analisis masalah atau karakteristik tugas penelitian yang
Perkembangan
menjadi contoh
prinsip-prinsip rubrik

Perkembangan butir penilaian oleh Unit Aktualisasi Kategori rubrik


Desain/ Perkembangan
Verifikasi Validitas Konten oleh ahli
Kerangka gambar rubrik

Merevisi dan melengkapi setelah studi percontohan


Evaluasi jawaban
(uji coba
studi
penelitian)
percontohan (uji coba pe
Aplikasi/ Perbaikan
Perkembangan butir penilaian dan rubric untuk studi utama
Koreksi
(penelitian)
dan Melengkapi rubrik

Gambar 1. Desain dalam Desain Rubric dan Butir Penilaian constructedresponse

Rubrik penilaian analitiik digunakan untuk memberi skor perilaku


berprestasi sesuai dengan unsur-unsur penilaian dan menentukan alokasi
tanda pada rubric penilaian serta memberikan tanda dengan unsur dengan
tujuan pemahaman dan mendiagnosa belajar siswa. Sedangkan hal tersbut
membutuhkan waktu yang banyak untuk memberi skor., hal tersebut juga
memiliki keunggulan dalam menangkap kekuatan dan kelemahan siswa
dengan unsur atau ruang lingkup, mencari tahu informasi konkret untuk
perbaikan program, dan memberikan tanda sesuai dengan berbagai aspek
kinerja (Charles , Lester & O'Daffer, 1987; Chi, 2000; Herman, Aschbacher
dan Winters, 1992).
Merefleksikan situasi sekolah yang lebih sering menggunakan penilaian
holistic di Korea seperti peningkatan yang sangat baik/ baik/ cukup/ kurang.
Penelitian ini menetapkan rubric penilaian holistic seperti yang terlihat pada
table 1. Rubrik penilaian holistik adalah metode di mana nilai penanda jika
dilihat dari sudut pandang holistik dengan unit skor perilaku prestasi secara
keseluruhan. Hal ini dimungkinkan untuk menilai dengan relative cepat dan
memberi satu jenis tanda untuk seluruh kertas jawaban ketika menganggap
penting tidak hanya untuk jawabannya, tapi juga untuk proses pemecahan.
3. Menerapkan butir penilaian constructed-response terhadap
siswa kelas 3

Contoh butir penilaian constructed-response yang dikembangkan


untuk kelas 3 SD ditampilkan di bawah. Unit mencakup topic volume dan
bobot dalam materi pengukuran. Materi pengukuran adalah topic yang
menghubungkan pengetahuan lain seperti pengukuran dan angka yang
merupakan materi utama dalam matematika sekolah. Secara khusus, untuk
siswa kelas tingkat yang lebih rendah, pelajaran pengukuran harus diatur
untuk dirasakan secara intuitif dan mengukur pengalaman sendiri dan untuk
memahami makna dan atribut pengukuran.
Dalam kurikulum matematika Korea, materi pengukuran berkaitan
dengan pemanfaatan waktu, panjang, kapasitas, berat, sudut, luas dan
volume. Item yang dicontohkan dalam penelitian ini dikembangkan untuk
babKapasitas dan Berat. Sebelum belajar tentang kapasitas dan berat,
siswa belajar perbandingan jumlah, taksiran nilai, satuan panjang dan
perhitungan dalam materi pengukuran. Bab ini memungkinkan siswa untuk
merasakan ketidaknyamanan menggunakan unit random dalam proses
perbandingan melalui contoh kehidupan sehari-hari; lebih jauh,
diperkenalkan unit universal. Selanjutnya dengan belajar bagaimana
memperkirakan berat badan dan bagaimana untuk mendapatkan jumlah dan
perbedaan bobot, siswa memperkirakan volume untuk kapasitas dan berat.
Mengindikasi nilai dengan menggunakan unit yang tepat, dan melakukan
perhitungan yang benar merupakan tujuan akhir. Selanjutnya, siswa
mengenali hubungan antara matematika dan kehidupan sehari-hari dengan
belajar berbagai pengukuran, seperti lebar, volume, dll. Penelitian ini
dimaksudkan untuk mengevaluasi apakah siswa memahami perlunya unit
universal dari berat dalam proses membandingkan bobot dan
ketidaknyamanan menggunakan unit acak. Item yang dibedakan dari item
operasi berpusat aritmatika yang menghitung jumlah dan perbedaan, seperti
yang terutama disarankan dalam item tes konvensional. Masalah yang
dikembangkan menggunakan kerangka penilaian holistik kemudian ditinjau
oleh 3 penilai yang berbeda yakni guru SD atau orang-orang dengan gelar
sarjana dalam pendidikan matematika SD. Para peserta penelitian ini
termasuk 74 siswa (27 untuk grade level 3-1, 47 untuk tingkat kelas 3-2) dari
3 kelas di kelas 3 (Tabel 3). Rubrik untuk penilaian holistik diaplikasikan
setiap item dengan mengubah 4 tingkat ('baik', 'Baik', 'sedang' dan butuh
peningkatan) untuk poin 3, 2, 1 dan 0.
Analisis koefisien reliabilitas Cronbach digunakan untuk menjamin
konsistensi internal antara 3 penilai di kelas. Koefisien untuk masing-masing
penilai berkisar 0,864-0,923, menunjukkan konsistensi internal yang baik di
antara penilai (Tabel 4). Metode koefisien korelasi Pearson digunakan untuk

butir penilaian constructed-response dari para peserta di kelas 3 untuk


reliabilitas antar penilai. Koefisien korelasi berkisar 0,864-0,923
menunjukkan bahwa reabilitas baik antar penilai dengan tingkat signifikansi
pada p <0,01 (Tabel 5).
Tabel 1. Kerangka Penilaian constructed-response item untuk
penilaian holistik
Level
A (Excellent)/
Baik Sekali

B (Good)/Baik

C (Fair)/ Cukup

Kriteria
Benar-benar memahami konsep-konsep matematika
yang disajikan dalam masalah
Benar memilih informasi yang diperlukan dari
masalah dan menerapkan konsep-konsep dan
informasi dalam pemecahan masalah
Akurat mengatur strategi dan membawanya keluar
dengan benar, dan menyatakan jawaban dalam
konteks masalah
Memecahkan masalah melalui penalaran yang tepat
Cukup menjelaskan proses sehingga tidak perlu
menduga-duga di tingkat proses
Merepresentasikan secara akurat konsep-konsep
matematika dan simbol
Benar-benar memahami konsep-konsep matematika
yang disajikan dalam masalah
Benar memilih informasi yang diperlukan dari
masalah dan menerapkan konsep-konsep dan
informasi dalam pemecahan masalah
Akurat mengatur strategi dan membawanya keluar
dengan benar, jawabannya adalah tidak benar jika:
a) kesalahan dalam perhitungan atau menuliskan
jawabannya
b) nomor di jawabannya benar tetapi unit tersebut
salah atau dihilangkan
c) tidak ada jawaban
Cukup menjelaskan proses secara logis, tetapi
termasuk sebagian jeda dalam logika yang
digunakan dalam proses
Mewakili konsep-konsep matematika dan simbol
dengan kesalahan-kesalahan kecil
memahami secara parsial konsep-konsep
matematika dalam masalah

D (Need
Improvement)/
Membutuhkan
peningkatan

Penggunaan informasi secaca parsial disajikan di


dalam masalah dengan situasi masalah yang kurang
Tepat dalam menggunakan strategi tetapi tidak
cukup mengeksekusi untuk mendapatkan jawaban
Tidak jelas mewakili konsep-konsep matematika dan
simbol dalam pemecahan masalah
Memberikan jawaban, tapi proses pemecahan
masalah tidak dapat dimengerti atau tidak ada
proses sama sekali
Tidak benar-benar mengerti apa masalah yang
diminta dan konsep-konsep matematika apa yang
disajikan dalam masalah
Kesalahan dalam menggunakan informasi yakni
tidak relevan dengan proses pemecahan masalah
karena kurangnya memahami masalah
Kesulitan dalam memahami proses pemecahan
masalah karena kurangnya penjelasan yang jelas
Melengkapi kekurangan uji coba:
a) lembar kosong, jawaban yang salah atau tidak
dijawab
b) beberapa penjelasan tidak relevan dengan
pemecahan masalah

Tabel 2. Contoh Penilaian constructed-response item untuk kelas 3


Tingkatan Level
Unit
Konten/ isi
3-2
Volume dan Berat
Pengukuran
Kemampuan dan konsep Perbandingan Berat
kunci
Tujuan
Untuk membandingkan bobot langsung atau
tidak langsung, dan untuk menjelaskan
perbandingan metode metode
Untuk merasakan perlunya ukuran (unit) dari
berat badan dan ketidaknyamanan dalam
pengukuran (unit) acak dengan
membandingkan aktivitas berat

Contoh masalah

Ada dua cara membandingkan bobot pensil dan


penghapus.
A. Mengukur berat dengan penjepit kertas dan
batu
B. Meletakkan pensil dan penghapus pada
pengukuran yang memenuhi syarat
(timbangan Standar Nasional)
{GAMBAR}
Metode yang harus digunakan untuk tepat
menimbang perbedaan antara pensil dan
penghapus?
Pilih metode dan jelaskan pilihan Anda!
Cari tahu berapa besar perbedaan berat
penghapus dari berat pensil dari hasil diperoleh
pada pengukuran yang memenuhi syarat
(timbangan standar nasional)
dan jelaskan bagaimana Anda dapat memecahkan
masalah ini?

Tabel 3: Kelas dan Jumlah siswa yang belajar


Tingkatan/KelasLevel
3-1
3-2

Kelas

Jumlah Siswa

Bab

A
B
C

27
21
26

1~8
1~8
1~8

Tabel 4. konsistensi internal (Cronbach Koefisien )


Penilai
A
B
C

Tingkatan/Kelas-Level 31
.864
.871
.881

Tingkatan/Kelas-Level 32
.929
.919
.904

Anda mungkin juga menyukai