FORMULIR
BAHAN AJAR
SEMESTER : GASAL
OLEH
TAHUN 2017
1
ASESMEN DALAM PEMBELAJARAN
Pendahuluan
P eserta PLPG yang baik. Asesmen pembelajaran merupakan bagian integral dari
keseluruhan proses belajar-mengajar, sehingga kegiatan asesmen harus dilakukan
2
7. Membuat instrumen penilaian sikap
8. Memberi scoring tes
9. Menganalisis butir soal objektif
Secara sederhana, pengukuran diartikan sebagai kegiatan atau upaya yang dilakukan
untuk memberikan angka-angka pada suatu gejala atau peristiwa, atau benda.
Untuk menetapkan angka dalam pengukuran, perlu sebuah alat ukur yang disebut
dengan instrumen. Ada instrumen yang standar, seperti thermometer, timbangan dan
3
meteran, sedangkan instrumen yang tidak standar seperti jengkal, depa, sebentar lagi dan
dekat saja. Dalam dunia pendidikan instrumen yang sering digunakan seperti tes, lembar
observasi, panduan wawancara, skala sikap dan angket.
Tes. Tes adalah salah satu contoh instrumen atau alat pengukuran yang paling
banyak dipergunakan untuk mengetahui kemampuan intelektual seseorang. Saudara tentu
sering melakukan tes baik sebagai peserta tes seperti ketika Saudara akan masuk Perguruan
Tinggi, terlebih dahulu Saudara mengikuti tes masuk, Saudara juga mengikuti Ujian Akhir
Semester (UAS) pada LPTK Saudara, Saudara mengikuti tes tengah semester (TTS), dan
sebagai guru Saudara telah mengadakan tes bagi peserta didik saudara. Secara rinci
kegiatan tes dijelaskan dalam gambar 1.1 dan 1.2.
Gambar 1.1. Peserta didik sedang tes Gambar 1.2. Penilaian peserta melalui non tes
Berdasarkan pengalaman yang telah Saudara peroleh, coba buatlah definisi tes!
Tes adalah seperangkat pertanyaan atau tugas yang direncanakan untuk memperoleh
informasi tentang trait atau sifat atau atribut pendidikan yang setiap butir pertanyaan
tersebut mempunyai jawaban atau ketentuan yang dianggap benar (Suryanto Adi, dkk.,
2009).
4
Provinsi yang ditunjukkan oleh angka I pada peta Pulau Jawa di atas adalah ….
A. Provinsi Banten
B. Provinsi DKI Jakarta
C. Provinsi Jawa Barat
D. Provinsi Jawa Tengah
Ini berarti asesmen berhubungan dengan setiap bagian dari proses pendidikan,
bukan hanya keberhasilan belajar peserta didik saja, tetapi mencakup semua proses
5
mengajar dan belajar. Oleh karena itu, kegiatan asesmen tidak terbatas pada karakteristik
peserta didik saja, tetapi juga mencakup karakteristik metode mengajar, kurikulum, fasilitas
dan administrasi sekolah.
Evaluasi. Evaluasi berasal dari kata evaluation (bahasa Inggris). Stufflebeam
(Fernandes 1984) mengatakan bahwa evaluasi merupakan proses penggambaran,
pencarian, dan pemberian informasi yang sangat bermanfaat bagi pengambil keputusan
dalam menentukan alternatif keputusan (judgement alternative). Sedangkan Tyler seperti
dikutip oleh Mardapi, D. (2004) menyatakan bahwa evaluasi merupakan proses penentuan
sejauh mana tujuan pendidikan telah tercapai. Artinya,
Evaluasi itu merupakan proses untuk memberi makna atau menetapkan kualitas hasil
pengukuran, dengan cara membandingkan angka hasil pengukuran tersebut dengan
kriteria tertentu.
Kriteria sebagai pembanding dari proses dan hasil pembelajaran tersebut dapat
ditentukan sebelum proses pengukuran atau ditetapkan setelah pelaksanaan pengukuran.
Kriteria ini dapat berupa proses atau kemampuan minimal yang dipersyaratkan seperti
KKM, atau batas keberhasilan, dapat pula berupa kemampuan rata-rata unjuk kerja
kelompok, atau berbagai patokan yang lain. Kriteria yang berupa batas kriteria minimal
yang telah ditetapkan sebelum pengukuran dan bersifat mutlak disebut dengan Penilaian
Acuan Patokan atau Penilaian Acuan Kriteria (PAP/PAK), sedang kriteria yang ditentukan
setelah kegiatan pengukuran dilakukan dan didasarkan pada keadaan kelompok dan bersifat
relatif disebut dengan Penilaian Acuan Norma/ Penilaian Acuan Relatif (PAN/PAR).
Tes, pengukuran, asesmen, dan evaluasi bersifat hierarkhis, maksudnya kegiatan
tersebut dilakukan secara berurutan, yaitu dimulai dari melaksanakan instrumen
pengukuran (yang sering digunakan adalah tes), mengadakan pengukuran, kemudian
melakukan asesmen (penilaian), dan terakhir evaluasi. Untuk memperjelas keterkaitan
empat hal tersebut di atas, maka dapat dijelaskan sebagai berikut:
Bapak Leo guru SD kelas V, ingin mengetahui kompetensi dasar mata pelajaran IPS
semester 1 yaitu mengenal keragaman kenampakan alam dan buatan serta pembagian
wilayah waktu di Indonesia dengan menggunakan peta/atlas/globe dan media lainnya, yang
telah dicapai peserta didiknya. Bapak Leo menyelenggarakan tes berbentuk obyektif
pilihan ganda dengan 50 butir soal. Selanjutnya Bapak Leo memeriksa lembar jawaban
6
peserta didik sesuai dengan kunci jawaban, kemudian dengan menggunakan rumus
tertentu, dihitung skor mentahnya dan diperoleh hasil 48, 54, 56, 56, 70, 72, 80, 84, 98, 90,
dan seterusnya (sampai di sini sudah terjadi pengukuran). Angka-angka atau skor ini belum
mempunyai makna atau nilai dan arti apa-apa. Oleh karena itu, Pak Leo selanjutnya
melakukan pengolahan dengan menggunakan pendekatan PAP dengan batas penguasaan
70. Hasil pengolahan menunjukkan bahwa skor di bawah 70 berarti tidak menguasai dan
skor 70 ke atas berarti menguasai. Disinilah proses asesmen terjadi. Ini contoh untuk
lingkup asesmen hasil belajar. Namun apabila pak Leo menginginkan untuk mengases
seluruh komponen pembelajaran, maka berarti terjadi evaluasi. Secara rinci dijelaskan
melalui bagan di halaman berikutnya.
Evaluasi
Asesmen
7
Kuantitatif Kualitatif
8
utuh; dan memberikan bimbingan yang tepat kepada peserta didik untuk memilih
sekolah atau jabatan yang sesuai dengan keterampilan, minat, dan kemampuannya.
9
Secara garis besar, asesmen dibedakan menjadi 5 jenis yaitu:
1. Asesmen formatif, yakni penilaian yang dilaksanakan pada setiap akhir pokok
bahasan, tujuannya untuk mengetahui tingkat penguasaan peserta didik terhadap pokok
bahasan tertentu. Informasi dari asesmen formatif dapat dipakai sebagai umpan balik
bagi pengajar mengenai proses pembelajaran. Jadi asesmen formatif berfungsi untuk
memperbaiki program pembelajaran, bukan untuk memberi kontribusi langsung pada
asesmen sumatif.
2. Asesmen sumatif, yaitu penilaian yang dilakukan pada akhir satuan program tertentu,
(catur wulan, semester atau tahun ajaran), tujuannya untuk melihat prestasi yang
dicapai peserta didik selama satu program yang secara lebih khusus hasilnya akan
merupakan nilai yang tertulis dalam raport dan penentuan kenaikan kelas.
3. Asesmen diagnostik, yaitu penilaian yang dilakukan untuk melihat kelemahan peserta
didik dan faktor-faktor yang diduga menjadi penyebabnya. Penilaian ini dilakukan
untuk keperluan memberi bimbingan belajar dan pengajaran remedial.
4. Asesmen penempatan (placement), yaitu penilaian yang ditujukan untuk
menempatkan peserta didik sesuai dengan bakat, minat, dan kemampuannya, misalnya
dalam pemilihan jurusan atau menempatkan peserta didik pada kerja kelompok dan
pemilihan kegiatan tambahan.
5. Asesmen seleksi, yakni penilaian yang ditujukan untuk menyaring atau memilih orang
yang paling tepat pada kedudukan atau posisi tertentu. Asesmen ini dilakukan kapan
saja diperlukan. Aspek yang dinilai dapat beraneka ragam disesuaikan dengan tujuan
seleksi, sebab tujuannya adalah memilih calon untuk posisi tertentu, karena itu analisis
dari asesmen ini biasanya menggunakan kriteria yang bersifat relatif atau berdasar
norma kelompok.
Syarat-syarat Asesmen. Dietel, Herman dan Knuth (1991) mensyaratkan asesmen
yang baik adalah valid (mengukur sesuai yang akan diukur) dan konsisten/reliabel (dapat
dipercaya). Slameto (1986) menyebutkan ada 8 syarat dalam asesmen pembelajaran yakni;
1. Sahih (valid)
Validitas dalam asesmen mempunyai pengertian bahwa dalam melakukan penilaian
harus ”menilai apa yang seharusnya dinilai dengan menggunakan alat yang sesuai
10
untuk mengukur kompetensi”. Apabila yang diukur sikap, tetapi asesmen mengukur
pengetahuan, maka asesmen tersebut tidak valid. Kesahihan asesmen biasanya diukur
dalam prosentase atau dalam derajat tertentu dengan alat ukur tertentu.
2. Terandalkan (reliable)
Pengertian reliabilitas berkaitan dengan konsistensi (keajegan) hasil penilaian.
Penilaian yang ajeg (reliable) memungkinkan perbandingan yang reliable, menjamin
konsistensi, dan keterpercayaan. Contoh, dalam menguji kompetensi siswa dalam
melakukan eksperimen di laboratorium. Sepuluh peserta didik melakukan eksperimen
dan masing-masing menulis laporannya. Penilaian ini reliable jika guru dapat
membandingkan taraf penguasaan 10 peserta didik itu dengan kompetensi eksperimen
yang dituntut dalam kurikulum. Penilaian ini reliable jika 30 peserta didik yang sama
mengulangi eksperimen yang sama dalam kondisi yang sama dan hasilnya ternyata
sama. Jika alat asesmen yang sama dilakukan terhadap kelompok peserta didik yang
sama beberapa kali dalam waktu yang berbeda-beda atau situasi yang berbeda-beda,
memberikan hasil yang sama, maka asesmen dinyatakan terandalkan.
3. Objektif
Objektif dalam konteks penilaian adalah bahwa proses penilaian yang dilakukan harus
meminimalkan pengaruh-pengaruh atau pertimbangan subjektif dari guru. Dalam
implementasinya, penilaian harus dilaksanakan secara objektif. Dalam hal tersebut,
penilaian harus adil, terencana, berkesinambungan, menggunakan bahasa yang dapat
dipahami peserta didik, dan menerapkan kriteria yang jelas dalam pembuatan keputusan
atau pemberian angka (skor). Asesmen dikatakan objektif jika tidak mendapat pengaruh
subjektif dari pihak penilai.
4. Seimbang
Keseimbangan dalam hal ini meliputi keseimbangan bahan, keseimbangan kesukaran,
dan keseimbangan tujuan. Bahan harus seimbang di antara berbagai pokok bahasan.
Keseimbangan dalam kesukaran artinya antara yang mudah, sedang dan sukar harus
dalam proporsi tertentu. Keseimbangan tujuan dimaksud keseimbangan antara berbagai
macam matra tujuan. Keseimbangan dalam berbagai ranah kognitif baik pengetahuan,
11
pemahaman, aplikasi, analisis, evaluasi dan kreatif, harus disusun dalam proporsi yang
seimbang.
5. Membedakan
Suatu asesmen harus dapat membedakan (discriminable) prestasi individual di antara
sekelompok peserta didik. Asesmen harus dapat membedakan peserta didik yang sangat
berhasil, cukup berhasil, kurang berhasil, gagal dan sebagainya.
6. Norma
Asesmen yang baik, hasilnya harus mudah ditafsirkan. Hal ini menyangkut tentang
adanya ukuran atau norma tertentu untuk menafsirkan hasil asesmen dari setiap peserta
didik.
7. Fair
Asesmen yang fair mengemukakan persoalan-persoalan dengan wajar, tidak bersifat
jebakan, dan tidak mengandung kata-kata yang bersifat menjebak. Di samping itu
terdapat keadilan untuk setiap peserta didik yang diases.
8. Praktis
Baik ditinjau dari segi pembiayaan, maupun dari segi pelaksanaannya, asesmen harus
efisien dan mudah dilaksanakan.
Ke delapan syarat tersebut perlu dimiliki oleh suatu asesmen yang baik walaupun dalam
derajad yang berbeda-beda.
Prinsip Asesmen. Prinsip adalah sesuatu yang harus dijadikan pedoman. Prinsip
asesmen pembelajaran adalah patokan yang harus dipedomani ketika Anda sebagai guru
melakukan asesmen proses dan hasil belajar. Ada beberapa prinsip dasar asesmen
pembelajaran yang harus dipedomani adalah seperti berikut ini.
1. Komprehensif (menyeluruh)
Asesmen terhadap hasil belajar peserta didik harus dilaksanakan secara menyeluruh,
utuh, dan tuntas yang mencakup seluruh domain aspek kognitif, psikomotorik, dan
afektif atau nilai, dan keterampilan, serta materi secara representatif sehingga hasilnya
dapat diintegrasikan dengan baik.
2. Berorientasi pada kompetensi
12
Konsekuensi perubahan kurikulum akan menuntut perubahan dalam sistem asesmen
nya. Dalam pelaksanaan kurikulum tingkat satuan pendidikan (KTSP), asesmen harus
berorientasi pada pencapaian kompetensi (rangkaian kemampuan), bukan pada
penguasaan materi (pengetahuan).
3. Terbuka, adil dan objektif
Prosedur asesmen, kriteria asesmen dan pengambilan keputusan hendaknya diketahui
oleh pihak yang berkepentingan, sehingga terbuka bagi berbagai kalangan
(stakeholders) baik langsung maupun tidak langsung, sehingga keputusan tentang
keberhasilan peserta didik jelas bagi pihak-pihak yang berkepentingan, tanpa ada
rekayasa atau sembunyi-sembunyi yang dapat merugikan semua pihak.
4. Berkesinambungan
Asesmen harus dilakukan secara terus-menerus, berkesinambungan berencana,
bertahap, teratur dari waktu ke waktu, untuk mengetahui secara menyeluruh
perkembangan kemajuan belajar peserta didik, sehingga kegiatan dan unjuk kerja
peserta didik dapat dipantau melalui asesmen.
5. Bermakna
Asesmen diharapkan mempunyai makna yang signifikan bagi semua pihak. Untuk itu,
asesmen hendaknya mudah dipahami dan dapat ditindaklanjuti oleh pihak-pihak yang
berkepentingan. Hasil asesmen hendaknya mencerminkan gambaran yang utuh tentang
prestasi peserta didik yang mengandung informasi keunggulan dan kelemahan, minat
dan tingkat penguasaan peserta didik dalam pencapaian kompetensi yang telah
ditetapkan.
6. Terpadu, sistematis dan menggunakan acuan kriteria
Pelaksanaan asesmen merupakan komponen yang tidak terpisahkan dari kegiatan
pembelajaran dan dilakukan secara berencana dan bertahap dengan mengikuti langkah-
langkah yang baku, serta mendasarkan pada ukuran pencapaian kompetensi yang
ditetapkan.
7. Mendidik dan akuntabel
Asesmen dilakukan bukan untuk mendiskriminasi peserta didik (lulus atau tidak lulus)
atau menghukum peserta didik, tetapi untuk mendeferensiasi peserta didik (sejauh mana
13
seorang peserta didik membuat kemajuan atau posisi masing-masing peserta didik
dalam rentang cakupan pencapaian suatu kompetensi). Berbagai aktivitas asesmen
harus memberikan gambaran kemampuan peserta didik, bukan gambaran ketidak-
mampuannya. Jadi, asesmen yang mendidik artinya proses asesmen hasil belajar harus
mampu memberikan sumbangan positif pada peningkatan pencapaian hasil belajar
peserta didik, sehingga hasil asesmen dapat memberikan umpan balik dan motivasi
kepada peserta didik untuk lebih giat belajar.
Latihan
Setelah Anda mempelajari konsep dasar asesmen pembelajaran ini, coba jawablah
pertanyaan berikut ini dan diskusikanlah!
1. Apa yang dimaksud dengan asesmen, pengukuran, dan evaluasi? Bagaimanakah
keterkaitannya?
2. Sebut dan jelaskan tujuan penilaian dengan memberikan contoh sesuai pengalaman!
3. Apa fungsi asesmen dalam pembelajaran berdasarkan jenisnya? Jelaskan!
4. Sebut dan jelaskan syarat asesmen pembelajaran!
5. Sebut dan jelaskan prinsip-prinsip asesmen dalam pembelajaran!
14
Trait pendidikan meliputi keterampilan, pengetahuan, kecerdasan, kemampuan, atau
bakat sesesorang atau kelompok. Berdasarkan definisi tersebut, dapat dijelaskan bahwa tes
merupakan informasi yang berbentuk pertanyaan atau tugas/latihan, dipergunakan untuk
mengukur kemampuan yang ada pada seseorang atau sekelompok orang. Sebagai alat ukur
dalam bentuk pertanyaan, maka tes harus dapat memberikan informasi mengenai
pengetahuan dan kemampuan objek yang diukur. Sedangkan sebagai alat ukur berupa
tugas/latihan, maka tes harus dapat mengungkap keterampilan dan bakat seseorang atau
sekelompok orang.
Tes merupakan alat ukur yang standar dan objektif sehingga dapat digunakan secara
meluas untuk mengukur dan membandingkan keadaan psikis atau tingkah laku individu.
Dengan demikian berarti sudah dapat dipastikan akan mampu memberikan informasi yang
tepat dan objektif tentang objek yang hendak diukur baik berupa psikis maupun tingkah
lakunya, sekaligus dapat membandingkan antara seseorang dengan orang lain. Jadi dapat
disimpulkan bahwa tes adalah suatu cara atau alat untuk mengadakan penilaian yang
berbentuk suatu tugas atau serangkaian tugas yang harus dikerjakan oleh peserta didik atau
sekelompok peserta didik, sehingga menghasilkan nilai tentang tingkah laku atau prestasi
peserta didik tersebut. Prestasi atau tingkah laku tersebut dapat menunjukkan tingkat
pencapaian kompetensi/tujuan pembelajaran atau tingkat penguasaan terhadap seperangkat
materi yang telah diberikan dalam proses pembelajaran, dan dapat pula menunjukkan
kedudukan peserta didik yang bersangkutan dalam kelompoknya.
Dalam kaitan dengan rumusan tersebut, sebagai alat asesmen hasil belajar, tes
minimal mempunyai dua fungsi, yaitu untuk:
1) mengukur tingkat penguasaan terhadap seperangkat materi atau tingkat pencapaian
terhadap seperangkat tujuan tertentu.
2) menentukan kedudukan atau perangkat peserta didik dalam kelompok, tentang
penguasaan materi atau pencapaian tujuan pembelajaran tertentu.
15
1. Tes Kecepatan (Speed Test)
Tes ini bertujuan untuk mengases peserta tes (testi) dalam hal kecepatan berpikir atau
keterampilan, baik yang bersifat spontanitas (logik) maupun hafalan dan pemahaman
dalam mata pelajaran yang telah dipelajarinya. Waktu yang disediakan untuk menjawab
seluruh materi tes ini relatif singkat dibandingkan dengan tes lainnya, misalnya tes
intelegensi dan tes keterampilan bongkar pasang suatu alat.
2. Tes Kemampuan (Power Test)
Tes ini bertujuan untuk mengases peserta tes dalam mengungkapkan kemampuannya
(dalam bidang tertentu) dengan tidak dibatasi secara ketat oleh waktu yang disediakan.
Kemampuan yang diases berupa kognitif atau psikomotorik. Soal-soal tes biasanya
relatif sukar karena menyangkut berbagai konsep dan pemecahan masalah serta
menuntut peserta tes untuk berfikir pada level yang tinggi yakni menerapkan (apply),
menganalisis (analyse), mengevaluasi (evaluate), dan membuat (create).
3. Tes Hasil Belajar (Achievement Test)
Tes ini dimaksudkan untuk mengases hal yang telah diperoleh dalam suatu kegiatan
seperti Tes Hasil Belajar (THB), tes harian (formatif) dan tes akhir semester (sumatif).
Tes ini bertujuan untuk mengases hasil belajar setelah mengikuti kegiatan pembelajaran
dalam suatu kurun waktu tertentu.
4. Tes Kemajuan Belajar (Gains/Achievement Test)
Tes kemajuan belajar disebut juga dengan tes perolehan. Tes ini dimaksudkan untuk
mengetahui kondisi awal testi sebelum pembelajaran dan kondisi akhir testi setelah
pembelajaran. Untuk mengetahui kondisi awal testi digunakan pre-tes dan kondisi akhir
testi digunakan post-tes.
5. Tes Diagnostik (Diagnostic Test)
Tes diagnostik adalah tes yang dilaksanakan untuk mendiagnosis atau mengidentifikasi
kesukaran-kesukaran dalam belajar, mendeteksi faktor-faktor yang menyebabkan
terjadinya kesukaran belajar, dan menetapkan cara mengatasi kesukaran atau kesulitan
belajar tersebut, seperti tes diagnostik matematika, tes diagnostik IPA.
6. Tes Formatif
16
Tes formatif adalah tes hasil belajar yang digunakan untuk mengetahui sejauh mana
kemajuan belajar yang telah dicapai oleh peserta didik dalam suatu program
pembelajaran tertentu seperti tes harian, ulangan harian.
7. Tes Sumatif
Istilah sumatif berasal dari kata “sum” yang berarti jumlah. Dengan demikian tes
sumatif berarti tes yang ditujukan untuk mengetahui penguasaan peserta didik terhadap
sekumpulan materi pelajaran (pokok bahasan) yang telah dipelajari, seperti UAN (Ujian
Akhir Nasional), THB, dan Ulangan Umum Bersama (UUB).
Dilihat dari jawaban peserta didik yang dituntut dalam menjawab atau memecahkan
persoalan yang dihadapinya, maka tes hasil belajar dapat dibagi menjadi 3 jenis yakni tes
lisan (oral test), tes tertulis (written test), dan tes tindakan atau perbuatan (performance
test). Penggunaan setiap jenis tes tersebut seyogyanya disesuaikan dengan kawasan
(domain) perilaku peserta didik yang hendak diukur. Misalnya tes tertulis atau tes lisan
dapat digunakan untuk mengukur kawasan kognitif, sedangkan kawasan psikomotorik
cocok dan tepat apabila diukur dengan tes tindakan, dan kawasan afektif biasanya diukur
dengan skala perilaku, seperti skala sikap.
2. Teknik Nontes
Jika tes adalah seperangkat pertanyaan yang memiliki jawaban benar atau salah,
teknik non-tes berisi pertanyaan atau pernyataan yang tidak memiliki jawaban benar atau
salah. Instrumen non-tes dapat berbentuk kuesioner atau inventori. Kuesioner berisi
sejumlah pertanyaan atau pernyataan, peserta didik diminta menjawab atau memberikan
pendapat terhadap pernyataan. Inventori merupakan instrumen yang berisi tentang laporan
diri yaitu keadaan peserta didik, misalnya potensi peserta didik. Hasil pengukuran melalui
instrumen non tes berupa angka disebut kuantitatif dan bukan berupa angka seperti
pernyataan sangat baik, baik, cukup, kurang, sangat kurang, dan sebagainya disebut
kualitatif.
Teknik nontes sangat penting dalam mengases peserta didik pada ranah afektif dan
psikomotor, berbeda dengan teknik tes yang lebih menekankan pada aspek kognitif. Ada
beberapa macam teknik nontes, beberapa di antaranya seperti unjuk kerja (performance),
penugasan (proyek), tugas individu, tugas kelompok, laporan, ujian praktik dan portofolio.
17
Unjuk kerja adalah suatu penilaian/pengukuran yang dilakukan melalui
pengamatan aktivitas peserta didik dalam melakukan sesuatu yang berupa tingkah laku atau
interaksinya seperti berbicara, berpidato, membaca puisi, dan berdiskusi; kemampuan
peserta didik dalam memecahkan masalah dalam kelompok; partisipasi peserta didik dalam
diskusi; ketrampilan menari; ketrampilan memainkan alat musik; kemampuan berolah raga;
ketrampilan menggunakan peralatan laboratorium; praktek sholat, bermain peran,
bernyanyi, dan ketrampilan mengoperasikan suatu alat.
Asesmen unjuk kerja/kinerja ini cocok digunakan untuk menilai ketercapaian
kompetensi yang menuntut peserta didik melakukan tugas tertentu seperti mengamati suatu
kejadian/benda /tanaman, praktek di laboratorium/olahraga, bermain peran, memainkan alat
musik, bernyanyi, membaca puisi, investigasi, demonstrasi, open-ended questions, jurnal,
dan portofolio dan lain-lain.
Penugasan adalah penilaian yang berbentuk pemberian tugas yang mengandung
penyelidikan (investigasi) yang harus selesai dalam waktu tertentu. Penyelidikan tersebut
dilaksanakan secara bertahap yakni perencanaan, pengumpulan data, pengolahan data, dan
penyajian data. Penilaian penugasan ini bermanfaat untuk menilai keterampilan
menyelidiki secara umum, pemahaman dan pengetahuan dalam bidang tertentu,
kemampuan mengaplikasi pengetahuan dalam suatu penyelidikan, dan kemampuan
menginformasikan subjek secara jelas.
18
dalam bentuk seperti pembuatan kliping, pembuatan makalah dan yang sejenisnya. Tingkat
berpikir yang terlibat pada peserta didik sebaiknya menerapkan (apply), menganalisis
(analyse), mengevaluasi (evaluate), dan membuat (create).
Tugas kelompok sama dengan tugas individu, namun dikerjakan secara kelompok.
Tugas ini diberikan untuk menilai kompetensi kerja kelompok. Bentuk instrumen yang
digunakan salah satunya adalah tertulis dengan menjawab uraian secara bebas dengan
tingkat berpikir tinggi yaitu aplikasi sampai evaluasi.
Laporan adalah penilaian yang berbentuk laporan atas tugas atau pekerjaan yang
diberikan seperti laporan diskusi, laporan kerja praktik, laporan praktikum dan laporan
Pemantapan Praktik Lapangan (PPL).
Responsi atau ujian praktik adalah suatu penilaian yang dipakai untuk mata
pelajaran yang ada kegiatan praktikumnya seperti mata kuliah PPL. Ujian responsi dapat
dilakukan pada awal praktik atau setelah melakukan praktik. Ujian yang dilakukan sebelum
praktik bertujuan untuk mengetahui kesiapan peserta didik melakukan praktik di
laboratorium/ruang keterampilan/bengkel kerja/sekolah latihan, sedangkan ujian yang
dilakukan setelah praktik tujuannya untuk mengetahui kompetensi dasar praktik yang telah
dan belum dicapai peserta didik.
Portofolio merupakan penilaian berkelanjutan yang didasarkan pada kumpulan
informasi yang menunjukkan perkembangan kemampuan peserta didik dalam satu periode
tertentu. Informasi tersebut dapat berupa karya peserta didik dari proses pembelajaran yang
dianggap terbaik oleh peserta didik, pekerjaan-pekerjaan yang sedang dilakukan, beberapa
contoh tes yang telah selesai dilakukan, berbagai keterangan-keterangan yang diperoleh
peserta didik, keselarasan antara pembelajaran dan tujuan spesifik yang telah dirumuskan,
contoh-contoh hasil pekerjaannya sehari-hari, evaluasi diri terhadap perkembangan
pembelajaran dan hasil observasi guru.
Penilaian portofolio pada dasarnya menilai karya-karya siswa secara individu pada satu
periode untuk suatu mata pelajaran. Akhir suatu periode hasil karya tersebut dikumpulkan
dan dinilai oleh guru dan peserta didik. Berdasarkan informasi perkembangan tersebut,
guru dan peserta didik sendiri dapat menilai perkembangan kemampuan peserta didik dan
terus melakukan perbaikan. Dengan demikian, portofolio dapat memperlihatkan
19
perkembangan kemajuan belajar peserta didik melalui karyanya, antara lain: karangan,
puisi, surat, komposisi, musik. Lihat gambar 1.7.
20
Penilaian Lompat Jauh Gaya Menggantung
Contoh lain:
Berilah skor:
4 bila aspek tersebut dilakukan dengan benar dan cepat
3 bila aspek tersebut dilakukan dengan benar tapi lama
2 bila aspek tersebut dilakukan selesai tapi salah
1 bila dilakukan tapi tidak selesai
21
Penilaian Sikap. Sikap bermula dari perasaan (suka atau tidak suka) yang terkait
dengan kecenderungan seseorang dalam merespon sesuatu/objek. Sikap dapat dibentuk,
sehingga terjadinya perilaku atau tindakan yang diinginkan. Sikap terdiri dari tiga
komponen, yakni: afektif, kognitif, dan konatif. Komponen afektif adalah perasaan yang
dimiliki oleh seseorang atau penilaiannya terhadap sesuatu objek. Komponen kognitif
adalah kepercayaan atau keyakinan seseorang mengenai objek. Adapun komponen konatif
adalah kecenderungan untuk berperilaku atau berbuat dengan cara-cara tertentu berkenaan
dengan kehadiran objek sikap. Secara umum, objek sikap yang perlu dinilai dalam proses
pembelajaran berbagai mata pelajaran adalah sebagai berikut. Sikap terhadap materi
pelajaran, sikap terhadap guru/pengajar, sikap terhadap proses pembelajaran, sikap
berkaitan dengan nilai atau norma yang berhubungan dengan suatu materi pelajaran.
Penilaian sikap dapat dilakukan dengan beberapa cara antara lain: observasi perilaku,
pertanyaan langsung, dan laporan pribadi.
1. Observasi perilaku. Perilaku seseorang pada umumnya menunjukkan kecenderungan
seseorang dalam sesuatu hal. Misalnya orang yang senang makan bakso, dapat
dipahami sebagai kecenderungannya yang senang kepada bakso. Oleh karena itu, guru
dapat melakukan observasi terhadap peserta didik yang dibinanya. Hasil observasi
dapat dijadikan sebagai umpan balik dalam pembinaan. Observasi perilaku di sekolah
dapat dilakukan dengan menggunakan buku catatan khusus tentang kejadian-kejadian
berkaitan dengan peserta didik selama di sekolah. Penilaian sikap dapat dilakukan pula,
pada saat peserta didik praktek IPS.
2. Pertanyaan langsung
Penilaian sikap dapat dilakukan dengan menanyakan secara langsung kepada peserta
didik tentang sikap seseorang berkaitan dengan sesuatu hal. Misalnya, bagaimana
tanggapan peserta didik tentang Ujian Nasional yang akan dilaksanakan.
3. Laporan pribadi
Dalam penilaian ini, peserta didik diminta membuat ulasan yang berisi pandangan atau
tanggapannya tentang suatu masalah, keadaan, atau hal yang menjadi objek sikap.
Misalnya, peserta didik diminta menulis pandangannya tentang lingkungan sekolah
22
Pada akhirnya, guna mempermudah pemahaman Anda terhadap teknik asesmen
proses dan hasil belajar, pelajarilah sketsa berikut ini.
TEKNIK BENTUK KEPENTINGAN JENIS
Tes Tertulis Obyektif Lebih sesuai untuk Benar-Salah, Pilihan Ganda, Isian,
indikator kognitif Menjodohkan
Subyektif Pengerjaan soal, latihan (exercise),
Membaca Pemahaman, Esai Berstruktur,
Esai Bebas
Lisan Obyektif Lebih sesuai untuk Kuis (Quis)
Subyektif indicator kognitif Pemahaman: Tanya jawab singkat,
Pelafalan, Membaca Nyaring,
Mendengarkan, Intruksi Lesan,
Percakapan
Perbuatan Kinerja Lebih sesuai untuk Permainan, Bermain Peran, Drama,
indikator psikomotor Demonstrasi, Olah Raga, Senam,
Bermain Musik, Bernyanyi, Pantomim,
Dinamika Kelompok, Berdoa,
Memelihara Tanaman, Memelihara
Hewan, Membaca Puisi, Berpidato,
Diskusi, Wawancara, Debat, Bercerita,
Menari, dan sebagainya.
Produk Lebih sesuai untuk Patung, Kerajinan Tangan, Model,
indicator psikomotor Pesawat Sederhana, Alat, Ternak,
Tanaman, Simpul tali-temali, Janur,
Hiasan Buah-Buahan, dan sebagainya.
Non Tes Penilaian Hasil Lebih sesuai untuk Pengamatan, Daftar Chek/Periksa, Skala
indicator afektif Sikap, Catatan Diri, Buku Harian,
Penilaian Diri, Angket, Ungkapan,
Perasaan, Catatan Anekdot, Sosiogram
Portofolio (Penilaian Dipakai untuk Puisi, Karangan Gambar/tulisan,
Proses dan Hasil) mengamati Peta/Denah, Desain Makalah, Laporan
perkembangan observasi, Laporan penyelidikan,
kemampuan kognitif Laporan penelitian, Laporan eksperimen,
dan psikomotor Sinopsis, Naskah Pidato, Naskah Drama,
Doa, Rumus, Kartu Ucapan, Surat,
Komposisi Musik, Teks Lagu, Resep
Makanan
23
matematika yang terdiri 50 butir soal. Andi mengerjakan betul sebanyak 30
butir soal, dan skor tertinggi 80, maka skor yang diperoleh Andi adalah rumus:
B
Skor = -------X 100 (skala 0-100)
N
(15x1)+(10x3)+(4x4)+(1x5)
Skor =Σ ------------------------------------ x 100 % = 73,3 %
90
Jadi skor yang diperoleh Vista adalah 73,3 %, artinya Vista dapat menguasai tes
mata pelajaran PPKn sebesar 73,5 %.
25
Sebuah kotak air minum berbentuk balok berukuran panjang 100 cm, lebar 60 cm,
dan tinggi 70 cm. Berapa liter air minumkah yang ada pada balok tersebut? (untuk
menjawabnya tuliskan langkah-langkahnya).
26
Skor tertinggi 10
27
V. Menganalisis Butir Soal dalam Asesmen Hasil Belajar
nalisis adalah kajian/telaah terhadap sesuatu hal untuk mengetahui keadaan yang
A sebenarnya. Analisis butir soal adalah kajian terhadap butir soal untuk
mengetahui kualitas butir soal sesuai karakter dan fungsi serta syarat yang
ditetapkan.
28
B. Teknik analisis butir soal
1. Analisis Kualitatif
Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaidah
penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini biasanya dilakukan
sebelum soal digunakan/diujikan.
Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah setiap soal
ditelaah dari segi materi, konstruksi, bahasa/budaya, dan kunci jawaban/ pedoman
penskorannya. Dalam melakukan penelaahan setiap butir soal, penelaah perlu
mempersiapkan bahan-bahan penunjang seperti: (1) kisi-kisi tes, (2) kurikulum yang
digunakan, (3) buku sumber, dan (4) kamus bahasa Indonesia.
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara
kualitatif, yaitu teknik moderator dan teknik panel. Teknik moderator merupakan teknik
berdiskusi yang di dalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini,
setiap butir soal didiskusikan secara bersama-sama dengan beberapa ahli seperti guru yang
mengajarkan materi, ahli materi, pengembang kurikulum, ahli penilaian, ahli bahasa,
berlatar belakang psikologi. Teknik ini sangat baik karena setiap butir soal dilihat secara
bersama-sama berdasarkan kaidah penulisannya. Di samping itu, para penelaah
dipersilakan mengomentari/ memperbaiki berdasarkan ilmu yang dimilikinya. Setiap
komentar/masukan dari peserta diskusi dicatat oleh notulis. Setiap butir soal dapat
dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini
adalah memerlukan waktu lama untuk rnendiskusikan setiap butir soal.
Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya
ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi materi, konstruksi,
bahasa/ budaya, kebenaran kunci jawaban/pedoman penskorannya yang dilakukan oleh
beberapa penelaah. Caranya adalah beberapa penelaah diberi butir-butir soal yang akan
ditelaah, format penelaahan, dan pedoman penilaian/penelaahannya (akan dipaparkan pada
sub unit 8.2). Pada tahap awal para penelaah diberikan pengarahan, kemudian tahap
berikutnya para penelaah bekerja sendiri-sendiri di tempat yang tidak sama. Para penelaah
dipersilakan memperbaiki langsung pada teks soal dan memberikan komentarnya serta
29
memberikan nilai pada setiap butir soal yang kriterianya adalah: baik, diperbaiki, atau
diganti.
Secara ideal penelaah butir soal di samping memiliki latar belakang materi yang
diujikan, beberapa penelaah yang diminta untuk menelaah butir soal memiliki
keterampilan, seperti guru yang mengajarkan materi itu, ahli materi, ahli pengembang
kurikulum, ahli penilaian, psikolog, ahli bahasa, ahli kebijakan pendidikan, atau lainnya.
Suatu soal dinyatakan baik jika sudah tidak dipersoalkan oleh setiap penelaah.
2. Analisis Kuantitatif
Penelaahan soal secara kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada
data empirik dari butir soal yang bersangkutan. Analisis kuantitatif yang dipergunakan
untuk tes obyektif dan tes subyektif (uraian) berbeda. Untuk tes obyektif ada dua
pendekatan dalam melakukan analisis, yaitu pendekatan secara klasik dan pendekatan
secara modern. Mengingat kompleksitas teori modern, maka dalam uraian berikut hanya
dibahas pendekatan secara klasik saja
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi
dari jawaban peserta didik, guna meningkatkan mutu butir soal yang bersangkutan
dengan menggunakan teori tes klasik.
Kelebihan analisis butir soal secara klasik adalah murah, dapat dilaksanakan sehari-
hari dengan cepat menggunakan komputer, murah, sederhana, familier dan dapat
menggunakan data dari beberapa peserta didik atau sampel kecil (Millman dan Greene,
1993). Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik adalah setiap
butir soal ditelaah dari segi:
30
Tingkat kesukaran adalah angka yang menunjukkan proporsi peserta didik yang
menjawab betul suatu butir soal (Slameto, 2001). Semakin besar tingkat kesukaran berarti
soal itu semakin mudah, demikian juga sebaliknya semakin rendah tingkat kesukaran
berarti soal itu makin sukar. Tingkat kesukaran soal adalah peluang untuk menjawab benar
suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk
indeks. Indeks tingkat kesukaran (P) dapat dihitung dengan rumus seperti berikut ini.
B
P = -----
N
P = Jumlah peserta didik yang menjawab benar dibagi dengan jumlah keseluruhan peserta
didik atau
P = proporsi peserta didik yang menjawab dengan benar.
Contoh:
Jika butir soal nomer 1 yang Anda ujikan dapat dijawab benar oleh 18 dari 40 orang peserta
didik, maka indeks tingkat kesukaran butir soal nomer 1 tersebut adalah:
18
P= — = 0,40
40
Tingkat kesukaran pada umumnya dinyatakan dalam bentuk proporsi yang besarnya
berkisar 0,00 - 1,00 (Aiken (1994). Untuk menentukan tingkat kesukaran butir soal kita
dapat menggunakan tabel tingkat kesukaran berikut ini.
Tabel Rentang Nilai Tingkat kesukaran
31
Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya untuk
keperluan ujian semester digunakan butir soal yang memiliki tingkat kesukaran sedang,
untuk keperluan seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi/sukar,
dan untuk keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat
kesukaran rendah/mudah. Dalam konstruksi tes, tingkat kesukaran butir soal sangat
penting, karena tingkat kesukaran butir dapat: (1) mempengaruhi karakteristik distribusi
skor (mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan korelasi antar-
soal), (2) berhubungan dengan reliabilitas (akan dibahas pada bahasan berikut). Semakin
tinggi korelasi antar-soal, semakin tinggi reliabilitas. Tingkat kesukaran butir soal juga
dapat digunakan untuk memprediksi alat ukur itu sendiri (soal) dan kemampuan peserta
didik dalam memahami materi yang diajarkan guru. Misalnya satu butir soal termasuk
kategori mudah, maka prediksi terhadap informasi ini adalah sebagian besar peserta didik
menjawab benar butir soal itu, artinya bahwa sebagian besar peserta didik telah memahami
materi yang ditanyakan, dengan kata lain peserta telah mengindikasikan penguasaan
kompetensi. Jika soal berbentuk pilihan ganda, berarti pengecoh butir soal itu tidak
berfungsi.
32
KB : jumlah peserta dalam kelompok bawah (sekitar 30%, berdasarkan ranking skor total) yg menjawab benar
J : jumlah seluruh peserta tes kelompok atas dan kelompok bawah
Contoh:
Setelah dilakukan pengukuran dengan tes, ternyata butir soal nomer 12, 8 dari 10 peserta
yang termasuk kelompok atas dapat menjawab benar, 2 dari 10 peserta termasuk kelompok
bawah dapat menjawab benar.
8-2
DB = —— = 0,6
0,5× 20
Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00. Kesepakatan
umum menyatakan bahwa DB terkecil yang dapat diterima adalah 0.25. Semakin tinggi
indeks daya pembeda soal berarti semakin mampu soal yang bersangkutan membedakan
peserta didik yang telah memahami materi dengan peserta didik yang belum menguasai
materi. Semakin tinggi daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika
daya pembeda negatif ( < 0 ) berarti lebih banyak kelompok bawah (peserta didik yang
tidak menguasai materi) menjawab benar soal dibanding dengan kelompok atas (peserta
didik yang menguasai materi yang diajarkan guru). Jika nilai DB kurang dari 0.25,
memberi indikasi bahwa soal tidak mampu untuk membedakan antara pencapaian
kelompok atas dan kelompok bawah. Dengan kata lain, jawaban yang benar tidak jelas
terbedakan dari jawaban-jawaban yang salah (pengecoh/ distructor).
Manfaat DB butir soal adalah untuk:
1. meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks daya
pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi, atau
ditolak.
2. mengetahui seberapa jauh setiap butir soal dapat mendeteksi/ membedakan kemampuan
peserta didik, yaitu peserta didik yang telah memahami atau belum memahami materi
yang diajarkan guru. Apabila suatu butir soal tidak dapat membedakan kedua
kemampuan peserta didik itu, maka butir soal itu dapat dicurigai "kemungkinannya"
seperti berikut ini.
Kunci jawaban butir soal itu tidak tepat.
33
Kompetensi yang diukur tidak jelas
Materi yang ditanyakan terlalu sulit, sehingga banyak peserta didik yang menebak
Sebagian besar peserta didik yang memahami materi yang ditanyakan berpikir ada
yang salah informasi dalam butir soalnya
Jika soal pilihan ganda, bisa jadi butir soal itu memiliki 2 atau lebih kunci jawaban
yang benar dan pengecoh tidak berfungsi
∑A + ∑B — (2Nskormin)
P = —————————
2N(skormaks — skormin)
∑A — ∑B
DB = —————————
N(skormaks — skormin)
Di mana:
∑A = jumlah skor KA
34
∑B = jumlah skor KB
N = 25% peserta
skormaks = skor maksimum setiap butir tes
skormin = skor minimal setiap butir tes
Validitas Instrumen
Validitas yaitu ketepatan mengukur yang dimiliki oleh sebutir item untuk mengukur
apa yang seharusnya (Sudijono, A. 2001). Sebutir item dapat dikatakan telah memiliki
validitas yang tinggi atau valid, jika skor pada butir item yang bersangkutan memiliki
kesesuaian atau kesejajaran arah dengan skor totalnya, atau dengan bahasa statistik, Ada
korelasi positif yang signifikan antara skor item dengan skor totalnya. Skor total disini
berkedudukan sebagai variabel terikat (dependent variable), sedangkan skor item
berkedudukan sebagai variabel bebasnya (independent variable).
Validitas tes pada dasarnya sama saja dengan validitas soal. Hasil estimasi validitas
pengukuran pada umumnya dinyatakan secara empirik oleh suatu koefisien yang disebut
koefisien validitas. Koefisien validitas dinyatakan oleh korelasi antara distribusi skor tes
yang bersangkutan dengan distribusi skor suatu kriteria. Kriteria ini dapat berupa skor tes
lain yang mempunyai fungsi ukur sama dan dapat pula berupa ukuran-ukuran lain yang
relevan.
Tipe validitas terbagi atas validitas isi (content), validitas konstrak (construct), dan
validitas berdasar kriteria (criterion-related). Validitas berdasar kriteria terbagi lagi atas
tipe validitas konkuren (concurrent) dan validitas prediktif (predictive).
1. Validitas isi
Validitas isi menunjukkan sejauhmana item-item dalam tes mencakup keseluruhan
kawasan isi yang hendak diukur oleh tes itu. Pengujian validitas isi tidak melalui
analisis statistika, tetapi menggunakan analisis rasional. Contoh:
apakah item-item dalam tes telah ditulis sesuai dengan blue-printnya
memeriksa apakah masing-masing item telah sesuai dengan indikator perilaku yang
hendak diungkapnya. Pengujian validitas isi ini sangat penting dalam proses
penyusunan tes prestasi belajar dan harus dilakukan dengan seksama pada waktu
pelaksanaan review item oleh suatu panel ahli.
2. Validitas konstrak
35
Validitas konstrak adalah validitas yang menunjukkan sejauhmana suatu tes mengukur
trait atau konstrak teoritik yang hendak diukurnya. Untuk pengujian validitas konstrak,
diperlukan analisis statistika yang kompleks seperti prosedur analisis faktor. Namun
ada prosedur pengujian validitas konstrak yang lebih sederhana yaitu dengan melalui
pendekatan multi-trait multi-method. Pendekatan ini akan menguji serentak dua atau
lebih trait yang diukur melalui dua atau lebih metode. Dari prosedur ini akan diperoleh
adanya bukti validitas diskriminan dan validitas konvergen. Validitas diskriminan
diperlihatkan oleh rendahnya korelasi antara skor skala atau tes yang mengukur trait
yang berbeda terutama bila digunakan metode yang sama, sedangkan validitas
konvergen ditunjukkan oleh tingginya korelasi skor tes yang mengukur trait yang sama
dengan menggunakan metode yang berbeda.
3. Validitas berdasar kriteria
Dalam pengujian validitas berdasar kriteria, bukti validitas tes diperlihatkan oleh
adanya hubungan skor pada tes yang bersangkutan dengan skor suatu kriteria. Untuk
melihat hubungan yang dimaksud dilakukan analisis korelasional.
Pada dasarnya, estimasi validitas dilakukan dengan menggunakan teknik analisis
korelasional. Namun, tidak semua pendekatan validitas memerlukan analisis statistik.
Tipe validitas yang berbeda menghendaki cara analisis yang beda pula. Bila skor tes
diberi simbol X dan skor kriteria mempunyai simbol Y, maka koefisien korelasi antara
tes dan kriteria itu merupakan koefisien validitas, yaitu rxy. Koefisien validitas hanya
punya makna apabila mempunyai harga yang positif. Walaupun semakin tinggi
mendekati angka 1,00 berarti suatu tes semakin valid hasil ukurnya, namun pada
kenyataannya suatu koefisien validitas tidak pernah mencapai angka 1,00. Pada
akhirnya sebagai ancar-ancar jika jumlah siswa 30 orang atau lebih, penafsiran validitas
yang mendasarkan koefisien korelasi tersebut adalah sebagai berikut:
37
Bagaimana reliabilitas dihitung? Setidaknya ada 4 cara untuk menghitung
reliabilitas tes yaitu:
1. Reliabilitas diperoleh dengan cara tes dan tes ulang (retest). Sebuah tes diujikan lagi
pada peserta tes sama, kemudian skor dari satu tes dikorelasikan dengan skor dari tes
lainnya. Kegunaan reliabilitas tes dan tes ulang adalah untuk menunjukkan seberapa
jauh kompetensi yang diuji tes berubah dengan bertambahnya waktu.
2. Reliabilitas diperoleh dengan cara menguji peserta tes dengan dua tes paralel dan skor
dari kedua tes dikorelasikan satu dengan lainnya. Kegunaan reliabilitas tes paralel ini
adalah untuk menguji kesetaraan dua perangkat tes.
3. Reliabilitas diperoleh dengan cara split-half (belah dua). Skor dari nomor soal ganjil
suatu tes dikorelasikan dengan skor nomor soal genap dari tes yang sama. Kegunaan
reliabilitas konsistensi internal tes ini adalah untuk menguji seberapa jauh sebuah tes
secara homogen menguji kompetensi tertentu.
4. Selain dengan berbagai rumus statistik lainnya, reliabilitas konsistensi internal tes juga
dapat diperoleh dengan rumus yang dinamakan dengan KR-20 (Kuder-Richardson 20).
Untuk menghitung KR-20 diperlukan pengetahuan statistik yang lebih lanjut sehingga
tidak dibahas dalam unit ini.
38
3 < 0,60 — 0,40 Cukup reliabel
4 < 0,40 — 0,20 Agak reliabel
5 < 0,20 Kurang reliabel
Latihan
Jawablah pertanyaan berikut ini, kemudian diskusikanlah dengan sesama teman sekelas!
1. Apa saja sikap dan perilaku guru yang perlu ditampilkan dalam melaksanakan
asesmen?
2. Dilihat dari tujuannya, ada banyak jenis tes. Sebut dan jelaskan masing-masing jenis tes
tersebut dan disertai contoh!
3. Sebut dan jelaskan teknik apa saja yang dapat digunakan dalam asesmen pembelajaran,
berikan contoh sesuai dengan pengalaman Anda!
4. Bagaimana caranya melakukan penskoran pada soal tes? Jelaskan jawaban saudara!
5. Mengapa harus melakukan analisis butir soal? Bagaimana cara melakukannya?
Daftar Pustaka
39
Balitbang Depdiknas. 2006. Panduan Penilaian Berbasis Kelas. Jakarta: Depdiknas.
Dietel, R.J., Herman, J.L. and Knuth, R.A. 1991. What Does Research Say About
Assessment?http://www/ncrel.org/sdrs/areas/stw.esys/4assess.htm (11/16/02).
Griffin, P & Nix, P. 1991. Educational assessment and reporting: A new approach.
Sydney: Harcourt Brace Jovanovich.
Hopkins, C., D., & Antes, R., L., 1990. Classroom Measurement and Evaluation. Illinois:
F.E. Peacock Publishers. Inc.
Mardapi, D. 2004. Penyusunan Tes Hasil Belajar. Yogyakarta: Program Pasca Sarjana
Universitas Negeri Yogyakarta.
Mardapi, D. 2008. Teknik Penyusunan Instrumen Tes dan Non Tes. Yogyakarta: Mitra
Cendikia Press.
Popham, W.J., 1994. Classroom Assessment (What Teachers Need to Know). Needham
Heights. Mass.
Pusat Kurikulum Badan Penelitan dan Pengembangan Departemen Pendidikan Nasional.
2006. Model Penilaian Kelas KTSP SD/MI. Jakarta: Depdiknas.
Slameto, 1988. Evaluasi Pendidikan. Jakarta: Bina Aksara
Stufflebeam, D. L., & Shinkfield, A. J. 1984. Sistematic Evaluation. Boston: Kluwer-
Nijhoff Publishing.
Suryanto, Adi. dan Tedjo Djatmiko. 2009. Evaluasi Pembelajaran di SD. Jakarta:
Universitas Terbuka.
40