Anda di halaman 1dari 40

KEMENTERIAN RISET, TEKNOLOGI DAN PENDIDIKAN TINGGI

UNIVERSITAS NEGERI SEMARANG (UNNES)

Kantor: Komplek Simpang 5 Unnes Kampus Sekaran, Gunungpati, Semarang 50229

Rektor: (024)8508081 Fax (024)8508082, Purek I: (024) 8508001

Website: www.unnes.ac.id - E-mail: unnes@unnes.ac.id

FORMULIR

FORMAT BAHAN AJAR


No. Dokumen No. Revisi Hal Tanggal Terbit

FM-02-AKD-07 01 1 dari 1 29 Februari 2016

BAHAN AJAR

MATA KULIAH : ASESMEN PEMBELAJARAN

SEMESTER : GASAL

OLEH

DRS. PURNOMO, M.Pd

PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR

FAKULTAS ILMU PENDIDIKAN

UNIVERSITAS NEGERI SEMARANG

TAHUN 2017

1
ASESMEN DALAM PEMBELAJARAN

Pendahuluan

P eserta PLPG yang baik. Asesmen pembelajaran merupakan bagian integral dari
keseluruhan proses belajar-mengajar, sehingga kegiatan asesmen harus dilakukan

P pengajar sepanjang rentang waktu berlangsungnya proses pembelajaran. Itulah


sebabnya, kemampuan untuk melakukan asesmen merupakan kemampuan yang
dipersyaratkan bagi setiap pengajar. Hal ini terbukti bahwa dalam semua referensi yang
berkaitan dengan tugas pembelajaran, selalu ditekankan pentingnya kemampuan
melakukan asesmen bagi guru dan kemampuan ini selalu menjadi salah satu indikator
kualitas kompetensi guru. Untuk itu, pemahaman tentang asesmen yang dilakukan dalam
pembelajaran peserta didik SD/MI sangat diperlukan.
Saudara, kompetensi dasar yang hendak dicapai dalam makalah ini adalah:
Pertama, menjelaskan perbedaan pengukuran, asesmen dan penilaian (evaluasi)
Kedua, menjelaskan tujuan, fungsi dan prinsip asesmen
Ketiga, menjelaskan teknik tes dan teknik non tes
Keempat, menjelaskan penskoran tes
Kelima, menganalisis butir soal

Adapun indikator untuk mencapai kompetensi dasar tersebut adalah:

1. Membedakan pengertian pengukuran, asesmen dan penilaian (evaluasi).


2. Menjelaskan tujuan asesmen proses dan hasil pembelajaran.
3. Menjelaskan 5 jenis asesmen sesuai fungsinya dan sistem asesmen.
4. Menjelaskan 3 syarat terpenting dalam asesmen.
5. Menjelaskan prinsip-prinsip asesmen dalam pembelajaran.
6. Memberikan contoh teknik penilaian unjuk kerja

2
7. Membuat instrumen penilaian sikap
8. Memberi scoring tes
9. Menganalisis butir soal objektif

I. Pengukuran, Asesmen Pembelajaran dan Penilaian (Evaluasi)


audara, dalam kegiatan evaluasi pembelajaran, ada tiga istilah yang tidak dapat
S dipisahkan satu sama lainnya, yakni:

pengukuran, asesmen dan evaluasi.

Pengukuran. Pernahkah Anda melakukan pengukuran? Saya percaya Anda telah


melakukan itu, seperti Anda ingin mengetahui berat badan Anda, Anda akan menimbang
badan Anda pada timbangan yang tersedia. Coba carilah contoh lainnya dan sebutkan nama
alat yang digunakan untuk mengukurnya. Kegiatan tersebut dinamakan dengan
pengukuran. Dapatkah Saudara mendefinisikan arti pengukuran?

Secara sederhana, pengukuran diartikan sebagai kegiatan atau upaya yang dilakukan
untuk memberikan angka-angka pada suatu gejala atau peristiwa, atau benda.

Pernahkah Saudara sebagai guru melakukan pengukuran dalam proses


pembelajaran terhadap peserta didik Saudara? Jawabannya, pasti sering? Sebagai guru,
Anda memberikan ulangan atau tes kepada peserta didik, misalnya ulangan IPS. Hasil
ulangan Anda koreksi dan Anda memberikan angka pada setiap peserta didik. Contoh Andi
memperoleh 70, Anton 90, Budi 60 dan Candra 100. Angka 70, 90, 60 dan 100 adalah
angka yang mencerminkan capaian hasil belajar yang diperoleh dari pengukuran dan biasa
disebut dengan skor mentah. Angka tersebut bersifat kuantitatif dan belum dapat
memberikan makna apa-apa, karena belum menyatakan tingkat kualitas dari apa yang
diukur. Jadi:
Pengukuran adalah penetapan angka dengan cara yang sistematik untuk menyatakan
keadaan individu (Allen dan Yen, 1979).

Untuk menetapkan angka dalam pengukuran, perlu sebuah alat ukur yang disebut
dengan instrumen. Ada instrumen yang standar, seperti thermometer, timbangan dan

3
meteran, sedangkan instrumen yang tidak standar seperti jengkal, depa, sebentar lagi dan
dekat saja. Dalam dunia pendidikan instrumen yang sering digunakan seperti tes, lembar
observasi, panduan wawancara, skala sikap dan angket.
Tes. Tes adalah salah satu contoh instrumen atau alat pengukuran yang paling
banyak dipergunakan untuk mengetahui kemampuan intelektual seseorang. Saudara tentu
sering melakukan tes baik sebagai peserta tes seperti ketika Saudara akan masuk Perguruan
Tinggi, terlebih dahulu Saudara mengikuti tes masuk, Saudara juga mengikuti Ujian Akhir
Semester (UAS) pada LPTK Saudara, Saudara mengikuti tes tengah semester (TTS), dan
sebagai guru Saudara telah mengadakan tes bagi peserta didik saudara. Secara rinci
kegiatan tes dijelaskan dalam gambar 1.1 dan 1.2.

Gambar 1.1. Peserta didik sedang tes Gambar 1.2. Penilaian peserta melalui non tes

Berdasarkan pengalaman yang telah Saudara peroleh, coba buatlah definisi tes!

Tes adalah seperangkat pertanyaan atau tugas yang direncanakan untuk memperoleh
informasi tentang trait atau sifat atau atribut pendidikan yang setiap butir pertanyaan
tersebut mempunyai jawaban atau ketentuan yang dianggap benar (Suryanto Adi, dkk.,
2009).

Contoh : Salah satu butir tes IPS


Pilihlah satu jawaban yang paling tepat dengan memberi tanda silang (X) pada
huruf A, B, C atau D pada lembar jawab yang telah tersedia.
1. Perhatikan peta Pulau Jawa di bawah ini!

4
Provinsi yang ditunjukkan oleh angka I pada peta Pulau Jawa di atas adalah ….
A. Provinsi Banten
B. Provinsi DKI Jakarta
C. Provinsi Jawa Barat
D. Provinsi Jawa Tengah

Asesmen. Menurut TGAT yang dikutip dalam Mardapi, D. (2008), asesmen


mencakup semua cara yang digunakan untuk menilai unjuk kerja individu atau kelompok.
Cara itu seperti menggunakan tes tertulis, tes lisan, kuis, ulangan harian, tugas kelompok,
laporan, lembar pengamatan, pedoman wawancara, tugas rumah, dan sebagainya. Dengan
demikian, proses asesmen meliputi pengumpulan bukti-bukti tentang pencapaian belajar
peserta didik. Bukti-bukti tersebut antara lain diperoleh dari hasil pengukuran dengan
menggunakan tes, kuis, tugas kelompok, angket dan pengamatan. Dalam PP. No.19 Tahun
2005, tentang Standar Nasional Pendidikan, Pasal 1 angka 17 dikatakan bahwa asesmen
juga disebut dengan penilaian.

Asesmen adalah proses pengambilan dan pengolahan informasi untuk mengukur


pencapaian hasil belajar peserta didik.

Dengan demikian, asesmen tersebut dapat dilakukan secara terpadu dengan


kegiatan pembelajaran, baik dalam suasana formal maupun informal, melalui tes tertulis,
melalui kumpulan kerja peserta didik melalui produk, melalui unjuk kerja, dan melalui
penugasan. Sependapat dengan dua definisi asesmen di atas, Griffin & Nix (1991) juga
menyatakan bahwa:
Asesmen adalah suatu pernyataan berdasarkan sejumlah fakta untuk menjelaskan
karakteristik seseorang atau sesuatu.

Ini berarti asesmen berhubungan dengan setiap bagian dari proses pendidikan,
bukan hanya keberhasilan belajar peserta didik saja, tetapi mencakup semua proses

5
mengajar dan belajar. Oleh karena itu, kegiatan asesmen tidak terbatas pada karakteristik
peserta didik saja, tetapi juga mencakup karakteristik metode mengajar, kurikulum, fasilitas
dan administrasi sekolah.
Evaluasi. Evaluasi berasal dari kata evaluation (bahasa Inggris). Stufflebeam
(Fernandes 1984) mengatakan bahwa evaluasi merupakan proses penggambaran,
pencarian, dan pemberian informasi yang sangat bermanfaat bagi pengambil keputusan
dalam menentukan alternatif keputusan (judgement alternative). Sedangkan Tyler seperti
dikutip oleh Mardapi, D. (2004) menyatakan bahwa evaluasi merupakan proses penentuan
sejauh mana tujuan pendidikan telah tercapai. Artinya,
Evaluasi itu merupakan proses untuk memberi makna atau menetapkan kualitas hasil
pengukuran, dengan cara membandingkan angka hasil pengukuran tersebut dengan
kriteria tertentu.
Kriteria sebagai pembanding dari proses dan hasil pembelajaran tersebut dapat
ditentukan sebelum proses pengukuran atau ditetapkan setelah pelaksanaan pengukuran.
Kriteria ini dapat berupa proses atau kemampuan minimal yang dipersyaratkan seperti
KKM, atau batas keberhasilan, dapat pula berupa kemampuan rata-rata unjuk kerja
kelompok, atau berbagai patokan yang lain. Kriteria yang berupa batas kriteria minimal
yang telah ditetapkan sebelum pengukuran dan bersifat mutlak disebut dengan Penilaian
Acuan Patokan atau Penilaian Acuan Kriteria (PAP/PAK), sedang kriteria yang ditentukan
setelah kegiatan pengukuran dilakukan dan didasarkan pada keadaan kelompok dan bersifat
relatif disebut dengan Penilaian Acuan Norma/ Penilaian Acuan Relatif (PAN/PAR).
Tes, pengukuran, asesmen, dan evaluasi bersifat hierarkhis, maksudnya kegiatan
tersebut dilakukan secara berurutan, yaitu dimulai dari melaksanakan instrumen
pengukuran (yang sering digunakan adalah tes), mengadakan pengukuran, kemudian
melakukan asesmen (penilaian), dan terakhir evaluasi. Untuk memperjelas keterkaitan
empat hal tersebut di atas, maka dapat dijelaskan sebagai berikut:
Bapak Leo guru SD kelas V, ingin mengetahui kompetensi dasar mata pelajaran IPS
semester 1 yaitu mengenal keragaman kenampakan alam dan buatan serta pembagian
wilayah waktu di Indonesia dengan menggunakan peta/atlas/globe dan media lainnya, yang
telah dicapai peserta didiknya. Bapak Leo menyelenggarakan tes berbentuk obyektif
pilihan ganda dengan 50 butir soal. Selanjutnya Bapak Leo memeriksa lembar jawaban

6
peserta didik sesuai dengan kunci jawaban, kemudian dengan menggunakan rumus
tertentu, dihitung skor mentahnya dan diperoleh hasil 48, 54, 56, 56, 70, 72, 80, 84, 98, 90,
dan seterusnya (sampai di sini sudah terjadi pengukuran). Angka-angka atau skor ini belum
mempunyai makna atau nilai dan arti apa-apa. Oleh karena itu, Pak Leo selanjutnya
melakukan pengolahan dengan menggunakan pendekatan PAP dengan batas penguasaan
70. Hasil pengolahan menunjukkan bahwa skor di bawah 70 berarti tidak menguasai dan
skor 70 ke atas berarti menguasai. Disinilah proses asesmen terjadi. Ini contoh untuk
lingkup asesmen hasil belajar. Namun apabila pak Leo menginginkan untuk mengases
seluruh komponen pembelajaran, maka berarti terjadi evaluasi. Secara rinci dijelaskan
melalui bagan di halaman berikutnya.

II. Tujuan, Fungsi dan Prinsip Asesmen Pembelajaran

Tujuan Asesmen. Tujuan utama penggunaan asesmen dalam pembelajaran


(classroom assessment) di sekolah adalah membantu guru dan peserta didik untuk
mengambil keputusan profesional dalam memperbaiki pembelajaran. Apakah Saudara
sebagai guru merasakan, bahwa asesmen pembelajaran yang ada di kelas Saudara dapat
Saudara pergunakan untuk melakukan perbaikan pembelajaran? Coba diskusikan hasilnya
dengan teman-teman!

Popham (1995:4-13) menyatakan bahwa asesmen bertujuan antara lain untuk:


1. mendiagnosa kelebihan dan kelemahan siswa dalam belajar,
2. memonitor kemajuan siswa,
3. menentukan jenjang kemampuan siswa,
4. menentukan efektivitas pembelajaran,
5. mempengaruhi persepsi publik tentang efektivitas pembelajaran.

Evaluasi

Asesmen

7
Kuantitatif Kualitatif

Pengukuran Non Pengukuran

Tes Non Tes

Bentuk Bentuk Pengamatan Wawancara


Uraian Obyektif

Gambar 1.4. Hubungan antara tes, pengukuran, asesmen dan evaluasi


Secara rinci tujuan melaksanakan asesmen pembelajaran tersebut dapat dijelaskan
seperti berikut ini.
1. Dengan melaksanakan asesmen pembelajaran, guru dapat mendiagnosis kemudahan
dan kesulitan belajar peserta didik, sekaligus memantau kemajuan belajarnya, sehingga
secara tepat dapat menentukan peserta didik mana yang perlu pengayaan dan peserta
didik mana yang perlu pengajaran remedial. Hal ini dilakukan untuk mencapai
kompetensi yang dipersyaratkan. Di samping itu, guru dapat mengetahui seberapa besar
tingkat kemampuan peserta didik dalam mencapai kompetensi yang dipersyaratkan.
2. Dengan melaksanakan asesmen pembelajaran, guru mengetahui kekuatan dan
kelemahan peserta didik dalam proses pencapaian kompetensi, sehingga guru dapat
secara langsung memberikan umpan balik kepada peserta didik.
3. Guru dapat memberikan umpan balik untuk memperbaiki metode, pendekatan,
kegiatan, dan sumber belajar yang digunakan, sesuai dengan kebutuhan materi dan
kebutuhan peserta didik dengan mendasarkan pada hasil pemantauan kemajuan proses
dan hasil pembelajaran. Di samping itu, guru juga dapat memilih alternatif jenis dan
model penilaian yang tepat untuk pembelajaran.
4. Hasil dari asesmen pembelajaran dapat memberikan informasi kepada orang tua dan
komite sekolah tentang efektivitas pendidikan. Contoh hasil ulangan peserta didik
dimintakan tanda tangan dan komentar orang tua.
5. Informasi semua aspek kemajuan peserta didik dapat dipergunakan oleh guru untuk
membantu pertumbuhan peserta didik menjadi anggota masyarakat dan pribadi yang

8
utuh; dan memberikan bimbingan yang tepat kepada peserta didik untuk memilih
sekolah atau jabatan yang sesuai dengan keterampilan, minat, dan kemampuannya.

Fungsi Asesmen. Dalam buku Panduan Penilaian Berbasis Kelas (Depdiknas,


2006) menjelaskan fungsi asesmen pembelajaran sebagai berikut :
1. untuk menggambarkan sejauhmana seorang peserta didik telah menguasai suatu
kompetensi,
2. sebagai landasan pelaksanaan evaluasi hasil belajar peserta didik untuk membantu
memilih program, pengembangan kepribadian maupun untuk penjurusan,
3. untuk menemukan kesulitan belajar dan sebagai alat diagnosis yang membantu
pendidik menentukan apakah seorang peserta didik perlu remedial atau pengayaan,
4. sebagai upaya pendidik untuk dapat menemukan kelemahan dan kekurangan proses
pembelajaran yang telah dilakukan ataupun yang sedang berlangsung,
5. Kesemuanya dapat dipakai sebagai kontrol bagi guru sebagai pendidik dan semua stake
holder pendidikan dalam lingkup sekolah tentang gambaran kemajuan perkembangan
proses dan hasil belajar peserta didik.
Jadi asesmen pembelajaran berfungsi untuk memberikan masukan atau informasi
secara komprehensif tentang hasil belajar siswa mulai dari proses pembelajaran hingga
hasil akhir pembelajaran, dengan menggunakan berbagai cara asesmen sesuai dengan
kompetensi yang diharapkan dicapai peserta didik.
Ditinjau dari fungsinya, asesmen dibedakan menjadi dua jenis yaitu: (a) asesmen
formatif, dan (b) asesmen sumatif. Asesmen formatif berfungsi untuk memperbaiki hasil
atau program kegiatan. Asesmen sumatif berfungsi untuk menentukan tingkat keberhasilan
pada akhir program. Sedangkan Hasan & Zainul (1993) menambahkan dua jenis asesmen
yakni: (c) asesmen penempatan, dan (d) asesmen diagnostik. Asesmen penempatan
berfungsi untuk mengelompokkan seseorang berdasarkan kriteria tertentu dan
menempatkan pada kategori program yang sesuai dengan kriteria. Asesmen diagnostik
berfungsi untuk mendeteksi kelemahan-kelemahan yang biasanya bersifat psikologis atau
mengidentifikasi kesulitan belajar peserta didik yang terkait dengan pembuatan program
remediasi (Hopkins & Antes, 1990).

9
Secara garis besar, asesmen dibedakan menjadi 5 jenis yaitu:
1. Asesmen formatif, yakni penilaian yang dilaksanakan pada setiap akhir pokok
bahasan, tujuannya untuk mengetahui tingkat penguasaan peserta didik terhadap pokok
bahasan tertentu. Informasi dari asesmen formatif dapat dipakai sebagai umpan balik
bagi pengajar mengenai proses pembelajaran. Jadi asesmen formatif berfungsi untuk
memperbaiki program pembelajaran, bukan untuk memberi kontribusi langsung pada
asesmen sumatif.
2. Asesmen sumatif, yaitu penilaian yang dilakukan pada akhir satuan program tertentu,
(catur wulan, semester atau tahun ajaran), tujuannya untuk melihat prestasi yang
dicapai peserta didik selama satu program yang secara lebih khusus hasilnya akan
merupakan nilai yang tertulis dalam raport dan penentuan kenaikan kelas.
3. Asesmen diagnostik, yaitu penilaian yang dilakukan untuk melihat kelemahan peserta
didik dan faktor-faktor yang diduga menjadi penyebabnya. Penilaian ini dilakukan
untuk keperluan memberi bimbingan belajar dan pengajaran remedial.
4. Asesmen penempatan (placement), yaitu penilaian yang ditujukan untuk
menempatkan peserta didik sesuai dengan bakat, minat, dan kemampuannya, misalnya
dalam pemilihan jurusan atau menempatkan peserta didik pada kerja kelompok dan
pemilihan kegiatan tambahan.
5. Asesmen seleksi, yakni penilaian yang ditujukan untuk menyaring atau memilih orang
yang paling tepat pada kedudukan atau posisi tertentu. Asesmen ini dilakukan kapan
saja diperlukan. Aspek yang dinilai dapat beraneka ragam disesuaikan dengan tujuan
seleksi, sebab tujuannya adalah memilih calon untuk posisi tertentu, karena itu analisis
dari asesmen ini biasanya menggunakan kriteria yang bersifat relatif atau berdasar
norma kelompok.
Syarat-syarat Asesmen. Dietel, Herman dan Knuth (1991) mensyaratkan asesmen
yang baik adalah valid (mengukur sesuai yang akan diukur) dan konsisten/reliabel (dapat
dipercaya). Slameto (1986) menyebutkan ada 8 syarat dalam asesmen pembelajaran yakni;
1. Sahih (valid)
Validitas dalam asesmen mempunyai pengertian bahwa dalam melakukan penilaian
harus ”menilai apa yang seharusnya dinilai dengan menggunakan alat yang sesuai

10
untuk mengukur kompetensi”. Apabila yang diukur sikap, tetapi asesmen mengukur
pengetahuan, maka asesmen tersebut tidak valid. Kesahihan asesmen biasanya diukur
dalam prosentase atau dalam derajat tertentu dengan alat ukur tertentu.
2. Terandalkan (reliable)
Pengertian reliabilitas berkaitan dengan konsistensi (keajegan) hasil penilaian.
Penilaian yang ajeg (reliable) memungkinkan perbandingan yang reliable, menjamin
konsistensi, dan keterpercayaan. Contoh, dalam menguji kompetensi siswa dalam
melakukan eksperimen di laboratorium. Sepuluh peserta didik melakukan eksperimen
dan masing-masing menulis laporannya. Penilaian ini reliable jika guru dapat
membandingkan taraf penguasaan 10 peserta didik itu dengan kompetensi eksperimen
yang dituntut dalam kurikulum. Penilaian ini reliable jika 30 peserta didik yang sama
mengulangi eksperimen yang sama dalam kondisi yang sama dan hasilnya ternyata
sama. Jika alat asesmen yang sama dilakukan terhadap kelompok peserta didik yang
sama beberapa kali dalam waktu yang berbeda-beda atau situasi yang berbeda-beda,
memberikan hasil yang sama, maka asesmen dinyatakan terandalkan.
3. Objektif
Objektif dalam konteks penilaian adalah bahwa proses penilaian yang dilakukan harus
meminimalkan pengaruh-pengaruh atau pertimbangan subjektif dari guru. Dalam
implementasinya, penilaian harus dilaksanakan secara objektif. Dalam hal tersebut,
penilaian harus adil, terencana, berkesinambungan, menggunakan bahasa yang dapat
dipahami peserta didik, dan menerapkan kriteria yang jelas dalam pembuatan keputusan
atau pemberian angka (skor). Asesmen dikatakan objektif jika tidak mendapat pengaruh
subjektif dari pihak penilai.
4. Seimbang
Keseimbangan dalam hal ini meliputi keseimbangan bahan, keseimbangan kesukaran,
dan keseimbangan tujuan. Bahan harus seimbang di antara berbagai pokok bahasan.
Keseimbangan dalam kesukaran artinya antara yang mudah, sedang dan sukar harus
dalam proporsi tertentu. Keseimbangan tujuan dimaksud keseimbangan antara berbagai
macam matra tujuan. Keseimbangan dalam berbagai ranah kognitif baik pengetahuan,

11
pemahaman, aplikasi, analisis, evaluasi dan kreatif, harus disusun dalam proporsi yang
seimbang.
5. Membedakan
Suatu asesmen harus dapat membedakan (discriminable) prestasi individual di antara
sekelompok peserta didik. Asesmen harus dapat membedakan peserta didik yang sangat
berhasil, cukup berhasil, kurang berhasil, gagal dan sebagainya.
6. Norma
Asesmen yang baik, hasilnya harus mudah ditafsirkan. Hal ini menyangkut tentang
adanya ukuran atau norma tertentu untuk menafsirkan hasil asesmen dari setiap peserta
didik.
7. Fair
Asesmen yang fair mengemukakan persoalan-persoalan dengan wajar, tidak bersifat
jebakan, dan tidak mengandung kata-kata yang bersifat menjebak. Di samping itu
terdapat keadilan untuk setiap peserta didik yang diases.
8. Praktis
Baik ditinjau dari segi pembiayaan, maupun dari segi pelaksanaannya, asesmen harus
efisien dan mudah dilaksanakan.
Ke delapan syarat tersebut perlu dimiliki oleh suatu asesmen yang baik walaupun dalam
derajad yang berbeda-beda.
Prinsip Asesmen. Prinsip adalah sesuatu yang harus dijadikan pedoman. Prinsip
asesmen pembelajaran adalah patokan yang harus dipedomani ketika Anda sebagai guru
melakukan asesmen proses dan hasil belajar. Ada beberapa prinsip dasar asesmen
pembelajaran yang harus dipedomani adalah seperti berikut ini.
1. Komprehensif (menyeluruh)
Asesmen terhadap hasil belajar peserta didik harus dilaksanakan secara menyeluruh,
utuh, dan tuntas yang mencakup seluruh domain aspek kognitif, psikomotorik, dan
afektif atau nilai, dan keterampilan, serta materi secara representatif sehingga hasilnya
dapat diintegrasikan dengan baik.
2. Berorientasi pada kompetensi

12
Konsekuensi perubahan kurikulum akan menuntut perubahan dalam sistem asesmen
nya. Dalam pelaksanaan kurikulum tingkat satuan pendidikan (KTSP), asesmen harus
berorientasi pada pencapaian kompetensi (rangkaian kemampuan), bukan pada
penguasaan materi (pengetahuan).
3. Terbuka, adil dan objektif
Prosedur asesmen, kriteria asesmen dan pengambilan keputusan hendaknya diketahui
oleh pihak yang berkepentingan, sehingga terbuka bagi berbagai kalangan
(stakeholders) baik langsung maupun tidak langsung, sehingga keputusan tentang
keberhasilan peserta didik jelas bagi pihak-pihak yang berkepentingan, tanpa ada
rekayasa atau sembunyi-sembunyi yang dapat merugikan semua pihak.
4. Berkesinambungan
Asesmen harus dilakukan secara terus-menerus, berkesinambungan berencana,
bertahap, teratur dari waktu ke waktu, untuk mengetahui secara menyeluruh
perkembangan kemajuan belajar peserta didik, sehingga kegiatan dan unjuk kerja
peserta didik dapat dipantau melalui asesmen.
5. Bermakna
Asesmen diharapkan mempunyai makna yang signifikan bagi semua pihak. Untuk itu,
asesmen hendaknya mudah dipahami dan dapat ditindaklanjuti oleh pihak-pihak yang
berkepentingan. Hasil asesmen hendaknya mencerminkan gambaran yang utuh tentang
prestasi peserta didik yang mengandung informasi keunggulan dan kelemahan, minat
dan tingkat penguasaan peserta didik dalam pencapaian kompetensi yang telah
ditetapkan.
6. Terpadu, sistematis dan menggunakan acuan kriteria
Pelaksanaan asesmen merupakan komponen yang tidak terpisahkan dari kegiatan
pembelajaran dan dilakukan secara berencana dan bertahap dengan mengikuti langkah-
langkah yang baku, serta mendasarkan pada ukuran pencapaian kompetensi yang
ditetapkan.
7. Mendidik dan akuntabel
Asesmen dilakukan bukan untuk mendiskriminasi peserta didik (lulus atau tidak lulus)
atau menghukum peserta didik, tetapi untuk mendeferensiasi peserta didik (sejauh mana

13
seorang peserta didik membuat kemajuan atau posisi masing-masing peserta didik
dalam rentang cakupan pencapaian suatu kompetensi). Berbagai aktivitas asesmen
harus memberikan gambaran kemampuan peserta didik, bukan gambaran ketidak-
mampuannya. Jadi, asesmen yang mendidik artinya proses asesmen hasil belajar harus
mampu memberikan sumbangan positif pada peningkatan pencapaian hasil belajar
peserta didik, sehingga hasil asesmen dapat memberikan umpan balik dan motivasi
kepada peserta didik untuk lebih giat belajar.

Latihan
Setelah Anda mempelajari konsep dasar asesmen pembelajaran ini, coba jawablah
pertanyaan berikut ini dan diskusikanlah!
1. Apa yang dimaksud dengan asesmen, pengukuran, dan evaluasi? Bagaimanakah
keterkaitannya?
2. Sebut dan jelaskan tujuan penilaian dengan memberikan contoh sesuai pengalaman!
3. Apa fungsi asesmen dalam pembelajaran berdasarkan jenisnya? Jelaskan!
4. Sebut dan jelaskan syarat asesmen pembelajaran!
5. Sebut dan jelaskan prinsip-prinsip asesmen dalam pembelajaran!

III. Teknik Asesmen Pembelajaran


Penilaian suatu kompetensi dasar dilakukan berdasarkan indikator-indikator
pencapaian hasil belajar, baik berupa domain kognitif, afektif, maupun psikomotor.
(Balitbang Depdiknas, 2006). Secara umum teknik asesmen dapat dikelompokkan menjadi
dua, yakni teknik tes dan nontes.
a. Teknik tes
Tes adalah seperangkat pertanyaan atau tugas yang direncanakan untuk memperoleh
informasi tentang trait atau sifat atau atribut pendidikan yang setiap butir pertanyaan
tersebut mempunyai jawaban atau ketentuan yang dianggap benar (Suryanto Adi, dkk.,
2009).

14
Trait pendidikan meliputi keterampilan, pengetahuan, kecerdasan, kemampuan, atau
bakat sesesorang atau kelompok. Berdasarkan definisi tersebut, dapat dijelaskan bahwa tes
merupakan informasi yang berbentuk pertanyaan atau tugas/latihan, dipergunakan untuk
mengukur kemampuan yang ada pada seseorang atau sekelompok orang. Sebagai alat ukur
dalam bentuk pertanyaan, maka tes harus dapat memberikan informasi mengenai
pengetahuan dan kemampuan objek yang diukur. Sedangkan sebagai alat ukur berupa
tugas/latihan, maka tes harus dapat mengungkap keterampilan dan bakat seseorang atau
sekelompok orang.
Tes merupakan alat ukur yang standar dan objektif sehingga dapat digunakan secara
meluas untuk mengukur dan membandingkan keadaan psikis atau tingkah laku individu.
Dengan demikian berarti sudah dapat dipastikan akan mampu memberikan informasi yang
tepat dan objektif tentang objek yang hendak diukur baik berupa psikis maupun tingkah
lakunya, sekaligus dapat membandingkan antara seseorang dengan orang lain. Jadi dapat
disimpulkan bahwa tes adalah suatu cara atau alat untuk mengadakan penilaian yang
berbentuk suatu tugas atau serangkaian tugas yang harus dikerjakan oleh peserta didik atau
sekelompok peserta didik, sehingga menghasilkan nilai tentang tingkah laku atau prestasi
peserta didik tersebut. Prestasi atau tingkah laku tersebut dapat menunjukkan tingkat
pencapaian kompetensi/tujuan pembelajaran atau tingkat penguasaan terhadap seperangkat
materi yang telah diberikan dalam proses pembelajaran, dan dapat pula menunjukkan
kedudukan peserta didik yang bersangkutan dalam kelompoknya.
Dalam kaitan dengan rumusan tersebut, sebagai alat asesmen hasil belajar, tes
minimal mempunyai dua fungsi, yaitu untuk:
1) mengukur tingkat penguasaan terhadap seperangkat materi atau tingkat pencapaian
terhadap seperangkat tujuan tertentu.
2) menentukan kedudukan atau perangkat peserta didik dalam kelompok, tentang
penguasaan materi atau pencapaian tujuan pembelajaran tertentu.

Fungsi satu lebih dititik-beratkan untuk mengukur keberhasilan program


pembelajaran, sedang fungsi dua lebih dititikberatkan untuk mengukur keberhasilan belajar
masing-masing individu peserta tes.
Dilihat dari tujuannya dalam bidang pendidikan, tes dapat dibagi menjadi:

15
1. Tes Kecepatan (Speed Test)
Tes ini bertujuan untuk mengases peserta tes (testi) dalam hal kecepatan berpikir atau
keterampilan, baik yang bersifat spontanitas (logik) maupun hafalan dan pemahaman
dalam mata pelajaran yang telah dipelajarinya. Waktu yang disediakan untuk menjawab
seluruh materi tes ini relatif singkat dibandingkan dengan tes lainnya, misalnya tes
intelegensi dan tes keterampilan bongkar pasang suatu alat.
2. Tes Kemampuan (Power Test)
Tes ini bertujuan untuk mengases peserta tes dalam mengungkapkan kemampuannya
(dalam bidang tertentu) dengan tidak dibatasi secara ketat oleh waktu yang disediakan.
Kemampuan yang diases berupa kognitif atau psikomotorik. Soal-soal tes biasanya
relatif sukar karena menyangkut berbagai konsep dan pemecahan masalah serta
menuntut peserta tes untuk berfikir pada level yang tinggi yakni menerapkan (apply),
menganalisis (analyse), mengevaluasi (evaluate), dan membuat (create).
3. Tes Hasil Belajar (Achievement Test)
Tes ini dimaksudkan untuk mengases hal yang telah diperoleh dalam suatu kegiatan
seperti Tes Hasil Belajar (THB), tes harian (formatif) dan tes akhir semester (sumatif).
Tes ini bertujuan untuk mengases hasil belajar setelah mengikuti kegiatan pembelajaran
dalam suatu kurun waktu tertentu.
4. Tes Kemajuan Belajar (Gains/Achievement Test)
Tes kemajuan belajar disebut juga dengan tes perolehan. Tes ini dimaksudkan untuk
mengetahui kondisi awal testi sebelum pembelajaran dan kondisi akhir testi setelah
pembelajaran. Untuk mengetahui kondisi awal testi digunakan pre-tes dan kondisi akhir
testi digunakan post-tes.
5. Tes Diagnostik (Diagnostic Test)
Tes diagnostik adalah tes yang dilaksanakan untuk mendiagnosis atau mengidentifikasi
kesukaran-kesukaran dalam belajar, mendeteksi faktor-faktor yang menyebabkan
terjadinya kesukaran belajar, dan menetapkan cara mengatasi kesukaran atau kesulitan
belajar tersebut, seperti tes diagnostik matematika, tes diagnostik IPA.
6. Tes Formatif

16
Tes formatif adalah tes hasil belajar yang digunakan untuk mengetahui sejauh mana
kemajuan belajar yang telah dicapai oleh peserta didik dalam suatu program
pembelajaran tertentu seperti tes harian, ulangan harian.
7. Tes Sumatif
Istilah sumatif berasal dari kata “sum” yang berarti jumlah. Dengan demikian tes
sumatif berarti tes yang ditujukan untuk mengetahui penguasaan peserta didik terhadap
sekumpulan materi pelajaran (pokok bahasan) yang telah dipelajari, seperti UAN (Ujian
Akhir Nasional), THB, dan Ulangan Umum Bersama (UUB).
Dilihat dari jawaban peserta didik yang dituntut dalam menjawab atau memecahkan
persoalan yang dihadapinya, maka tes hasil belajar dapat dibagi menjadi 3 jenis yakni tes
lisan (oral test), tes tertulis (written test), dan tes tindakan atau perbuatan (performance
test). Penggunaan setiap jenis tes tersebut seyogyanya disesuaikan dengan kawasan
(domain) perilaku peserta didik yang hendak diukur. Misalnya tes tertulis atau tes lisan
dapat digunakan untuk mengukur kawasan kognitif, sedangkan kawasan psikomotorik
cocok dan tepat apabila diukur dengan tes tindakan, dan kawasan afektif biasanya diukur
dengan skala perilaku, seperti skala sikap.
2. Teknik Nontes
Jika tes adalah seperangkat pertanyaan yang memiliki jawaban benar atau salah,
teknik non-tes berisi pertanyaan atau pernyataan yang tidak memiliki jawaban benar atau
salah. Instrumen non-tes dapat berbentuk kuesioner atau inventori. Kuesioner berisi
sejumlah pertanyaan atau pernyataan, peserta didik diminta menjawab atau memberikan
pendapat terhadap pernyataan. Inventori merupakan instrumen yang berisi tentang laporan
diri yaitu keadaan peserta didik, misalnya potensi peserta didik. Hasil pengukuran melalui
instrumen non tes berupa angka disebut kuantitatif dan bukan berupa angka seperti
pernyataan sangat baik, baik, cukup, kurang, sangat kurang, dan sebagainya disebut
kualitatif.
Teknik nontes sangat penting dalam mengases peserta didik pada ranah afektif dan
psikomotor, berbeda dengan teknik tes yang lebih menekankan pada aspek kognitif. Ada
beberapa macam teknik nontes, beberapa di antaranya seperti unjuk kerja (performance),
penugasan (proyek), tugas individu, tugas kelompok, laporan, ujian praktik dan portofolio.

17
Unjuk kerja adalah suatu penilaian/pengukuran yang dilakukan melalui
pengamatan aktivitas peserta didik dalam melakukan sesuatu yang berupa tingkah laku atau
interaksinya seperti berbicara, berpidato, membaca puisi, dan berdiskusi; kemampuan
peserta didik dalam memecahkan masalah dalam kelompok; partisipasi peserta didik dalam
diskusi; ketrampilan menari; ketrampilan memainkan alat musik; kemampuan berolah raga;
ketrampilan menggunakan peralatan laboratorium; praktek sholat, bermain peran,
bernyanyi, dan ketrampilan mengoperasikan suatu alat.
Asesmen unjuk kerja/kinerja ini cocok digunakan untuk menilai ketercapaian
kompetensi yang menuntut peserta didik melakukan tugas tertentu seperti mengamati suatu
kejadian/benda /tanaman, praktek di laboratorium/olahraga, bermain peran, memainkan alat
musik, bernyanyi, membaca puisi, investigasi, demonstrasi, open-ended questions, jurnal,
dan portofolio dan lain-lain.
Penugasan adalah penilaian yang berbentuk pemberian tugas yang mengandung
penyelidikan (investigasi) yang harus selesai dalam waktu tertentu. Penyelidikan tersebut
dilaksanakan secara bertahap yakni perencanaan, pengumpulan data, pengolahan data, dan
penyajian data. Penilaian penugasan ini bermanfaat untuk menilai keterampilan
menyelidiki secara umum, pemahaman dan pengetahuan dalam bidang tertentu,
kemampuan mengaplikasi pengetahuan dalam suatu penyelidikan, dan kemampuan
menginformasikan subjek secara jelas.

Gambar 1.5. Presentasi kelompok Gambar 1.6. Unjuk kerja


Tugas individu adalah penilaian yang berbentuk pemberian tugas kepada peserta
didik yang dilakukan secara individu. Tugas ini dapat diberikan pada waktu-waktu tertentu

18
dalam bentuk seperti pembuatan kliping, pembuatan makalah dan yang sejenisnya. Tingkat
berpikir yang terlibat pada peserta didik sebaiknya menerapkan (apply), menganalisis
(analyse), mengevaluasi (evaluate), dan membuat (create).
Tugas kelompok sama dengan tugas individu, namun dikerjakan secara kelompok.
Tugas ini diberikan untuk menilai kompetensi kerja kelompok. Bentuk instrumen yang
digunakan salah satunya adalah tertulis dengan menjawab uraian secara bebas dengan
tingkat berpikir tinggi yaitu aplikasi sampai evaluasi.
Laporan adalah penilaian yang berbentuk laporan atas tugas atau pekerjaan yang
diberikan seperti laporan diskusi, laporan kerja praktik, laporan praktikum dan laporan
Pemantapan Praktik Lapangan (PPL).
Responsi atau ujian praktik adalah suatu penilaian yang dipakai untuk mata
pelajaran yang ada kegiatan praktikumnya seperti mata kuliah PPL. Ujian responsi dapat
dilakukan pada awal praktik atau setelah melakukan praktik. Ujian yang dilakukan sebelum
praktik bertujuan untuk mengetahui kesiapan peserta didik melakukan praktik di
laboratorium/ruang keterampilan/bengkel kerja/sekolah latihan, sedangkan ujian yang
dilakukan setelah praktik tujuannya untuk mengetahui kompetensi dasar praktik yang telah
dan belum dicapai peserta didik.
Portofolio merupakan penilaian berkelanjutan yang didasarkan pada kumpulan
informasi yang menunjukkan perkembangan kemampuan peserta didik dalam satu periode
tertentu. Informasi tersebut dapat berupa karya peserta didik dari proses pembelajaran yang
dianggap terbaik oleh peserta didik, pekerjaan-pekerjaan yang sedang dilakukan, beberapa
contoh tes yang telah selesai dilakukan, berbagai keterangan-keterangan yang diperoleh
peserta didik, keselarasan antara pembelajaran dan tujuan spesifik yang telah dirumuskan,
contoh-contoh hasil pekerjaannya sehari-hari, evaluasi diri terhadap perkembangan
pembelajaran dan hasil observasi guru.
Penilaian portofolio pada dasarnya menilai karya-karya siswa secara individu pada satu
periode untuk suatu mata pelajaran. Akhir suatu periode hasil karya tersebut dikumpulkan
dan dinilai oleh guru dan peserta didik. Berdasarkan informasi perkembangan tersebut,
guru dan peserta didik sendiri dapat menilai perkembangan kemampuan peserta didik dan
terus melakukan perbaikan. Dengan demikian, portofolio dapat memperlihatkan

19
perkembangan kemajuan belajar peserta didik melalui karyanya, antara lain: karangan,
puisi, surat, komposisi, musik. Lihat gambar 1.7.

Gambar 1.7. Dokumen kumpulan bukti-bukti hasil kerja peserta didik SD

Hal ini mengggambarkan bahwa hendaknya guru melakukan penilaian tersebut


tidak hanya tertumpu pada tes akhir peserta didik saja, namun mesti lebih komprehensif
dan holistik. Pendekatan penilaian portofolio merupakan sebuah strategi penilaian yang
baik dalam rangka menampilkan kesetaraan dan fairness dari penilaian dibandingkan
dengan penggunaan instrumen tes yang distandardisasi. Hal-hal yang perlu diperhatikan
dan dijadikan pedoman dalam penggunaan penilaian portofolio di sekolah, antara lain:
1. Karya peserta didik adalah benar-benar karya peserta didik itu sendiri
2. Saling percaya antara guru dan peserta didik
3. Kerahasiaan bersama antara guru dan peserta didik
4. Milik bersama (joint ownership) antara peserta didik dan guru
5. Kepuasan
6. Kesesuaian
7. Penilaian proses dan hasil
8. Penilaian dan pembelajaran
Kriteria untuk mengevaluasi portofolio seyogyanya juga didiskusikan dengan peserta didik,
sehingga baik guru maupun peserta didik dapat mengetahui kriteria ini. Bagi guru kriteria
dapat digunakan untuk memberi balikan, sedangkan bagi peserta didik dapat menggunakan
kriteria itu untuk melakukan tugasnya. Kriteria yang telah disepakati akan membantu untuk
memandu guru membuat keputusan yang menyeluruh tentang kerja peserta didik.

Contoh teknik penilaian untuk unjuk kerja

20
Penilaian Lompat Jauh Gaya Menggantung

Nama Siswa: ________ Kelas: _____

No. Aspek Yang Dinilai Nilai


1 2 3 4
1. Teknik awalan
2. Teknik tumpuan
3. Sikap/posisi tubuh saat di udara
4. Teknik mendarat
Jumlah
Skor Maksimum 16
Keterangan penilaian:
1 = tidak kompeten
2 = cukup kompeten
3 = kompeten
4 = sangat kompeten
Jika seorang peserta didik memperoleh skor 16 dapat ditetapkan ”sangat kompeten”. Dan
seterusnya sesuai dengan jumlah skor perolehan.

Contoh lain:

Instrumen penilaian kinerja peserta didik


dalam mengukur volume air dengan menggunakan gelas ukur
No. Aspek yang dinilai Skor
4 3 2 1
1 Gelas ukur diletakkan di atas tempat yang datar,
skala menghadap pengamat
2 Menuang air ke dalam gelas ukur sampai
hampir mencapai 100 ml, penuangan
dihentikan.
3 Volume air ditambah setetes demi setetes
menggunakan pipet sampai mencapai 100 ml.
4 Permukaan air didalam gelas dibaca dengan
posisi sejajar mata.
5 Hasil pengukuran dicatat dengan benar.

Berilah skor:
4 bila aspek tersebut dilakukan dengan benar dan cepat
3 bila aspek tersebut dilakukan dengan benar tapi lama
2 bila aspek tersebut dilakukan selesai tapi salah
1 bila dilakukan tapi tidak selesai

21
Penilaian Sikap. Sikap bermula dari perasaan (suka atau tidak suka) yang terkait
dengan kecenderungan seseorang dalam merespon sesuatu/objek. Sikap dapat dibentuk,
sehingga terjadinya perilaku atau tindakan yang diinginkan. Sikap terdiri dari tiga
komponen, yakni: afektif, kognitif, dan konatif. Komponen afektif adalah perasaan yang
dimiliki oleh seseorang atau penilaiannya terhadap sesuatu objek. Komponen kognitif
adalah kepercayaan atau keyakinan seseorang mengenai objek. Adapun komponen konatif
adalah kecenderungan untuk berperilaku atau berbuat dengan cara-cara tertentu berkenaan
dengan kehadiran objek sikap. Secara umum, objek sikap yang perlu dinilai dalam proses
pembelajaran berbagai mata pelajaran adalah sebagai berikut. Sikap terhadap materi
pelajaran, sikap terhadap guru/pengajar, sikap terhadap proses pembelajaran, sikap
berkaitan dengan nilai atau norma yang berhubungan dengan suatu materi pelajaran.
Penilaian sikap dapat dilakukan dengan beberapa cara antara lain: observasi perilaku,
pertanyaan langsung, dan laporan pribadi.
1. Observasi perilaku. Perilaku seseorang pada umumnya menunjukkan kecenderungan
seseorang dalam sesuatu hal. Misalnya orang yang senang makan bakso, dapat
dipahami sebagai kecenderungannya yang senang kepada bakso. Oleh karena itu, guru
dapat melakukan observasi terhadap peserta didik yang dibinanya. Hasil observasi
dapat dijadikan sebagai umpan balik dalam pembinaan. Observasi perilaku di sekolah
dapat dilakukan dengan menggunakan buku catatan khusus tentang kejadian-kejadian
berkaitan dengan peserta didik selama di sekolah. Penilaian sikap dapat dilakukan pula,
pada saat peserta didik praktek IPS.
2. Pertanyaan langsung
Penilaian sikap dapat dilakukan dengan menanyakan secara langsung kepada peserta
didik tentang sikap seseorang berkaitan dengan sesuatu hal. Misalnya, bagaimana
tanggapan peserta didik tentang Ujian Nasional yang akan dilaksanakan.
3. Laporan pribadi
Dalam penilaian ini, peserta didik diminta membuat ulasan yang berisi pandangan atau
tanggapannya tentang suatu masalah, keadaan, atau hal yang menjadi objek sikap.
Misalnya, peserta didik diminta menulis pandangannya tentang lingkungan sekolah

22
Pada akhirnya, guna mempermudah pemahaman Anda terhadap teknik asesmen
proses dan hasil belajar, pelajarilah sketsa berikut ini.
TEKNIK BENTUK KEPENTINGAN JENIS
Tes Tertulis Obyektif Lebih sesuai untuk Benar-Salah, Pilihan Ganda, Isian,
indikator kognitif Menjodohkan
Subyektif Pengerjaan soal, latihan (exercise),
Membaca Pemahaman, Esai Berstruktur,
Esai Bebas
Lisan Obyektif Lebih sesuai untuk Kuis (Quis)
Subyektif indicator kognitif Pemahaman: Tanya jawab singkat,
Pelafalan, Membaca Nyaring,
Mendengarkan, Intruksi Lesan,
Percakapan
Perbuatan Kinerja Lebih sesuai untuk Permainan, Bermain Peran, Drama,
indikator psikomotor Demonstrasi, Olah Raga, Senam,
Bermain Musik, Bernyanyi, Pantomim,
Dinamika Kelompok, Berdoa,
Memelihara Tanaman, Memelihara
Hewan, Membaca Puisi, Berpidato,
Diskusi, Wawancara, Debat, Bercerita,
Menari, dan sebagainya.
Produk Lebih sesuai untuk Patung, Kerajinan Tangan, Model,
indicator psikomotor Pesawat Sederhana, Alat, Ternak,
Tanaman, Simpul tali-temali, Janur,
Hiasan Buah-Buahan, dan sebagainya.
Non Tes Penilaian Hasil Lebih sesuai untuk Pengamatan, Daftar Chek/Periksa, Skala
indicator afektif Sikap, Catatan Diri, Buku Harian,
Penilaian Diri, Angket, Ungkapan,
Perasaan, Catatan Anekdot, Sosiogram
Portofolio (Penilaian Dipakai untuk Puisi, Karangan Gambar/tulisan,
Proses dan Hasil) mengamati Peta/Denah, Desain Makalah, Laporan
perkembangan observasi, Laporan penyelidikan,
kemampuan kognitif Laporan penelitian, Laporan eksperimen,
dan psikomotor Sinopsis, Naskah Pidato, Naskah Drama,
Doa, Rumus, Kartu Ucapan, Surat,
Komposisi Musik, Teks Lagu, Resep
Makanan

IV. Teknik Pemberian Skor


Teknik pemberian skor meliputi pemberian skor tes pada:
A. Domain kognitif yang terdiri dari:
1. Pensekoran soal berbentuk pilihan ganda, dengan cara:
a. Pensekoran tanpa koreksi, yaitu pemberian skor 1 (tergantung dari bobot butir
soal), pada setiap butir soal yang dijawab benar. Misal Andi mengerjakan tes

23
matematika yang terdiri 50 butir soal. Andi mengerjakan betul sebanyak 30
butir soal, dan skor tertinggi 80, maka skor yang diperoleh Andi adalah rumus:

B
Skor = -------X 100 (skala 0-100)
N

Keterangan : B = banyaknya butir soal yang dijawab benar


N= adalah banyaknya butir soal
30
Skor = ----- X 80 = 48.
50
b. Pensekoran dengan koreksi jawaban yaitu pemberian skor dengan memberikan
pertimbangan pada butir soal yang dijawab salah dan tidak dijawab. Rumusnya:
S
Skor = [B - ------]/ N ] X 100
P-1

Keterangan : B= banyaknya butir yang dijawab benar


S = banyaknya butir yang dijawab salah
P= banyaknya pilihan jawaban tiap butir soal
N= banyaknya butir soal
Butir soal yang tidak dijawab diberi skor satu
Contoh:
Tes Bahasa Indonesia soal berbentuk pilihan ganda yang terdiri dari 60 butir
soal dengan empat alternatif jawaban. Theo dapat menjawab benar 30 butir soal,
menjawab salah 12 butir soal, dan tidak dijawab 18 butir soal, maka skor yang
diperoleh Amir adalah :
12
Skor = [30 - ----- ]/60] X 100 = 26/60 X 100 = 43.3
4-1
c. Pensekoran dengan butir beda bobot yaitu pemberian skor dengan memberikan
bobot yang berbeda pada sekelompok butir soal. Biasanya bobot butir soal
menyesuaikan dengan tingkatan berfikir kognitif (pengetahuan, pemahaman,
penerapan, analisis, evaluasi, dan kreasi (menciptakan)). Adapun rumusnya
sebagai berikut:
(Bi x bi)
Skor = Σ ---------------- x 100%
24
St
Keterangan : Bi= banyaknya butir soal yang dijawab benar peserta tes
bi= bobot setiap butir soal
St= skor teoritis (skor bila menjawab benar semua butir soal)
Contoh:
Vista mengikuti tes mata pelajaran PPKn yang terdiri dari 40 butir soal yang
terdiri dari tiga tingkatan berfikir kognitif dengan bobot sebagai berikut :
penerapan 1, analisis 3, evaluasi 4 dan kreasi 5. Vista menjawab benar 15 butir
soal domain penerapan dari 20 butir, 10 butir dari 12 butir soal analisis, 4 butir
soal evaluasi dari 6 butir, 1 butir soal kreasi dari 2 butir. Berapakah skor yang
diperoleh Vista?
Untuk memudahkan memberi skor disusun tabel sebagai berikut:

Domain butir soal Jumlah Butir Bi Jumlah butir X bi Bi


Penerapan 20 1 20 15
Analisis 12 3 36 10
Evaluasi 6 4 24 4
Kreasi 2 5 10 1
Jumlah 40 - St=90 30

(15x1)+(10x3)+(4x4)+(1x5)
Skor =Σ ------------------------------------ x 100 % = 73,3 %
90
Jadi skor yang diperoleh Vista adalah 73,3 %, artinya Vista dapat menguasai tes
mata pelajaran PPKn sebesar 73,5 %.

2. Pensekoran Soal Bentuk Uraian Objektif


Pada bentuk soal uraian objektif, biasanya langkah-langkah mengerjakan dianggap
sebagai indikator kompetensi peserta didik.
Contoh:
Indikator : peserta didik dapat mengisi isi bangun ruang (balok) dan mengubah
satuan ukurannya.
Butir soal :

25
Sebuah kotak air minum berbentuk balok berukuran panjang 100 cm, lebar 60 cm,
dan tinggi 70 cm. Berapa liter air minumkah yang ada pada balok tersebut? (untuk
menjawabnya tuliskan langkah-langkahnya).

Pedoman pensekoran uraian objektif


Langkah Kunci jawaban Skor
1 Isi balok = P X L X T 1
2 = 100 cm X 60 cm X 70 cm 1
3 = 420.000 Cm ³ 1
4 Isi kotak air dalam liter 1
420.000
= -------------------- liter
1.000
5 = 420 liter 1
Skor maksimum 5

3. Pensekoran Soal Bentuk Uraian Non-Objektif


Prinsip pensekoran soal bentuk uraian non objektif adalah dengan menentukan
indikator kompetensinya.

Indikator : peserta didik dapat menghargai berbagai peninggalan sejarah di


lingkungan setempat (kabupaten/kota, provinsi) dan menjaga kelestariannya.

Butir soal : tuliskan alasan-alasan yang membuat Anda menghargai berbagai


peninggalan sejarah di lingkungan setempat Anda!
Pedoman pensekoran
Jawaban boleh lebih dari 1
Kriteria Jawaban Rentang skor
Menghargai peninggalan sejarah yang berkaitan dengan candi 0-2
Menghargai peninggalan sejarah yang berkaitan dengan tempat 0-2
ibadah
Menghargai peninggalan sejarah yang berkaitan dengan museum 0-2
Menghargai peninggalan sejarah yang berkaitan dengan patung 0-2
Menghargai peninggalan sejarah yang berkaitan dengan pakaian 0-2
adat

26
Skor tertinggi 10

4. Pembobotan Soal Bentuk Campuran


Dalam beberapa situasi dapat digunakan soal bentuk campuran, yaitu bentuk pilihan
ganda dan bentuk uraian. Pembobotan soal bagian soal bentuk pilihan ganda dan
bentuk uraian ditentukan oleh cakupan materi dan kompleksitas jawaban atau tingkat
berfikir yang terlibat dalam mengerjakan soal. Pada umumnya cakupan materi
bentuk soal pilihan ganda lebih banyak, sedang tingkat berfikir yang terlibat dalam
mengerjakan soal bentuk uraian biasanya lebih banyak dan lebih tinggi.

B. Pemberian Skor Pada Domain Afektif


Domain afektif ikut menentukan keberhasilan belajar peserta didik. Paling tidak ada dua
komponen dalam domain afektif yang penting untuk diukur, yaitu sikap dan minat
terhadap suatu pelajaran.

C. Pemberian Skor Tes pada Domain Psikomotor.


Tes untuk mengukur ranah psikomotor berupa penampilan atau kinerja (performance)
yang telah dikuasai peserta didik. Tes tersebut dapat berupa tes paper and pencil, tes
identifikasi, tes simulasi, dan tes unjuk kerja. Rubrik yang berupa skala penilaian cocok
digunakan untuk member skor pada subjek yang jumlahnya sedikit. Sedangkan
pemberian skor untuk mengukur perbuatan menggunakan skala penilaian yang terentang
dari sangat tidak sempurna sampai sangat sempurna. Jika dibuat lima skala, maka skala
1 untuk skor yang paling tidak sempurna, dan skala 5 untuk skor yang paling sempurna.

27
V. Menganalisis Butir Soal dalam Asesmen Hasil Belajar

nalisis adalah kajian/telaah terhadap sesuatu hal untuk mengetahui keadaan yang

A sebenarnya. Analisis butir soal adalah kajian terhadap butir soal untuk
mengetahui kualitas butir soal sesuai karakter dan fungsi serta syarat yang
ditetapkan.

A. Perlunya Analisis Butir Soal


Menurut S. Hamid & Asmawi (1991), analisis butir soal diperlukan untuk:
1. mengetahui kekuatan dan kelemahan butir tes, sehingga dapat dilakukan seleksi dan
revisi butir soal.
2. memperoleh informasi tentang spesifikasi butir soal secara lengkap, sehingga akan
lebih memudahkan bagi guru menyusun perangkat soal yang akan memenuhi
kebutuhan ujian dalam bidang dan tingkat tertentu.
3. segera dapat diketahui masalah yang terkandung dalam butir soal, seperti; kemenduaan
butir soal, kesalahan meletakkan kunci jawaban, soal yang terlalu sukar atau terlalu
mudah, atau soal yang tidak dapat membedakan antara peserta didik yang
mempersiapkan diri secara baik atau tidak dalam menghadapi tes.
4. dijadikan alat guna menilai butir soal yang akan disimpan dalam kumpulan soal atau
bank soal. Kegiatan mengumpulkan butir soal yang baik menjadi kumpulan soal atau
bank soal merupakan hal yang dianjurkan kepada guru.
5. memperoleh informasi tentang butir soal sehingga memungkinkan untuk menyusun
beberapa perangkat soal yang paralel. Penyusun perangkat seperti ini sangat bermanfaat
bila akan melakukan ujian ulang atau mengukur kemampuan beberapa kelompok
peserta tes dalam waktu yang berbeda.

28
B. Teknik analisis butir soal
1. Analisis Kualitatif
Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaidah
penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini biasanya dilakukan
sebelum soal digunakan/diujikan.
Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah setiap soal
ditelaah dari segi materi, konstruksi, bahasa/budaya, dan kunci jawaban/ pedoman
penskorannya. Dalam melakukan penelaahan setiap butir soal, penelaah perlu
mempersiapkan bahan-bahan penunjang seperti: (1) kisi-kisi tes, (2) kurikulum yang
digunakan, (3) buku sumber, dan (4) kamus bahasa Indonesia.
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara
kualitatif, yaitu teknik moderator dan teknik panel. Teknik moderator merupakan teknik
berdiskusi yang di dalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini,
setiap butir soal didiskusikan secara bersama-sama dengan beberapa ahli seperti guru yang
mengajarkan materi, ahli materi, pengembang kurikulum, ahli penilaian, ahli bahasa,
berlatar belakang psikologi. Teknik ini sangat baik karena setiap butir soal dilihat secara
bersama-sama berdasarkan kaidah penulisannya. Di samping itu, para penelaah
dipersilakan mengomentari/ memperbaiki berdasarkan ilmu yang dimilikinya. Setiap
komentar/masukan dari peserta diskusi dicatat oleh notulis. Setiap butir soal dapat
dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini
adalah memerlukan waktu lama untuk rnendiskusikan setiap butir soal.
Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya
ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi materi, konstruksi,
bahasa/ budaya, kebenaran kunci jawaban/pedoman penskorannya yang dilakukan oleh
beberapa penelaah. Caranya adalah beberapa penelaah diberi butir-butir soal yang akan
ditelaah, format penelaahan, dan pedoman penilaian/penelaahannya (akan dipaparkan pada
sub unit 8.2). Pada tahap awal para penelaah diberikan pengarahan, kemudian tahap
berikutnya para penelaah bekerja sendiri-sendiri di tempat yang tidak sama. Para penelaah
dipersilakan memperbaiki langsung pada teks soal dan memberikan komentarnya serta

29
memberikan nilai pada setiap butir soal yang kriterianya adalah: baik, diperbaiki, atau
diganti.
Secara ideal penelaah butir soal di samping memiliki latar belakang materi yang
diujikan, beberapa penelaah yang diminta untuk menelaah butir soal memiliki
keterampilan, seperti guru yang mengajarkan materi itu, ahli materi, ahli pengembang
kurikulum, ahli penilaian, psikolog, ahli bahasa, ahli kebijakan pendidikan, atau lainnya.
Suatu soal dinyatakan baik jika sudah tidak dipersoalkan oleh setiap penelaah.

2. Analisis Kuantitatif
Penelaahan soal secara kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada
data empirik dari butir soal yang bersangkutan. Analisis kuantitatif yang dipergunakan
untuk tes obyektif dan tes subyektif (uraian) berbeda. Untuk tes obyektif ada dua
pendekatan dalam melakukan analisis, yaitu pendekatan secara klasik dan pendekatan
secara modern. Mengingat kompleksitas teori modern, maka dalam uraian berikut hanya
dibahas pendekatan secara klasik saja
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi
dari jawaban peserta didik, guna meningkatkan mutu butir soal yang bersangkutan
dengan menggunakan teori tes klasik.

Kelebihan analisis butir soal secara klasik adalah murah, dapat dilaksanakan sehari-
hari dengan cepat menggunakan komputer, murah, sederhana, familier dan dapat
menggunakan data dari beberapa peserta didik atau sampel kecil (Millman dan Greene,
1993). Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik adalah setiap
butir soal ditelaah dari segi:

1. tingkat kesukaran butir,


2. daya pembeda butir, dan
3. penyebaran pilihan jawaban atau frekuensi jawaban pada setiap pilihan jawaban.

a. Tingkat Kesukaran (TK) Tes Pilihan Ganda

30
Tingkat kesukaran adalah angka yang menunjukkan proporsi peserta didik yang
menjawab betul suatu butir soal (Slameto, 2001). Semakin besar tingkat kesukaran berarti
soal itu semakin mudah, demikian juga sebaliknya semakin rendah tingkat kesukaran
berarti soal itu makin sukar. Tingkat kesukaran soal adalah peluang untuk menjawab benar
suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk
indeks. Indeks tingkat kesukaran (P) dapat dihitung dengan rumus seperti berikut ini.
B
P = -----
N

Dimana B = jumlah peserta didik yang menjawab betul


N = jumlah peserta didik

P = Jumlah peserta didik yang menjawab benar dibagi dengan jumlah keseluruhan peserta
didik atau
P = proporsi peserta didik yang menjawab dengan benar.

Contoh:
Jika butir soal nomer 1 yang Anda ujikan dapat dijawab benar oleh 18 dari 40 orang peserta
didik, maka indeks tingkat kesukaran butir soal nomer 1 tersebut adalah:

18
P= — = 0,40
40

Tingkat kesukaran pada umumnya dinyatakan dalam bentuk proporsi yang besarnya
berkisar 0,00 - 1,00 (Aiken (1994). Untuk menentukan tingkat kesukaran butir soal kita
dapat menggunakan tabel tingkat kesukaran berikut ini.
Tabel Rentang Nilai Tingkat kesukaran

Rentang Nilai Tingkat Kesukaran


0.00 – 0.25 Sukar
0.26 – 0.75 Sedang
0.76 – 1.00 Mudah

31
Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya untuk
keperluan ujian semester digunakan butir soal yang memiliki tingkat kesukaran sedang,
untuk keperluan seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi/sukar,
dan untuk keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat
kesukaran rendah/mudah. Dalam konstruksi tes, tingkat kesukaran butir soal sangat
penting, karena tingkat kesukaran butir dapat: (1) mempengaruhi karakteristik distribusi
skor (mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan korelasi antar-
soal), (2) berhubungan dengan reliabilitas (akan dibahas pada bahasan berikut). Semakin
tinggi korelasi antar-soal, semakin tinggi reliabilitas. Tingkat kesukaran butir soal juga
dapat digunakan untuk memprediksi alat ukur itu sendiri (soal) dan kemampuan peserta
didik dalam memahami materi yang diajarkan guru. Misalnya satu butir soal termasuk
kategori mudah, maka prediksi terhadap informasi ini adalah sebagian besar peserta didik
menjawab benar butir soal itu, artinya bahwa sebagian besar peserta didik telah memahami
materi yang ditanyakan, dengan kata lain peserta telah mengindikasikan penguasaan
kompetensi. Jika soal berbentuk pilihan ganda, berarti pengecoh butir soal itu tidak
berfungsi.

b. Daya Pembeda Tes Pilihan Ganda


Daya Pembeda (DB) dapat diartikan sebagai suatu indeks yang menunjukkan bagaimana
pilihan jawaban membedakan peserta didik pandai (atau yang belajar dengan baik) dari
yang kurang pandai (atau yang tidak belajar). Sebagian besar peserta didik yang memiliki
kemampuan yang tinggi untuk menjawab butir item tersebut lebih banyak menjawab betul,
sementara peserta didik yang kemampuannya rendah untuk menjawab butir item tersebut
sebagian besar tidak dapat menjawab dengan betul.
Cara menghitung DB menggunakan rumus berikut ini:

Daya Beda (DB) = (KA – KB)


0.5 x J
Keterangan:
KA : jumlah peserta dalam kelompok atas (sekitar 30%, berdasarkan ranking skor total) yg menjawab benar

32
KB : jumlah peserta dalam kelompok bawah (sekitar 30%, berdasarkan ranking skor total) yg menjawab benar
J : jumlah seluruh peserta tes kelompok atas dan kelompok bawah
Contoh:
Setelah dilakukan pengukuran dengan tes, ternyata butir soal nomer 12, 8 dari 10 peserta
yang termasuk kelompok atas dapat menjawab benar, 2 dari 10 peserta termasuk kelompok
bawah dapat menjawab benar.

8-2
DB = —— = 0,6
0,5× 20

Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00. Kesepakatan
umum menyatakan bahwa DB terkecil yang dapat diterima adalah 0.25. Semakin tinggi
indeks daya pembeda soal berarti semakin mampu soal yang bersangkutan membedakan
peserta didik yang telah memahami materi dengan peserta didik yang belum menguasai
materi. Semakin tinggi daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika
daya pembeda negatif ( < 0 ) berarti lebih banyak kelompok bawah (peserta didik yang
tidak menguasai materi) menjawab benar soal dibanding dengan kelompok atas (peserta
didik yang menguasai materi yang diajarkan guru). Jika nilai DB kurang dari 0.25,
memberi indikasi bahwa soal tidak mampu untuk membedakan antara pencapaian
kelompok atas dan kelompok bawah. Dengan kata lain, jawaban yang benar tidak jelas
terbedakan dari jawaban-jawaban yang salah (pengecoh/ distructor).
Manfaat DB butir soal adalah untuk:
1. meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks daya
pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi, atau
ditolak.
2. mengetahui seberapa jauh setiap butir soal dapat mendeteksi/ membedakan kemampuan
peserta didik, yaitu peserta didik yang telah memahami atau belum memahami materi
yang diajarkan guru. Apabila suatu butir soal tidak dapat membedakan kedua
kemampuan peserta didik itu, maka butir soal itu dapat dicurigai "kemungkinannya"
seperti berikut ini.
 Kunci jawaban butir soal itu tidak tepat.

33
 Kompetensi yang diukur tidak jelas
 Materi yang ditanyakan terlalu sulit, sehingga banyak peserta didik yang menebak
 Sebagian besar peserta didik yang memahami materi yang ditanyakan berpikir ada
yang salah informasi dalam butir soalnya
 Jika soal pilihan ganda, bisa jadi butir soal itu memiliki 2 atau lebih kunci jawaban
yang benar dan pengecoh tidak berfungsi

c. Penyebaran (Distribusi) Jawaban Soal Pilihan Ganda


Penyebaran pilihan jawaban dijadikan dasar dalam penelaahan soal. Hal ini
dimaksudkan untuk mengetahui berfungsi tidaknya jawaban yang tersedia. Pengecoh yaitu
suatu pola yang dapat menggambarkan bagaimana testee menentukan pilihan jawabannya
terhadap kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap butir item.
Suatu pilihan jawaban (pengecoh) dapat dikatakan berfungsi apabila pengecoh:
1. paling tidak dipilih oleh 5% dari seluruh peserta didik,
2. lebih banyak dipilih oleh kelompok peserta didik yang belum menguasai materi.

Analisis Kuantitatif Tes Uraian


Pada umumnya analisis butir soal memang dilakukan untuk tes pilihan ganda, tetapi
kita juga dapat menganalisis tes uraian dengan cara:
1. tentukan jumlah peserta didik kelompok atas (KA) dan kelompok bawah (KB) masing-
masing 25%
2. hitung jumlah skor KA dan jumlah skor KB
3. hitung P dan DB dengan rumus:

∑A + ∑B — (2Nskormin)
P = —————————
2N(skormaks — skormin)

∑A — ∑B
DB = —————————
N(skormaks — skormin)

Di mana:
∑A = jumlah skor KA
34
∑B = jumlah skor KB
N = 25% peserta
skormaks = skor maksimum setiap butir tes
skormin = skor minimal setiap butir tes

Validitas Instrumen
Validitas yaitu ketepatan mengukur yang dimiliki oleh sebutir item untuk mengukur
apa yang seharusnya (Sudijono, A. 2001). Sebutir item dapat dikatakan telah memiliki
validitas yang tinggi atau valid, jika skor pada butir item yang bersangkutan memiliki
kesesuaian atau kesejajaran arah dengan skor totalnya, atau dengan bahasa statistik, Ada
korelasi positif yang signifikan antara skor item dengan skor totalnya. Skor total disini
berkedudukan sebagai variabel terikat (dependent variable), sedangkan skor item
berkedudukan sebagai variabel bebasnya (independent variable).
Validitas tes pada dasarnya sama saja dengan validitas soal. Hasil estimasi validitas
pengukuran pada umumnya dinyatakan secara empirik oleh suatu koefisien yang disebut
koefisien validitas. Koefisien validitas dinyatakan oleh korelasi antara distribusi skor tes
yang bersangkutan dengan distribusi skor suatu kriteria. Kriteria ini dapat berupa skor tes
lain yang mempunyai fungsi ukur sama dan dapat pula berupa ukuran-ukuran lain yang
relevan.
Tipe validitas terbagi atas validitas isi (content), validitas konstrak (construct), dan
validitas berdasar kriteria (criterion-related). Validitas berdasar kriteria terbagi lagi atas
tipe validitas konkuren (concurrent) dan validitas prediktif (predictive).
1. Validitas isi
Validitas isi menunjukkan sejauhmana item-item dalam tes mencakup keseluruhan
kawasan isi yang hendak diukur oleh tes itu. Pengujian validitas isi tidak melalui
analisis statistika, tetapi menggunakan analisis rasional. Contoh:
 apakah item-item dalam tes telah ditulis sesuai dengan blue-printnya
 memeriksa apakah masing-masing item telah sesuai dengan indikator perilaku yang
hendak diungkapnya. Pengujian validitas isi ini sangat penting dalam proses
penyusunan tes prestasi belajar dan harus dilakukan dengan seksama pada waktu
pelaksanaan review item oleh suatu panel ahli.
2. Validitas konstrak

35
Validitas konstrak adalah validitas yang menunjukkan sejauhmana suatu tes mengukur
trait atau konstrak teoritik yang hendak diukurnya. Untuk pengujian validitas konstrak,
diperlukan analisis statistika yang kompleks seperti prosedur analisis faktor. Namun
ada prosedur pengujian validitas konstrak yang lebih sederhana yaitu dengan melalui
pendekatan multi-trait multi-method. Pendekatan ini akan menguji serentak dua atau
lebih trait yang diukur melalui dua atau lebih metode. Dari prosedur ini akan diperoleh
adanya bukti validitas diskriminan dan validitas konvergen. Validitas diskriminan
diperlihatkan oleh rendahnya korelasi antara skor skala atau tes yang mengukur trait
yang berbeda terutama bila digunakan metode yang sama, sedangkan validitas
konvergen ditunjukkan oleh tingginya korelasi skor tes yang mengukur trait yang sama
dengan menggunakan metode yang berbeda.
3. Validitas berdasar kriteria
Dalam pengujian validitas berdasar kriteria, bukti validitas tes diperlihatkan oleh
adanya hubungan skor pada tes yang bersangkutan dengan skor suatu kriteria. Untuk
melihat hubungan yang dimaksud dilakukan analisis korelasional.
Pada dasarnya, estimasi validitas dilakukan dengan menggunakan teknik analisis
korelasional. Namun, tidak semua pendekatan validitas memerlukan analisis statistik.
Tipe validitas yang berbeda menghendaki cara analisis yang beda pula. Bila skor tes
diberi simbol X dan skor kriteria mempunyai simbol Y, maka koefisien korelasi antara
tes dan kriteria itu merupakan koefisien validitas, yaitu rxy. Koefisien validitas hanya
punya makna apabila mempunyai harga yang positif. Walaupun semakin tinggi
mendekati angka 1,00 berarti suatu tes semakin valid hasil ukurnya, namun pada
kenyataannya suatu koefisien validitas tidak pernah mencapai angka 1,00. Pada
akhirnya sebagai ancar-ancar jika jumlah siswa 30 orang atau lebih, penafsiran validitas
yang mendasarkan koefisien korelasi tersebut adalah sebagai berikut:

Tabel 8.2. Rentang Indeks Validitas


No Indeks Interpretasi
1 0,81 – 1,00 Sangat tinggi
2 0,61 – 0,80 Tinggi
3 0,41 – 0,60 Cukup
4 0,21 – 0,40 Rendah
36
5 0,00 – 0,20 Sangat rendah

Reliabilitas Skor Tes


Reliabilitas (ajeg) tes adalah kemampuan alat ukur untuk memberikan hasil
pengukuran yang konstan atau ajeg. Tujuan utama menghitung reliabilitas skor tes adalah
untuk mengetahui tingkat ketepatan (precision) dan keajegan (consistency) skor tes.
Pengertian yang paling sederhana dari reliabilitas adalah kemantapan alat ukur, dalam
pengertian bahwa alat ukur tersebut dapat diandalkan atau memiliki keajegan hasil.
Kerlinger (1986) mengemukakan bahwa reliabilitas dapat diukur dari tiga kriteria
yaitu: (1) Stability, adalah kriteria yang menunjuk pada keajegan (konsistensi) hasil yang
ditunjukkan alat ukur dalam mengukur gejala yang sama, pada waktu yang berbeda; (2)
Dependability, yaitu kriteria yang mendasarkan diri pada kemantapan alat ukur atau
seberapa jauh alat ukur dapat diandalkan; (3) Predictability, karena perilaku merupakan
proses yang saling berkait dan berkesinambungan, maka kriteria ini mengidealkan alat ukur
yang dapat diramalkan hasilnya dan meramalkan hasil pada pengukuran gejala selanjutnya.
Batas reliabilitas atau keajegan dapat diartikan sebagai konsistensi skor yang diperoleh dari
orang yang sama, pada gejala yang sama. Untuk itu ada kemungkinan skor pembanding,
mungkin berupa skor yang diperoleh dari alat ukur yang sama pada kesempatan yang
berbeda, atau skor yang diperoleh dari alat ukur lain yang seimbang. Kerlinger menyatakan
bahwa reliabilitas instrumen dikatakan baik, bila alat tersebut dikenakan pada obyek yang
sama, akan mendapatkan hasil yang sama pada beberapa kesempatan yang berbeda.
Permasalahan dalam reliabilitas adalah kesalahan dalam penggunaan suatu alat
ukur, semakin kecil kesalahan terjadi, maka akan semakin reliabel alat ukur tersebut.
Dijelaskan lebih jauh bahwa reliabilitas alat ukur dapat ditingkatkan dengan cara
memperbanyak butir item, dengan alasan bahwa secara statistik jumlah item yang banyak
akan meningkatkan reliabilitas alat ukur. Meningkatkan reliabilitas alat ukur dapat pula
dilakukan dengan menggunakan petunjuk pengerjaan yang jelas dan dengan menggunakan
istilah-istilah yang jelas, sesuai dengan tingkat pengetahuan dan bahasa responden,
sehingga tidak menimbulkan keraguan atau kesalahpahaman dalam pengisian.

37
Bagaimana reliabilitas dihitung? Setidaknya ada 4 cara untuk menghitung
reliabilitas tes yaitu:
1. Reliabilitas diperoleh dengan cara tes dan tes ulang (retest). Sebuah tes diujikan lagi
pada peserta tes sama, kemudian skor dari satu tes dikorelasikan dengan skor dari tes
lainnya. Kegunaan reliabilitas tes dan tes ulang adalah untuk menunjukkan seberapa
jauh kompetensi yang diuji tes berubah dengan bertambahnya waktu.
2. Reliabilitas diperoleh dengan cara menguji peserta tes dengan dua tes paralel dan skor
dari kedua tes dikorelasikan satu dengan lainnya. Kegunaan reliabilitas tes paralel ini
adalah untuk menguji kesetaraan dua perangkat tes.
3. Reliabilitas diperoleh dengan cara split-half (belah dua). Skor dari nomor soal ganjil
suatu tes dikorelasikan dengan skor nomor soal genap dari tes yang sama. Kegunaan
reliabilitas konsistensi internal tes ini adalah untuk menguji seberapa jauh sebuah tes
secara homogen menguji kompetensi tertentu.
4. Selain dengan berbagai rumus statistik lainnya, reliabilitas konsistensi internal tes juga
dapat diperoleh dengan rumus yang dinamakan dengan KR-20 (Kuder-Richardson 20).
Untuk menghitung KR-20 diperlukan pengetahuan statistik yang lebih lanjut sehingga
tidak dibahas dalam unit ini.

Koefisien reliabilitas selalu berada dalam rentangan 0 sampai dengan 1 yang


menunjuk pada persentase varian error dengan sumber variasi yang berbeda. Misalnya
koefisien reliabilitas menunjukkan 0.74 berarti 74% varian skor yang bersumber pada
keadaan yang diukur, sedang 26% adalah kesalahan atau varian error yang bersumber dari
keadaan di luar variabel yang diukur.
Semakin tinggi koefisien reliabilitas suatu tes (mendekati 1), makin tinggi pula
keajegan/ ketepatannya. Tes yang memiliki konsistensi reliabilitas tinggi adalah akurat
terhadap kesempatan testing dan instrumen tes lainnya. Sebagai ancar-ancar koefisien
reliabilitas berdasarkan nilai Alfa dapatlah diinterpretasikan seperti berikut ini
Tabel 8.3. Rentang Indeks Reliabilitas
No Indeks Interpretasi
1 0,80 — 1,00 Sangat reliabel
2 < 0,80 — 0,60 Reliabel

38
3 < 0,60 — 0,40 Cukup reliabel
4 < 0,40 — 0,20 Agak reliabel
5 < 0,20 Kurang reliabel

Faktor yang mempengaruhi reliabilitas skor tes di antaranya:


1. Semakin banyak jumlah butir soal, semakin ajeg suatu tes.
2. Semakin lama waktu tes, semakin ajeg.
3. Semakin sempit range kesukaran butir soal, semakin besar keajegan.
4. Soal-soal yang saling berhubungan akan mengurangi keajegan.
5. Semakin objektif pemberian skor, semakin besar keajegan.

Latihan
Jawablah pertanyaan berikut ini, kemudian diskusikanlah dengan sesama teman sekelas!
1. Apa saja sikap dan perilaku guru yang perlu ditampilkan dalam melaksanakan
asesmen?
2. Dilihat dari tujuannya, ada banyak jenis tes. Sebut dan jelaskan masing-masing jenis tes
tersebut dan disertai contoh!
3. Sebut dan jelaskan teknik apa saja yang dapat digunakan dalam asesmen pembelajaran,
berikan contoh sesuai dengan pengalaman Anda!
4. Bagaimana caranya melakukan penskoran pada soal tes? Jelaskan jawaban saudara!
5. Mengapa harus melakukan analisis butir soal? Bagaimana cara melakukannya?

Daftar Pustaka

-------------------------. 2005. Peraturan Pemerintah No.19 Tahun 2005 tentang Standar


Nasional Pendidikan. Jakarta: Departemen Pendidikan Nasional.
Allen, Mary., & Yen, Wendy. 1979. Introduction to measurement theory. California:
Brooks/Cole Publishing Company.

39
Balitbang Depdiknas. 2006. Panduan Penilaian Berbasis Kelas. Jakarta: Depdiknas.
Dietel, R.J., Herman, J.L. and Knuth, R.A. 1991. What Does Research Say About
Assessment?http://www/ncrel.org/sdrs/areas/stw.esys/4assess.htm (11/16/02).
Griffin, P & Nix, P. 1991. Educational assessment and reporting: A new approach.
Sydney: Harcourt Brace Jovanovich.
Hopkins, C., D., & Antes, R., L., 1990. Classroom Measurement and Evaluation. Illinois:
F.E. Peacock Publishers. Inc.
Mardapi, D. 2004. Penyusunan Tes Hasil Belajar. Yogyakarta: Program Pasca Sarjana
Universitas Negeri Yogyakarta.
Mardapi, D. 2008. Teknik Penyusunan Instrumen Tes dan Non Tes. Yogyakarta: Mitra
Cendikia Press.
Popham, W.J., 1994. Classroom Assessment (What Teachers Need to Know). Needham
Heights. Mass.
Pusat Kurikulum Badan Penelitan dan Pengembangan Departemen Pendidikan Nasional.
2006. Model Penilaian Kelas KTSP SD/MI. Jakarta: Depdiknas.
Slameto, 1988. Evaluasi Pendidikan. Jakarta: Bina Aksara
Stufflebeam, D. L., & Shinkfield, A. J. 1984. Sistematic Evaluation. Boston: Kluwer-
Nijhoff Publishing.
Suryanto, Adi. dan Tedjo Djatmiko. 2009. Evaluasi Pembelajaran di SD. Jakarta:
Universitas Terbuka.

40

Anda mungkin juga menyukai