Tentang
PENILAIAN/ASSESMENT, EVALUASI, PENGUKURAN, TESTING,
VALIDITAS DAN RELIABILITAS
Disusun Oleh:
SHOFIA RANTI
16175030
Dosen:
Prof. Dr. Festiyed, M.S.
Dr. Hj. Djusmaini Djamas, M.Si.
Assalamu’alaikum wr.wb
Tiada ucapan yang lebih pantas diucapkan setiap makhluk kepada
khaliknya selain ucapan “Alhamdulillaahi rabbil ‘alamiin” atas segala limpahan
rahmat dan anugerah-Nya kepada kita semua. Shalawat dan salam semoga selalu
tercurah untuk Rasulullah dan keluarganya, para sahabat, tabi’ dan tabi’in, serta
umat beliau.
Terima kasih penulis ucapkan kepada orang tua yang telah memberikan
motivasi ucapan terima kasih kepada dosen pembimbing, Prof. Dr. Festiyed, MS,
beserta bapak Dr. Djusmaini Djamas, M.Si., yang telah memberikan pengarahan
kepada penulis dalam penyusunan tugas ini.
Resume ini dibuat untuk memenuhi tugas individu mata kuliah
Pengembangan Evaluasi dan Proses Pembelajaran Fisika serta untuk menambah
pengetahuan, khususnya penulis sendiri. Penulis menyadari sepenuhnya bahwa
makalah ini tidak terlepas dari khilaf dan kealfaan. Untuk itu, penulis
mengharapkan kritik dan saran yang bersifat membangun dari dosen pembimbing
khususnya serta para pembaca umumnya.
Hanya kepada Allah SWT. kita berharap, semoga makalah ini dapat
bermanfaat bagi kita semua, khususnya bagi para pembaca. karena hanya Allah
pengijabah segala doa dan harapan hamba-Nya.
Penulis
i
BAB I
PENDAHULUAN
1
menguasai materi yang disampaikan, dan apakah proses pembelajaran telah
mampu membelajarkan siswa secara efektif dan efisien. Untuk menjawab
pertanyaan tersebut perlu dilakukan asesmen pembelajaran. Asesmen
pembelajaran merupakan bagian integral dari keseluruhan proses pembelajaran,
sehingga kegiatan asesmen harus dilakukan pengajar sepanjang rentang waktu
berlangsungnya proses pembelajaran. Itulah sebabnya, kemampuan untuk
melakukan asesmen merupakan kemampuan yang dipersyaratkan bagi setiap
tenaga pengajar. Selain asesmen juga terdapat istilah penilaian, pengukuran, dan
testing.
Pada makalah ini akan dibahas secara umum hal-hal yang berkenaan dengan
perbandingan penilaian, asesmen, pengukuran, dan testing; bentuk dan jenis
asesmen; fungsi penilaian; validitas, reabilitas; bias; standar error measurement.
2
BAB II
LANDASAN TEORI
A. PERBANDINGAN PENILAIAN, PENGUKURAN, DAN TESTING
1. Pengertian Penilaian (Assesment)
Ada beberapa macam pengertian dari penilaian (assessment) diantaranya
yaitu:
a. Penilaian (assessment) menurut Griffin & Nix (1991) adalah istilah
umum yang mencakup semua metode yang biasa digunakan untuk
menilai unjuk kerja individu atau kelompok peserta didik mencakup
pengumpulan bukti untuk menjelaskan karakteristik seseorang atau
sesuatu terhadap semua proses pembelajaran.
b. Penilaian (assessment) menurut Endang Poerwanti (2006) adalah
penerapan berbagai cara dan penggunaan beragam alat penilaian untuk
memperoleh informasi tentang sejauh mana hasil belajar siswa atau
ketercapaian kompetensi (rangkaian kemampuan) siswa. Penilaian
menjawab pertanyaan tentang sebaik apa hasil atau prestasi belajar seorang
siswa.
c. Menurut Reynolds, Livingston, & Willson (1999: 3) penilaian
(Assesment) adalah beberapa prosedur sistematis untuk mengumpulkan
informasi yang dapat digunakan untuk membuat kesimpulan tentang
karakteristik seseorang atau objek.
d. Menurut Griffin dan Nix (Endang Kurniawan & Endah Mutaqimah,
2009: 3), menyebutkan bahwa penilaian merupakan suatu pernyataan
berdasarkan sejumlah fakta untuk menjelaskan karakteristik seseorang
atau sesuatu.
e. Menurut Anas Sudijono (2011: 4-5) penilaian berarti menilai sesuatu.
Sedangkan menilai mengandung arti mengambil keputusan terhadap
sesuatu dengan mendasarkan atau berpatokan pada ukuran baik atau
buruk, sehat atau sakit, pandai atau bodoh dan lain sebagainya.
f. Menurut Djemari Mardapi (2008: 5) penilaian mencakup semua cara
yang digunakan untuk menilai kerja individu, yaitu prestasi belajar
3
yang dicapai peserta didik. Proses penilaian melalui bukti-bukti tentang
pencapaian beajar peserta didik.
g. Assessment is a broad term that includes testing. A test is a special form
of assessment. Tests are assessments made under contrived
circumstances especially so that they may be administered. In other
words, all tests are assessments, but not all assessments are tests”
(http://www.adprima.com/measurement.html).
h. Asesmen menurut Endang Poerwanti (2006) dapat diartikan sebagai
proses untuk mendapatkan Informasi dalam bentuk apapun yang dapat
digunakan untuk dasar pengambilan keputusan tentang siswa baik yang
menyangkut kurikulumnya, program pembelajarannya, iklim sekolah
maupun kebijakan-kebijakan sekolah melalui beberapa prosedur.
2. Pengertian Pengukuran
Ada beberapa macam pengertian dari pengukuran diantaranya yaitu:
a. Menurut Guilford (1982), pengukuran (measurement) adalah proses
penetapan ukuran terhadap suatu gejala menurut aturan tertentu
b. Menurut Allen & Yen (1979: 2) pengukuran (measurement) adalah
penetapan angka bagi individu dengan cara sistematis yang
mencerminkan sifat (karakteristik) dari individu.
c. Menurut Miller (2008: 2), pengukuran adalah deskripsi kuantitatif
prestasi individu dari peserta didik pada tes tunggal atau beberapa tes
penilaian.
d. Menurut Saifuddin Azwar (2010: 3) pengukuran adalah suatu prosedur
pemberian angka terhadap atribut atau variabel suatu kontinum.
e. Sementara itu, menurut Anas Sudijono (2011: 4) pengukuran dapat
diartikan sebagai kegiatan untuk mengukur sesuatu. Pada hakekatnya,
kegiatan ini adalah membandingkan sesuatu dengan atau atas dasar
ukuran tertentu.
f. Pengukuran (measurement) menurut Endang Poerwanti (2006) adalah
proses pemberian angka atau usaha memperoleh deskripsi numerik dari
suatu tingkatan dimana seorang siswa telah mencapai karakteristik
tertentu. Hasil penilaian dapat berupa nilai kualitatif dan nilai kuantitatif.
4
Pengukuran berhubungan dengan proses pencarian atau penentuan nilai
kuantitatif tersebut.
g. Berdasarkan beberapa definisi sebelumnya, maka dapat dikemukakan
bahwa pengukuran adalah proses pemberian angka atau deskripsi
numerik kepada individu. Hasil dari pengukuran adalah angka. Oleh
karena itu, dapat dipahami bahwa pengukuran bersifat kuantitatif.
3. Pengertian Testing
Ada beberapa macam pengertian dari testing diantaranya yaitu:
a. Tes menurut Endang Poerwanti (2006) adalah cara penilaian yang
dirancang dan dilaksanakan kepada siswa pada waktu dan tempat
tertentu serta dalam kondisi yang memenuhi syarat-syarat tertentu yang
jelas.
b. Menurut Allen dan Yen (1979: 1), tes adalah alat untuk memperoleh
data tentang perilaku individu.
c. Menurut Djemari Mardapi (2008: 71) tes menambahkan bahwa tes
merupakan sejumlah pertanyaan yang memiliki jawaban benar atau
salah.
d. Pada AERA, APA & NCME (Reynolds, Livingston, & Willson,1999:
3), menjelaskan tes adalah suatu prosedur dimana sampel perilaku dari
individu didapatkan, dievaluasi, dan dinilai menggunakan prosedur
standar.
e. Menurut Harun Rasyid & Mansur (2008: 11), beberapa istilah yang
sering digunakan dalam kaitan dengan tes, yaitu testing, testee, dan
tester. Testing adalah waktu dimana tes dilaksanakan, atau waktu
pelaksanaan tes. Testee adalah orang yang dikenai tes, atau orang yang
mengerjakan tes. Sedangkan tester adalah orang yang melakukan tes,
atau pelaksana tes.
f. Berdasarkan definisi sebelumnya, maka dapat dikemukakan bahwa tes
adalah cara yang dipergunakan atau prosedur yang ditempuh dalam
pengukuran dan penilaian sehingga dihasilkan skor yang
menggambarkan tingkah laku atau kemampuan individu.
5
B. BENTUK DAN JENIS ASSESMENT
1. Bentuk-bentuk Assesment
Bentuk assesment yang digunakan antara lain sebagai berikut:
a. Asesmen Konvensional
Secara konvensional, evaluasi terhadap suatu kemampuan (pengetahuan
atau keterampilan) siswa dilakukan dengan suatu proses pengukuran
terhadap kemampuan tersebut menggunakan teknik tes.
b. Asesmen Alternatif. Teknik pengukuran untuk mengevaluasi
kemampuan siswa dengan menggunakan teknik pengukuran non-tes.
c. Asesmen Otentik. Salah satu bentuk asesmen alternatif yang teknik
pengukurannya meminta siswa untuk mengaplikasikan pengetahuan
atau menunjukkan keterampilan sebagaimana pengetahuan atau
keterampilan itu dipakai dalam dunia nyata.
d. Asesmen Kinerja. Bentuk asesmen alternatif lain yang teknik
pengukurannya memberikan kesempatan kepada siswa untuk
menciptakan berbagai situasi untuk siswa atau menciptakan berbagai
situasi agar siswa dapat menunjukkan kemampuannya dalam
mengaplikasikan pengetahuan dan keterampilannya dalam berbagai
situasi (Marzano, 1992).
2. Jenis-jenis Assesment
Jenis-jenis assesment yang digunakan antara lain sebagai berikut:
a. Evaluasi Formatif, yakni penilaian yang dilaksanakan pada setiap akhir
pokok bahasan, tujuannya untuk mengetahui tingkat penguasaan siswa
terhadap pokok bahasan tertentu.
b. Evaluasi Sumatif, yaitu penilaian yang dilakukan pada akhir satuan
program tertentu, (catur wulan, semester atau tahun ajaran), tujuannya
untuk melihat prestasi yang dicapai peserta didik selama satu program.
c. Evaluasi Diagnostik, yaitu penilaian yang dilakukan untuk melihat
kelemahan siswa dan faktor-faktor yang diduga menjadi penyebab,
dilakukan untuk keperluan pemberian bimbingan belajar dan
pengajaran remidial.
6
d. Evaluasi penempatan (placement), yaitu penilaian yang ditujukan untuk
menempatkan siswa sesuai dengan bakat, minat, dan kemampuannya,
misalnya dalam pemilihan jurusan atau menempatkan anak pada kerja
kelompok dan pemilihan kegiatan tambahan.
e. Evaluasi Seleksi, yakni penilaian yang ditujukan untuk menyaring atau
memilih orang yang paling tepat pada kedudukan atau posisi tertentu.
Evaluasi ini dilakukan kapan saja diperlukan.
C. FUNGSI PENILAIAN
Ada beberapa fungsi dilaksanakannya penilaian diantaranya yaitu:
7
c. Membantu peserta didik memahami dirinya dan membuat keputusan
tentang langkah pemilihan program, pengembangan kepribadian, dan
penjurusan.
8
Segala macam faktor yang berhubungan dengan subjek tes, entah itu
kesehatan, motivasi, kemauan, dan lain sebagainya.
Tipe III : Assessment Errors
Kebanyakan terjadi karena faktor situasi. Misalnya, terlalu banyaknya para
penguji menyebabkan adanya ketidaknyamanan sehingga mempengaruhi hasil
yang diperoleh.
2. Systematic/Biased Errors
Kesalahan yang merupakan hasil dari pemikiran yang tercemar,
kecenderungan personal, moral yang tidak pantas, dan lain sebagainya.
Terdapat 3 tipe dalam kesalahan ini, yaitu:
Tipe I
Kesalahan yang terjadi karena kekeliruan yang diperbuat oleh penguji.
Misalnya, kekeliruan penguji dalam membaca test manual. Kesalahan ini
dapat dihilangkan dengan cara membandingkan hasil yang didapat oleh
beberapa orang penguji yang berbeda.
Tipe II
Kesalahan yang muncul karena kecerobohan. Misalnya, kekeliruan penguji
yang seharusnya menulis 0,1 malah menulis 0,01 saat menghitung hasil.
Kesalahan ini dapat dihilangkan dengan cara para penguji harus sangat
berhati-hati saat mencatat dan menghitung hasil.
Tipe III
Kesalahan yang tidak dapat dihindari. Hal ini dikarenakan perilaku manusia di
pengaruhi oleh banyak sekali faktor internal maupun eksternal yang mana
meskipun saat tes banyak faktor yang dikontrol oleh penguji, tetap saja
terdapat faktor-faktor yang tidak terkontrol. Kesalahan ini tidak dapat
dihilangkan, tetapi bisa dikurangi dengan cara pengontrolan lebih banyak lagi
faktor-faktor yang ada.
3. Interpretative Errors
Kesalahan ini terjadi berkaitan dengan kesalahan dalam menginterpretasi hasil
dari suatu tes. Kesalahan ini dapat terjadi jika terdapat kesalahpahaman dalam
dua hal, yakni, “dengan kelompok yang bagaimana seseorang telah
dibandingkan”, dan “dengan cara apa pembandingan antara seseorang tersebut
9
dan kelompoknya dibandingkan”. Kesalahan tersebut dapat dikendalikan
dengan cara para penguji harus memperhatikan kelompok dan cara
membandingkan hasil seseorang dengan kelompoknya.
4. Variable Errors
Kesalahan yang disebabkan oleh ketidakmurnian yang muncul berkaitan
dengan adanya perbedaan alasan dan faktor situasi. Contohnya, seseorang
yang dites dengan alat tes yang sama pada beberapa kesempatan yang berbeda
akan memberikan hasil yang berbeda. Kesalahan ini dapat diperkirakan
melalui test reliability.
5. Personal Errors
Kesalahan yang terjadi berkaitan dengan subjektivitas seseorang. Contohnya,
4 orang yang duduk dalam sebuah mobil akan memberikan jawaban yang
berbeda ketika diminta membaca speedometer.
6. Constant Errors
Kesalahan yang muncul karena perbedaan antara “internal qualities” dan
“internal abilities”. Hal ini jelas sekali membuktikan bahwa nilai tes seseorang
dalam sebuah tes “mental abilities” juga tergantung pada kemampuan orang
tersebut dalam membaca.
7. Statistical Errors
Kesalahan ini dibagi menjadi 2, yaitu :
a. Errors of Descriptive Statistics
Ada dua cara untuk menghitung error dalam statistik deskriptif, yaitu:
1) Standard Errors
Ketika mean suatu sample dihitung, terdapat kemungkinan adanya
perbedaan antara mean dari sample dan mean dari populasi dimana
sample tersebut diambil. Perbedaan antara dua mean tersebut dapat
diperlihatkan melalui standard error. Standard deviasi dari sebuah
distribusi statistik dapat disebut standard error dari statistik tersebut.
2) Probable Errors
Jika dari dua observasi pada kesempatan yang berbeda terdapat hasil
yang tidak jauh berbeda, atau hasil observasi dari dua orang pada
masalah yang sama tidak jauh berbeda, maka hal itu tidak dianggap
10
reliable, tetapi persimpangan kecil dalam dua observasi tersebut akan
membuatnya reliable. Dengan begitu, ketika kita mencoba untuk
mengetahui kebenaran melalui measures of variance, hasil yang
didapat adalah probable error.
b. Inferential Errors
Dalam inferential errors terdapat dua tipe error. Yaitu:
1) Type I Error
Error semacam ini terjadi ketika H0 ditolak, sedangkan sebenarnya H0
benar
2) Type II Error
Error semacam ini terjadi ketika H0 diterima, sedangkan sebenarnya
H0 salah
Measures of test errors yang paling sering digunakan adalah empat tipe
error yang dinamakan:
a. Error of measurement
Error yang terjadi saat merubah skor yang didapat menjadi true score.
b. Error of substitution
Error yang dibuat ketika menggantikan skor dalam suatu tes kepada skor
dalam tes paralel.
c. Error of estimating observed scores
Error yang dibuat ketika sebuah persamaan regresi digunakan untuk
memperkirakan skor dalam sebuah tes dari suatu rangkaian tes paralel.
d. Error of estimating true scores
Error yang terjadi dalam memperkirakan true score dari skor yang didapat
ketika menerapkan persamaan regresi yang paling sesuai.
11
BAB III
PEMBAHASAN
2 EVALUASI Suatu proses atau kegiatan untuk Kualitatif Lebih luas dari penilaian Konteks internal dan
menentukan nilai, kriteria-judgment (semua komponen) eksternal
atau tindakan dalam pembelajaran
12
3 PENGUKURAN Proses pemberian angka atau usaha Kuantitatif Lebih sempit dari Konteks internal saja
memperoleh deskripsi numerik dari penilaian
suatu tingkatan di mana seorang
peserta didik telah mencapai
karakteristik tertentu
4 TES Cara penilaian yang dirancang dan Kuantitatif Lebih sempit dari Konteks internal saja
dilaksanakan kepada peserta didik pengukuran
pada waktu dan tempat tertentu serta
dalam kondisi yang memenuhi
syarat-syarat tertentu yang jelas
13
b. Validitas Kontruk/teoritik hubungan antara skor hasil penyajian tes yang sama
Adalah seberapa besar derajat tes mngukur konstruk hipotesis yang kepada kelompok yang sama, pada waktu yang berbeda.
dikehendaki untuk diukur. Kontruk adalah perangai yang tidak dapat b. Reliabilitas Belah-Dua
diamati, yang menjelaskan perilaku. Menguji validitas kontstruk Reliabilitas ini diukur dengan menetukan hubungan
mencakup uji hipotesis yang didedukasi dari suatu teori yang antara skor dua peruh yang ekuivalen suatu tess, yang
mengajukan konstruk tersebut. disajikan kepada seluruh kelompok pada suatu saat.
c. Validitas Konkruen Karena reliabilitas belah dua mewakili reliabilitas hanya
Validitas ini menunjukkan seberapa besar derajat skor tes berkorelasi separuh tes yang sebenarnya, rumus Spearman-Brown
dengan skor yang diperoleh dari tes lain yang sudah mantap, bila dapat digunakan untuk mngoreksi koofisien yang
disajikan pada saat yang sama, atau dibandingkan denan criteria lain didapat.
yang valid yang diperoleh pada saat yang sama. c. Reliabilitas Rasional Ekuivalen
d. Validitas prediktif Reliabilitas ini tidak ditentukan menggunakan korelasi
Adalah seberapa besar derajat tes berhasil memprediksi kesuksesan tetapi menggunakan estimasi konsistensi internal.
seorang pada situasi yang akan dating. Validitas prediktif ditentukan Reliabilitas ini diukur menggunakan Kuder-Richardson,
dengan mengungkap hubungan antara skor dengan hasil tes atau ukuran biasanya Formula-20 (KR-20) atau Formula-21 (KR-
lain kesuksesan dalam satu situasi sasaran. 21). Kedua rumus ini hanya dapat diapakai untuk tes
yang aitem-aitemnya diskor dikotomi, yaitu benar atau
salah,0 atau 1.
14
d. Reliabilitas Proyektor/Penilai
Adalah reliabilitas dua (atau lebih) penyekor
independen. Reliabilitas ini biasa ditentukan
menggunakan teknik korelasi, tetapi juga dapat hanya
dinyatakan dalam presentase kesepakatan.
15
BAB IV
PENUTUP
A. Kesimpulan
1. Penilaian adalah: Proses sistematis meliputi pengumpulan informasi
(angka,deskripsi verbal), analisis, interpretasi informasi untuk membuat
keputusan.
2. Asesmen adalah: proses pengumpulan informasi tentang peserta didik,
berkenaan dengan apa yang mereka ketahui dan apa yang mereka lakukan
(Hart,1994).
3. Measurement atau pengukuran ialah pemberian tanda atau angka pada
hasil sebuah tes atau bentuk lain dari menurut assessment aturan tertentu.
Hasilnya hanya angka-angka, tetapi dapat dipakai untuk membuat
penilaian.
4. Test adalah tipe khusus dari assessment yang secara khusus terdiri atas
seperangkat pertanyaan yang dilaksanakan semenjak periode waktu
tertentu sampai dengan membandingkan hasil belajar semua peserta didik.
B. Saran
Untuk pemahaman lebih lanjut maka penulis memberikan saran,
Perlunya penambahan materi untuk perluasan pemahaman karena penulis
menyadari makalah ini masih banyak kekuranganan penulis.
16
DAFTAR PUSTAKA
Akman, 2007. Materi Kuliah Evaluasi Proses dan Hasil Belajar Fisika.
Saverius, 1991. Evaluasi hasil Belajar dan Umpan Balik, , Jakarta: PT Grasindo
Siregar, Evelin. dan Hartini Nara., Teori Belajar dan Pembelajaran, (Jakarta:
Ghalia Indonesia, 2010), h.139
http://mrpendi.wordpress.com/2008/02/13/kesalahan-dalam-pengukuran/ (diakses
08 Februari 2017)