Anda di halaman 1dari 21

PENGUKURAN DAN PENILAIAN DALAM PENDIDIKAN

Makalah Ini Disusun Untuk Memenuhi Tugas


Mata Kuliah Pengembangan Psikologi Pendidikan Islam

Dosen Pengampu : Dr. Budi Astuti, M.Pd.

Disusun Oleh :

Metha Shofi Ramadhani

NIM.1420410041

PAI-B

PROGRAM STUDI PENDIDIKAN ISLAM

KONSENTRASI PENDIDIKAN AGAMA ISLAM

PROGRAM PASCASARJANA UIN SUNAN KALIJAGA

YOGYAKARTA

2014
BAB I

PENDAHULUAN

A. Latar Belakang

Pengukuran dan penilaian dalam pendidikan merupakan suatu


rangkaian dari proses pendidikan. Penilaian dilakukan setalah proses
pendidikan usai atau telah selesai dilaksanakan. Penilaian digunakan untuk
mengetahui kualitas suatu proses pendidikan. Pendidikan dikatakan
berkualitas ketika terdapat evaluasi yang berbentuk hasil evaluasi pendidikan.

Mutu suatu sekolah atau lembaga pendidikan dapat ditengarai dengan


indikator berupa hasil out put pendidikan. Adapun out put dari proses
pendidikan dapat berupa nilai yang tertulis dalam lembar hasil penilaian,
raport, ataupun transkrip nilai. Hasil dari proses pendidikan yang berbentuk
soft skills dan hard skills, dengan penjabaran bahwa penilaian dapat ditinjau
dari beberapa aspek diantaranya yaitu aspek kognitif, afektif dan
psikomotorik. Ketrampilan peserta didik setelah mendapatkan pengalaman
“belajar” dapat berupa ketrampilan membaca, menulis, berbicara, memahami
suatu konsep keilmuan dari materi yang telah diajarkan oleh pendidik kepada
peserta didik.

Adapun bentuk-bentuk evaluasi dapat berupa pengukuran dan


penilaian. Pengukuran dilakukan untuk mengetahui kualitas secara kuantitatif
tanpa interpretasi, sedangkan penilaian dilakukan untk mengetahui kualitas
secara kualitatif yang telah menggunakan interpretasi sehingga pengukuran
yang dilakukan memiliki makna.

Dalam makalah ini akan dibahas tentang definisi penilaian dan


pengukuran beserta contohnya, tujuan dan fungsinya, asas pengukuran dan
penilaian, syarat alat ukur dan macam-macam jenis pengukuran dan
penilaian.

2
B. Rumusan Masalah
1. Apakah definisi dari pengukuran dan penilaian dalam pendidikan ?
2. Apakah fungsi dan tujuan pengukuran dan penilaian dalam pendidikan ?
3. Apa saja asas pengukuran dan penilaian dalam pendidikan ?
4. Bagaimana syarat alat ukur dalam pendidikan ?
5. Bagaimana macam-macam jenis pengukuran dan penilaian dalam
pendidikan ?
C. Tujuan Penulisan
1. Mengetahui definisi dari pengukuran dan penilaian dalam pendidikan
2. Mengetahui fungsi dan tujuan pengukuran dan penilaian dalam
pendidikan
3. Mengetahui asas pengukuran dan penilaian dalam pendidikan
4. Mengetahui syarat alat ukur dalam pendidikan
5. Mengetahui dan mendeskripsikan macam-macam jenis pengukuran dan
penilaian dalam pendidikan

BAB II

PEMBAHASAN

A. Definisi Pengukuran Dan Penilaian Dalam Pendidikan


1. Pengukuran (Measurement)
Sutrisno Hadi mendefinisikan pengukuran sebagai suatu tindakan
untuk mengidentifikasi besar kecilnya suatu gejala. Menurut Suharsimi
(1999:3), pengukuran merupakan proses membandingkan sesuatu dengan
satu ukuran tertentu dan bersifat kuantitatif.1 Pengukuran bersifat
kuantitatif, yakni untuk mengetahui atau menentukan luas, dimensi,
banyaknya dan serajat kesanggupan suatu hal atau benda. Tugas
pengukuran berhenti sampai mengetahui “berapa banyak pengetahuan

1
Muhamad Irham dan Novan Ardy Wiyani, Psikologi Pendidikan : Teori dan Aplikasi dalam
Proses Pembelajaran, (Yogyakarta : Ar-Ruzz Media, 2013), hal. 210.

3
yang telah dimiliki siswa” tanpa memperhatikan arti dan penafsiran
terhadap banyaknya pengetahuan yang dimilikinya itu.2
Hasil pengukuran dapat berupa angka atau uraian tentang
kenyataan atas sesuatu yang menggambarkan derajat kualitas, kuantitas,
dan eksistensi keadaan sesuatu yang diukur. Hasil pengukuran dapat
menjelaskan sesuatu bila telah ditafsirkan dengan cara membandingkan
dengan suatu patokan, norma, atau kriteria tertentu.
Dalam proses belajar mengajar, pengukuran dilakukan untuk
mengetahui seberapa perubahan tingkah laku siswa setelah mengikuti
proses belajar mengajar. Pengukuran hasil belajar umumnya
menggunakan tes sebagai alat pengukur.3
Misalnya: untuk mengukur keberhasilan proses pembelajaran PAI,
yang diikuti oleh 10 orang siswa dilakukan tes dengan jumlah 10 soal
dengan hasil sebagai berikut :

Tabel Skor Hasil Pengukuran Ujian PAI

No Nama Siswa Skor


1. Ananda Maliana 6
2. Beni Susanto 8
3. Chelsea 9
4. Dede Setianto 5
5. Evan Kurniawan 6
6. Fendy 7
7. Galuh Hermawan 4
8. Hilwan Hendrowo 10
9. Imam Hanifuddin 7
10. Joni Irwanto 3
Total 65
Rata-Rata Kelas 6,5

Proses pembuatan soal, pelaksanaan tes, dan penskoran hasil tes


menrupakan rangkaian proses pelaksanaan pengukuran. Angka-angka
yang dicapai siswa pada tabel di atas merupakan contoh skor hasil

2
Oemar Hamalik, Psikologi Belajar & Mengajar, (Bandung : Sinar Baru Algesindo, 2009), hal.
203.
3
Muhamad Irham dan Novan Ardy Wiyani, Psikologi Pendidikan, hal. 211,

4
pengukuran yang berupa angka. Skor-skor tersebut belum memberikan
arti apapun secara lebih tentang kondisi siswa tersebut, hal ini disebabkan
belum dilakukan penilaian dengan cara membandingkan skor yang
diperoleh siswa dalam pengukuran tersebut dengan norma, patokan, atau
kriteria tertentu yang digunakan sebagai pembanding.
2. Penilaian (Evaluation)
Menurut Schwartz, penilaian adalah program untuk memberikan
pendapat dan penentuan arti atau faedah suatu pengalaman. Pengalaman
yang dimaksud adalah pengalaman yang diperoleh berkat proses
pendidikan. Pengalaman itu jelas tampak dalam perubahan pada perilaku
anak atau pola kepribadian anak. Dalam hal ini penilaian adalah usaha
untuk memeriksa sejauh mana anak telah mengalami kemajuan belajar
atau telah mencapai tujuan belajar.4
Penilaian dalam kegiatan evaluasi hasil belajar merupakan tindakan
untuk memberikan interpretasi terhadap hasil pengukuran yang telah
dilakukan untuk memberikan interpretasi terhadap hasil pengukuran yang
telah dilakukan dengan menggunakan norma-norma tertentu dengan
tujuan untuk mengetahui tinggi rendah atau baik buruk tentang aspek-
apsek tertentu yang dievaluasi.5 Menurut Suharsimi (1999:3), penilaian
merupakan kegiatan pengambilan suatu keputusan terhadap sesuatu
dengan ukuran baik buruk dan penilaian lainnya yang bersifat kualitatif.6
Hasil pengukuran tiada ada gunanya tanpa dinilai dengan
menggunakan norma sehingga semua usaha membandingkan hasil
pengukuran terhadap bahan pembanding berupa patokan atau norma
tertentu yang dikenal dengan istilah penilaian.
Untuk memberikan interpretasi hasil ujian PAI terhadap 10 orang
siswa, maka digunakan patokan nilai 6. Skor 6 ini menjadi patokan nilai
untuk menetapkan lulus atau tuntas tidaknya siswa atau dapat digunakan

4
Oemar Hamalik, Psikologi Belajar & Mengajar, hal. 203-204.
5
Muhamad Irham dan Novan Ardy Wiyani, Psikologi Pendidikan, hal. 212.
6
Ibid.

5
untuk melihat baik buruk atau tinggi rendah kemampuan penguasaan
pelajaran PAI, contoh hasil pengukurannya sebagai berikut:
Tabel Penilaian/Interpretasi Hasil Pengukuran Ujian PAI

No Nama Siswa Skor Patoka Interpretasi


n
1. Ananda Maliana 6 6 Tuntas / Lulus
2. Beni Susanto 8 6 Tuntas / Lulus
3. Chelsea 9 6 Tuntas / Lulus
4. Dede Setianto 5 6 Tidak Tuntas
5. Evan Kurniawan 6 6 Tuntas/ Lulus
6. Fendy 7 6 Tuntas / Lulus
7. Galuh Hermawan 4 6 Tuntas / Lulus
8. Hilwan Hendrowo 10 6 Tuntas / Lulus
9. Imam Hanifuddin 7 6 Tuntas / Lulus
10. Joni Irwanto 3 6 Tidak Tuntas

Keterangan sangat tinggi, tinggi, sedang, dan rendah merupakan


hasil penilaian atau interpretasi hasil pengukuran. Begitu juga dengan
predikat lulus atau tidak lulus. Patokan atau norma memberi batas untuk
memberikan interpretasi nilai di atas dan di bawahnya. Skor di atas norma
dinilai baik atau tinggi, dan skor di bawah norma dinilai buruk atau
rendah. Melakukan sebuah penilaian harus memiliki patokan atau norma
sebagai acuan penilaian.7
Jeanne Ellis Ormrod menyatakan dalam bukunya Educational
Psychology Developing Learners, penilaian atau assement adalah proses
mengamati sebuah sampel dari perilaku seorang siswa dan megambil
kesimpulan tentang pengetahuan dan kemampuan siswa tersebut.8
Pertama assesment melibatkan pengamatan terhadap perilaku siswa.
Seperti dinyatakan kaum behavioris sangat mustahil melihat ke dalam
kepala siswa dan melihat pengetahuan apa yang mengendap di sana, kita
dapat melihat hanya bagaimana siswa berperilaku dalam situasi-situasi
tertentu. Kedua, assesment biasanya meliputi hanya sebuah sampel

7
Ibid, hal 213.
8
Jeanne Ellis Ormrod, Psikologi Pendidikan : Membantu Siswa Tumbuh dan Berkembang , Edisi
Keenam terj. Amitya Kumara, (Jakarta : Erlangga, 2008), hal. 267.

6
perilaku, kita tentu saja tidak dapat mengamati dan melacak setiap hal
yang dilakukan setiap siswa di sekolah. Assesment juga melibatkan
pengambilan kesimpulan berdasarkan perilaku yang diamati untuk
membuat assesment tentang prestasi siswa secara keseluruhan di kelas.
Penting kita memilih perilaku yang dapat menyediakan perkiraan akurat
tentang apa yang diketahui dan dapat dilakukan siswa.9
B. Fungsi Dan Tujuan Pengukuran dan Penilaian Dalam Pendidikan

Assesment dapat digunakan untuk berbagai tujuan. Dalam evaluasi


formatif, yang menilai apa yang diketahui dan dapat dilakukan siswa sebelum
atau selama pengajaran. Evaluasi formatif berkelanjutan dapat membantu
kita menetukan apa yang telah diketahui dan diyakini siswa tentang topik
yang akan dibahas. Apakah mereka membutuhkan praktek lebih lanjut untuk
ketrampilan tertentu dan sebagainya, dan kita dapat mengembangkan atau
memperbaiki rencana pelaksanaan pengajaran RPP. Di saat yang lain akan
ada evaluasi sumatif, dengan melakukan assement setelah pengajaran dalam
rangka membuat keputusan terakhir tentang apa yang telah dicapai siswa.
Evaluasi sumatif digunakan untuk menentukan apakah siswa telah menguasai
isi suatu pelajaran atau unit, berapa nilai akhir yang harus kita berikan, siswa
mana yang layak naik kelas dan sebagainya.10

Dengan berdasarkan dua jenis evaluasi dasar ini, assesment dapat


digunakan untuk (a) meningkatkan pembelajaran, (b) memandu pembuatan
keputusan pengajaran, (c) mendiagnosa masalah pembelajaran dan performa,
(d) meningkatkan pengaturan diri (self regulation), atau (e) memutuskan apa
yang akhirnya telah dipelajari siswa. Adapun penjelasannya sebagai berikut:11

a) Meningkatkan Pembelajaran
 Assesment dapat memotivasi siswa untuk belajar

9
Ibid, hal 267-268.
10
Ibid, hal. 270.
11
Ibid, hal. 270-273.

7
 Assesment dapat mempengaruhi proses-proses kognitif tertentu di
dalamnya siswa terlibat
 Assesment dapat berperan sebagai pengalaman belajar dalam dan dari
dirinya sendiri
 Assesment dapat memberi siswa umpan balik yang berharga tentang apa
yang telah dan belum mereka kuasai
b) Memandu Pembuatan Keputusan Pengajaran
c) Mendiagnosa Masalah Pembelajaran dan Performa
d) Meningkatkan Pengaturan Diri (self regulation)
e) Memutuskan Apa yang Akhirnya Telah Dipelajari Siswa.
C. Asas Pengukuran dan Penilaian Dalam Pendidikan
Penilaian hasil belajar dilakukan berdasarkan asas-asas tertentu.
William R. Lucck dalam bukunya, An Introduction to Teaching,
mengemukakan bahwa penilaian harus berdasarkan asas-asas sebagai berikut:
1. Penilaian bersifat kuantitas atau kualitas. Penilaian bersifat kualitatif dan
kuantitatif berkenaan dengan mutu hasil belajar. Penilaian kuantitatif
berkenaan dengan banyaknya materi yang telah dipelajari
2. Penilaian dilaksanakan secara berkesinambungan. Penilaian dilakukan
sejak awal proses belajar, dilanjutkan sepanjang proses berlangsung, dan
diakhiri pada akhir pembelajaran
3. Penilaian bersifat keseluruhan. Penilaian dilakukan terhadap keseluruhan
aspek pribadi siswa yang mencakup aspek-apek intelektual, hubungan
sosial, sikap, watak, sifat kepemimpinan, hubungan personal sosial, moral
tanggung jawab, ketekunan bekerja, kejujuran, kesehatan jasmani, dan
semua aktivitasnya, hubungan, kesehatan rohani jasmani, dan semua
aktivitasnya, baik di dalam maupun luar sekolah.
4. Penilaian bersifat obyektif. Penilaian ditujukan ke arah pemeriksaan
perkembangan dan kemajuan siswa dalam hubungan dengan pencapaian
tujuan belajar. Penilaian diberikan sebagaimana adanya siswa, tidak
dipengaruhi oleh unsur-unsur emosi, hubungan sosial tertentu, atau sikap

8
guru terhadap siswa. Pendeknya subyektivitas guru tidak berpengaruh
terhadap hasil penilaian
5. Penilaian bersifat kooperatif. Kegiatan penilaian adalah tanggung jawab
bersama, baik para guru, orang tua, siswa maupun maysrakat. Jadi
penilaian itu merupakan hasil kerja sama antara semua pihak yang terkait,
baik di dalam lingkungan seolah maupun di luar sekolah.12
Mehl Mills Douglass (1958) mengemukakan tujuh asas penilaian
sebagai berikut :
1. Penilaian harus dilakukan dalam kaitannya dengan tujuan-tujuan
pengajaran, yakni tujuan siswa, tujuan unit, dan tujuan pelajaran harian
2. Penilaian harus dilakukan terhadap hasil belajar sejak siswa melakukan
kagiatan belajarnya sampai akhir pelajaran
3. Penilaian bertalian dengan latar belakang dan potensi-potensi dalam diri
individu siswa. Siswa yang superior, yang memiliki latar belakang yang
baik, akan maju lebih cepat dan lebih baik untuk mencapai tujuan
instruksional
4. Penilaian berlangsung secara terus menurus sepnjang institusi belajar.
Penilaian direncanakan oleh guru dan siswa dan dilaksanakan secara
berkesinambungan terhadap kelompok dan individual siswa
5. Teknik dan alat penilaian yang digunakan harus disusun seobyektif
mungkin kendatipun mungkin segi seubyektivitas tak dapat dihindari
6. Penilaian sendiri oleh siswa perlu sebagaimana halnya penilaian oleh guru.
Dalam batas-batas tertentu banyak hal yang dapat diungkapkan sendiri
oleh masing-masing individu siswa yang bermanfaat untuk menentukan
keberhasilan belajar mereka
7. Penilaian bersifat konstruktif. Penilaian dimaksudkan untuk mengadakan
perbaikan serta membentuk meningkatkan kemajuan siswa.13
D. Syarat Alat Ukur Dalam Pendidikan

12
Oemar Hamalik, Psikologi Belajar & Mengajar, hal. 205-206.
13
Ibid, hal 206.

9
Syarat alat ukur untuk assesment, atau karakteristik-karakteristik
penting assesment yang baik, memiliki beberapa persyaratan sebagai berikut :
a) Reliabilitas suatu instrumen atau prosedur, artinya sejauh mana
assesment tersebut memberikan informasi yang konsisten tentan
pengetahuan, keterampilan, atau karakteristik yang ingin kita ukur.
Sebuah instrumen assesment jarang memberikan hasil yang persis sama
untuk siswa yang sama pada dua kesempatan berbeda, bahkan kalaupun
pengetahuan atau kemampuan yang dinilai tetap sama. Banyak kondisi
temporer yang tidak berkaitan dengan kemampuan yang diukur
cenderung mempengaruhi performa siswa dan mengakibatkan fluktuasi
tertentu dalam hasil assesment. Faktor-faktor temporer seperti :14
 Perubahan harian dalam diri siswa (misal : perubahan kondisi
kesehatan, motivasi, suasana hati dan tingkat energi)
 Variasi dalam lingkungan fisik (misal : variasi suhu ruangan, tingkat
kebisingan, dan distraksi di luar kelas)
 Variasi dalam pelaksanaan assesment (misal : variasi pengajaran,
penentuan waktu, dan jawaban guru terhadap pertanyaan siswa)
 Karakteristik instrumen assesment (misal : panjang, kejelasan, dan
kesulitan tugas)
 Subyektivitas dalam pemberian nilai (misalnya didasarkan pada
kriteria yang tidak jelas dan tidak tepat)

a.1) Menentukan Reliabilitas Secara Matematis

a.2) Mengestimasi Kesalahan Dalam Hasil Assesment

a.3) Meningkatkan Reliabilitas Assesment Kelas

b) Standarisasi, karakteristik assesment dikatakan baik apabila memenuhi


standarirasi, yaitu assesment mencakup isi dan format yang sama serta
dilaksanakan dan diskor dalam cara yang sama untuk setiap orang.
Misalnya di sebagian besar situasi semua siswa seharusnya memperoleh

14
Jeanne Ellis Ormrod, Psikologi Pendidikan, hal. 275-276.

10
instruksi yang sama, mengerjakan tugas yang sama atau mirip, memiliki
tengat waktu yang sama, serta bekerja dengan tantangan yang sama.
Jawaban siswa juga diskor sekonsisten mungkin, kecuali ada kondisi
yang memperingan, kita seharusnya tidak menggunakan standar yang
lebih ketat untuk seorang siswa dibandingkan siswa-siwa lainnya.15
c) Validitas, suatu instrumen assesment dikatakan baik yaitu sejauh mana
instrumen tersebut mengukur apa yang ingin diukur dan memungkinkan
kita untuk menarik kesimpulan yang tepat tentang karakteristik atau
kemampuan yang dibicarakan.
1) Validitas Isi, yaitu sejauh mana berbagai pertanyaan kita akan sangat
terfokus pada validitas sampel yang representatif dari seluruh isi
pengetahuan dan keterampilan yang kita nilai. Validitas yang tinggi
sangat penting ketika kita menggunakan instrumen penelitian untuk
tujuan evaluasi sumatif, yaitu untuk menentukan pengetahuan dan
keterampilan apa yang telah dikuasai siswa dalam kaitannya dengan
tujuan-tujuan pengajaran yang penting.16
2) Validitas Prediktif, yaitu sejauh mana instrumen assesment
memprediksi perfora masa depan di bidang tertentu.
3) Validitas Konstruk, sejauh mana suatu instrumen assesment benar-
benar mengukur karakteristik yang abstrak dan tidak dapat diamati.
Validitas konstruk berfokus utama ketika mencoba mengambil
kesimpulan umum tentang sifat dan kemampuan siswa sehingga kita
dapat menyesuaikan metode-metode dan bahan-bahan pengajaran
dengan lebih baik untuk memenuhi kebutuhan individual mereka.17
d) Praktikalitas, yaitu sejauh mana instrumen dan prosedur assesment relatif
mudah digunakan.18 Praktikalitas meliputi masalah-masalah seperti :19

15
Ibid, hal 278.
16
Ibid, hal. 281.
17
Ibid, hal. 283.
18
Banyak ahli psikologi menggunakan istilah kebergunaan (usability), namun praktikalitas lebih
baik untuk mengomunikasikan gagasan ini.
19
Jeanne Ellis Ormrod, Psikologi Pendidikan, hal. 285.

11
 Berapa banyak waktu yang akan digunakan untuk mengembangkan
instrumen tersebut
 Dapatkah assement itu dilakukan untuk banyak siswa secara
bersamaan atau dilaksanakan satu persatu
 Apakah material yang dilibatkan
 Berapa banyak waktu aktivitas pengajaran akan berkurng untuk
assesment itu
 Seberapa cepat dan seberapa mudah performa siswa dapat dievaluasi
E. Macam-Macam Jenis Pengukuran Dan Penilaian Dalam Pendidikan
1. Tes Standar
Tes yang dibakukan mengandung prosedur yang seragam untuk
menentukan nilai dan administrasinya. Tes standar bisa membandingkan
kemampuan murid dengan murid lain pada usia atau level yang sama, dan
dalam banyak kasus perbandingan ini dilakukan di tingkat nasional. Soal
tes buatan guru cenderung difokuskan pada tujuan instruksional untuk
kelas tertentu. Sedangkan tes standar mencakup berbagai materi yang
lazimnya diajarkan di kebanyakan kelas (Airasian, 2001; Chatterji, 2003).
Adapun perbedaan lain antara tes standar dengan tes buatan guru adalah
banyak tes standar yang memiliki aturan umum dan kebanyakan telah
dievaluasi validitas dan reliabilitasnya.20
Tujuan tes standar, tes standar biasanya bertujuan untuk :
 Memberikan informasi tentang kemajuan murid
 Mendiagnosis kekuatan dan kelamahan murid
 Memberikan bukti untuk penempatan murid dalam program khusus
 Memberi informasi untuk merencanakan dan meningkatkan
pengajaran atau instruksi
 Membantu administrator mengevaluasi program
 Memberikan akuntabilitas

20
John W. Santrock, Psikologi Pendidikan, Edisi Kedua Terj. Tri Wibowo B.S, (Jakarta : Kencana,
2007), hal. 600.

12
Kriteria untuk mengevaluasi tes standar. Adapun kriteria yang
paling penting untuk mengevaluasi tes standar adalah validitas,
reliabilitas, dan keadilan.
 Norma, untuk memahami kinerja individual dalam suatu tes,
kinerjanya perlu dibandingkan dengan kinerja dari kelompok norma
(norm group) yakni kelompok dari individu yang sama seblumnya
telah diberi ujian oleh penguji. Tes ini dikatakan didasarkan pada
norma nasional (national norms) apabila kelompok norma itu terdiri
dari representasi murid secara nasional. Selain norma nasional, tes
standar juga dapat mengandung norma kelompok spesial dan norma
lokal. Norma kelompok spesial terdiri dari nilai tes untuk sub
kelompok dari sampel nasional. Misalnya norma kelompok spesial
mungkin tersedia untuk murid dari kelompok sosioekonomi rendah,
menengah, dan atas, untuk murid perkotaan, sub urban, dan
perdesaan, untuk sekolah swasta dan negeri, untuk siswa perempuan
dan laki-laki, dan untuk murid dari kelompok etnis yang berbeda-
beda. Norma lokal terkadang disediakan untuk tes standar. Norma ini
membandingkan kinerja murid dengan murid lain dari kelas yang
sama, sekolah yang sama, atau distrik yang sama. Jadi evaluasi
kinerja tes murid mungkin akan berbeda-beda tergantung kepada
norma kelompok yang dipakai.21
 Validitas, adalah sejauh mana sebuah tes mengukur apa-apa yang
hendak diukur dan apakah inferensi nilai tes itu akurat atau tidak. Tes
standar yang valid harus mengandung validitas isi yang baik, yakni
kemampuan tes untuk mencakup sampel (to sample) isi yang hendak
diukur. Konsep ini sama dengan “fakta yang berkaitan dengan isi”.
Bentuk lain dari validitas adalah validitas kriteria, yakni kemampuan
tes untuk memprediksi kinerja murid saat diukur dengan penilaian
atau dengan kriteria lain. Validitas kriteria dapat bersifat concurrent
and predictive (Gregory, 2000; Krunger, 2000). Concurrent validity

21
Ibid, hal. 602.

13
adalah relasi antara nilai tes dengan kriteria lain yang ada saat ini.
Predictive validity adalah relasi antara nilai tes dengan kinerja masa
depan murid. Selanjutnya construct validity yaitu sejauh mana ada
bukti bahwa sebuah tes mengukur tertentu. Sebuah konstruk adalah
ciri atau karakteristik yang tidak bisa dilihat dari seseorang, seperti
intelegensi (kecerdasan), gaya belajar, personalitas, atau lecemasan.22
 Reliabilitas, berarti sejauh mana sebuah prosedur tes bisa
menghasilkan nilai yang konsisten dan dapat direproduksi. Agar bisa
disebut reliabel, nilai harus stabil, dependable, dan relatif bebas dari
kesalahan pengukuran (Fekken, 2000; Popham, 2002). Reliabilitas
dapat diukur dengan beberapa cara antara lain test restest reliability,
alternate forms reliability, dan split half reliabilty. Test retest
reliability adalah sejauh mana sebuah tes menghasilkan kinerja yang
sama ketika seorang siswa diberi tes yang sama dalam dua
kesempatan yang berbeda. Alternate form reliability ditentukan
dengan memberikan bentuk yang berbeda dari tes yang sama pada
dua kesempatan yang berbeda untuk kelompok murid yang sama dan
mengamati seberapa konsistenkah skornya. Split half reliabilty,
membagi item tes menjadi dua bagian, seperti item bernomor genap
dan ganjil. Nilai pada dua set itu itu dibandaingkan guna menentukan
seberapa konsistenkah kinerja murid di kedua set itu. Validitas dan
reliabilitas adalah saling terkait. Sebuah tes yang valid itu reliabel,
tetapi sebuah tes yang reliabel tidak selalu valid.23
 Keadilan, tes yang adil (fair) adalah tes yang tidak bias (unbiased)
dan tidak diskriminatif (McMillan, 2001). Tes itu tidak dipengaruhi
oleh faktor-faktor seperti gender, etnis, atau faktor subyektif seperti
bias penilai.24
2. Tes Kecakapan dan Prestasi

22
Ibid, hal. 602-603.
23
Ibid, hal. 604.
24
Ibid, hal. 605.

14
Ada dua tipe utama tes standar yaitu tes kecakapan (aptitude) dan
tes prestasi (achievement). Tes kecakapan (aptitude test) didesign guna
memprediksi kemampuan murid untuk mempelajari suatu keahlian atau
menguasai suatu keahlian atau menguasai sesuatu dengan pendidikandan
training tingkat lanjut. Tes kecakapan ini mencakup tes kemampuan
mental umum seperti tes kecerdasan (Stanford-Binet, Wechsler Scales,
dan sebagainya). Tes prestasi dimaksudkan untuk mengukur apa yang
telah dipelajari atau keahlian apa yang telah dikuasai murid (Andrews,
Sakloske & Janzen, 2001; Haladyna, 2002; Smith, 2001). Namun
perbedaan antara tes prestasi dengan tes kecakapan terkadang kabur.
Kedua jenis tes ini menilai status murid, pertanyaan yang dipakai
kebanyakan mirip, dan biasanya hasil dari dua jenis tes ini mempunyai
korelasi yang tinggi.25
Jenis-jenis tes prestasi standar, ada bebarapa tepe tes prestasi
standar. Salah satu cara umumuntuk mengklasifikasikannya adalah
sebagai survey batterie, spesific subject test, or diagnostic tests (Payne,
1997). Survey battery (baterai survei) adalah sekelompok tes pokok
persoalan individual yang didesign untuk murid level tertentu. Survey
batteries adalah tes standar nasional yang banyak digunakan (McMillan,
2001). Tes untuk subyek spesifik, dimaksudkan untuk menilai keahlian di
bidang tertentu seperti membaca atau matematika. Karena tes ini
difokuskan pada area spesifik, tes ini biasanya menialai suatu keahlian
secara lebih mendetail dan ekstensif ketimbang survey battery. Tes
diagnostik, adalah fungsi penting dari tes standar. Diagnostic testing
terdiri dari evaluasi area pembelajaran spesifik secara mendalam.
Tujuannya adalah menetukan kebutuhan pembelajaran spesifik dari murid
sehingga kebutuhan itu dapat dipenuhi melalui instruksi reguler atau
remidial. Membaca dan matematika adalah dua area di mana tes standar
paling banyak dipakai untuk diagnosis (Berniger, dkk., 2001).26

25
Ibid, hal. 606.
26
Ibid, hal. 607.

15
3. Ujian Negara Beresiko Tinggi (high stakes)27
Setelah publik dan pemerintah menuntut pertanggungjawaban
terhadap efektivitas sekolah dalam mendidik anak-anak bangsa, tes atau
ujian yang diwajibkan negara (ujian negara) semakin kuat perannya
(Hambleton, 2002;Olson, 2001). Negara telah lama mewajibkan ujian atau
tes, tetapi penekanannya berubah belakangan ini (Airasian, 2001).
Sebelum 1990-an, isinya tidak berhubungan erat dengan apa yang
diajarkan dan dipelajari di kelas. Ujian negara hanya memberikan tinjauan
umum atas seberapa baik murid di suatu negara bagian dalam mata
pelajaran tertentu, terutama membaca dan matematika.
Tahun 1990-an, dimulailah usaha untuk menghubungkan ujian
negara dengan sasaran instruksional yang didukung negara. Kebanyakan
negara bagian di AS punya atau sedang dalam proses identifikasi sasaran
yang harus dicapai oleh setiap murid di suatu negara. Sasaran ini menjadi
basis bukan hanya untuk ujian negara, tetapi juga untuk menjadi pedoman
aktivitas seperti pendidikan guru dan penentuan kurikulum (Whitford &
Jones, 2000).
Adapun format ujian negara ditinjau dari sudut pandang
konstruktivis, ujian yang diwajibkan negara ini menggunakan format yang
salah, terdiri dari soal pilihan berganda. Hanya tujuh negara bagian yang
belakangan ini menggunakan soal model esai atau soal kinerja (Quality
Couns, 2001). Ketika penilaian berbasis konstruksi dipakai, penilaian itu
biasanya menggunakan soal jawaban pendek atau soal menulis. Hanya
sedikit negara bagian yang memasukkan pertofolio sebagai bagian dari
penilaiannya. Hampir semua negara bagian menggunakan penilaian yang
mengacu pada kriteria, yang berarti bahwa nilai murid dievaluasi
berdasarkan standar yang telah ditetapkan. Kebanyakan negara
menggunakan nilai dasar (seperti jawaban benar sampai 70 persen) yang
harus dicapai murid agar lulus. Tes semacam itu juga memberikan nilai
komparatif.

27
Ibid, hal. 609-610.

16
Keuntungan dan penggunaan tes beresiko tinggi. Sejumlah
pembuat kebijakan berpendapat bahwa ujian negara berisiko tinggi (high
stakes) memberikan sejumlah efek posistif diantaranya :
 Meningkatkan kinerja murid
 Lebih banyak waktu untuk mengajarkan pelajaran yang diujikan
 Ekspektasi tinggi untuk semua murid
 Identifikasi sekolah, guru, dan administrasi yang berkinerja payah
 Meningkatkan rasa percaya diri di sekolah setelah nilai ujian naik.
Kritik terhadap ujian negara. Kritik terhadap ujian yang diwajibkan
negara ini menyatakan bahwa ujian negara akan menimbulkan akibat
negatif (McMillan, 2002) yaitu :
 Menumpulkan kurikulum dengan penekanan lebih besar pada hafalan
ketimbang pada keahlian berpikir dan memecahkan masalah. Dalam
sebuah analisis, kebanyakan ujian negara lebih difokuskan pada
pengetahuan dan keahlian yang cenderung gampang ketimbang
kognitif yang lebih kompleks (Quality Counts, 2001). Ini akan
mempersempit kurikulum dan lebih fokus pada keahlian kognitif yang
rendah (Linn, 2000).28
 Mengajar demi ujian, guru akan mengajar pengetahuan dan keahlian
yang akan diujikan saja (Gallagher, 2000). Mereka menghabiskan
banyak waktu untuk berlatih soal-soal ujian. Dalam sebuah survei,
lebih dari enam dari sepuluh guru sekolah publik mengatakan bahwa
ujian negara ini menyebabkan pengajaran difokuskan pada ujian
(Quality Counts, 2001).29
 Diskriminasi terhadap murid dari status sosioekonomi (SES) rendah
dan minoritas. Hal ini terjadi ketika jumlah anak-anak dari kelompok
ini tidak memenuhi standar negara ini sangat besar, sedangkan murid
SES yang lebih tinggi dan kulit putih bisa memenuhi standar. Para
riset telah menemukan bahwa murid yang ditempatkan di jalur lambat

28
Ibid, hal. 610.
29
Ibid.

17
atau program remidial, murid dari keluarga muskin dan etnis
minoritas, lebih mungkin mendapatkan pengajaran yang buruk dan
berprestasi berprestasi rendah (Cooper & Sherk, 1989 ; Oakes,
1990).30
4. Tes Distrik dan Nasional
Selain ujian negara, sebuah distrik atau kabupaten mungkin
mewajibkan tes standar, murid mungkin juga harus mengikuti ujian
naisonal.
Ujian Distrik (Lokal). Di Spencerport, New York, distrik sekolah
mengumpulkan isnformasi tentang kinerja murid dengan tes berikut ini :
Standford Achievement Test in Reading (grade 2-8) and Math (grade 1-8);
New York Satae Pupil Evaluation Test in Reading (grade 3-6), Written
Expression (grade 5), and Mathematics (grade 3 dan 6); New York State
Program Evaluation Test, yang menilai program sainsdan studi ssosial;
New York Preliminary Competency Test, yang dipakai untuk memprediksi
kesuksesan masa depan di pelajaran membaca, menulis, dan matematika
(diberikan untuk setiap grade); New York States Regents Competency
Test, yang menilai kompetensi untuk pelajaran matematika, sains, studi
global, dan sejarah dan pemerintahan AS (diberikan di SMA untuk murid
yang tidak mengikuti Regent Test); Scholastic Assessment Tes (SAT) dan
American Collage Test (ACT), diberikan kepada murid yang berencana
masuk ke universitas atau akademik dan Advance Placement Test untuk
bidang sejarah AS, biologi, kimia, sastra dan bahasa Inggris, Perancis,
Spanyol, kalkulus, dan teori musik yang dapat diikuti oleh murid untuk
memasuki kelas tertentu berdasarkan level pengetahuan dan kemampuan
yang mereka miliki. Pada tahun 1999, Spenceport juga mulai menilai
kemampuan murid untuk mengaplikasikan pengetahuan dan keahlian
memecahkan masalah dalam sejumlah bidang. Tes tipe standar dapat

30
Ibid, hal. 610-611.

18
bervariasi antardistrik. Akan tetapi, seperti dalam dalam sekolah distrik
Spencerport, jumlah keseluruhannya banyak.31
Penilaian Nasional dan Standar Kelas Dunia, pemerintah federal
juga dilibatkan dalam menstandarisasikan ujian melalui National
Assessment of Educational Progress (NAEP). Negara bagian tidak
diwajibkan ikut berpatisipasi dalam penilaian naional, walaupun banyak
yang ikut (misalnya, lebih dari 40 negara bagian telah mewajibkan murid
di sana untuk mengikuti ujian). NAEP adalah penelitian mirip sensus
terhadap pengetahuan, keahlian, pemahaman, dan sikap generasi muda
Amerika (Bourque, 1999; Payne, 1997). Area subyek mencakup bidang
membaca, menulis, sastra, matematika, sains, studi sosial, seni,
kewarganegaraan, dan perkembangan karier dan pekerjaan. Murid,
sekolah, kota, atau negara bagian tidak disebutkan dalam kajian ini,
walaupun negara bagian boleh meminta agar namanya dicantumkan.
Setiap murid yang mengikuti NAEP hanya merespons sebagian dari
seluruh penilaian.
Temuan dari NAEP (2000) menunjukkan trend sebagai berikut :
 Membaca. Tidak ada peningkatan dari tahun 1992 sampai 2000
untuk anak grade empat dan tidak ada perkembangan untuk anak
grade delapan sampai dua belas dari 1992 sampai 1998.
 Matematika. Dari tahun 1990 sampai 2000 terdapat kenaikan nilai
untuk anak grade empat dan grade delapan, tetpi menunjukkan
penurunan pada tahun 2000 untuk anak grade 12.
 Sains. Tidak ada perubahn nilai dari 1996 sampai 2000 untuk anak
grade empat dan delapan, namun nilai anak grade dua belas
menurun dalam rentang waktu tersebut.32

31
Ibid, hal. 612.
32
Ibid, hal. 612-613.

19
BAB III

PENUTUP

KESIMPULAN

1. Pengukuan dan penilaian dalam pendidikan merupakan rangkaian dari proses


pendidikan. Pengukuran memiliki arti proses membandingkan sesuatu dengan
satu ukuran tertentu dan bersifat kuantitatif. Sedangkan penilaian merupakan
kegiatan pengambilan suatu keputusan terhadap sesuatu dengan ukuran baik
buruk dan penilaian lainnya yang bersifat kualitatif.
2. Evaluasi atau assesment dapat digunakan untuk (a) meningkatkan
pembelajaran, (b) memandu pembuatan keputusan pengajaran, (c)
mendiagnosa masalah pembelajaran dan performa, (d) meningkatkan
pengaturan diri (self regulation), atau (e) memutuskan apa yang akhirnya
telah dipelajari siswa.
3. Pengukuran dan penilaian memiliki asas-asas tertentu, memiliki syarat alat
ukur untuk pengukuran dan penilaian, juga mempunyai jenis dan macam yang
berbeda-beda yang disesuaikan dengan tujuan dari pengukuran dan penilaian.

DAFTAR PUSTAKA

Hamalik, Oemar, Psikologi Belajar & Mengajar, Bandung : Sinar Baru Algesindo, 2009.

Muhamad Irham dan Novan Ardy Wiyani, Psikologi Pendidikan : Teori dan Aplikasi
dalam Proses Pembelajaran, Yogyakarta : Ar-Ruzz Media, 2013.

Ormrod, Jeanne Ellis, Psikologi Pendidikan : Membantu Siswa Tumbuh dan


Berkembang, Edisi Keenam terj. Amitya Kumara, Jakarta : Erlangga,
2008.

Santrock, John W., Psikologi Pendidikan, Edisi Kedua Terj. Tri Wibowo B.S, Jakarta :
Kencana, 2007.

20
21

Anda mungkin juga menyukai