Anda di halaman 1dari 9

the notion that we are dealing with measurable characteristics of educational systems;

• the aspiration to measure “key aspects”, be it only to provide an “at a glance profile of
current conditions” (Nuttall, 1989) rather than in-depth description;
• the requirement that indicators show something of the quality of schooling, which
implies that indicators are statistics that have a reference point (or standard) against
which value-judgements can be made.

DASAR PENGUKURAN DAN


EVALUASI PENDIDIKAN
08 Nov

DASAR-DASAR PENGUKURAN DAN EVALUASI PENDIDIKAN

Oleh: ABDUL ZAHIR, S.Pd

Pendidikan merupakan hal yang sangat penting dalam kehidupan ini. Pendidikan sebagai
proses yang berkesinambungan dan sistematis dijalankan dalam rangka pencerdasan
kehidupan sehingga ada perubahan yang signifikan bersifat gradasi dalam setiap individu-
individu. Keberartian pendidikan senantiasa dipahamkan agar terjadi tumbuhkembang prilaku
yang lebih baik.

Kesinambungan pendidikan harus senantiasa dilaksanakan. Kesinambungan ini bukan hanya


diartikan akan adanya proses yang panjang, tapi adanya usaha sadar dalam rangka perbaikan
kerja, kinerja, dan sistem pendidikan untuk menjadi lebih baik lagi. Satu hal yang tak bisa
diabaikan dalam kesinambungan pendidikan adalah kegiatan evaluasi akan pendidikan itu
sendiri.

Berbicara tentang evaluasi pendidikan, ada beberapa criteria dan klasifikasi yang mesti
dirunut dan diterjemahkan. Sama halnya pendidikan, evaluasi pendidikan harus berjalan
berkesinambungan dan sistematis pula. Evaluasi pendidikan yang memiliki cakupan yang
cukup luas, tidak serta merta akan diterjemahkan dalam satu kegiatan saja. Kegiatan evaluasi
mempunyai bangunan tersendiri dan tidak terpisahkan. Setidaknya dalam uraian ini, akan
digambarkan bagaimana evaluasi pendidikan itu.

1. 1.             Hakikat dan Lingkup Pengukuran dan Evaluasi Pendidikan

Secara umum orang hanya mengidentikkan kegiatan evaluasi sama dengan menilai, karena
aktifitas mengukur sudah termasuk didalamnya. Pengukuran, penilaian dan evaluasi
merupakan kegiatan yang bersifat hierarki. Artinya ketiga kegiatan tersebut dalam kaitannya
dengan proses belajar mengajar tidak dapat dipisahkan satu sama lain dan dalam
pelaksanaannya harus dilaksanakan secara berurutan.

Konsep Evaluasi

Menurut pengertian bahasa kata evaluasi berasal dari bahasa Inggris evaluation yang berarti
penilaian atau penaksiran (John M. Echols dan Hasan Shadily: 1983). Menurut Stufflebeam,
dkk (1971) mendefinisikan evaluasi sebagai “The process of delineating, obtaining, and
providing useful information for judging decision alternatives”. Artinya evaluasi merupakan
proses menggambarkan, memperoleh, dan menyajikan informasi yang berguna untuk
merumuskan suatu alternatif keputusan. Evaluasi adalah kegiatan mengukur dan menilai.
Mengukur lebih besifat kuantitatif, sedangkan menilai lebih bersifat kualitatif.

Viviane dan Gilbert de Lansheere (1984) menyatakan bahwa evaluasi adalah proses
penentuan apakah materi dan metode pembelajaran telah sesuai dengan tujuan yang
diharapkan. Penentuannya bisa dilakukan salah satunya dengan cara pemberian tes kepada
pembelajar. Terlihat disana bahwa acuan tes adalah tujuan pembelajaran.

Konsep Penilaian

Penilaian (assessment) adalah penerapan berbagai cara dan penggunaan beragam alat
penilaian untuk memperoleh informasi tentang sejauh mana hasil belajar peserta didik atau
ketercapaian kompetensi (rangkaian kemampuan) peserta didik. Penilaian menjawab
pertanyaan tentang sebaik apa hasil atau prestasi belajar seorang peserta didik.Hasil penilaian
dapat berupa nilai kualitatif (pernyataan naratif dalam kata-kata) dan nilai kuantitatif (berupa
angka). Pengukuran berhubungan dengan proses pencarian atau penentuan nilai kuantitatif
tersebut.

Penilaian hasil belajar pada dasarnya adalah mempermasalahkan, bagaimana pengajar (guru)
dapat mengetahui hasil pembelajaran yang telah dilakukan. Pengajar harus mengetahui sejauh
mana pebelajar (learner) telah mengerti bahan yang telah diajarkan atau sejauh mana
tujuan/kompetensi dari kegiatan pembelajaran yang dikelola dapat dicapai. Tingkat
pencapaian kompetensi atau tujuan instruksional dari kegiatan pembelajaran yang telah
dilaksanakan itu dapat dinyatakan dengan nilai.

Konsep Pengukuran

Pengukuran adalah penentuan besaran, dimensi, atau kapasitas, biasanya terhadap suatu
standar atau satuan pengukuran. Pengukuran tidak hanya terbatas pada kuantitas fisik, tetapi
juga dapat diperluas untuk mengukur hampir semua benda yang bisa dibayangkan, seperti
tingkat ketidakpastian, atau kepercayaan konsumen.

Pengukuran adalah proses pemberian angka-angka atau label kepada unit analisis untuk
merepresentasikan atribut-atribut konsep. Proses ini seharusnya cukup dimengerti orang
walau misalnya definisinya tidak dimengerti. Hal ini karena antara lain kita sering kali
melakukan pengukuran.

Perbedaan Evaluasi, Penilaian dan Pengukuran

Berdasarkan pengertian di atas penulis menyimpulkan bahwa penilaian adalah suatu proses
untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui
pengukuran hasil belajar baik yang menggunakan tes maupun nontes. Pengukuran adalah
membandingkan hasil tes dengan standar yang ditetapkan. Pengukuran bersifat kuantitatif.
Sedangkan menilai adalah kegiatan mengukur dan mengadakan estimasi terhadap hasil
pengukuran atau membanding-bandingkan dan tidak sampai ke taraf pengambilan
keputusan.Penilaian bersifat kualitatif.

Agar lebih jelas perbedaannya maka perlu dispesifikasi lagi untuk pengertian masing-masing.
 Evaluasi pembelajaran adalah suatu proses atau kegiatan untuk menentukan nilai,
kriteria-judgment atau tindakan dalam pembelajaran.
 Penilaian dalam pembelajaran adalah suatu usaha untuk mendapatkan berbagai
informasi secara berkala, berkesinambungan, dan menyeluruh tentang proses dan
hasil dari pertumbuhan dan perkembangan yang telah dicapai oleh anak didik melalui
program kegiatan belajar.
 Pengukuran atau measurement merupakan suatu proses atau kegiatan untuk
menentukan kuantitas sesuatu yang bersifat numerik. Pengukuran lebih bersifat
kuantitatif, bahkan merupakan instrumen untuk melakukan penilaian. Dalam dunia
pendidikan, yang dimaksud pengukuran sebagaimana disampaikan Cangelosi (1995:
21) adalah proses pengumpulan data melalui pengamatan empiris.

Berdasarkan pengertian di atas secara implisit menyatakan bahwa evaluasi memiliki cakupan
yang lebih luas daripada pengukuran dan penilaian. Hal ini diperkuat oleh beberapa
pengertian yang lain seperti Wiersma dan Jurs membedakan antara evaluasi, pengukuran dan
testing. Mereka
berpendapat bahwa evaluasi adalah suatu proses yang mencakup pengukuran dan
mungkin juga testing, yang juga berisi pengambilan keputusan tentang nilai. Pendapat ini
sejalan dengan pendapat Arikunto yang menyatakan bahwa evaluasi merupakan kegiatan
mengukur dan menilai. Kedua pendapat di atas secara implisit menyatakan bahwa evaluasi
memiliki cakupan yang lebih luas daripada pengukuran dan testing.

Ralph W. Tyler, yang dikutif oleh Brinkerhoff dkk. Mendefinisikan evaluasi sedikit berbeda.
Ia menyatakan bahwa evaluation as the process of determining to what extent the educational
objectives are actually being realized. Sementara Daniel Stufflebeam (1971) yang dikutip
oleh Nana Syaodih S., menyatakan bahwa evaluation is the process of delinating, obtaining
and providing useful information for judging decision alternatif. Demikian juga dengan
Michael Scriven (1969) menyatakan evaluation is an observed
value compared to some standard. Beberapa definisi terakhir ini menyoroti evaluasi sebagai
sarana untuk mendapatkan informasi yang diperoleh dari proses pengumpulan dan
pengolahan data.

Sementara itu Asmawi Zainul dan Noehi Nasution mengartikan pengukuran sebagai
pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang,
hal, atau obyek tertentu menurut aturan atau formulasi yang jelas, sedangkan penilaian adalah
suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh
melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes. Pendapat ini
sejalan dengan pendapat Suharsimi Arikunto yang membedakan antara pengukuran,
penilaian, dan evaluasi. Arikunto menyatakan bahwa mengukur adalah membandingkan
sesuatu dengan satu ukuran.

Pengukuran bersifat kuantitatif. Sedangkan menilai adalah mengambil suatu keputusan


terhadap sesuatu dengan ukuran baik buruk. Penilaian bersifat kualitatif. Hasil pengukuran
yang bersifat kuantitatif juga dikemukakan oleh Norman E. Gronlund (1971) yang
menyatakan “Measurement is limited to quantitative descriptions of pupil behavior”
Pengertian penilaian yang ditekankan pada penentuan nilai suatu obyek juga dikemukakan
oleh Nana Sudjana. Ia menyatakan bahwa penilaian adalah proses menentukan nilai suatu
obyek dengan menggunakan ukuran atau kriteria tertentu, seperti Baik , Sedang, Jelek.
Seperti juga halnya yang dikemukakan oleh Richard H. Lindeman (1967) “The assignment of
one or a set of numbers to each of a set of person or objects according to certain established
rules”

1. 2.             Alat Pengukuran dan Evaluasi Pendidikan

Secara umum yang dimaksud dengan instrumen adalah suatu alat yang memenuhi
persyaratan akademis, sehingga dapat digunakan sebagai alat untuk mengukur suatu objek
ukur atau mengumpulkan data mengenai suatu variable. Dalam bidang penelitian, instrumen
diartikan sebagai alat untuk mengumpulkan data mengenai variabel-variabel penelitian untuk
kebutuhan penelitian, sedangkan dalam bidang pendidikan instrumen digunakan untuk
mengukur prestasi belajar siswa, faktor-faktor yang diduga mempunyai hubungan atau
berpengaruh terhadap hasil belajar, perkembangan hasil belajar siswa, keberhasilan proses
belajar mengajar guru, dan keberhasilan pencapaian suatu program tertentu.

Pada dasarnya instrumen dapat dibagi dua yaitu tes dan non tes. Berdasarkan bentuk atau
jenisnya, tes dibedakan menjadi tes uraian dan obyektif, sedangkan nontes terdiri dari
observasi, wawancara (interview), angket (questionaire), pemeriksaan document
(documentary analysis), dan sosiometri. Instrumen yang berbentuk test bersifat performansi
maksimum sedang instrumen nontes bersifat performansi tipikal.

Instrumen hasil belajar bentuk tes uraian memiliki banyak keunggulan seperti mudah disusun,
tidak memberi banyak kesempatan untuk berspekulasi dan mampu mendorong siswa untuk
berani mengemukakan pendapat serta menyusun jawaban dalam bentuk kalimat. Namun
perdebatan di kalangan guru dan bahkan dikalangan orang tua, adalah memandang bahwa tes
uraian sering tidak adil. Bahkan ada pandangan bahwa cara pemberian skor tes uraian cukup
dilihat dari panjang pendeknya tes uraian.

Di lain pihak, penggunaan nontes untuk menilai hasil dan proses belajar masih sangat terbatas
jika dibandingkan dengan penggunaan alat melalui tes dalam menilai hasil dan proses belajar.
Padahal ada aspek-aspek yang tidak bisa terukur secara “realtime” dengan hanya
menggunakan test, seperti pada mata pelajaran matematika. Pada tes siswa dapat menjawab
dengan tepat saat diberi pertanyaan tentang langkah-langkah melukis sudut menggunakan
jangka tanpa busur, tetapi waktu diminta melukis secara langsung di kertas atau papan tulis
ternyata cara menggunakan jangka saja mereka tidak bisa. Jadi dengan menggunakan nontes
guru bisa menilai siswa secara komprehensif, bukan hanya dari aspek kognitif saja, tapi juga
afektif dan psikomotornya.

Berdasarkan permasalahan-permasalahan yang telah disebutkan diatas, dapat disimpulkan


bahwa alat ukur dapat dikategorisasi dalam dua bagian yaitu alat ukur berupa test dan non
test. Adapun penggolongan lebih lanjutnya dapat diuraikan di bawah ini.

1. Alat Ukur Tes/ujian

Ada banyak model ujian, di antaranya mencakup:

1)        Ujian ungkapan seperti essai, jawaban singkat, dan pengisian rumpang (blank)

2)        Ujian pilihan seperti betul-salah, pilihan ganda, dan penjodohan.

3)        Ujian perbuatan seperti melakukan suatu kegiatan


1. Alat Ukur Non Tes

Tehnik penilaian nontes berarti melaksanakan penilaian dengan tidak mengunakan tes.
Tehnik penilaian ini umumnya untuk menilai kepribadian anak secara menyeluruh meliputi
sikap, tingkah laku, sifat, sikap sosial, ucapan, riwayat hidup dan lain-lain. Yang
berhubungan dengan kegiatan belajar dalam pendidikan, baik secara individu maupun secara
kelompok. Alat ukur ini dapat berupa observasi (pengamatan), wawancara (interview),
angket (quisioner), pemeriksaan dokumen (Ducumentary Analisis), dan sosiometri.

1. 3.             Statistika Untuk Pengukuran

Skala Pengukuran

Untuk memilih uji statistik yang akan digunakan dalam menganalisa data maka tipe data
memegang peranan yang penting. Jenis data pada gilirannya akan menentukan jenis uji
statistik yang digunakan. Dalam statistik, data merupakan karakteristik, symbol atau angka
dari sebuah variabel yang diukur. Pengukuran hanya dilakukan terhadap variabel yang dapat
didefinisikan seperti minat, kinerja ataupun sikap. Agar hasil penelitian tidak memberikan
interpretasi yang berbeda maka definisi operasional terhadap variabel yang diteliti perlu
dijelaskan terlebih dahulu. Data dalam statistik secara umum dapat digolongkan menjadi 2
macam yaitu:

1)        Data nominal yaitu data yang didapat dari hasil perhitungan dan berbentuk kategori
misalnya laki-laki-perempuan, tua-muda. Jika laki-laki disimbolkan dengan 1 dan perempuan
disimbolkan dengan 2, maka bukan berarti perempuan lebih baik atau lebih banyak dua kali
lipat dari laki. Data ini tidak bisa diberikan perlakuan matematika seperti penjumlahan
ataupun perkalian. Yang termasuk data nominal juga adalah data ordinal.

2)        Data kontinu yaitu data yang didapat dari hasil pengukuran. Data hasil pengukuran
diperoleh dari tes, kuesioner ataupun alat ukur lain yang sudah terstandar misalnya
timbangan, panjang ataupun skala psikologis yang lain. yang termasuk data kontinum ini
adalah interval dan rasio.
Data didapatkan dari perhitungan dan pengukuran. Pengukuran adalah penggunaan aturan
untuk menetapkan bilangan pada obyek atau peristiwa.

Dengan kata lain, pengukuran memberikan nilai-nilai variabel dengan notasi bilangan. Aturan
penggunaan notasi bilangan dalam pengukuran disebut skala atau tingkat pengukuran (scales
of measurement).Secara lebih rinci, dalam statistik terdapat 4 skala pengukuran yaitu
nominal, ordinal, interval dan rasio.

Skala nominal adalah skala mengelompokkan obyek atau peristiwa dalam berbentuk
kategori. Skala nominal diperoleh dari pengukuran nominal yaitu suatu proses
mengklasifikasian obyek-obyek yang berbeda kedalam kategori-kategori berdasarkan
beberapa karakteristik tertentu.
Karakteristik data nominal adalah

1)        Kategori data bersifat mutually eksklusif (setiap obyek hanya memiliki satu kategori)

2)        Kategori data tidak disusun secara logis


Skala ordinal adalah jenis skala yang menunjukkan tingkat. Skala ini biasanya dipergunakan
dalam menentukan ranking seseorang dibandingkan dengan yang lain. misalnya ranking
siswa dikelas dibuat dari nilai tertinggi sampai nilai terendah. Ranking pertama dan kedua
tidak memiliki jarak rentangan yang sama dengan rankin kedua dan ketiga. Contoh lain skala
ordinal adalah nilai mahasiswa dalam bentuk huruf, A, B, C, D dan E. skala ordinal memiliki
karakteristik:

1)        Kategori data bersifat mutually eksklusif (setiap obyek hanya memiliki satu kategori),

2)        Kategori data tidak disusun secara logis,

3)        Kategori data disusun berdasarkan urutan logis dan sesuai dengan besarnya
karakteristik yang dimiliki

Skala interval adalah skala yang yang memiliki jarak yang sama antar datanya akan tetapi
tidak memiliki nol mutlak. Nol mutlak artinya tidak dianggap ada. Salah satu cirri matematis
yang dimiliki skala interval adalah penjumlahan. Dengan demikian, kita dapat membuat
operasi penambahan atau pengurangan. Misalnya, jarak pada temperature tertentu. Jarak
antara 250F dengan 500F sama dengan jarak 750F dengan 1000F. akan tetapi, skala suhu ini
tidak memiliki titik nol mutlak sehingga kita tidak bisa melakukan operasi perkalian dan
pembagian. Untuk itu maka ada satu lagi skala yaitu skala rasio.

Skala rasio adalah skala pengukuran yang memiliki nol mutlak sehingga dapat dilakukan
operasi perkalian dan pembagian. Misalnya berat badan, tinggi badan, pendapatan dan lain
sebagainya.

Adapun desain pengukuran dapat digunakan beberapa skala seperti:

1)        Skala Likert

      Skala Likert’s digunakan untuk mengukur sikap, pendapat dan persepsi seseorang tentang
fenomena sosial.

      Contoh:

     Pelayanan rumah sakit ini sudah sesuai dengan apa yang saudara harapkan.

     a. Sangat setuju                                   skor 5

     b. Setuju                                              skor 4

     c. Tidak ada pendapat                         skor 3

     d. Tidak setuju                                                skor 2

     e. Sangat tidak setuju                         skor 1

2)        Skala Guttman

      Skala Guttman akan memberikan respon yang tegas, yang terdiri dari dua alternatif.
      Misalnya :

Ya                              Tidak

Baik                           Buruk

Pernah                      Belum Pernah

Punya                        Tidak Punya

3)        Skala Semantic Deferensial

      Skala ini digunakan untuk mengukur sikap  tidak dalam bentuk pilihan ganda atau
checklist, tetapi tersusun dari sebuah garis kontinuem dimana nilai yang sangat negatif
terletak disebelah kiri sedangkan nilai yang sangat positif terletak disebelah kanan.

      Contoh:

Bagimana tanggapan saudara terhadap pelayanan dirumah sakit ini ?

1.Sangat buruk                           5.Sangat baik

4)        Skala Rating

      Dalam skala rating data yang diperoleh adalah data kuantitatif  kemudian peneliti baru
mentranformasikan data kuantitatif tersebut menjadi data kualitatif.

      Contoh:

          Kenyaman ruang loby Bank  CBA:

          5          4          3          2          1         

          Kebersihan ruang parkir Bank  CBA:

          5          4          3          2          1

1. 4.             Penskoran

Penskoran adalah suatu proses pengubahan jawaban instrumen menjadi angka-angka yang
merupakan nilai kuantitatif dari suatu  jawaban terhadap item dalam instrumen (kuantifikasi
terhadap jawaban instrumen).  Dengan memberikan Skor, kita dapat memperoleh deskripsi
tentang seberapa nilai atau harga suatu variabel untuk masing-masing unit analisis dalam
penelitian.

Dalam pemberian skor hasil belajar, tidak ada generalisasi di dalamnya. Hal ini berarti
penskoran dilakukan berdasarkan alat ukur tesnya. Penskoran dengan menggunakan tes
uraian tentu berbeda dengan tes dalam bentuk tes pilihan atau lebih luass alat ukur tes dengan
alat ukur bukan tes.
Diffirensiasi penskoran ini diarahkan agar terjadi proporsional pengukuran sehingga terjadi
pendistribusian skor yang seimbang dan mudah dilakukan penilaian. Sedangkan pemberian
skor pada dasarnya mengacu dalam dua hal, yaitu berdasarkan acuan norma dan acuan
patokan.

a)             Penilaian Acuan Norma

Ada beberapa pendapat tentang pengertian Penilaian Acuan Norma, yaitu:

1)      Acuan norma merupakan elemen pilihan yang memeberikan daftar dokumen normatif
yang diacu dalam standar sehingga acuan tersebut tidak terpisahkan dalam penerapan standar.
Data dokumen normatif yang diacu dalam standar yang sangat diperlukan dalam penerapan
standar.

2)      Pengolahan dan pengubahan skor mentah menjadi nilai dilakukan dengan mengacu
pada norma atau kelompok. Cara ini dikenal sebagai penilaian acuan norma (PAN).

3)      PAN adalah Nilai sekelompok peserta didik (siswa) dalam suatu proses pembelajaran
didasarkan pada tingkat penguasaan di kelompok itu. Artinya pemberian nilai mengacu pada
perolehan nilai di kelompok itu.

4)      Penilaian Acuan Norma (PAN) yaitu dengan cara membandingkan nilai seorang siswa
dengan nilai kelompoknya. Jadi dalam hal ini prestasi seluruh siswa dalam kelas / kelompok
dipakai sebagai dasar penilaian.

Dari beberapa pengertian ini dapat disimpulkan bahwa Penilaian Acuan Norma adalah
penilaian yang dilakukan dengan mengacu pada norma kelmpok; nilai-nilai yang diperoleh
siswa diperbandingkan dengan nilai-nilai siswa yang lain yang termasuk di dalam kelompok
itu.

b)   Penilaian Acuan Patokan (PAP)

Penilaian acuan patokan (PAP) biasanya disebut juga criterion evaluation merupakan
pengukuran yang menggunakan acuan yang berbeda. Dalam pengukuran ini siswa
dikomperasikan dengan kriteria yang telah ditentukan terlebih dahulu dalam tujuan
instruksional, bukan dengan penampilan siswa yang lain. Keberhasilan dalam prosedur acuan
patokan tegantung pada penguasaaan materi atas kriteria yang telah dijabarkan dalam item-
item pertanyaan guna mendukung tujuan instruksional .

Dengan PAP setiap individu dapat diketahui apa yang telah dan belum dikuasainya.
Bimbingan individual untuk meningkatkan penguasaan siswa terhadap materi pelajaran dapat
dirancang, demikian pula untuk memantapkan apa yang telah dikuasainya dapat
dikembangkan. Guru dan setiap peserta didik (siswa) mendapat manfaat dari adanya PAP.

Melalui PAP berkembang upaya untuk meningkatkan kualitas pembelajaran dengan


melaksanakan tes awal (pre test) dan tes akhir (post test). Perbedaan hasil tes akhir dengan
test awal merupakan petunjuk tentang kualitas proses pembelajaran.

Pembelajaran yang menuntut pencapaian kompetensi tertentu sebagaimana diharapkan dan


termuat pada kurikulum saat ini, PAP merupakan cara pandang yang harus diterapkan. PAP
juga dapat digunakan untuk menghindari hal-hal yang tidak diinginkan, misalnya kurang
terkontrolnya penguasaan materi, terdapat siswa yang diuntungkan atau dirugikan, dan tidak
dipenuhinya nilai-nilai kelompok berdistribusi normal. PAP ini menggunakan prinsip belajar
tuntas (mastery learning).

Anda mungkin juga menyukai