2018
KELOMPOK II
Puji syukur Tim Penyusun ucapkan atas kehadirat Allah SWT, karena dengan
rahmat dan karunia-Nya kami masih diberi kesempatan untuk bekerja bersama untuk
menyelesaikan makalah ini. Dimana makalah ini merupakan salah satu dari tugas mata
kuliah Psikologi Pendidikan, yaitu tentang Pengukuran dan Penilaian. Tidak lupa
kami ucapkan terimakasih kepada dosen pembimbing ibu Dina Amalia, S. Psi. M.Sc.
Dan teman-teman yang telah memberikan dukungan dalam menyelesaikan makalah ini.
Kami telah berusaha membuat makalah ini dengan semaksimal mungkin. Namun
kami menerima kritik dan saran dari para pembaca.
Kelompok II
i
DAFTAR ISI
ii
BAB I
PENDAHULUAN
1
2
1.3 Tujuan
Tujuan dari penulisan makalah ini adalah untuk menjelaskan beberapa pokok
pembahasan dan pembaca memahami penjelasan mengenai:
1. Pengertian pengukuran dan penilaian dalam pendidikan
2. Fungsi pengukuran dan penilaian dalam pendidikan
3. Klasifikasi tes dalam pendidikan
4. Prinsip umum alat pengukur
5. Cara memberi skor
6. Skor mentas dan skor dijabarkan.
1.4 Manfaat
Makalah ini diharapkan dapat menjadi bahan pembelajaran untuk kita semua sebagai
materi pembelajaran untuk mata kuliah Psikologi Pendidikan khusunya materi yang
menyangkut dengan Pengukuran dan Penilaian.
BAB II
PEMBAHASAN
a. pengukuran
Menurut Thalib dalam bukunya Psikologi Pendidikan Berbasis Analisis Empiris
Aplikatif, pengukuran dalam psikologi adalah suatu prosedur pemberian angka
(kuantitatifikasi) terhadap atribut-atribut psikologi (kepribadian, intelegensi, bakat,
dan prestasi belajar ( Suryabrata, 2000). Jadi, untuk memberikan gambaran
mengenai prestasi belajar, diperlukan pengukuran tentang prestasi belajar yang
akurat. Secara operasional, pengukuran merupakan suatu prosedur perbandingan
antara atribut yang hendak diukur dengan alat ukurnya. Karakteristik pengukuran
mencakup;
a. Perbandingan antara atribut yang diukur dengan alat ukurnya
b. Hasilnya dinyatakan secara kuantitatif
c. Bersifat deskriptif (Azwar, 1999).
Secara umum, ada tiga macam instrumen yang paling sering digunakan dalam
penelitian ilmiah, yaitu angket, tes, dan skala nilai (rating scale). Angket digunakan
untuk menyelidiki pendapat subjek mengenai sesuatu hal atau mengungkapkan hal
pribadi responden. Skala nilai digunakan untuk menilai keadaan pribadi orang lain
atau mengenai sesuatu hal tertentu. Tes digunakan untuk mengungkapkan keadaan
pribadi seseorang, termasuk di dalamnya, kemampuan, bakat, minat, sikap, dan
kepribadian.
b. Penilaian
Menurut Firman (2000:15), penilaian merupakan proses penentuan informasi
yang dilakukan serta penggunaan informasi tersebut untuk melakukan pertimbangan
sebelum keputusan. Suatu proses untuk mengambil keputusan dengan menggunakan
informasi yang diperoleh melalui pengukuran hasil belajar, baik menggunakan tes
dan non tes. Penilaian (assessment) adalah penerapan berbagai cara dan penggunaan
beragam alat penilaian untuk memperoleh informasi tentang sejauh mana hasil
belajar peserta didik atau ketercapaian kompetensi (rangkaian kemampuan) peserta
didik. Penilaian menjawab pertanyaan tentang sebaik apa hasil atau prestasi belajar
3
4
seorang peserta didik. Hasil penilaian dapat berupa nilai kualitatif (pernyataan naratif
dalam kata-kata) dan nilai kuantitatif (berupa angka). Pengukuran berhubungan
dengan proses pencarian atau penentuan nilai kuantitatif tersebut.
Evaluasi atau penilaian berarti suatu tindakan untuk menentukan nilai sesuatu.
Dalam arti luas, evaluasi adalah suatu proses dalam merencanakan, memperoleh, dan
menyedia- kan informasi yang sangat diperlukan untuk membuat alternatif-alternatif
keputusan (Mehrens &Lelman, 1978). Dalam hubungan dengan kegiatan pengajaran,
Gronlund (1975) merumuskan pengertian evaluasi sebagai "Evaluasi adalah suatu
proses yang sistematis untuk menentukan atau membuat keputusan sampai sejauh
mana tujuan-tujuan pengajaran telah dicapai oleh siswa. Sedangkan Wrightstone dan
kawan-kawan (1956) me- ngemukakan rumusan evaluasi pendidikan ialah
penaksiran terhadap pertumbuhan dan kemajuan siswa ke arah tujuan- tujuan atau
nilai yang telah ditetapkan.
a) Skala Pengukuran
Penelitian dalam bidang psikologi, demikian pula dalam bidang-bidang yang
lainnya, selalu melibatkan isu tentang skala pengukuran (types of measurement
scales). Penerapan skala pengukuran ini berkenaan dengan isu tentang interpretasi
yang dapat diberikan terhadap bilangan-bilangan yang dihasilkan dari suatu
pengukuran psikologis, dan legitimasi prosedur matematis tertentu yang diterapkan
oleh peneliti dalam suatu pengukuran psikologis. Misalnya, apakah suatu alat ukur
inteligensi setara dengan meteran, dapatkah hasil pengukuran psikologis dianalisis
secara sama seperti hasil pengukuran fisik. Dalam penelitian psikologis (juga dalam
penelitian bidang lainnya), terdapat empat skala pengukuran, yakni: nominal,
ordinal, interval, dan rasio. Berikut adalah penjelasan secara garis besar dari empat
skala pengukuran tersebut.
1. Skala Nominal
Skala nominal hanya memilah objek atau atribut ke dalam kategori-kategori yang
berbeda, seperti: jenis kelamin (laki/perempuan), tingkat pendidikan (dasar,
menengah, tinggi), umur (0-6 tahun, 7 – 12 tahun, 13 – 18 tahun), jenis pekerjaan
(pegawai negeri, wiraswasta, BUMN, dan lainnya). Skala nominal memiliki
kelemahan dalam arti bahwa kita tak dapat melakukan banyak operasi matematis
pada bilangan-bilangan nominal. Dicontohkan, ketika kita menempatkan orang ke
dalam suatu kategori khusus, misalnya memberinya nama, nama tersebut hanya
memberi informasi bahwa orang tersebut berbeda dari orang lain. Suatu bilangan
nominal tidak membentuk kita dalam mengukur atribut-atribut orang tersebut secara
lebih mendalam.
6
2. Skala Ordinal
Skala ordinal mengukur perbedaan dalam besaran atau jarak (magnitude) suatu
objek atau atribut.Tipe skala ini dapat kita peroleh jika kita menempatlan objek atau
atribut ke dalam suatu urutan ranking. Misalnya, kita menempatkan siswa-siswa ke
dalam suatu urutan ranking atas dasar prestasi hasil belajarnya.Siswa pertama dari
urutan ranking tersebut adalah siswa yang paling tinggi capaian prestasi akademik,
siswa kedua adalah nomor dua dari atas dalam pencapaian prestasi belajar, dan
seterusnya. Demikian pula kita dapat menempatkan seseorang ke dalam urutan
ranking kekayaan, sikap prososial, tingkat motivasi, daya tarik, dan lainnya. Jika kita
membuat ranking suatu objek atau atribut, satu hal yang perlu dicatat adalah bahwa
perbedaan antara nilai skala yang berdekatan atau berbatasan tidak harus selalu sama
untuk semua objek atau atribut yang diranking. Sebagai contoh, siswa dalam ranking
pertama dan kedua mungkin hampir berdekatan dalam tingkat capaian prestasi
belajarnya, tetapi siswa kelima dan keenam mungkin berbeda agak jauh. Dengan
kata lain, skala ordinal tidak memiliki interval yang sama dan dengan demikian kita
juga tak dapat melakukan banyak operasi matematis terhadap jenis skala ini,
misalnya dicari rata-ratanya atau simpangan bakunya. Dapat dikatakan bahwa skala
ordinal merupakan:
a. Pengurutan seperangkat objek kedalam suatu “ranking” (dari paling atas
hingga paling bawah, atau sebaliknya) menurut atribut tertentu.
b. Tidak ada indikasi berkenaan dengan “seberapa banyak” suatu atribut
dimiliki oleh objek; dan
c. Tidak ada indikasi mengenai jarak atau perbedaan atribut dari objek yang
diamati/diukur.
Jadi, dalam contoh pengurutan prestasi belajar siswa, tidak ada informasi
menyangkut seberapa besar prestasi belajar dari siswa yang satu berbeda dengan
siswa lainnya, kecuali informasi bahwa siswa pertama > siswa kedua > siswa ketiga
> siswa keempat dan seterusnya.
d. Skala Interval
Dalam skala interval terdapat perbedaan (interval) yang sama dan tegas
menyangkut suatu atribut tertentu antara objek yang satu dengan lainnya. Jadi dalam
skala interval lebih banyak operasi matematis yang dapat dilakukan, seperti
menambah, mengurangi, membagi, mengalikan, mencari rata-rata, atau nenemukan
simpangan bakunya. Dengan kata lain, skala interval memiliki sifat perbedaan,
7
urutan, dan interval yang sama. Sebagai contoh, perbedaan skor IQ antara 100 dan
110 adalah sama dengan perbedaan skor IQ antara 120 dan 130. Demikian pula,
perbedaan prestasi belajar dari 5-6 adalah sama dengan perbedaan prestasi belajar
dari 8-9. Skor IQ dan prestasi belajar tersebut merupakan dua bentuk contoh dari
skala interval.
e. Skala rasio
Skala rasio memiliki empat karakteristik pengukuran: perbedaan, jarak, interval
sama, dan nol mutlak. Skala rasio dapat memberikan banyak informasi dan selalu
dinilai sebagai bentuk skala yang sangat bermanfaat dalam pengukuran psikologis.
Karena skala rasio memiliki nilai nol mutlak (true zero), maka skala ini
memungkinkan kita untuk menetapkan rasio dari nilai-nilai skala (oleh karena itu
skala ini disebut skala rasio). Bahkan jika skor IQ diukur dalam skala interval, kita
dapat mengatakan bahwa IQ 120 adalah dua kali lebih besar dari IQ 60, atau lebih
besar dari IQ 100.
a) Tes Terstandar
Tes yang dibakukan menggunakan prosedur yang seragam untuk menentukan
nilai dan administrasinya. Tes ini bisa membandingkan kemampuan murid dengan
murid lai pada usia atau level yang sama, dan dalam banyak kasus perbandingan ini
dilakukan di tingkat nasional. Perbedaan antara tes standard dengan tes buatan guru
ialah banyak tes standard yang memiliki aturan umum dan kebanyakan telah
dievaluasi validitas dan realibitasnya.Tes standar biasanya bertujuan untuk :
Memberikan informasi tentang kemajuan murid
Mendiagnosis kekuatan dan kelamahan murid
Memberikan bukti untuk penempatan murid dalam program khusus
Memberi informasi untuk merencanakan dan meningkatkan
pengajaran atau instruksi
Membantu administrator mengevaluasi program
Memberikan akuntabilitas.
Suatu tes dikatakan terstandar jika telah memiliki beberapa properti
(karakteristik) tes baku seperti, standar norma, validitas dan reliabilitas, keadilan.
11
tes pokok persoalan individual yang didesign untuk murid level tertentu. Survey
batteries adalah tes standar nasional yang banyak digunakan. Tes untuk subyek
spesifik, dimaksudkan untuk menilai keahlian di bidang tertentu seperti membaca
atau matematika. Karena tes ini difokuskan pada area spesifik, tes ini biasanya
menilai suatu keahlian secara lebih mendetail dan ekstensif ketimbang survey
battery. Tes diagnostik, adalah fungsi penting dari tes standar. Diagnostic testing
terdiri dari evaluasi area pembelajaran spesifik secara mendalam. Tujuannya adalah
menetukan kebutuhan pembelajaran spesifik dari murid sehingga kebutuhan itu
dapat dipenuhi melalui instruksi reguler atau remidial. Membaca dan matematika
adalah dua area di mana tes standar paling banyak dipakai untuk diagnosis.
c. Merencanakan rencana tes atau tabel spesifikasi, yaitu suatu tabel yang
membuat berbagai tujuan pengajaran dan berbagai tingkat perkembangan
yang akan diukur.
5. Membuat Soal Tes Objektif
Setelah jelas apa dan siapa yang dites, maka tiba untuk membuat soal. Suatu
prinsip yang harus dipegang ialah bahwa setiap soal hendaknya dapat membedakan
an siswa yang mengetahui dengan siswa yang tidak mengetahuinya. Unsur
kemungkinan menduga-duga hendak jangan sempat muncul pada siswa yang tidak
menguasai bahan.
a. Soal Pilihan Ganda
Oleh sebagian pendidik, soal pilihan ganda dianggap paling bermanfaat dan
paling luwes di antara semua jenis tes, karena dapat digunakan untuk menguji
sebagian besar mata pelajaran. Bentuk dari soal pilihan ganda adalah suatu stem.
Stem dapat berupa pertanyaan ataupun pernyataan. Stem diikuti oleh alternatif-
alternatif atau pilihan-pilihan jawaban. Tidak ada batas mengenai jumlah alternatif
itu, tetapi umnya empat sampai lima alternatif, di mana hanya ada um satu jawaban
yang benar. Contoh: pada umumnya, tujuan membuat soal pilihan ganda adalah agar
siswa memilih jawaban yang benar dan bukannya disesatkan oleh alternatif-alternatif
jawaban yang salah, di samping mengurai kesempatan bagi siswa yang tidak siap
menduga-duga jawaban yang benar. Untuk mencapai maksud ini, pilihan-pilihan
yang salah hendaknya kelihatan meyakinkan bagi siswa yang tidak siap itu, artinya
susunan kata-kata dan bentuknya harus tidak segera diketahui sebagai jawaban-
jawaban yang salah. Jadi, salah satu tugas dalam membuat soal pilihan ganda yang
baik ialah mengidentifikasi pilihan-pilihan jawaban yang salah.
b. Soal Menjodohkan
Item soal menjodohkan disajikan dalam bentuk dua daftar, A dan B. Setiap item
pada daftar A, ada jodohnya atau pasangannya, dengan item yang ada pada daftar B.
Tugas siswa adalah memilih jawaban yang benar yang ada pada daftar B yang
berjodoh dengan itemyang ada pada daftar A. Contoh:
16
No A No B
1 Aktualisasi-diri a Skinner
2 Operant conditioning b Erikson
3 Observational c Thorndike
4 Pseudostupidity d Maslow
5 Krisis Identitas e Elkind
f Bandura
Daftar item di sebelah kiri (A) berisi istilah-istilah yang berkaitan dengan
bermacam-macam tokoh psikologi yang tertera pada daftar item di sebelah kanan
(B). Untuk setiap istilah yang bersesuaian dengan item di kanan, tuliskan huruf
pengenalnya (misalnya d) pada garis yang ada di depan nomor istilah. Contoh:
d----1. Aktualisasi diri
a----2. Operant Conditioning
c. Soal Benar-Salah
Soal benar-salah adalah kalimat berita yang oleh siswa harus dijawab benar atau
salah. Contoh:
B -S Tabel spesifikasi digunakan untuk merencanakan tes buatan guru.
Orang mengira, bahwa membuat soal benar-salah itu ar itu uimilit paling
sederhana. Tetapi sebenarnya tidak, menyusun soal benar-salah yang baik bukan
pekerjaan mudah.
Soal benar-salah itu memiliki beberapa kelebihan:
a. Jawabannya mudah dinilai dan dapat dinilai oleh siapa satu butr pun asal
kunci skoringnya tersedia.
b. Hanya memerlukan waktu sebentar bagi siswa untuk membacanya; karena
soal tersebut dapat meliput banyak topik.
c. Kalau disusun secara cermat, soal benar-salah itu dapat digunakan untuk
mengukur kemampuan membuat sintesis dan penilaian, bukan hanya sekadar
mengukur ingatan. Tetapi sudah tentu membuat soal benar-salah yang
bertaraf tinggi seperti ini memerlukan waktu dan kehati-hatian. Dalam
kenyataan, sebagian besar benar- salah itu hanya mengukur ingatan dan
pengertian- pengertian dasar.
17
b) Mudah memeriksanya artinya bahwa tes itu dilengkapi dengan kunci jawaban
maupun pedoman skoringnya. Untuk soal yang obyektif, pemeriksaan akan
lebih mudah dilakukan jika dikerjakan oleh siswa dalam lembar jawaban.
c) Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat diberikan/
diawali oleh orang lain.
5. Ekonomis
Yang dimaksud dengan ekonomis ialah bahwa pelaksanaan tes tersebut tidak
membutuhkan ongkos/biaya yang mahal, tenaga yang banyak dan waktu yang lama,
baik untuk memproduksinya maupun untuk melaksanakan dan mengolah hasilnya.
Dengan mempertimbangkan kriteria-kriteria tersebut, sewajarnya dapat dihasilkan
alat tes (soal-soal) yang berkualitas yang memenuhi syarat-syarat dibawah ini : a)
Shahih (valid), yaitu mengukur yang harus diukur, sesuai dengan tujuan, b) Relevan,
dalam arti yang diuji sesuai dengan tujuan yang diinginkan, c) Spesifik, soal yang
hanya dapat dijawab oleh peserta didik yang betul-betul belajar dengan rajin. d)
Tidak mengandung ketaksaan (tafsiran ganda). harus ada patokan; tugas ditulis
konkret. Apa yang harus diminta; harus dijawab berapa lengkap e) Representatif,
soal mewakili materi ajar secara keseluruhan f) Seimbang, dalam arti pokok-pokok
yang penting diwakili, dan yang tidak penting tidak selalu perlu.
siswa tersebut dapat mengerjakan tes dengan sempurna. Angka 40 disebut skor
mentah.
Untuk mengetahui prestasi siswa, guru harus mengubah skor mentah menjadi
skor berstandar 100. Contoh skor maksimum yang diharapkan 40. Santi memperoleh
skor 32. Ini berarti bahwa Santi telah menguasai:
32
100 % = 80
40
b. Prinsip-Prinsip Penilaian
Seperti telah disinggung di atas untuk dapat melakukan pengukuran dan
penilaian prestasi belajar siswa secara efektif diperlukan penguasaan teori-teori yang
relevan dan latihan-latihan. Berikut beberapa prinsip yang perlu diperhatikan sebagai
dasar pelaksanaan penilaian.
a. Penilaian hendaknya didasarkan atas hasil pengukuran yang komprehensif
yang sekaligus dituntut penggunaan bermacam-macam media pengukuran
dan tidak hanya dalam bentuk tertulis saja.
b. Evaluasi harus dibedakan antara penilaian (grading) dan . penskoran
(scoring) Penskoran berarti proses pengubahan prestasi menjadi angka-angka.
Dalam penilaian kita memproses angka- angka hasil kuantifikasi dalam
hubungannya dengan skala tentang baik-buruk, bisa diterima-tidak bisa
diterima lulus-tidak lulus, dan sebagainya. Pada penskoran, perhatian
terutama ditujukan pada kecermatan dan kemantapan (accuracy dan
realibility), sedangkan penilaian terutama perhatian ditujukan pada validitas
dan guu kegunaan (validity dan utility).
c. Dalam proses pemberian nilai sebaiknya diperhatikan dua macam penilaian
yaitu penilaian yang norm-referenced dan criterion-referenced. Penilaian
norm-referenced adalah penilaian yang diorientasikan pada suatu kelompok
tertentu; jadi hasil evaluasi perorangan siswa dibandingkan dengan prestasi
kelompoknya. Penilaian criterion-referenced adalah penilaian yang
21
Ada nilai yang diberikan menurut standar absolut, ada pula yang diberikan
menurut standar relatif. Standar penilaian absolut terdiri dari persentase skor yang
sudah ditentukan sebelumnya yang dituntut bagi nilai tertentu. Contoh:
Dalam bentuk standar absolut yang lain, yang disebut penilaian acuan patokan
(PAP) atau criterion-referenced-grad-ing, guru menentukan terlebih dulu prestasi
yang bagaimana yang bagus sekali (A), di atas rata-rata (B), rata-rata (C), di bawah
rata-rata (D) dan kurang atau gagal (E).
Suatu standar penilaian relatif terjadi ketika guru memberikan nilai menurut
peringkat siswa di dalam kelasnya. Standar penilaian relatif ini menegaskan berapa
persen siswa yang diberi nilai A, B dan seterusnya. Hal ini disebut: "penilaian pada
kurva" karena ia memberi nilai kepada siswa-siswa berdasarkan posisi mereka pada
"kurva normal" skor seperti tertera di bawah ini:
3.1 Kesimpulan
Pengukuran adalah proses pengumpulan data melalui pengamatan empiris.
Pengukuran menunjukkan seberapa banyak, seberapa sering atau seberapa
baik dengan memberi nilai atau peringkat.
Pengukuran bersifat kuantitatif-deskripsi tentang sebuah kejadian atau
karakteristik dengan menggunakan angka-angka antar atribut yang diukur
dengan alat ukurnya.
Penilaian adalah kegiatan mengambil keputusan yang menentukan sesuatu
berdasarkan kriteria baik-buruk, dan proses pengumpulan dan pengelolaan
informasi untuk mencapai hasil tujuan penilaian yaitu penelusuran,
pengeceka, pencarian dan penyimpulan.
Pengukuran dan penilaian memiliki hubungan yang tidak dapat dipisahkan.
Pengukuran dan penilaian memiliki banyak fungsi, manfaat dan makna baik
bagi siswa, guru dan sekolah.
3.2 Saran
Semoga makalah ini bisa bermanfaat bagi para pembaca pada umumnya, dan
bagi Tim Penyusun pada khusunya, dalam penggunaan makalah ini sebagai
sebahagian kecil bacaan dan sebagai referensi. Dan semoga makalah ini mampu
menjadi tambahan wawasan dan pengalaman, serta sebagai acuan dalam membuat
karya yang lebih baik lagi dimasa mendatang.
24
DAFTAR PUSTAKA
25