Anda di halaman 1dari 137

EVALUASI PEMBELAJARAN KIMIA

Nurbaity
Achmad Ridwan
Yuli Rahmawati

2017
DAFTAR ISI

BAB I PENDAHULUAN ............................................................................................... 3


A. Pembelajaran Kimia. .........................................................................................4
B. Evaluasi dan Penilaian dalam Pembelajaran Kimia. ......................................10
BAB II TINJAUAN UMUM PENILAIAN PEMBELAJARAN .......................................11
A. Pengertian Penilaian .......................................................................................11
B. Obyek Penilaian Pembelajaran ......................................................................23
BAB II TES SEBAGAI ALAT PENILAIAN .................................................................30
A. Konsep Tes. ....................................................................................................30
B. Jenis-Jenis Tes, Kebaikan dan Kelemahannya ..............................................31
C. Ciri-Ciri Tes Yang Baik....................................................................................40
D. Langkah-Langkah Dalam Menyusun Tes Kognitif .........................................49
E. Cara Menskor Soal-Soal Essay ......................................................................55
F. Cara Menskor Tes Objektif .............................................................................55
BAB III VALIDITAS, RELIABILITAS TES DAN ANALISIS BUTIR SOAL .................61
A. Validitas dan Reliabitas Tes ...........................................................................61
B. Perbedaan Antara Skor dan Nilai ...................................................................98
BAB IV PENILAIAN KEGIATAN PRAKTIKUM KIMIA ............................................118
A. Hakikat Praktikum Kimia ...............................................................................118
B. Sumber Penilaian Kegiatan Laboratorium. ...................................................120
C. Nilai Individual Dalam Kelompok ..................................................................121
D. Instrumen Penilaian Kegiatan Praktikum ......................................................129
BAB V PENILAIAN KETRAMPILAN PROSES .......................................................134
A. Pengertian .....................................................................................................134
B. Pendekatan Ketrampilan Proses Dalam Pembelajaran Kimia. ....................135
C. Mengorganisasi data.....................................................................................136
D. Hipotesis. ......................................................................................................136
DAFTAR PUSTAKA ................................................................................................137

2
KATA PENGANTAR

Evaluasi pembelajaran merupakan hal yang penting dalam komponen


pembelajaran. Pembelajaran kimia dengan karakteristiknya merupakan hal yang
tidak dapat dipisahkan. Berdasarkan hal tersebut, kami selaku pendidik yang
bergerak di bidang pendidikan kimia menulis buku ini sebagai sarana kajian literatur
yang diharapkan dapat memberikan gambaran mengenai konsep-konsep dan
perkembangan penilaian pembelajaran kimia serta dapat diaplikasi dalam
pembelajaran.
Buku ini memberikan gambaran yang berbeda dalam memberikan
pemahaman terkait penilaian pembelajaran kimia. Pemahaman terhadap prinsip,
bentuk, dan penerapan penilaian merupakan hal yang dapat berdampak terhadap
kualitas pembelajaran. Buku ini merupakan perluasan modul yang telah disusun
oleh Prof. Nurbaity untuk mata kuliah Perencanaan, Pengelolaan, dan Evaluasi
Pembelajaran, sehingga diharapkan dapat dimanfaatkan secara luas.
Selanjutnya, kami mengucapkan terima kasih pada berbagai pihak atas
bantuan dan dukungannya dalam penyelesaian buku ini.Pada akhirnya, semoga
buku ini dapat bermanfaat bagi mahasiswa, guru, dosen, serta praktisi pendidikan
yang lain, khususnya dalam melaksanakan penilaian pembelajaran kimia. Kami
menyadari buku ini jauh dari sempurna, sehingga perbaikan akan terus dilakukan
untuk perbaikan buku ini sebagai kontribusi pengembangan penelitian pendidikan di
Indonesia.

Jakarta, September 2017


Tim Penulis

3
BAB I
PENDAHULUAN

A. Pembelajaran Kimia.

Ilmu kimia adalah ilmu yang mempelajari materi, meliputi susunan, sifat-sifat dan
perubahannya, serta perubahan energi yang menyertai perubahan materi tersebut
(Chang, 2003). Kimia sebagai disiplin ilmu memiliki banyak konsep dan topik yang
bersifat abstrak sehingga umumnya siswa kesulitan dalam menghubungkan ilmu
kimia yang abstrak dengan keadaan konkrit yang riil. Konteks dalam pembelajaran
kimia cenderung kompleks, rumit, dan lebih banyak melibatkan keterkaitan
antarkonsep sehingga siswa cenderung membuat konsep yang lebih sederhana
agar mereka mudah memahaminya (Treagust, 2000).

Jika dikaji dalam sudut padang karakteristik ilmu kimia tersebut, maka menurut
American Society Chemistry (2012), terdapat empat big ideas yang harus terdapat
dalam pembelajaran kimia yang direpresentasikan pada tabel di bawah ini.

Tabel 1. Big Ideas dalam Pendidikan Kimia


Big Ideas Topik-topik penting yang terkait dengan Big
Ideas
Kekekalan Massa dan Energi  Atom-atom tidak dihancurkan/hilang dalam
(Conservation of matter and reaksi kimia, namun terjadi perubahan susunan
energy)  Bentuk-bentuk energi dan energy yang terjadi
dalam perubahan kimia
 Stoikiometri
 Persamaan reaksi kimia

Sifat dan Karakteristik Materi  Tabel periodik


(Behavior and properties of  Hukum gas
Matter)  Perbedaan unsur, senyawa, dan campuran
 Hukum-hukum Gas
 Ikatan kimia
 Gaya intermolekul
Particulate nature of matter  Gaya kinetik molekul
 Struktur atom, ion, dan molekul
Equilibrium and driving  Prinsip Le Chatelier’s
forces • Laju Reaksi
• Termodinamika (Entropi dan entalpi)
 Asam Basa
 Reaksi Reduksi Oksidasi

4
Selanjutnya jika dimapping maka sebaran konsep-konsep penting dalam
pembelajaran kimia dapat diuraikan sebagai berikut:

Gambar 2. Mapping Ruang Lingkup Materi Muatan Kimia


Struktur dan Karakteristik Materi Perubahan Materi

Senyawa
Ikatan
Organik Stoikiometri Energi-
Kimia
Termokimia
Reaksi
STRUKTUR Kimia
MATERI MATERI
Redoks &
PERUBAHAN Elektrokimia
KARAKTERISTIK MATERI
MATERI

Periodik Tabel
Klasifikasi Laju Termodinamika
Materi Reaksi

Larutan Atom-Struktur
 Asam Gas Atom Kesetimbangan
Basa Kimia
 Elektrolit
-non
elektrolit

Topik-topik penting ini diharapkan menjadi materi-materi yang dipresentasikan


dalam pembelajaran kimia, sehingga pencapaian kompetensi dalam pembelajaran
kimia dapat tercapai.

Ilmu kimia dianggap sulit bagi sebagian siswa. Kesulitan mempelajari kimia
disebabkan oleh kompeksnya perhitungan yang terlibat, bahasa yang jarang
digunakan dalam kehidupan sehari-hari, serta perbedaan level-level representasi
yang digunakan para ahli kimia dalam menjelaskan fenomena kimia (Gabel &
Bunce 1994 dalam Sheppard 2006). Fenomena kimia digambarkan dan dijelaskan
oleh para ahli kimia menggunakan level-level representasi yang meliputi
representasi makroskopik, mikroskopik, dan simbolik. Pada level Makroskopis,
penjelasan difokuskan pada kareakteristik kimia yang dapat diamati. Hal ini dapat
dilakukan ketika peserta didik mengamati fenomena nyata di laboratorium atau di
kehidupan sehari-hari. Pada level makroskopis meliputi perubahan warna,

5
temperatur, pH larutan, pembentukan gas, atau pembentukan endapan yang dapat
diamati selama reaksi kimia berlangsung. Contohnya, level makroskopis dari air
meliputi deskripsi fisik air pada berbagai temparatur. Pada level partikulat/ sub-
mikroskopis kimia diwakili dalam hal atom, molekul, dan ion pembentuknya
menggunakan gambar atau model molekul. Contohnya, pada level partikulat dari
air, Gabel, 2003 dalam Nyachwaya et al., 2010 menggambarkan sebagai kumpulan
molekul yang memiliki gaya tarik menarik dan terdiri dari partikel atom hidrogen dan
oksigen. Level simbolis digunakan untuk menjelaskan fenomena kimia makroskopis
secara simbolis. Pada level ini, sifat fisik dan perubahan kimia diwakili bahasa
simbol sehingga digunakan simbol-simbol kimia, mekanisme reaksi, analogi, grafik,
rumus kimia, dan persamaan matematis. Contohnya, level simbolis untuk air
menggunakan formula H2O.

Selanjutnya, Johnstone (1991) menganalogikan segitiga hubungan ketiga level


gambaran pengetahuan yang digunakan dalam kimia seperti gambar berikut,
Level makroskopis

Level simbolik Level sub-mikroskopis


Gambar 3. Tiga level representasi dalam kimia

Selain itu, Devetak dan Glažar (2001) menjelaskan ketergantungan ketiga level di
atas yang dihubungkan dengan pengetahuan konkrit dan abstrak.

Level
Makroskopis Visualisasi

Realitas
Sub
makroskopis Symbol
Level Penggambaran
level
realitas
Gambar 4. Keterkaitan antara tiga level representasi dalam kimia

Kemampuan menjelaskan hubungan ketiga level diatas juga dapat memperoleh


pengetahuan memori jangka panjang peserta didik.

6
Penggunaan ketiga level representasi dalam pembelajaran kimia memungkinkan
peserta didik lebih mudah mentrasfer pengetahuan yang sangat dipengaruhi oleh
gaya berpikirinya. Sehingga peserta didik dapat menjelaskan hal-hal umum dengan
baik dan hal ini dapat mengurangi miskonsepsi. Johnstone, 1991 menyebutkan
bahwa peserta didik tidak hanya harus mampu memahami ketiga level representasi,
namun juga perlu kemampuan menterjemahkan dan menghubungkan tiap tingkatan
dengan baik. Menurut penelitian (Treagust et al.,2003 dalam Nyachwaya et al.,
2010) tiga level representasi kimia menjadi bagian yang terintegrasi dan tidak
terpisahkan pada pemahaman konsep kimia. Selain itu, sangat penting untuk
memahami ketiga level representasi menjadi satu bagian utuh. Hal ini karena,
ketiganya menggambarkan dan menjelaskan fenomena yang saling berkaitan dan
dapat juga memudahkan pemahaman peserta didik.

Pembelajaran kimia selain fokus pada konsep materi itu sendiri juga harus dapat
memgembangkan keterampilan peserta didik dalam memahami aplikasi ilmu kimia
tersebut. Pembelajaran kimia harus dapat mengembangan pemahaman dan
perkembangan dalam bidang teknik, kedokteran, dan teknologi. Selanjutnya isu-isu
dan permasalahan yang berkaitan dengan inovasi dalam kimia, harus dapat
mengembangan pemahaman mengenai hubungan antara sains, teknologi, social
dan lingkungan. Pada akhirnya pembelajaran kimia harus dapat menciptakan
pembelajaran yang menarik dan relevan, sehingga pembelajaran kimia harus dapat
dikaitkan dengan kehidupan sehari-hari. Peserta didik diharapkan untuk
mengaplikasikan ilmu kimia yang mereka peroleh dalam aplikasinya dengan bidang
ilmu yang lain. Jika dilihat maka pembelajaran kimia, harus dapat membantu
peserta didik dalam:
a) Mengembangkan minat dan rasa ingin tahu terhadap kimia
b) Mengkonstruksi dan mengaplikasikan ilmu kimia dalam berbagai berbagai
bidang
c) Mengembangkan keterampilan scientific inquiry
d) Mengembangkan keterampilan berpikir saintifik, kritis, kreatif dan keterampilan
menyelesaikan masalah secara individu dan kolaboratif dalam hal yang terkait
dengan kimia
e) Mendiskusikan isu-isu terkait sains dengan menggunakan bahasa kimia
f) Memutuskan dan menilai isu-isu yang terkait dengan kimia
g) Berpikir terbuka, objektif, dan pro aktif
h) Memahami dan mengevaluasi implikasi kimia dalam aspek sosial, etika,
ekonomi, lingkungan, dan teknologi sebagai warga negara yang bertanggung
jawab.

Sehingga beberapa yang perlu diperhatikan dalam pengembangan pembelajaran


kimia, yaitu pengetahuan awal, keluasan dan kedalaman materi, teori dan aplikasi,
Learning how to learn dan inquiry-based learning, level kompetensi, persiapan
dunia kerja, keterkaitan dengan bidang lain, dan terkait dengan kehidupan sehari-
hari.
Kimia lahir dan berkembang berdasarkan observasi dan eksperimentasi.
Pengetahuan yang berupa konsep-konsep kimia diperoleh dengan metode tertentu
dan dikembangkan melalui pengamatan(observasi), dan eksperimentasi. Penting
untuk diketahui, dalam eksperimentasi inilah terletak metoda kimia. Jadi dalam
7
kimia ada dua aspek yang harus diperhatikan yaitu pengetahuan dan metode
memperoleh pengetahuan tersebut. Metode untuk bereksperimentasi dalam
memperoleh pengetahuan inilah yang dikenal dengan metode kimia, yaitu suatu
proses atau kegiatan dengan ciri-ciri dan tata cara yang khas, yang populer dikenal
dengan istilah metode ilmiah.

Bertolak pada ciri khas dimaksud di atas, perlu diketahui apakah yang dimaksud
dengan observasi ( pengamatan) dan eksperimen. Observasi adalah kegiatan
menggunakan alat indera untuk memperoleh kesan atau persepsi tentang suatu
obyek yang akan diamati. Sedangkan eksperimentasi merupakan suatu kegiatan
ilmiah untuk menemukan hukum-hukum, konsep-konsep baru dalam ilmu
pengetahuan. Jadi hakekat belajar kimia adalah kimia sebagai hasil dan proses, di
mana keduanya saling terkait, sebab hasil merupakan akibat dari proses yang
dilakukan.

Oleh karena itu dalam proses pembelajaran kimia, guru hendaknya melaksanakan
kegiatan belajar mengajar dengan mengembangkan ketrampilan-ketrampilan dasar
yang dimiliki anak didiknya. Belajar dengan keterampilan proses memungkinkan
siswa mempelajari fakta, konsep yang menjadi tujuan belajar kimia, sikap Ilmiah,
dan sikap kritis.

Dewasa ini para guru masih ada yang melakukan proses pembelajaran IPA hanya
memberikan fakta dan konsep-konsep, dengan demikian guru bertindak sebagai
satu-satunya sumber informasi dengan menggunakan metode ceramah. Akibatnya
para siswa memiliki banyak pengetahuan tetapi tidak dilatih untuk menemukan
pengetahuan, tidak dilatih untuk menemukan konsep dan tidak dilatih untuk
mengembangkan ilmu pengetahuan. Latihan soal dan praktikum hanya
memantapkan pengetahuan fakta dan konsep dengan jalan pengulangan dan
penerapan sederhana. Test sebagai alat penilaian hanya dilakukan untuk
mengetahui apakah konsep dan fakta-fakta itu diketahui dan dipahami, dimana hasil
belajar yang diperoleh siswa setelah mengalami pengalaman belajar kimia
cenderung berupa ingatan dan hafalan-hafalan.

Dengan semakin cepatnya perkembangan ilmu pengetahuan makin banyak fakta


dan konsep yang harus dipelajari. Sedangkan jika kita perhatikan dengan seksama,
kebanyakan ilmuwan justru memperoleh penemuan-penemuan baru tanpa
menguasai semua fakta dan konsep yang terhimpun dalam suatu cabang atau
disiplin ilmu. Sebenarnya yang mereka lakukan adalah menumbuhkan dan
mengembangkan salah satu bidang sampai mereka menguasai keterampilan
tertentu. Malahan penguasaan fakta dan konsep yang terlalu banyak dan
mendalam justru menghambat daya ciptanya untuk menemukan hal-hal baru
Conny S. 1985).

8
Memperhatikan ciri-ciri yang dikemukakan di atas, salah satu cara pembelajaran
kimia adalah memberikan peluang kepada siswa untuk mengadakan kontak dengan
benda-benda, kejadian-kejadian atau proses-proses yang terjadi di alam sekitarnya.
Dengan adanya kontak langsung antara siswa dengan hal-hal tersebut tadi akan
menumbuhkan aktifitas dengan dilakukannya observasi, eksperimen, dan
manipulasi benda-benda atau suatu obyek tertentu. Dengan adanya kontak itu akan
muncul rasa ingin tahu dan tidak dapat dihindari munculnya berbagai pertanyaan
serta usaha-usaha untuk memberi jawaban atas pertanyaan-pertanyaan yang
timbul karena rasa keingin tahuannya. Untuk memuaskan rasa keingintahuannya
maka sudak dapat dipastikan timbul masalah-masalah yang dihadapi, sekaligus
usaha-usaha pemecahan berbagai masalah yang timbul tadi dan tidak menutup
kemungkinan timbulnja masalah baru. Kondisi pembelajaran yang demikian,
wawasan siswa terus berkembang sehingga rasa ingin tahunya pun berkembang
pula. Pembelajaran kimia yang demikian, diperlukan suatu pendekatan yang dapat
menumbuhkan, mengembangkan sampai siswa menguasai sejumlah kemampuan-
kemapuan atau keterampilan fisik dan mental untuk mengamati, menyelidiki dan
mempelajari lingkungan alam yang ada disekitarnya. Pendekatan inilah yang
dikenal dengan pendekatan ketrampilan proses.

Lebih lanjut Herbet Vonsen (1986) mengemukakan bahwa ilmu kimia sebagai
bagian dari ilmu pengetahuan alam, maka didalam pembelajarannya harus ada
aktifitas yang menunjukkan siswa terlibat dalam proses , seperti observasi,
eksperimen atau pengambilan kesimpulan. Tugas mendidik yang diberikan kepada
ilmu kimia ditentukan pada metode dan cara berfikir secara ilmiah yang ditunjukkan
pada contoh kimia. Pada pembelajaran kimia tidak selalu diharuskan
menyampaikan konsep, teori, dan hukum, yang sudah ada (sudah ditemukan
sebelumnya). Selain itu Conny S (1985) mengemukakan bahwa tugas guru
bukanlah memberikan pengetahuan, melainkan menyiapkan situasi yang mnggiring
anak untuk bertanya, mengamati, mengadakan eksperimen, serta menemukan
fakta dan konsep sendiri .

Apabila kita perhatikan pendapat para ahli tersebut, maka seorang guru kimia harus
dapat menyiapkan situasi/kondisi dalam proses pembelajaran yang dapat
menggiring siswa dalam mengembangkan kemampuan-kemampuan yang
mendasar melalui pengalaman belajar sebagaimana para ilmuwan bekerja.
Sehingga diperoleh hasil belajar siswa yang berupa kemampuan kognitif, afektif dan
psikomotorik.

9
B. Evaluasi dalam Pembelajaran Kimia.

Mencermati uraian di atas seorang guru kimia dalam kegiatan pembelajaran kimia
haruslah memahami tiga aspek yang mendasar yaitu :
1. Metode Ilmiah
2. Aplikasi metode Ilmiah dalam pembelajaran kimia
3. Bagaimana menilai hasil belajar kimia.

Kita harus dapat membedakan antara metode ilmiah dengan metode mengajar
kimia. Seorang guru kimia harus memahami metode ilmiah sebelum ia dapat
mengajar kimia dengan baik. Karena mengajar kimia itu tidak hanya memberikan
informasi ilmiah atau pengetahuan tentang kimia kepada siswa, tetapi juga harus
melatih siswa bekerja sebagaimana para ilmuwan bekerja.

Sebagaimana diketahui bahwa hasil belajar sangat berkaitan erat dengan proses
pembelajaran, pembelajaran kimia tidak hanya disampaikan dalam bentuk teori,
namun disampaikan dalam bentuk praktikum di laboratorium. Pengalaman belajar
yang diperoleh akan berdampak pada perkembangan potensi kemampuan
intelektual saja, tetapi ketrampilan dan sikap. Lebih lanjut, Benyamin dan Bloom
dalam ”Taxonomi of Educational Obyectives ” mengatakan bahwa perubahan-
perubahan yang diharapkan dari pengalaman belajarnya :
1. Perubahan dalam kemampuan inteleknya ( Cognitive Domain)
2. Perubahan dalam sikapnya (Affective Domain
3. Perubahan dalam ketrampilan (Psyhomotor Domain).

Tujuan-tujuan pembelajaran tersebut harus dapat dinilai, apakah seorang siswa


telah mencapai tujuan ataukah belum, dapat diukur dengan mengamati perilaku
atau menilai hasil belajarnya dengan menggunakan test, baik lisan atau tulisan
untuk mengetahui apakah siswa tersebut mampu memperlihatkan perubahan
tingkah laku, sebagai akibat dari pengalaman belajarnya.

Dalam prakteknya penilaian hasil belajar, pada umumnya masih terdapat


kecenderungan dilakukan dengan alat ukur berupa test yang hanya menilai
perkembangan kognitif saja. Akan tetapi penilaian bidang ketrampilan
(psikomotorik) dan sikap (afektif) belum sepenuhnya terjangkau. Siswa dapat
dikatakan memahami kimia, apabila ia dapat menyatakan pendapatnya dalam
bentuk lisan, dapat menunjukkan ketrampilannya dan penguasannya dalam
menggunakan alat-alat, mampu merancang, meramalkan/prediksi, membuat
hipotesis, dan melaksanakan percobaan/ eksperimentasi. Karena itu penilaian
pembelajaran kimia dilakukan dengan berbagai cara, sehingga diperoleh data yang
valid untuk menilai hasil belajar. Untuk selanjutnya masalah penilaian ini akan
dibahas pada bab selanjutnya.

10
BAB II
TINJAUAN UMUM PENILAIAN PEMBELAJARAN

A. Pengertian Penilaian

Penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan


informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan
instrumen tes maupun non-tes. Jadi maksud penilaian adalah memberi nilai
tentang kualitas sesuatu. Tidak hanya sekedar mencari jawaban terhadap
pertanyaan tentang apa, tetapi lebih diarahkan kepada menjawab pertanyaan
bagaimana atau seberapa-jauh sesuatu proses atau suatu hasil yang diperoleh
seseorang atau suatu program. Penilaian di sini diartikan sebagai padanan kata
evaluasi.
Untuk memperjelas pengertian penilaian (evaluasi) tersebut ada baiknya bila dikutip
beberapa pemmusan sebagai berikut:
a. Adams (1964) dalam bukunya "Measurement and evaluation in education,
psychology, and guidance" menjelaskan bahwa kita mengukur berbagai
kemampuan anak didik. Bila kita melangkah lebih jauh lagi dalam
menginterpretasi skor sebagai hasil pengukuran itu dengan menggunakan
standar tertentu untuk menentukan nilai dalam suatu kerangka maksud
pendidikan dan pelatihan atau atas dasar beberapa pertimbangan lain untuk
membuat penilaian, maka kita tidak lagi membatasi diri kita dalam pengukuran,
kita sekarang telah mengevaluasi kemampuan atau kemajuan anak didik.
b. Daniel L. Stufflebeam dan Anthony J. Shinkfield (1985) secara singkat
merumuskan evaluasi sebagai berikut: "Evaluation is the systematic
assessment of the worth or merit of some objects". Dengan demikian maka
evaluasi antara lain merupakan kegiatan membandingkan tujuan dengan hasil
dan juga merupakan studi yang mengkombinasi kan penampilan dengan suatu
nilai tertentu.
c. Robert L. Thorndike dan Elizabeth Hagen (1961) menjelaskan evaluasi
tersebut dengan mengatakan bahwa evaluasi itu berhubungan dengan
pengukuran. Dalam beberapa hal evaluasi lebih luas, karena dalam evaluasi
juga termasuk penilaian formal dan penilaian intuitif mengenai kemajuan
peserta didik. Evaluasi juga mencakup penilaian tentang apa yang baik dan
apa yang diharapkan. Dengan demikian hasil pengukuran yang benar
merupakan dasar yang kokoh untuk melakukan penilaian.
Secara garis besar penilaian dapat dibagi menjadi dua, yaitu penilaian formatif dan
penilaian sumatif (istilah ini pertama kali digunakan oleh Scriven (1967) dalam
artikelnya berjudul "The Methodology of evaluation". Penilaian formatif dilakukan
dengan maksud memantau sejauh manakah suatu proses pendidikan telah berjalan
sebagaimana yang direncanakan. Sedangkan penilaian sumatif dilakukan untuk
mengetahui sejauhmana peserta didik telah dapat berpindah dari suatu unit
pengkuliah ke unit berikutnya.
Dari uraian singkat mengenai pengertian tes, pengukuran, dan evaluasi di atas
dapat disimpulkan bahwa ketiga hal tersebut saling berhubungan satu dengan yang
11
lain. Penilaian hasil belajar baru dapat dilakukan dengan baik dan benar bila
menggunakan informasi yang diperoleh melalui pengukuran hasil belajar, yang
menggunakan tes sebagai alat ukurnya. Tentu saja tes hanya merupakan salah
satu alat yang dapat digunakan. Dapat saja informasi tentang hasil belajar tersebut
diperoleh tanpa menggunakan tes sebagai instrumen ukumya. Misalnya dapat
digunakan alat ukur nontes, seperti observasi, skala rating, dan lain-lain.

Agar dalam melaksanakan penilaian pembelajaran, dapat dicapai sasaran


sebagaimana dikehendaki, maka akan disampaikan terlebih dahulu apa yang
dimaksud dengan penilaian itu, sehingga kita mempunyai gambaran tentang apa
yang akan dinilai dan sekaligus dapat mengetahui manfaat apa yang akan diperoleh
dari penilaian itu.

Tanpa kita sadari bahwa setiap saat kita selalu melakukan pekerjaan penilaian,
pekerjaan ini dimaksudkan untuk menjawab apakah pekerjaan yang kita lakukan
mencapai hasil atau tidak. Dalam kegiatan pembelajaran penilaian ini sering muncul
istilah yang cukup membingungkan yaitu pengukuran,penilaian, dan evaluasi.
Sebagian orang lebih cenderung mengartikan penilaian berbeda dengan evaluasi,
dan sebagian lainnya cenderung berpendapat bahwa penilaian itu sama dengan
evaluasi, yang merupakan terjemahan dari bahasa inggris evaluation.

Pengukuran menururt Guilford (1982) adalah proses penempatan angka terhadap


suatu gejala menurut aturan tertentu. Disini pengukuran dapat bersifat kuantitatif
hasilnya berupa angka, dan dapat besifat kualitatif hasilnya dinyatakan dengan
pernyataan kualitatif yaitu : sangat baik, baik, cukup, kurang, sangat kurang dan
sebagainya. Griffin dan Nix (1991) mendefinisikan penilaian adalah suatu
pernyataan berdasarkan sejumlah fakta untuk menjelaskan karakteristik seseorang
atau sesuatu. Lebih lanjut definisi penilaian berhubungan dengan setiap setiap
bagian dari proses pendidikan, bukan hanya keberhasilan belajar saja, tetapi
mencakup semua proses mengajar dan belajar. Kegiatan penilaian oleh karenanya
tidak hanya terbatas pada karakteristik peserta didik saja, tetapi juga mencakup
karakteristik metode mengajar, kurikulum, fasilitas dan administrasi
sekolah.(Depdiknas, Pedoman umum Pengembangan Kurikulum, 2004)

Menurut Anwar (2002) penilaian dalam pendidikan pada prinsipnya adalah usaha
memperoleh data atau informasi untuk menetapkan suatu keputusan apakah
mahasiswa dianggap telah mencapai hasil sesuai yang diharapkan. Selanjutnya
Nitko(1996) mengemukakan penilaian adalah proses mendapatkan informasi yang
digunakan untuk mengambil suatu keputusan tentang mahasiswa, kurikulum,
program dan kebijakan pendidikan. Dari hasil penilaian yg dilakukan, akan diproleh
informasi sejauh mana efektifitas dan efesiensi dalam pencapaian tujuan
pembelajaran. Oleh karena itu penilaian hasil belajar siswa yang mencakup
perubahan tingkah laku pada aspek kognitif, afektif dan psikomotorik dengan proses
12
pembelajaran saling berkaitan satu sama lain sebab hasil merupakan akibat dari
proses pembelajaran yang dilakukan.

Penilaian (Sumarna S. 2004) merupakan salah satu kegiatan yang dilakukan untuk
mengukur dan menilai tingkat pencapaian kurikulum. Penilaian juga digunakan
untuk mengetahui kekuatan dan kelemahan yang ada dalam proses pembelajaran,
sehingga dapat dijadikan dasar untuk pengambilan dasar keputusan, misalnya
apakah proses pembelajaran sudah baik,dan dapat dilanjutkan atau masih perlu
perbaikan dan penyempurnaan. Oleh karena itu guru harus dapat menguasai materi
yang terdapat dalam kurikulum, metode pembelajaran dan menguasai berbagai
aspek dalam penilaian.

Agar kita dapat memperoleh pengertian antara ketiganya perhatikanlah contoh


sederhana dibawah ini :
Jika seseorang ingin membeli papan dengan ukuran panjang 4 m, lebar 30 cm, dan
ketebalan papan 2 cm misalnya. Untuk mencapai tujuan ini tentu saja orang
tersebut pergi ke toko bahan bangunan dan melakukan hal-hal sebagai berikut :
a. Mengukur, yaitu membandingkan papan-papan yang tersedia dengan ukuran
yang dikehendaki. Setelah diukur dengan alat ukur yang cermat dan teliti akan
diperoleh papan sesuai dengan yang dilkehendakinya. Ukuran inilah yang
dinamakan kriteria, dan pengukuran yang dilakukan bersifat kuantitatif.
b. Menilai, yaitu mengambil keputusan terhadap papan-papan yang menurut
kriteria ukuran yang dikendaki dengan ukuran baik, jelek, layak dan lain
sebagainya. Ukuran ini merupakan ukuran kriteria pula tetapi sifatnya kualitatif.
c. Mengadakan evaluasi, meliputi kedua langkah di atas yaitu mengukur dan
menilai untuk memperoleh informasi yang digunakan dalam membuat
keputusan.

Dari contoh di atas, untuk mengadakan penilaian yang sistematis, kita harus
mengadakan langkah yang mendahuluinya yaitu pengukuran atau measurement.
Dengan demikian penilaian itu adalah tindakan/kegiatan menilai tetapi dilakukan
dengan mengukur terlebih dahulu dengan ukuran yang bersifat kuantitatif untuk
selanjutnya diinterpretasi. Jadi ada tiga istilah yang terkait dengan konsep penilaian
yang sering digunakan untuk mengetahui keberhasilan belajar peserta didik, yaitu
pengukuran yang bersifat kuantitatif, penilaian yang bersifat kualitatif,dan evaluasi
sehingga diperoleh informasi untuk membuat keputusan.

Di dalam kegiatan pembelajaran terdapat tiga unsur penting yaitu tujuan


pembelajaran, proses pembelajaran dan hasil belajar, ketiga unsur tersebut saling
berhubungan satu sama lain yang dapat digambarkan dalam suatu diagram
sebagai berikut :

13
Tujuan Pembelajaran

(a) (b)

Proses Hasil Belajar


Pembelajaran (c)
(pengalaman belajar)

Dari gambar di atas, kegiatan penilaian dinyatakan oleh garis (c) yakni suatu
tindakan atau kegiatan untuk melihat sejauh mana tujuan-tujuan pembelajaran telah
dapat dicapai oleh siswa dalam bentuk hasil belajar yang diperlihatkannya setelah
siswa melalui pengalaman belajarnya (menempuh proses pembelajaran)
Sedangkan garis (b) merupakan kegiatan penilaian untuk mengetahui seberapa
efektif dan produktifnya proses pembelajaran dalam mencapaian tujuan
pembelajaran dalam bentuk hasil belajar. Sedangkan garis (a) yaitu suatu kegiatan
penilaian untuk mengetahui sejauh mana pencapaian tujuan pembelajaran.

Jika kita perhatikan dari garis a, b dan c tersebut di atas, ruang lingkup sasaran
penilaian pendidikan itu mencakup tiga sasaran pokok yaitu :
a. Penilaian program pengajaran, yaitu penilaian terhadap program pengajaran
yang meliputi tiga hal, yaitu penilaian terhadap tujuan pengajaran, penilaian
terhadap isi program pengajaran, dan penilaian terhadap strategi belajar dan
mengajar.
b. Sebagai feed-back atau umpan balik bagi perbaikan proses pembelajaran.
Kemungkinan perbaikan dapat dilakukan pada tujuan pembelajaran, kegiatan
belajar siswa, pembelajaran keterampilan proses, strategi mengajar guru,
sarana dan lain sebagainya.
c. Sebagai dasar untuk membuat laporan tentang kemajuan siswa kepada
orang tua atau kepada siswa itu sendiri. Dalam laporan tersebut disajikan
kemampuan dan kecakapan belajar siswa dalam berbagai bidang studi dalam
bentuk nilai-nilai prestasi yang dicapai oleh siswa.

Berdasarkan fungsi penilaian sebagaimana disebutkan di atas dapat dikemukakan


tujuan penilaian, yaitu antara lain :
a. Untuk mendiskripsikan kecakapan belajar siswa sehingga dapat diketahui
kekurangan dan kelebihannya. Dengan mendiskripsikan kecakapan tersebut

14
dapat diketahui pula posisi kemampuan siswa dibandingkan dengan siswa
lainnya.
b. Untuk mengetahui keberhasilan proses pendidikan dan pembelajaran di
sekolah yakni seberapa keefektifan dan produktifnya kegiatan belajar siswa,
strategi mengajar, tujuan pembelajaran dan lain-lainnya.
c. Menindak lanjuti hasil penelitian, yaitu melakukan perbaikan dan
penyempurnaan dalam hal program pendidikan dan pengajaran serta strategi
pelaksanaannya. Perlu untuk diperhatikan, kegagalan siswa dalam hasil
belajar yang diperolehnya, hendaknya kegagalan itu tidak dipandang sebagai
kekurangan pada diri siswa semata-mata, tetapi harus dilihat pula dari
kekurangan-kekurangan pada program pengajaran yang diberikan. Bisa jadi
kesalahan terletak pada strategi dalam melaksanakan program, tidak tepatnya
metode mengajar yang dipergunakan dan alat bantu pengajaran yang dipakai
kurang tepat misalnya.
d. Memberikan pertanggungjawaban dari pihak sekolah sebagai penyelenggara
pendidikan, kepada pihak-pihak yang berkepentingan yaitu pemerintah dalam
hal ini adalah Depdiknas dan kepada masyarakat serta kepada orang tua
siswa. Lazimnya pertanggungjawaban kepada masyarakat dan orang tua
disampaikan melalui laporan kemajuan siswa yaitu dalam bentuk rapor pada
setiap akhir program, semester dan catur wulan.

Dari penjelasan di atas terdapat mata rantai yang tidak terpisahkan antara program
pengajaran, proses pembelajaran dan hasil belajar. Oleh karena itu untuk
melakukan penilaian yang sistematis harus bertumpu pada tiga unsur tersebut yang
saling berkaitan. Hasil belajar siswa yang tidak sesuai dengan harapan misalnya,
hal ini bisa terjadi bukan karena kesalahan siswa. Akan tetapi karena guru tidak
dapat melaksanakan proses pembelajaran yang menjadikan siswa belajar, atau
bisa jadi program pengajarannya yang harus ditinjau kembali. Untuk uraian
selanjutnya akan dibatasi hanya pada penilaian hasil belajar dan proses
pembelajaran.

Dilihat dari fungsi penilaian pembelajaran sebagaimana disebutkan pada uraian


sebelumnya dikenal beberapa jenis penilaian terhadap hasil belajar yaitu :
a. Penilaian formatif, yaitu penilaian yang dilaksanakan pada akhir program
belajar mengajar, dilaksanakan dalam rangka untuk melihat tingkat
keberhasilan proses pembelajaran. Penilaian formatif berorientasi kepada
proses belajar mengajar, oleh karena itu penilaian formatif diharapkan guru
dapat memperbaiki program pengajaran dan strategi pelaksanaannya. Dan
bagi siswa dapat digunakan untuk mengetahui apakah siswa sudah menguasai
bahan program secara menyeluruh. Dengan mengetahui hasil penilaian
formatif siswa dapat dengan jelas mengetahui bagian mana dari bahan
pelajaran yang masih dirasakan sulit.

15
b. Penilaian sumatif, adalah penilaian yang dilaksanakan pada akhir unit
program, yaitu akhir catur wulan, akhir semester, dan akhir tahun. Penilaian ini
berorientasi kepada produk bukan kepada hasil. Oleh karena itu tujuan
penilaian ini adalah untuk melihat hasil yang dicapai oleh para siswa.
c. Penilaian diagnostik, adalah penilaian yang bertujuan untuk melihat
kelemahan-kelemahan siswa serta faktor penyebabnya, sehingga berdasarkan
kelemahan-kelamahan yang ditemukan dan kedua faktor penyebabnya dapat
dilakukan tindakan dan pemberian perlakuan yang tepat. Perlakuan yang
diberikan tersebut dapat berupa bimbingan belajar, pengajaran remidial,
menemukan kasus-kasus dan lain-lainnya.
d. Penilaian penempatan, penilaian ini dilakukan dengan tujuan untuk
mengetahui keterampilan prasyarat yang diperlukan bagi suatu program
belajar seperti yang diprogramkan sebelum memulai kegiatan belajar untuk
program itu. Penilaian penempatan berorientasi kepada kesiapan siswa untuk
menghadapi program baru dan kecocokan antara kemampuan siswa dengan
program belajar.

Tes
Tes dapat didefinisikan sebagai suatu pertanyaan atau tugas atau seperangkat
tugas yang direncanakan untuk memperoleh informasi tentang trait atau atribut
pendidikan atau psikologik yang setiap butir pertanyaan atau tugas tersebut
mempunyai jawaban atau ketentuan yang dianggap benar. Dengan demikian maka
setiap tes menuntut keharusan adanya respon dari subyek (orang yang di tes) yang
dapat disimpulkan sebagai suatu trait yang dimiliki oleh subyek yang sedang dicari
informasinya. Jadi bila ada tugas atau pertanyaan yang harus dikerjakan oleh
seseorang tetapi tidak ada jawaban atau cara mengerjakan yang benar atau salah,
atau suatu usaha pengukuran yang tidak mengharuskan subyek untuk menjawab
atau mengerjakan suatu tugas, maka itu bukanlah tes.
Berikut ini dikutip beberapa definisi tes menurut beberapa penulis:
a. Test is a measure countaining a set of questions, each of which can be said
have a correct answer. (Ebel & Frisbie, 1986).
b. Test: Any planned, intrusive procedure or series of tasks used to obtain
observations. (Sax, 1980).
c. Test often connotes the presentation of a standard set of questions to be
answered. (Mehrens & Lehmann, 1973).
Tes dapat dipilah-pilah ke dalam berbagai kelompok. Bila dilihat konstruksinya
maka tes dapat diklasifikasikan sebagai berikut:
a. menurut bentuknya: Secara umum ada-dua bentuk tes, yaitu butir tes bentuk
uraian (essay test) dan butir tes bentuk objektif (objective test). Dua bentuk
butir tes ini dapat dipilah lagi ke dalam berbagai tipe.
b. menurut tipenya: Butir tes uraian dapat diklasifikasi ke dalam dua tipe, yaitu
tes uraian terbatas (restricted essay), dan tes uraian bebas (extended essay).
Butir tes objektif menurut tipenya dapat dibagi menjadi tiga, yaitu tes benar-

16
salah (true-false), butir tes menjodohkan (matching), dan butir tes pilihan
ganda (multiple choice),
c. menurut ragamnya: Tiap tipe tes tersebut dalam butir b di atas dapat dipilah
lagi ke dalam ragam butir tes, yaitu:
1) tipe tes uraian terbatas:
a) ragam tes jawaban singkat
b) ragam tes melengkapi
c) ragam tes uraian terbatas sederhana
2) tipe tes uraian bebas:
a) ragam tes uraian bebas sederhana
b) ragam tes uraian ekspresif
3) tipe tes objektif benar salah
a) ragam benar salah sederhana
b) ragam benar salah dengan koreksi
4) Tes tipe objektif menjodohkan
a) ragam menjodohkan sederhana
b) ragam menjodohkan hubungan sebab akibat
5) tipe tes objektif pilihan ganda:
a) ragam pilihan ganda biasa
b) ragam pilihan ganda hubungan antar hal
c) ragam pilihan ganda analisis kasus
d) ragam pilihan ganda kompleks
e) ragam pilihan ganda membaca diagram

Pengukuran
Pengukuran diartikan sebagai pemberian angka kepada suatu atribut atau
karakteristik tertentu yang dimiliki oleh orang, hal, atau objek tertentu menurut
aturan atau formulasi yang jelas. Misalnya untuk mengukur tinggi atau berat
seseorang dengan mudah kita memahami karena aturannya telah diketahui secara
umum. Tetapi untuk mengukur pendengaran, penglihatan atau kepekaan seseorang
jauh lebih kompleks dari itu, dan tidak semua orang dapat memahaminya. Dalam
kegiatan seperti ini mungkin saja aturan dan formulasi yang diikuti tidak lagi
sederhana. Dalam melakukannya harus diikuti seperangkat aturan atau formulasi
yang disepakati secara umum oleh para ahli. Kegiatan pengukuran itu menjadi lebih
kompleks lagi bila akan mengukur karakteristik psikologik seseorang, seperti
kecerdasan, kematangan, atau kepribadian. Dalam hal yang terakhir ini tidak semua
orang dapat memahaminya, dan tentu saja tidak semua orang dapat
melakukannya. Karena memang pengukuran itu menuntut keahlian dan latihan
tertentu.
Demikian juga halnya dengan pengukuran dalam bidang pendidikan. Kita hanya
mengukur atribut atau karakteristik peserta didik tertentu, bukan peserta didik itu
sendiri. Dosen dapat mengukur penguasaan peserta pendidikan dalam suatu mata
kuliah tertentu atau kemampuan dalam melakukan suatu keterampilan tertentu yang
telah dilatih, tetapi tidaklah mengukur peserta didik itu sendiri. Pengukuran
pendidikan adalah salah satu pekerjaan profesional guru, instruktur atau dosen.
17
Tanpa kemampuan melakukan pengukuran pendidikan, seorang guru atau dosen
tidak akan dapat mengetahui dengan persis di mana ia berada pada suatu saat
atau pada suatu kegiatan.
Berikut ini akan dikutip beberapa definisi pengukuran yang dirumuskan oleh
beberapa ahli pengukuran pendidikan dan psikologi yang acapkali dijadikan acuan
beberapa penulis.
a. Richard H. Lindeman (1967) merumuskan pengukuran sebagai "The
assignment of one or a set of numbers to each of a set of persons or objects
according to certain established rules".
b. Norman E, Gronlund (1971) secara sederhana merumuskan pengukuran
sebagai "Measurement is limited to quantitative descriptions of pupil behavior".
c. Georgia S. Adams (1964) merumuskan pengukuran sebagai "Nothing more
than careful observations of actual performance under standard conditions",
d. Victor H. Noll (1957) mengemukakan dua karakteristik utama
pengukuran, yaitu "quantitativeness" dan "constancy of units". Atas dasar dua
karakteristik ini ia menyatakan "Since measurement is a v quantitative
process,, the results of measurement are always expressed in numbers,
e. William A. Mehrens dan Irvin J. Lehmann (1973) mendefinisikan
pengukuran sebagai berikut: "Using observations, rating scales, or any other
device that allows us to obtain information in a quantitative form is
measurement",
f. Robert Li Ebel dan David A. Frisbie (1986) merumuskan pengukuran sebagai
"Measurement is a process of assigning numbers to the individual members of
a set of objects or person for the purpose of indicating differences among them
in the degree to which they possess the characteristic being measured.
g. Gilbert Sax (1980) menyatakan "Measurement: The assignment of numbers
to attributes of characteristics of persons, events, or objects according to
explicit formulations or rules".
Dari definisi yang telah dikemukakan di atas terdapat dua karakteristik pengukuran
yang utama, yaitu (1) penggunaan angka atau skala tertentu, dan (2) menurut suatu
aturan atau formula tertentu.
Karena pengukuran menggunakan angka atau skala tertentu, maka untuk lebih
memahami penggunaan angka atau skala tersebut kepada para dosen dituntut
untuk mengetahui dan memahami karakteristik angka atau skala. Skala atau angka
itu dapat diklasifikasi kedalam 4 (empat) kategori, yaitu : (1) skala nominal, yaitu
skala yang bersifat katagorikal. Misalnya, bila sebutir soal dapat dijawab benar oleh
mahasiswa, maka ia mendapat skor 1 (satu), jika ia menjawab salah maka ia
memperoleh skor 0 (nol). (2) Skala ordinal, yaitu angka yang menunjukkan adanya
urutan, tanpa mempersoalkan jarak antar urutan tersebut. Misalnya, angka yang
menunjuk urutan ranking mahasiswa dalam suatu mata kuliah tertentu. Mahasiswa
yang memperoleh ranking 1 (satu) tidak berarti dua kali lebih pandai dari
mahasiswa ranking 2 (dua). Jarak kepandaian mahasiswa ranking 1 dengan
ranking 2 tidak sama dengan jarak kepandaian mahasiswa ranking 2 dengan
ranking 3, dan seterusnya. (3) Skala atau angka interval, yaitu angka yang
menunjukkan adanya jarak yang sama dari angka yang berurutan. Misalnya, angka
Km untuk mengukur jarak. Jarak antara Km 1 dengan Km 2 sama dengan jarak

18
antara Km 3 dengan Km 4, dan seterusnya. (4) Skala atau angka rasio, yaitu angka
yang memiliki semua karakteristik angka atau skala yang terdahulu dan ditambah
dengan satu karakteristik lagi, yaitu skala tersebut berlanjut terus ke atas dan ke
bawah. Jadi memiliki nol mutlak. Misalnya, tinggi badan seorang. Bila ada tinggi
badan manusia 75 cm dan yang lainnya 150 cm, maka tinggi yang pertama
setengah dari yang kedua, atau manusia kedua 2 kali lebih tinggi dari yang
pertama. Sebaliknya seseorang yang memiliki IQ: 70 dan yang lain IQ: 140, tidak
dapat dikatakan orang kedua dua kali lebih cerdas dari yang pertama, karena skala
IQ adalah skala interval.

Kegunaan Tes, Pengukuran dan Penilaian dalam Pendidikan.


Ada beberapa alasan untuk menggunakan pengukuran, tes, dan penilaian dalam
pendidikan, antara lain:
a. Seleksi
Tes dan beberapa alat pengukuran digunakan untuk mengambil keputusan
tentang orang yang akan diterima atau ditolak dalam suatu proses seleksi. Untuk
dapat memutuskan penerimaan atau penolakan ini maka haruslah digunakan tes
yang tepat, yaitu tes yang dapat meramalkan keberhasilan atau kegagalan
seseorang dalam suatu kegiatan tertentu pada masa yang akan datang dengan
resiko yang terendah. Tes jenis ini banyak terjadi dalam masyarakat kita, karena
hampir selalu terjadi peminat untuk pekerjaan atau pendidikan jauh lebih banyak
dari yang dibutuhkan. Dilihat dari segi ini, maka acapkali tes seleksi yang dilakukan
hanya sekedar untuk memisahkan orang yang akan diterima dari orang yang akan
ditolak. Bukan untuk memperoleh calon yang paling besar kemungkinan berhasil
dalam pekerjaan atau program yang akan dilakukan.

b. Penempatan
Dalam pelaksanaan kursus atau latihan yang singkat biasanya dilakukan tes
penempatan, untuk menentukan tempat yang paling cocok bagi seseorang untuk
dapat berprestasi dan berproduksi secara efisien dalam suatu proses pendidikan
atau pekerjaan. Tes seperti ini terutama didasarkan pada informasi tentang apa
yang telah dan apa yang belum dikuasai oleh seseorang.
c. Diagnosis dan remedial
Tes seperti ini terutama untuk mengukur kekuatan dan kelemahan seseorang dalam
kerangka memperbaiki penguasaan atau kemampuan dalam suatu program
pendidikan tertentu. Jadi sebelum dilakukan remedial, seharusnya didahului dengan
suatu tes diagnosis.
d. Umpan balik
Hasil suatu pengukuran atau skor tes tertentu dapat digunakan sebagai umpan
balik, baik bagi individu yang menempuh tes maupun bagi dosen atau instruktur
yang berusaha mentransfer kemampuan kepada mahasiswa. Suatu skor tes dapat
digunakan sebagai umpan balik, bila telah diinterpretasi. Setidak-tidaknya ada dua
19
cara menginterpretasi skor tes. yaitu dengan membandingkan skor seseorang
dengan kelompoknya yang kedua dengan melihat kedudukan skor yang diperoleh
seseorang dengan kriteria yang ditentukan sebelum tes di mulai.
Untuk yang pertama dinamakan "norm reference test" dan yang kedua dinamakan
"criterion reference test".
e. Memotiuasi dan membimbing belajar
Hasil tes seharusnya dapat memotivasi belajar mahasiswa. dan juga dapat menjadi
pembimbingan bagi mereka untuk belajar. Bagi mereka yang memperoleh skor
yang rendah seharusnya menjadi cambuk untuk lebih berhasil dalam tes yang akan
datang dan secara tepat dapat mengetahui di wilayah mana terletak kelemahannya.
Dan bagi mereka yang mendapat skor yang tinggi tentu saja hasil itu dapat menjadi
motivasi mempertahankan dan meningkatkan hasilnya, serta dapat menjadi
pedoman dalam mempelajari bahan pengayaan.
f. Perbaikan kurikulum dan program pendidikan
Salah satu peran yang penting dari penilaian pendidikan ialah mencari dasar yang
kokoh bagi perbaikan kurikulum dan program pendidikan. Perbaikan kurikulum atau
program pendidikan yang dilakukan tanpa hasil penilaian yang sistematik acapkali
menjadi usaha sia-sia yang mubazir.
g. Pengembangan ilmu
Hasil pengukuran tes. dan penilaian tentu saja akan dapat memberi sumbangan
yang berarti bagi perkembangan teori dan dasar pendidikan. Ilmu seperti
pengukuran pendidikan dan psikometrik sangat tergantung pada hasil-hasil
pengukuran, tes dan penilaian yang dilakukan sebagai kegiatan sehari-hari dosen
dan pendidik. Dari hasil itu akan diperoleh pengetahuan empirik yang sangat
berharga untuk pengembangan ilmu dan teori.

5. Etika Tes
Kegiatan pengujian berperan sangat besar dalam sistem pendidikan dan sistem
persekolahan. Karena pentingnya itu maka setiap tindakan pengujian selalu
menimbulkan kritik yang tajam dari masyarakat. Kritik tersebut tidak jarang datang
dari para ahli, di samping datang dari orang tua yang secara langsung atau tidak
langsung berkepentingan terhadap pengujian. Diantara beberapa kritik tersebut ada
beberapa yang harus menjadi perhatian sungguh-sungguh dari para praktisi dan
ahli tes, pengukuran dan penilaian. Kritik tersebut antara lain:
a. Tes senantiasa akan mencampuri rahasia pribadi peserta tes. Setiap tes
berusaha mengetahui pengetahuan dan kemampuan peserta tes, yang dapat
berarti membuka kelemahan dan kekuatan pribadi seseorang. Di dalam
masyarakat yang sangat melindungi akan hak dan rahasia pribadi, masalah ini
selalu akan menjadi gugatan atau keluhan.
b. Tes selalu menimbulkan rasa cemas peserta tes. Memang sampai batas
tertentu rasa cemas itu dibutuhkan untuk dapat mencapai prestasi terbaik.
Tetapi tes acapkali menimbulkan rasa cemas yang tidak perlu, yang justru
dapat menghambat seseorang mampu mendemonstrasikan kemampuan
terbaiknya.
20
c. Tes acapkali justru menghukum mahasiswa yang kreatif. Karena tes itu selalu
menuntut jawaban yang sudah ditentukan pola dan isinya, maka tentu saja hal
itu tidak memberi ruang gerak yang cukup bagi mahasiswa yang kreatif.
d. Tes selalu terikat pada kebudayaan tertentu. Tidak ada tes hasil belajar yang
bebas budaya. Karena itu kemampuan peserta tes untuk memberi jawaban
terbaik turut ditentukan oleh kebudayaan penyusun tes.
e. Tes hanya mengukur hasil belajar yang sederhana dan yang remeh. Hampir
tidak pernah ada tes hasil belajar yang mampu mengungkapkan tingkah laku
mahasiswa secara menyeluruh, yang justru menjadi tujuan utama pendidikan
formal apapun.
Karena banyak kritik yang tajam dari masyarakat terhadap praktek tes pendidikan,
maka para pendidik harus dapat melakukan tes dengan penuh tanggung jawab.
Untuk itu perlu ditegakkan beberapa etika tes, yang membedakan tindakan yang
etis dan tindakan yang tidak etis dalam tes secara profesional.
Praktek tes hasil belajar yang etis terutama mencakup empat hal utama:
a. Kerahasiaan hasil tes
Setiap dosen atau pengajar wajib melindungi kerahasiaan hasil tes, baik individual
maupun secara kelompok. Hasil tes hanya dapat disampaikan kepada orang
lain bila:
1) Ada izin dari mahasiswa yang bersangkutan atau orang yang
bertanggung jawab terhadap peserta didik (bagi peserta didik yang belum
dewasa). Jadi dengan demikian maka praktek menempelkan hasil tes di papan
pengumuman dengan identitas jelas peserta tes, merupakan pelanggaran
terhadap etika ini.
2) Ada tanda-tanda yang jelas bahwa hasil tes tersebut menunjukkan gejala
doping membahayakan dirinya atau membahayakan kepentingan orang lain.
3) Penyampaian hasil tes tersebut kepada orang lain jelas-jelas menguntungkan
peserta tes.
b. Keamanan tes.
Tes merupakan alat pengukur yang hanya dapat digunakan secara profesional.
Dengan demikian maka tes tidak dapat digunakan di luar batas-batas yang
ditentukan oleh profesionalisme pekerjaan guru. Dengan demikian setiap
pendidik harus dapat menjamin keamanan tes, baik sebelum digunakan maupun
sesudah digunakan.
c. Iterpretasi hasil tes
Hal yang paling mengandung kemungkinan penyalahgunaan tes adalah
penginterpretasian hasil tes secara salah. Karena itu maka interpretasi hasil tes
harus diikuti tanggung jawab profesional. Bila hasil tes diinterpretasi secara tidak
patut, dalam jangka panjang akan dapat membahayakan kehidupan peserta tes.
d Penggunaan tes
Tes hasil belajar haruslah digunakan secara patut. Bila tes hasil belajar tertentu
merupakan tes baku, maka tes tersebut harus digunakan di bawah ketentuan yang

21
berlaku bagi pelaksanaan tes baku tersebut. Tak ada tes baku yang boleh
digunakan di luar prosedur yang ditetapkan oleh tes itu sendiri.
Di samping beberapa butir seperti yang diuraikan di atas, ada beberapa petunjuk
praktis yang hendaknya ditaati oleh dosen dalam tes:
a. Pelaksanaan tes hendaknya diberi tahu terlebih dahulu kepada peserta tes;
Hanya karena pertimbangan tertentu, yang sangat penting, yang dapat
membenarkan dosen tidak memberi tahu terlebih dahulu kepada peserta tes
tentang tes yang akan dilaksanakan. Bahkan kisi-kisi tes sebaiknya diberi tahu
kepada peserta tes sebelum melaksanakan tes.
b. Sebaiknya dosen menjelaskan cara menjawab yang dituntut dalam suatu tes.
Petunjuk menjawab tes bukanlah sesuatu yang harus dirahasiakan. Petunjuk
yang bersifat menjebak harus dihindari.
c. Sebaiknya dosen justru memotivasi peserta tes mengerjakan tesnya secara
baik. Jangan sampai seorang dosen justru menakut-nakuti , mahasiswa
dengan tes.
d. Bila dosen menggunakan tes baku, maka hendaknya dosen tersebut
bertanggung jawab penuh terhadap keamanan tes tersebut. Tidak ada tes
baku yang boleh digunakan dalam latihan.
e. Seorang dosen dapat menggunakan hasil tes untuk mengidentifikasi kekuatan
dan kelemahan peserta tes, asalkan hal tersebut tetap menjadi rahasia peserta
tes dan pendidik yang bersangkutan.
f. Dosen hendaknya menghindari diri dari keterlibatan dalam bimbingan tes yang
dapat diperkirakan akan mengganggu proses belajar mahasiswa. Hal ini
menjadi penting bila dosen yang bersangkutan justru terlibat dalam
penyusunan butir tes yang digunakan.
g. Adalah tidak etis bila seorang dosen mengembangkan butir soal atau
perangkat soal yang paralel dengan suatu tes baku dengan maksud untuk
digunakan dalam bimbingan tes.
h. Adalah tidak etis untuk mendiskriminasikan mahasiswa tertentu atau kelompok
tertentu yang boleh mengikuti suatu tes atau melarang mengikuti tes.
i. Adalah tidak etis untuk memperpanjang waktu atau menyingkat waktu dari
yang ditentukan oleh petunjuk tes.
j. Dosen tidak boleh meningkatkan rasa cemas peserta tes dengan penjelasan
yang tidak perlu.
Secara lebih mendasar etika tes ini diatur dalam standar tes yang dikembangkan
oleh organisasi profesional seperti American Psychological Association (APA),
American Educational Research Association (AERA), dan fational Council on
Measurement in Education (NCME). Terakhir ketiga organisasi profesional ini
membentuk Panitia bersama untuk menyusun standar dalam tes. Mereka
menghasilkan buku yang dinamakan "Standard for Educational and Psychological
Testing (1985).
Dalam Standard ini dicantumkan berbagai tolok ukur, seperti:
1. Technical Standards for Test Construction and Evaluation:
2. Professional Standards for Test Use;
3. Standards for Particular Applications; dan
4. Standards for Administrative Procedures.
22
Semua standar ini mencakup dua aspek utama, yaitu tes hasil belajar dan tes
psikologi. Pelanggaran terhadap standar ini merupakan pelanggaran kepada etika
profesi, yang dalam hal tertentu dapat merupakan pelanggaran atau kejahatan.

B. Obyek Penilaian Pembelajaran

Pada uraian terdahulu telah dikemukakan bahwa dalam proses belajar dan
mengajar ada empat unsur utama yang sangat berperan yaitu tujuan, bahan,
metode dan alat serta evaluasi. Berbicara tentang evaluasi sebagai salah satu
unsur dalam proses belajar mengajar tersebut akan muncul pertanyaan yang
mendasar yaitu apa yang harus dinilai itu.

Untuk menjawab pertanyaan ini perlu diketahui apa fungsi penilaian itu sendiri.
Adapun fungsi penilaian sebagaimana telah dikemukakan pada uraian sebelumnya
adalah sebagai alat untuk mengetahui keberhasilan proses dan hasil belajar. Dari
sinilah dapat dijawab bahwa obyek dari penilaian itu adalah proses pembelajaran
dan hasil belajar.

1. Hasil Belajar.

Hasil belajar sebagai obyek evaluasi mencakup kemampuan-kemampuan yang


dimiliki siswa setelah siswa tersebut menerima pengalaman belajarnya. Dalam
sistem pendidikan nasional kita, rumusan tujuan pendidikan, baik tujuan kurikuler
maupun tujuan pembelajaran, menggunakan klasifikasi hasil belajar dari Benyamin
Bloom yang secara garis besarnya beliau membaginya dalam tiga ranah yaitu ranah
kognitif, ranah afektif, dan ranah psikomotorik. Ketiga ranah tersebut menjadi obyek
penilaian hasil belajar. Alat penilaian untuk setiap ranah tersebut mempunyai
karakteristik tersendiri sebab setiap ranah berbeda dalam cakupan dan hakekat
yang terkandung di dalamnya. Diantara ketiga ranah itu, ranah kognitiflah yang
paling banyak dinilai oleh para guru di sekolah karena berkaitan dengan
kemampuan para siswa dalam menguasai isi bahan ajar. Selanjutnya ke tiga
ranah dimaksud akan dibahas satu persatu.

a. Ranah Kognitif

Ranah kognitif berkenaan dengan hasil belajar menurut Bloom terdiri dari
enam aspek yaitu pengetahuan atau ingatan, pemahaman, aplikasi, analisis,
sintesis, dan evaluasi. Berikut ini akan diuraikan satu persatu.

23
1). Tipe hasil belajar : Pengetahuan

Pengetahuan atau knowledge dalam taksonomi Bloom termasuk pula di


dalamnya pengetahuan faktual disamping pengetahuan hafalan atau
untuk diingat seperti rumusan, definisi, batasan, istilah, pasal dalam
undang-undang, nama-nama tokoh, dan lain lainnya. Tipe hasil belajar
pengetahuan ini termasuk kognitif tingkat rendah. Hafal merupakan
prasarat bagi pemahaman, hal ini berlaku bagi semua bidang ilmu baik
eksakta, ekonomi, bahasa maupun sosial. Hafal suatu rumus misalnya
akan menyebabkan paham bagaimana menggunakan rumus tersebut,
hafal kata-kata akan memudahkan untuk membuat kalimat.

Menyusun tes pengetahuan hafalan tidaklah begitu sulit, bahkan para


penyusun tes hasil belajar secara tidak sengaja banyak terjebak masuk
kedalam kawasan hafalan ini. Misalnya tes yang dibuat banyak
pertanyaan-pertanyaannya memuat aspek fakta-fakta seperti nama orang,
tempat, teori. Rumus hukum dan lain sebagainya. Disini siswa hanya
dituntut kesanggupan untuk mengingat sehingga jawabannya mudah
ditebak.

2) Tipe hasil belajar : pemahaman

Dalam taksonomi Bloom, kesanggupan memahami setingkat lebih tinggi


dari pada pengetahuan, namun tidaklah berarti bahwa pengetahuan tidak
perlu ditanyakan dalam tes sebab, untuk memahami, terlebih dahulu
mengetahui atau mengenal.
Pemahaman itu dapat dibedakan ke dalam 3 katagori yaitu :
a) Pemahaman terjemahan, dalam arti yang sebenarnya misalnya
dari bahasa Inggris ke bahasa Indonesia, mengartikan Bhineka
Tunggal Ika, dan menerapkan prinsip-prinsip listrik dalam
memasang sakelar.
b) Pemahaman penafsiran, yakni menghubungkan bagian-bagian
terdahulu dengan yang diketahui berikutnya, atau menghubungkan
beberapa bagian dari grafik dengan kejadian, membedakan yang
pokok dan yang bukan pokok.
c) Pemahaman ekstrapolasi, dengan pemahaman ini yang
merupakan pemahaman tertinggi diharapkan seseorang mampu
melihat di balik yang tertulis, dapat membuat pridiksi-pridiksi atau
ramalan-ramalan tentang konsekuensi atau dapat memperluas
persepsi dalam arti waktu, dimensi, kasus, ataupun masalahnya.
Dalam penyusunan tes dapat membedakan item yang susunannya
termasuk sub-katagori tersebut. Sejauh dengan mudah dapat

24
dibedakan antara pemahaman terjemahan, penafsiran, dan
ekstrapolasi, bedakanlah hal tersebut untuk kepentingan
penyusunan soal tes hasil belajar. Krakteristik soal-soal
pemahaman sangat mudah dikenali, misalnya item pemahaman
terjemahan mengungkapkan sesuatu dengan bahasa sendiri
dengan simbol tertentu termasuk ke dalam pemahaman
terjemahan. Dapat menghubungkan hubungan antar unsur dari
keseluruhan pesan atau termasuk kedalam pemahaman penafsiran.
Item ekstrapolasi mengungkapkan kemampuan dibalik pesan yang
tertulis dalam suatu keterangan atau lisan. Sebagian item
pemahaman dapat disajikan dalam gambar, denah, diagram, atau
grafik. Dalam tes obyektif, tipe pilihan ganda dan tipe banar-salah
banyak mengungkapkan aspek pemahaman.

3) Tipe hasil belajar : Aplikasi

Penggunaan abstraksi pada situasi kongkrit atau situasi khusus


merupakan ciri khas tipe hasil belajar aplikasi. Abstraksi tersebut mungkin
berupa ide, teori, atau petunjuk teknis. Suatu situasi akan tetap dilihat
sebagai situasi baru bila tetap terjadi proses pemecahan masalah. Kecuali
itu ada unsur lagi yang perlu masuk, yaitu abstraksi tersebut perlu berupa
prinsip atau generalisasi, yakni sesuatu yang umum sifatnya untuk
diterapkan pada situasi khusus. Mengetengahkan problem/masalah baru
hendaknya lebih didasarkan atas realitas yang ada di dalam masyarkat
atau realitas yang ada dalam teks bacaan. Problem baru yang diciptakan
sendiri oleh penyusun tes tidak mustahil naif karena dimensi yang dicakup
terlalu sederhana.
Bloom membedakan delapan tipe aplikasi dalam rangka menyusun item
tes tentang aplikasi yaitu :
a) Dapat menetapkan prinsip atau generalisasi yang sesuai untuk
situasi baru yang dihadapi. Dalam hal ini yang bersangkutan belum
diharapkan dapat memecahkan seluruh problem, tetapi sekedar
dapat menetapkan prinsip yang sesuai.
b) Dapat menyusun kembali problemnya sehingga dapat menetapkan
prinsip atau generalisasi mana yang sesuai.
c) Dapat memberikan spesifikasi batas-batas relevansi suatu prinsip
atau generalisasi.
d) Dapat mengenali hal-hal khusus yang terpampang dari prinsip dan
generalisasi.
e) Dapat menjelaskan suatu gejala baru berdasarkan prinsip dan
generalisasi tertentu. Bentuk yang banyak dipakai adalah melihat
hubungan sebab akibat.

25
f) Dapat meramalkan sesuatu yang akan terjadi berdasarkan prinsip
dan generalisasi tertentu.
g) Dapat menentukan tindakan atau keputusan tertentu dalam
menghadapi situasi baru dengan menggunakan prinsip dan
generalisasi yang relevan.
h) Dapat menjelaskan alasan menggunakan prinsip dan generalisasi
bagi situasi baru yang dihadapi,

4) Tipe hasil belajar : Analisis

Analisis merupakan kecakapan yang kompleks, yang memanfaatkan


kecakapan dari ketiga tipe sebelumnya. Analisis adalah usaha memilah
suatu integritas menjadi unsur-unsur atau bagian-bagian sehingga jelas
susunannya atau hierarkinya. Dengan analisis diharapkan seseorang
mempunyai pemahaman yang komprehansif dan dapat memilahkan
integritas menjadi bagian-bagian yang tetap terpadu, untuk beberapa hal
memahami prosesnya, untuk hal lain memahami cara bekerjanya, untuk
hal lain lagi memahami sistematikanya.

Untuk membuat item tes kecakapan analisis ini perlu mengenal berbagai
kecakapan yang termasuk klasifikasi analisis, yakni :
a) Dapat mengklasifikasikan kata-kata, frase-frase, atau pertanyaan-
pertanyaan dengan menggunakan kriteria analitik tertentu.
b) Dapat meramalkan sifat-sifat khusus tertentu yang tidak disebutkan
secara jelas.
c) Dapat meramalkankualitas, asumsi, atau kondisi yang implisit.
d) Dapat mengetengahkan pola, tata, atau pengaturan materi dengan
menggunakan kriteria seperti relevansi, sebab akibat, dan
peruntutan.
e) Dapat mengenal organisasi, prinsip-prinsip organisasi, dan pola-pola
materi yang dihadapi.
f) Dapat meramalkan sudut pandangan, kerangka acuan, dan tujuan
materia yang dihadapinya.

5) Tipe hasil belajar : Sintesis

Berpikir sintesis adalah berpikir divergen, dalam berpikir divergen


pemecahan atau jawabannya belum dapat dipastikan. Berpikir sintesis
merupakan salah satu terminal untuk menjadikan orang lebih kreatif.
Berpikir kreatif merupakan salah satu hasil yang hendak dicapai dalam
pendidikan. Seseorang yang kratif sering menemukan atau menciptakan
sesuatu. Dengan kemampuan sintesis, orang mungkin menemukan

26
hubungan kausal atau urutan tertentu, atau menemukan abstraksinya atau
operasionalnya.

Mengetes kecakapan sintesis perlu dipahami 3 klasifikasi kecakapan


sintesis yaitu :
a) Kemampuan menemukan hubungan yang unik, artinya, menemukan
hubungan antara unit-unit yang tak berarti dengan menambahkan
satu unsur tertentu, unit-unit tak berharga menjadi sangat berharga.
b) Kemampuan menyusun rencana atau langkah-langkah operasi dari
suatu tugas atau problem yang diketngahkan.
c) Kemampuan mengabstraksikan sejumlah besar gejala, data, dan
hasil observasi menjadi terarah, proposional, hipotesis, skema,
model, atau bentuk-bentuk lainnya.

6) Tipe Hasil belajar : Evaluasi

Evaluasi adalah pemberian keputusan tentang nilai sesuatu yang mungkin


dilihat dari segi tujuan, gagasan, cara bekerja, pemecahan, metode,
materiel dan lain-lainnya. Dari segi tersebut, maka dalam evaluasi perlu
adanya kriteria atau standar. Mengembangkan kemampuan evaluasi yang
dilandasi pemahaman, aplikasi, analisis, dan sintesis akan mempertinggi
kualitas evaluasi.

Untuk mengetes kecakapan evaluasi perlu diketahui bahwa kecakapan


evaluasi seseorang dapat dikatagorikan kedalam enam tipe yaitu:
a) Dapat memberikan evaluasi tentang ketepatan suatu karya atau
dokumentasi.
b) Dapat memberikan evaluasi satu sama lain antara asumsi, evidensi,
dan kesimpulan, juga keajegan logika dan organisasinya.
c) Dapat memahami nilai serta sudut pandang yang dipakai orang
dalam mengambil suatu keputusan.
d) Dapat mengevaluasi suatu karya dengan memperbandingkannya
dengan karya lain yang relevan.
e) Dapat mengevaluasi suatu karya dengan menggunakan kriteria yang
telah ditetapkan.
f) Dapat memberikan evaluasi tentang suatu karya dengan
menggunakan sejumlah kriteria yang eksplisit.

b. Ranah Afektif

Penilaian hasil belajar afektif kurang mendapat perhatian guru, para guru lebih
banyak menilai ranah kognitif dari pada ranah afektif. Ranah afektif ini

27
berkenaan dengan sikap dan nilai, tipe hasil belajar ini tampak pada siswa
dalam berbagai tingkah laku seperti perhatian terhadap pelajaran, disiplin,
motivasi belajar, kebiasan belajar, menghargai guru dan teman sekelas, dan
lain sebagainya.

Untuk mengetes harus diketahui beberapa jenis katagori ranah afektif sebagai
hasil belajar, yaitu :
a) Reciving/attending, yaitu semacam kepekaan dalam siswa dalam
menerima rangsangan/stimulus dari luar dalam bentuk masalah, situasi,
gejala dan lain sebagainya.
b) Responding, yakni respon yang diberikan siswa terhadap stimulasi yang
datang dari luar. Respon ini mencakup ketepatan reaksi, perasaan,
kepuasan dalam menjawab stimulus dari luar yang dihadapi.
c) Valuing (penilaian), berkenaan dengan nilai dan kepercayaan terhadap
gejala stimulus untuk selanjutnya muncul adanya kesediaan dan
kesepakatan untuk menerima nilai tadi.
d) Organisasi, yakni mengembangkan dari nilai ke dalam suatu sistem
organisasi. Yang termasuk ke dalam organisasi ialah konsep tentang nilai,
organisasi sistem nilai dan lain-lainnya.
e) Karakteristik nilai atau internalisasi nilai, yakni keterpaduan semua sistem
nilai yang telah dimiliki siswa, yang mempengaruhi pola kepribadian, dan
tingkah lakunya.

c. Ranah Psikomotorik

Ranah psikomotorik berkaitan dengan ketrampilan dan kemampuan bertindak


siswa secara individual. Oleh karena itulah hasil belajar sebagai obyek
penilaian ranah ini dapat dilihat dalam bentuk ketrampilan (skill) dan
kemamuan bertindak individu. Ada enam tingkatan ketrampilan, yaitu :
1) gerakan refleks.
2) ketrampilan pada gerakan-gerakan dasar.
3) kemampuan perseptual, termasuk di dalamnya membedakan visual,
membedakan auditif, motoris, dan lain-lain.
4) kemampuan dibidang fisik, seperti kekuatan, keharmonisan, dan
ketepatan.
5) gerakan-gerakan skill, mulai dari keterampilan sederhana sampai pada
ketrampilan yang kompleks.
6) Kemampuan yang berkenaan dengan komunikasi non-decursive seperti
gerakan,ekspresif dan interpretatif.

Sebagaimana telah disinggung pada uraian terdahulu, bahwa dalam proses


pembelajaran di sekolah pada dewasa ini, tipe hasil belajar kognitif lebih

28
dominan jika dibandingkan dengan tipe hasil belajar bidang afektif dan
psikomotorik. Hal ini bisa jadi karena asumsi seseorang yang berubah tingkat
kognisinya sebenarnya dalam kadar tertentu telah berubah pula sifat (afektif)
dan perilakunya (psikomotorik). Meskipun demikian tidaklah harus diartikan
bidang afektif dan psikomotorik diabaikan sehingga tak perlu dilakukan
penilaian.

Yang menjadi persoalan ialah bagaimana menjabarkan tipe hasil belajar


dtmaksud sehingga jelas apa yang harus dinilai. Oleh karena itulah ketiga hasil
belajar ranah kognitif, afektif, dan psikomotorik yang telah dikemukakan di atas
penting untuk diketahui oleh para guru dalam rangka melaksanakan tugasnya
diantaranya adalah menyusun instrumen penilaian, baik melalui tes maupun
non tes dengan segala bentuk dan jenisnya.

29
BAB II
TES SEBAGAI ALAT PENILAIAN

A. Konsep Tes.

Di dalam proses belajar mengajar di kelas, guru akan berhadapan dengan


perbedaan individual diantara para siswanya. Adanya perbedaan antar individual ini
seperti kemampuan, minat , bakat, motivasi dan lain sebagainya, sudah barang
tentu akan berpengaruh atau menentukan keberhasilan individu-individu tersebut.
Secara singkatnya dapat dikatakan bahwa perbedaan individual akan berakibat
pula adanya perbedaan dalam hasil belajarnya.

Sejalan dengan adanya perbedaan di atas, maka perlu diciptakan alat untuk
mengukur dan menilai keadaan individu, alat inilah yang lazim disebut dengan tes.
Selanjutnya tes sebagai alat penilaian ini, bila dilihat dari segi alatnya dapat
dibedakan kedalam 2 macam yaitu tes dan non tes. Baik tes maupun non tes ini
disebut juga sebagai teknik tes.

Kegiatan mengukur itu pada umumnya tertuang dalam bentuk tes dengan berbagai
macam dan bentuknya. Dalam praktek, teknis tes inilah yang sering dipakai dalam
rangka menilai hasil belajar para siswa.

Banyak para pakar pendidikan mengemukakan apa yang dimaksud dengan tes
sebagai alat penilaian, namun apabila kita cermati dan disimpulkan dapat
dikemukakan disini bahwa yang dimaksud dengan tes adalah cara yang dapat
dipergunakan atau prosedur yang perlu ditempuh dalam rangka mengukur dan
menilai sejauh mana tujuan-tujuan instruksional telah dapat dicapai siswa, dan
seberapa efektifnya proses belajar mengajar dalam mencapai hasil belajar yang
optimal. Dari hasil pengukuran dapat diperoleh nilai yang menggambarkan tingkah
laku atau prestasi siswa, dimana nilai dari hasil tes dapat dibandingkan dengan
nilai-nilai yang dicapai oleh siswa lainnya, atau dibandingkan dengan nilai standar
tertentu.

Apapun jenis dan macamnya, tes sebgai alat penilaian adalah pertanyaan-
pertanyaan yang diberikan kepada siswa untuk mendapat jawaban dari siswa
dalam bentuk lisan (tes lisan), dalam bentuk tulisan (tes tertulis) dan dalam bentuk
tindakan/ketrampilan (tes perbuatan). Jadi sesuai dengan cara mengajukan
pertanyaan dan cara memberikan jawabannya sebagaimana tersebut di atas, maka
tes dapat dibedakan :
a. Tes tertulis : dimana pertanyaan-pertanyaan atau soal-soal yang diajukan
dan jawaban yang harus diberikan siswa dilakukan secara tertulis.

30
b. Tes lisan : yakni tes dimana pertanyaan-pertanyaan atau soal-soal yang
diajukan dan jawaban yang harus diberikan siswa dilakukan secara lisan.
c. Tes perbuatan : yaitu tes yang pertanyaan-pertanyannya dapat diajukan
dalam bentuk tulisan atau lisan akan tetapi jawaban yang harus diberikan
siswa dilakukan dalam bentuk perbuatan.

Untuk melaksanakan penilaian terhadap hasil belajar dengan menggunakan alat


yaitu tes sebagaimana dimaksud di atas, jika dilihat dari aspek pembuatannya,
seorang guru dapat menggunakan dua macam tes, yaitu tes yang telah
distandarkan (standardized test) dan tes buatan guru sendiri (teacher-made test ).

Yang dimaksud dengan standardized test ialah tes yang telah mengalami proses
standarisasi, yakni proses validasi dan keandalannya (reability) sehingga tes
tersebut benar-benar valid dan andal untuk suatu tujuan dan bagi suatu kelompok
tertentu. Pada umumnya tes ini dibuat oleh para ahli psikologi dan bayak dipakai
untuk tujuan rekruitment pegawai dalam instansi pemerintahan, perusahaan dan
militer. Di sekolah-sekolah di Indonesia, pada umumnya tes ini belum banyak
dipergunakan, hanya dibeberapa sekolah yang memiliki Lembaga Bimbingan dan
Penyuluhan yang digunakan dalam rangka seleksi siswa dan penjurusan.

Adapun tes buatan guru adalah tes yang dibuat oleh guru sendiri dengan sedikit
atau tanpa bantuan dari pihak luar, dibuat berdasarkan isi dan tujuan-tujuan
pembelajaran, menyangkut topik, kecakapan atau ketrampilan dimana penggunaan
tes ini terbatas hanya di kelas atau sekolah dimana guru tersebut mengajar. Uraian
selanjutnya dalam buku ini akan lebih mengarah dan ditekankan pada tes buatan
guru.

B. Jenis-Jenis Tes, Kebaikan dan Kelemahannya

Dalam uraian di atas telah disampaikan tentang apa yang dimaksud dengan tes
lisan, tes tertulis dan tes praktek secara singkat. Mengingat tes hasil belajar yang
lazim digunakan oleh para guru di sekolah-sekolah adalah tes lisan dan tes tertulis
yang dibuat sendiri oleh guru, berikut ini akan dikemukanan bentuk-bentuk tes,
kebaikan dan kelemahannya.

Tes tertulis sebagai alat penilaian yang dapat dipergunakan untuk menilai proses
dan hasil belajar yang telah dilakukan terhadap siswa, ada dua jenis tes yang
utama yakni :
a) Essay type test, yang biasa disebut tes uraian yaitu suatu tes yang berbentuk
pertanyan tulisan dimana siswa dapat menjawab pertanyaan yang diajukan
tersebut secara tertulis dengan bebas (dalam tes ini jawaban tidak disediakan).
Jawaban siswa pada umumnya dapat merupakan uraian yang panjang,

31
panjang pendeknya jawaban tes ini relatif sesuai dengan kecakapan dan
pengetahuan siswa. Tes ini merupakan bentuk penilaian yang paling dikenal
dan banyak dipergunakan oleh para guru dari dulu sampai sekarang. Perlu
diperhatikan karena tes uraian memerlukan jawaban yang panjang dan waktu
yang lama, jumlah soal yang diajukan harus dibatasi dan disesuaikan dengan
waktu yang tersedia.
b) Structured response test yang biasa disebut obyektif tes, yaitu suatu tes
yang dibuat sedemikian rupa sehingga hasil tes yang diperoleh itu dapat dinilai
secara obyektif, dalam arti dinilai oleh siapapun akan menghasilkan skor yang
sama. Dalam tes ini pertanyaan-pertanyaan yang diajukan telah tersedia
jawabannya siswa atau si penjawab tinggal memilih, mengisi dan menjodohkan
dengan menggunakan tanda-tanda atau perintah seperti yang tercantum dalam
soal. Test ini disebut juga short-answer test karena jawabannya pendek-
pendek dan ringkas.
Sesuai dengan keterangan di atas obyektif tes ini terdiri dari dua jenis yaitu :
1. Completion type test, terdiri dari :
• Completion test atau tes melengkapi.
• Fill-in jawaban tes berupa mengisi titik dalam kalimat pada soal yang
dikosongkan.
2. Selection type test atau tes yang jawabannya dengan mengadakan
pilihan.
Tes jenis ini terdiri atas :
• true-false (benar – salah)
• multiple choice (pilihan ganda)
• matching (menjodohkan)

Setiap tes sebagai alat penilaian hasil belajar mempunyai kebaikan-kebaikan,


namun juga mempunyai kelemahan-kelemahan. Apalagi tes buatan guru
(teacher-made test) yang belum distandarisasikan. Oleh karena itulah berikut
ini akan dikemukakan beberapa kebaikan dan kelemahan tiap-tiap tes.
Dimaksudkan agar dapat dipergunakan sebagai bahan pembanding sekaligus
dengan mengetahui kelemahan-kelemahannya dapat diusahakan
meminimalkan kelemahannya tersebut sehingga bermanfaat untuk
meningkatkan kualitas tes yang akan dibuat oleh guru.

a. Tes Lisan
• Kebaikannya antara lain :
1) Tes dilakukan secara tatap muka sehingga lebih dapat menilai
kepribadian dan pengetahuan siswa yang dikuasainya.
2) Jika pertanyaan yang diajukan guru belum jelas bagi siswa, guru
dapat mengubah pertanyaan sehingga dapat dimengerti oleh
siswa.
32
3) Dari sikap dan cara siswa menjawab, guru dapat mengetahui
apa yang tersirat dan tersurat.
4) Guru dapat mengorek isi pengetahuan siswa secara detail,
sehingga dapat diketahui bidang yang dikuasai atau disenangi
siswa.
5) Hasil tes langsung dapat diketahui.

• Kelemahan tes lisan ini antara lain :


1) Obyektifitas hasil tes tidak dapat dijamin, apalagi jika hubungan
guru– siswa kurang baik.
2) Faktor psikis siswa, misalnya siswa yang mempunyai sifat
penggugup, akan berpengaruh pada kelancaran jawaban yang
diberikan.
3) Pertanyaan yang diajukan tidak konsisten dalam pengertian
tidak dapat selalu sama pada tiap-tiap siswa yang di tes.
4) Tes yang dilakukan untuk satu kelas/kelompok akan memakan
waktu yang sangat lama sehingga tidak efisien.
5) Kebebasan bagi siswa untuk menjawab tidak ada atau kurang
ada.

b. Tes Tulisan (Tes tertulis)


• Kebaikan tes ini antara lain :
1) Sekali gus dapat digunakan untuk menilai kelompok/kelas dalam
waktu yang singkat.
2) Siswa mempunyai kebebasan untuk memilih soal yang akan
dijawab terlebih dahulu dan cara menjawabnya.
3) Karena pertanyaan/soal-soal yang diajukan guru sama, maka
ruang lingkup dan isi pengetahuan yang dinilai tiap-tiap siswa
pun akan sama.
• Adapun kelemahan tes tulisan ini antara lain :
1) Tidak dapat mencerminkan secara benar-benar nilai individu dan
kepribadian seseorang.
2) Mudah menimbulkan kecurangan dan kepalsuan jawaban.
3) Mudah menimbulkan spekulasi bagi siswa yang akan di tes.

c. Tes Uraian (Essay Test)


• Tes ini mempunyai sifat dan keuntungannya antara lain :
1) Untuk mengukur kemampuan siswa dalam mengungkapkan
pendapatnya secara bebas dan murni.
2) Untuk mengukur kemampuan siswa dalam memecahkan
masalah (problem solving).

33
3) Untuk mengukur kemampuan siswa memilih diantara
perbendaharaan pengetahuannya yang sesuai untuk menjawab
suatu pertanyaan.
4) Dapat dibuat dalam waktu yang singkat

• Adapun kebaikan yang dimiliki tes uraian ini antara adalah :


1) Bagi guru, menyusun tes ini sangat mudah dan tidak
memerlukan waktu yang lama.
2) Siswa mempunyai kebebasan dalam menjawab dan
mengeluarkan ide dan buah pikirannya.
3) Dapat melatih siswa untuk mengeluarkan ide dan buah
pikirannya tertuang dalam bentuk kalimat atau bahasa yang
teratur, disusun secara sistimatis sehingga komunikatif dan
mudah dipahami.
4) Efisien dan efektif dalam pengertian hemat waktu serta hemat
biaya karena tidak memerlukan banyak kertas, bahkan soal-soal
yang dibuat dapat didiktekan atau ditulis di papan tulis.

• Sedangkan kelemahan tes uraian antara lain adalah :


1) Tidak atau kurang dapat digunakan untuk menilai pelajaran yang
ruang lingkupnya luas sehingga kurang dapat menilai isi
pengetahuan siswa yang sebenarnya.
2) Menyulitkan guru dalam memberikan nilai skornya, karena
kemungkinan adanya jawaban dari siswa yang heterogen
sifatnya.
3) Perbedaan kerapian dan baik buruknya tulisan, serta panjang
pendeknya jawaban yang diberikan siswa secara individual
membuat kecenderungan guru untuk mudah memberikan
penilaian dan pemberian skor kurang obyektif.
4) Karakteristik pembuatan tes uraian baik cara membuat
pertanyaan dan tuntutan jawabannya, setiap guru yang berbeda-
beda dapat menimbulkan salah pengertian bagi siswa yang
menjawabnya.

Berdasarkan pada pertimbangan kebaikan dan keburukan tes uraian


sebagaimana disebutkan di atas dapatlah dikemukakan beberapa hal
yang perlu diperhatikan oleh guru dalam membuat tes uraian antara lain :
• Sebelum menuliskan suatu soal essai, guru hendaknya menentukan
terlebih dahulu pengetahuan atau kecakapan siswa yang bagaimana
yang akan dinilai.
• Gunakanlah bahan-bahan atau himpunan bahan-bahan dalam
menyusun soal-soal essay.

34
• Nyatakan pertanyaan sedemikian rupa sehingga jelas arah jawaban
yang diharapkan. Misalnya dngan menggunakan kata : “ Apa
berbedaan antara ........... dengan ..........” , “ Bandingkan ....... “, “
berikan alasan mengapa .......”, terangkan bagaimana cara
...............”, “buktikan .............”, “berikan kritik ............”, “uraikan
dengan kata-kata sendiri ...........”, dan lain sebagainya.
• Sesuaikan panjang pendeknya dan kompleksitas jawaban dengan
tingkat kematangan siswa.
• Usahakan agar soal essay yang akan disusun itu benar-benar dapat
menimbulkan perilaku yang dikehendaki untuk dilakukan siswa.
• Buatlah kunci (hanya untuk diketahui guru sendiri) jawaban-jawaban
secara tertulis yang diharapkan untuk memudahkan penskorannya.
• Sediakan waktu yang cukup bagi siswa untuk menuliskan jawaban.

d. Tes Obyektif
• Kebaikan tes obyektif ini antara lain :
1) Dapat dipergunakan untuk menilai bahan pelajaran dalam ruang
lingkup yang luas artinya pelajaran yang diberikan selama satu
tahun atau dua tahun dapat dites sekaligus.
2) Jawaban yang diberikan siswa dapat bebas dan terarah ( karena
dalam tes obyektif ini telah disediakan jawabannya).
3) Dapat dinilai secara obyektif, artinya siapapun yang menilainya
hasil atau skornya akan sama.
4) Memaksa siswa untuk mempelajari semua materi yang telah
disampaikan, sehingga siswa tidak dapat berspekulasi pada
bagian-bagian mana saja yang dipelajari.
5) Memudahkan guru untuk memberikan skor karena jawabannya
telah dibuat kuncinya.

• Adapun kelemahan tes ini antara lain :


1) Kurang memberikan kesempatan kepada siswa untuk
menyatakan ide dan pikirannya, karena jawaban telah tersedia,
siswa dalam menjawab pertanyaan hanya memilih, mengisi dan
menjodohkan, dan sama sekali tidak membuat kalimat.
2) Dalam memberikan jawaban atas pertanyaan-pertanyaan yang
diberikan, siswa dapat berbuat coba-coba, spekulasi dan main
untung-untungan tanpa didasari pemikiran siapa tahu
jawabannya benar. Oleh karena itu untuk menghindari hal ini
guru harus dapat membuat tesnya denga teliti dan baik sehingga
tes tersebut dapat benar-benar merangsang siswa untuk
berpikir.

35
3) Menyusun tes ini tidak mudah, memerlukan ketelitian dan
kecermatan serta membutuhkan waktu yang relatif cukup lama.
4) Jika dibandingkan dengan ter uraian, tes obyektif ini kurang
efektif dan efisien karena membutuhkan disamping waktu yang
cukup lama, juga memakan biaya dan kertas yang banyak.

Setelah diketahui kebaikan dan kelemahan dari bentuk tes obyektif ini, maka
dapat jadikan acuan oleh guru dalam membuat pertanyaan-pertanyan atau
soal dalam bentuk tes obyektif.

Secara umum dapat dikemukakan beberapa saran yang perlu diperhatikan


oleh guru dalam menyususun tes obyektif antara lain :
1) Tiap bentuk dari tes obyektif harus didahului dengan penjelasan atau
perintah, bagaimana cara mengerjakannya.
2) Penjelasan atau perintah tersebut haruslah dituangkan dalam bahasa
yang baik, singkat dan jelas sehingga mudah dipahami dan tidak
menimbulkan salah persepsi siswa.
3) Hindarkan pertanyaan-pertanyaan yang dapat menimbulkan bermacam-
macam penafsiran.
4) Tiap-tiap soal haruslah konstan (tetap), gramatika (bahasanya yang baik)
sehingga tidak menimbulkan salah tangkap dan membingungkan.
5) Hindarkan pertanyaan-pertanyaan yang secara langsung menjiplak dari
buku teks karena hal tersebut hanya memaksa anak untuk menghafal,
kurang merangsang siswa untuk berpikir.
6) Urutan-urutan jawaban yang benar dan yang salah janganlah menurut
suatu pola tertentu yang tetap misalnya pola jawaban A.A.A. B.B.B.
C.C.C dan seterusnya.
7) Janganlah soal yang satu bergantung pada soal yang lain atau soal
terdahulu. Setiap siswa yang dites agar diberi kesempatan yang sama
untuk setiap soal, artinya jangan karena siswa tidak dapat menjawab soal
yang satu, ia tidak dapat menjawab soal yang berikutnya atau lainnya.

Sebagaimana telah disebutkan di atas bahwa tes obyektif mempunyai


beberapa bentuk tes yaitu tes completion, fill-in, true-false, multiple-choise dan
matching, maka berikut ini akan dikemukakan sifat dan kegunaan serta saran
pembuatannya tes dimaksud di atas.

a. Tes Melengkapi ( Completion test)


• Sifat dan kegunaannya :
1) Untuk mengukur kemampuan mengingat kembali
perbendaharaan pengetahuan yang pernah dipelajari.
2) Mudah dibuat dalam waktu singkat.

36
3) Tidak dapat dipakai untuk mengukur kemampuan yang lebih
komplek.
4) Adanya kesulitan dalam penilaian atau penyekorannya.

• Saran untuk pembuatannya antara lain :


1) Pertanyaan yang diajukan adalah pengetahuan yang penting
saja.
2) Yakinkan bahwa hanya ada satu jawaban yang mungkin.
3) Ruang jawaban tidak memberi petunjuk adanya jawaban.
4) Satu nomor soal hanya berisi satu isian.

b. Test Isian ( Fill-in )


• Sifat dan kegunaannya antara lain :
1) Pada dasarnya sifat dan kegunaan tes isian ini sama dengan tes
melengkapi, tetapi tes ini untuk mengukur tingkat berpikir yang
lebih sederhana (recall) misalnya tentang istilah, rumus, tahun
dan fakta-fakta.
2) Mudah dibuat.

• Beberapa saran untuk membuatnya antara lain :


1) Hindarkan adanya kemungkinan lebih dari satu jawaban yang
benar.
2) Panjang ruang isian hendaknya sama.
3) Hendaknya untuk satu nomor soal berisi satu isian.
4) Hindarkan isian pada permulaan kalimat.

c. Tes Benar Salah ( True-false)


• Sifat dan kegunaannya antara lain :
1) Lebih mudah dibuat jika dibandingkan dengan pembuatan tes
pilihan ganda.
2) Waktu pembuatannya relatif lebih singkat.
3) Sukar digunakan untuk mengukur aspek kemampuan siswa
yang lebih tinggi.
4) Kemungkinan dapat menebak jawaban sangat besar.

• Beberapa saran yang perlu diperhatikan dalam membuatnya lain:


1) Pernyataan harus sedemikian rupa sehingga siswa yang samar
pengertiannya dapat terkecoh.
2) Sedapat mungkin hindarilah peryataan yang berupa kalimat
negatif.
3) Hindarkan kata-kata penentu misalnya “ semua”, “tak pernah”,
“selalu”, “kadang-kadang”.
37
4) Gunakanlah pernyatan yang salah itu sedikit lebih banyak dari
pada pernyataan yang benar.

d. Tes pilihan Ganda (Multiple – Choice)


• Sifat dan kegunaan test pilihan ganda ini antara lain :
1) Dapat digunakan untuk mengukur hampir semua aspek
kemampuan siswa.
2) Dapat dipakai untuk mendiagnosa kesulitan belajar siswa.
3) Mempunyai reliabilitas yang tinggi dalam penskorannya.
4) Sukar dalam penulisannya terutama dalam menetapkan pilihan
yang salah (mengecoh).
5) Sulit untuk mengukur kemampuan siswa dalam mengemukakan
gagasannya atau buah pikirannya.
6) Memungkinkan peluang bagi siswa menebak jawaban yang
benar.

• Beberapa saran untuk membuat tes pilihan ganda, antara lain :


1) STEM, yaitu bagian dari tes yang mengungkapkan masalah
yang ditanyakan hendaknya singkat dan jelas.
2) Gunakan kalimat positif, bila tidak mungkin hendaknya kata
“tidak” atau “ kecuali” dalam kalimat negatif ditulis dengan huruf
besar.
3) Jangan menggunakan katabilangan tak tentu misalnya : sering
kali, kadang-kadang, dan lain sebagainya.
4) Usahakan agar pengecoh mirip dengan kunci jawaban.
5) Letak kunci jawaban tidak selalu ditempatnya.
6) Hindarkan agar soal yang satu tidak tergantung dari soal yang
lainnya.
7) Perhatikan aspek kemampuan siswa yang hendak diukur.

e. Tes Menjodohkan (Matching)


• Sifat dan kegunaannya antara lain :
1) Dapat mengukur aspek kemampuan yang sederhana, misalnya
mengingat fakta, istilah, peristiwa dan lain-lainnya.
2) Dapat mengukur pengertian sederhana yang merupakan
hubungan antara suatu fakta atau konsep dengan yang lainnya.
3) Sedikit lebih sukar pembuatannya dibandingkan dengan tes
benar salah.

Beberapa saran untuk membuatnya antara lain :


1) Jumlah jawaban hendaknya lebih banyak dari jumlah pertanyaannya,
sehingga sisa jawaban tidak menjadi petunjuk untuk soal yang lain.

38
2) Jawaban yang lebih hendaknya mengandung kebenaran yang mirip
dengan jawaban yang benar.
3) Materi soal harus homogen, misalnya tentang satu pokok bahasan saja.
4) Buatlah dua kolom, kolom pertama berisi nomor soal, pertanyaan dan
ruang jawaban. Sedangkan kolom kedua berisi kode dan pilihan jawaban.

Berdasarkan sifat dan kegunaan jenis/bentuk di atas dapat dibuat ikhtisar seperti
dibawah ini :

IKHTISAR

Bentuk Soal
Tes Tes Tes
NO. URAIAN
Uraian Isian Obyektif
1. Dapat mengukur kemampuan siswa dalam
memecahkan masalah. ++ + ++

2. Dapat mengukur kemampuan siswa


+ + --
mengorganisasi, mengintegrasi dan
mensintesa.
3. Dapat mengukur kemampuan siswa dalam
mengemukakan pendapat yang ++ + --
murni/gagasan baru terhadap masalah2.

4. Dapat mendiaknosa kemampuan siswa


yang khusus dari yang umum.
-- - ++
5. Dapat mencakup secara keseluruhan &
keseimbangan akan bahan pelajaran
maupun jenis-jenis kemampuan. -- - ++

6. Bebas dari kesempatan untuk menebak


jawaban.
++ ++ --
7. Memberikan skor yg reliable dari
pemeriksaan satu dengan yang lain.
- - ++
8 Dapat diskor oleh tenaga administrasi.
Memerlukan sedikit waktu untuk menulis - - ++
soal.
+ + -

39
Dari ikhtisar di atas ternyata tes obyektif khususnya tes pilihan ganda merupakan
bentuk tes yang sangat menguntungkan, karena selain dapat mengukur hampir
semua aspek kemampuan siswa juga mempunyai reliabilitas penskoran yang tinggi.
Hal ini cocok untuk jumlah murid yang banyak. Atas karakteristik yang demikian
inilah tes ini dapat direkomendasikan untuk dipakai, dan bila perlu kelemahannya
dapat ditutupi dengan cara mengkombinasikan dengan tes uraian.

C. Ciri-Ciri Tes Yang Baik

Tes yang baik, akan diharapkan dapat mengukur dan menilai hasil belajar siswa
yang dapat menunjukkan atau menggambarkan keadaan siswa yang sebenarnya
dalam mencapai tujuan pengajaran setelah yang bersangkutan memperoleh
pengajaran melalui proses belajar mengajar.

Sebuah tes dapat dikatakan baik sebagai alat pengukur harus memenuhi
persyaratan tes, yaitu :

a) Validitas

Sebuah tes hasil belajar disebut valid apabila tes tersebut dapat tepat mengukur
apa yang hendak diukur. Istilah “valid” sering diartikan dengan istilah tepat, benar
atau shahih. Jadi validitas dapat diartikan dengan ketepatan, kebenaran, atau
keshahihan. Dengan kata lain sebuah tes dikatakan telah memiliki “validitas”
apabila tes tersebut secara tepat, benar atau shahih telah dapat mengukur apa
yang seharusnya diukur melalui tes tersbut. Jadi tes hasil belajar kimia dapat
dinyatakan valid apabila tes hasil belajar tersebut secara tepat, benar atau shahih
telah dapat mengukur hasil belajar kimia yang telah dicapai siswa setelah
mengalami proses pembelajaran
Contoh
 Untuk mengukur volume air dapat digunakan gelas ukur. Jadi gelas ukur
merupakan alat ukur untuk mengukur volume air yang tepat (valid).
 Thermometer adalah alat pengukur yang valid untuk mengukur suhu
udara/tubuh.

Dalam proses belajar mengajar untuk mengukur hasil belajar siswa bukan diukur
melalui sikap siswa/kehadiran siswa, tetapi diukur melalui nilai yang diperoleh pada
waktu ulangan.

40
b) Reliabilitas

Reliabilitas berhubungan dengan masalah kepercayaan. Sebuah tes dapat


dipercaya apabila tes tersebut diberikan secara berulang-ulang selalu memberikan
hasil yang tetap. Reliabilitas tes adalah ketetapan tes tersebut dalam menilai apa
yang dinilai.

Misalnya kepada siswa kelas I SMA diberikan tes kimia secara berulang-ulang
dengan soal yang sama, tetapi berbeda waktunya dengan jarak waktu satu minggu,
ternyata hasil yang diperoleh dari tes-tes yang dilakukan tersebut relatif sama.
Mungkin saja terjadi adanya perbedaan hasil pada setiap tes yang diperoleh, tetapi
perbedaan ini disebabkan oleh adanya :
a. Pengalaman yang diperoleh pada waktu tes sebelumnya. Keadaan ini
dikatakan bahwa ada carry over effect atau practice effect yaitu adanya akibat
yang dibawa karena siswa telah mengalami kegiatan.
b. Kondisi siswa itu sendiri pada waktu mengerjakan tes tersebut misalnya siswa
dalam keadaan sakit atau baru dapat musibah yang berpengaruh pada
kejiwaan siswa.

Jadi perbedaan hasil tes yang diperoleh bukan karena alat penilaian yaitu tes, tetapi
oleh adanya 2 faktor tersebut di atas.
Koefisien reliabilitas tes dapat ditentukan dengan mengkorelasikan skor-skor yang
diperoleh dari hasil penilaian.

c) Obyektivitas

Obyektivitas lazimnya mempunyai pengertian tidak adanya unsur pribadi yang


mempengaruhi. Sedang lawan obyektif adalah subyektif artinya, terdapat unsur
pribadi. Jadi sebuah tes dikatakan memiliki obyektivitas apabila dalam
melaksanakan tes itu tidak ada faktor subyektif yang mempengaruhinya. Hal ini
terutama terjadi pada sistem skoringnya.

d) Praktibilitas

Sebuah tes dikatakan memiliki praktibilitas yang tinggi apabila tes tersebut bersifat
praktis, dalam pengertian mudah untuk pengadministrasiannya, mudah
dilaksanakan, mudah pemeriksaannya dan diklengkapi dengan petunjuk yang jelas
cara mengerjakannya.

41
e) Ekonomis

Yang dimaksud dengan ekonomis disini adalah bahwa pelaksanaan tes tersebut
tidak membutuhkan biaya yang mahal, tenaga yang banyak, dan waktu yang lama.

D. Teknik Penyusunan Kisi-Kisi Tes Hasil Belajar


a) Pengertian Kisi-kisi

Kisi-kisi adalah suatu format atau matriks yang memuat informasi yang dapat
dijadikan pedoman untuk menulis soal atau merakit soal menjadi tes. Kisi-kisi
disusun berdasarkan tujuan penggunaan tes. Dengan demikian dapat
diperoleh berbagai macam kisi-kisi. Misalnya, kisi-kisi tes yang dimaksudkan
untuk mendiagnosa kesukaran belajar murid berbeda dengan kisi-kisi tes yang
maksudkan untuk melihat prestasi belajar peserta didik. Penyusunan kisi-kisi
merupakan langkah penting yang harus dilakukan sebelum penulisan soal.
Tanpa adanya indikator dalam kisi-kisi tidak dapat diketahui arah dan tujuan
setiap soal.

b) Kegunaan dan Fungsi Kisi-kisi


Kisi-kisi tes berfungsi sebagai pedoman dalam penulisan soal dan perakitan
tes. Dengan adanya panduan ini, penulisan soal akan dapat menghasilkan
soal-soal yang sesuai dengan tujuan tes dan perakit tes dapat menyusun
perangkat tes dengan mudah. Dengan demikian, jika tersedia sebuah kisi-kisi
yang baik, maka penulis soal yang berbeda akan dapat menghasilkan
perangkat soal yang relatif sama, baik dari tingkat kedalaman maupun cakupan
materi yang ditanyakan.

c) Syarat Kisi-kisi yang Baik


Kisi-kisi tes prestasi belajar harus memenuhi beberapa persyaratan, yaitu :
1. mewakili isi kurikulum yang akan diujikan.
2. komponen-komponennya rinci, jelas, dan mudah dipahami.
3. soal-soalnya dapat dibuat sesuai dengan indikator dan bentuk soal yang
ditetapkan.

d) Komponen-komponen Kisi-kisi
Komponen yang diperlukan dalam sebuah kisi-kisi sangat ditentukan oleh
tujuan tes yang hendak disusun. Komponen-komponen ini dapat dihimpun
menjadi dua kelompok identitas dan kelompok matriks. Kelompok identitas
dicantumkan di bagian atas matriks, sedangkan kelompok matriks dicantumkan
dalam kolom-kolom yang sesuai. Komponen-komponen yang biasa digunakan
dalam penyusunan kisi-kisi tes prestasi belajar adalah sebagai berikut :

42
1. jenis sekolah/jenjang sekolah.
2. program/jurusan.
3. bidang studi/mata pelajaran.
4. tahun ajaran.
5. kurikulum yang diacu.
6. alokasi waktu.
7. jumlah soal.
8. bentuk soal.
9. Tujuan Pembelajaran
10. materi.
11. bahan kelas.
12. jumlah untuk setiap Materi Pokok
13. indikator.
14. nomor urut soal.

Butir 1-8 merupakan komponen identitas dan sisanya termasuk komponen


matriks.
Dari berbagai komponen tersebut di atas, komponen no. 10 hanya ditulis
Materi Pokok , komponen ini merupakan salah satu komponen yang perlu
penjelasan lebih rinci, karena menyangkut pemilihan Materi Pokok yang akan
diujikan. Pemilihan ini dilakukan karena di dalam suatu tes, tidak mungkin
semua Materi Pokok yang telah diajarkan, dapat diujikan dalam waktu singkat.
Oleh sebab itu, perlu dipilih Materi Pokok yang penting-penting saja. Pemilihan
Materi Pokok ini dilakukan dengan memperhatikan kriteria sebagai berikut :
1. urgensi, yaitu Materi Pokok yang secara teoritis, mutlak harus dikuasai
oleh siswa;
2. kontinuitas, merupakan Materi Pokok lanjutan yang merupakan
pendalaman dari satu atau lebih Materi Pokok yang sudah dipelajari
sebelumnya, baik dalam jenjang yang sama maupun antar jenjang;
3. relevansi, maksudnya Materi Pokok harus merupakan materi pokok yang
diperlukan untuk mempelajari atau memahami bidang studi lain;
4. keterpaksaan, Materi Pokok harus merupakan materi pokok yang memiliki
nilai terapan tinggi dalam kehidupan sehari-hari.

Untuk pemilihan Materi Pokok, selain diperhatikan kriteria pemilihan di atas


perlu pula diperhatikan bahwa penguasaan materi pokok terpilih harus dapat
diukur dengan menggunakan bentuk soal yang sudah ditetapkan. Misalnya
kalau sudah ditetapkan untuk membuat tes pilihan ganda, maka penguasaan
Materi Pokok yang dipilih harus dapat diukur dengan menggunakan pilihan
ganda. Sebaliknya kalau sudah ditetapkan untuk membuat tes uraian, maka
penguasaan Materi Pokok yang terpilih juga harus dapat diukur dengan
menggunakan tes uraian.

43
Komponen lainnya yang perlu penjelasan lebih rinci adalah materi dan
indikator. Materi dipilih/dirumuskan sebagai bagian dari beberapa materi yang
terdapat pada Materi Pokok terpilih. Pemilihan materi dilakukan berdasarkan
sub materi pokokyang akan ditanyakan dalan tes. Sedangkan indikator adalah
suatu rumusan yang menggunakan kata kerja operasional. Rumusan ini
memuat perilaku siswa dan materi yang akan diukur sesuai dengan materi
terpilih. Hal yang sangat penting dalam perumusan indikator adalah keterkaitan
indikator dengan materi, Materi Pokok dan Tujuan Pembelajaran.

Dalam penulisan kisi-kisi tes prestasi belajar, misalnya untuk ujian harian dan
ujian kenaikan kelas, para penulis kisi-kisi perlu merumuskan lebih lanjut
materi yang terpilih menjadi indikator. Perumusan ini penting karena dari
indikator yang terdapat pada kisi-kisi ini penulis soal dapat mengetahui
kemampuan murid yang hendak diukur. Karena indikator dibuat berdasarkan
materi yang berasal dari Materi pokok dan Tujuan pembelajaran tertentu maka
indikator ini dibuat untuk melihat ketercapaian tujuan pembelajaran.
Berikut ini adalah diagram yang menggambarkan proses penjabaran Tujuan
embelajaran (TP) menjadi indikator.

Keterangan diagram :
TP : berisi tujuan umum pembelajaran yang diharapkan dicapai
siswa.
PB : berisi Materi Pokok yang dipilih untuk diujikan.
Materi : berisi uraian/bagian dari Materi Pokok yang dipilih untuk
diujikan.
Rumusan materi di sini tidak harus persis sama dengan yang
terdapat dalam GBPP asalkan tidak menyimpang dari Materi
Pook yang bersangkutan.
Indikator : berisi ciri yang dapat diamati untuk digunakan sebagai
petunjuk bahwa suatu TP telah dicapai.
Panah berlabel 1 : menunjukkan bahwa indikator memberi petunjuk
(indikasi) mengenai ketercapaian TP.
44
Panah berlabel 2 : menunjukkan keterkaitan antara tiap komponen itu
dengan komponen yang mendahuluinya.
Panah berlabel 3 : menunjukkan urutan langkah-langkah antar komponen.

Berdasarkan diagram di atas dapat dilihat bahwa seorang penulis/penyusun


kisi-kisi yang melakukan penjabaran TP menjadi indikator perlu malalui
langkah-langkah sebagai berikut :
1. memilih TP (apabila materi yang hendak diujikan meliputi beberapa TP).
2. memilih Materi Pokok yang esensial.
3. memilih/merumuskan materi.
4. membuat indikator.

Kriteria indikator yang baik adalah :


1. Memuat ciri-ciri TP yang hendak diukur.
2. Memuat satu kata kerja operasional yang dapat diukur. Khusus untuk
bentuk soal uraian dapat lebih dari satu.
3. Berkaitan erat dengan materi.
4. Dapat dibuatkan soalnya dengan bentuk yang telah ditetapkan dalam kisi-
kisi.

Karena indikator berasal dari materi dan tiap TP mempunyai beberapa materi
maka jelaslah bahwa satu TP dapat dijabarkan ke dalam beberapa indikator
sesuai materi yang telah dipilih untuk diujikan.

e) Langkah Penyusunan Kisi-kisi

Komponen-komponen kisi-kisi yang disebutkan terdahulu adalah komponen-


komponen yang diperlukan dalam penyusunan kisi-kisi. Namun demikian, tidak
ada tuntutan atau keharusan untuk menggunakan semua komponen tersebut.
Penggunaan komponen-komponen tersebut disesuaikan dengan kebutuhan
berdasarkan jenis dan tujuan tes yang akan disusun.

Setelah ditentukan komponen-komponen yang perlu dimasukkan ke dalam


kisi-kisi, maka langkah selanjutnya adalah memasukkan semua komponen
tersebut ke dalam suatu format atau matriks. Salah satu format yang
digunakan adalah sebagai berikut :

Cantumkan beberapa identitas yang penting. Misalnya :

45
KISI-KISI PENULISAN SOAL UJIAN AKHIR

Jenis Sekolah : SMA


Mata Pelajaran : Kimia
Kurikulum : Kurikulum KTSP
Komponen
identitas Alokasi waktu : 90 menit
Jumlah soal : 30 soal
Bentuk soal : Pilihan Ganda

No. Kelas/ PB/SPB/Konsep/ No.


Urut TP Cawu Sub Konsep/ Materi Indikator Urut
Tema/Sub Tema Soal
Kom-
ponen
Mariks

Untuk lebih jelasnya lihat lampiran.

Perencanaan Tes
Tes baru akan berarti bila terdiri dari butir-butir soal yang menguji tujuan yang
penting dan mewakili ranah pengetahiian, kemampuan dan keterampilan secara
representatif. Untuk itu rnaka peranan perencanaan dalam pengujian menjadi
sangat penting. Tes tanpa rencana yang dapat dipertanggungjawabkan dapat
menjadi usaha sia-sia, bahkan mungkin akan mengganggu proses pencapaian
tujuan. Enam hal yang harus dipertimbangkan dalam perencanaan tes:
1. pengambilan sampel dan pemilihan butir soal,
2. tipe tes yang akan digunakan,
3. aspek yang akan diuji,
4. format butir soal,
5. jumlah butir soal, dan
6. distribusi tingkat kesukaran butir soal.
1. Pengambilan Sampel dan Pemilihan Butir Soal
Tes hasil belajar (achievement test) haruslah disusun atas butir-butir soal yang
terpilih, yang secara akademik dapat dipertanggung-jawabkan sebagai sampel yang
representatif dari ilmu atau bidang studi yang diuji dengan perangkat tes tersebut.
Proses pemilihan atau sampling butir soal itu tidak mungkin dapat dilakukan secara
acak (random). Hanya seorang ahli alam bidang studi yang tahu secara lebih baik
apakah butir-butir soal itu cukup representatif atau tidak. Pemilihan itu dilakukan
atas dasar pertimbangan pentingnya konsep, generalisasi, dalil, atau teori yang diuji
dalam hubungannya dengan peranannya terhadap bidang studi tersebut secara
46
keseluruhan. Karena itu tidak mungkin pemilihan itu dilakukan oleh orang dalam
bidang studi tersebut.
Untuk rnemperoleh butir-butir yang mewakili keseluruhan konsep yang dalam suatu
bidang studi, biasanya bidang studi itu dipilah-pilah beberapa pokok bahasan (major
content areas) dan sub pokok n (specific content areas). Tentu saja tidak perlu ada
jumlah butir soal sama untuk setiap pokok bahasan. Jumlah soal dalam setiap
pokok atau subpokok bahasan hendaknya sebanding dengan luas dan pokok
bahasan atau sub pokok bahasan tersebut. Sebagai tentang tingkat kepentingan
dari suatu pokok bahasan atau subpokok bahasan dapat dilihat dari kontribusinya
terhadap keseluruhan bidang studi itu atau, untuk mudahnya, keluasan
pembahasan pokok bahasan dan atau subpokok bahasan itu. Tidak ada batasan
jumlah butir soal untuk satu pokok bahasan atau suatu subpokok bahasan.
2. Tipe Tes yang Digunakan
Ebel dan Frisbie membagi tiga tipe soal: (1) esei, (2) objektif, dan (3) problem
matematik. Di samping itu masih juga dikenal soal-soal penampilan dan soal lisan.
Ada kesalahfahaman yang umum terjadi dikalangan pengguna tes, yaitu anggapan
yang menyatakan suatu tipe tes lebih baik dari tipe tes lainnya dalam mengukur
ranah kognitif tertentu. Berbagai penelitian telah menunjukkan perbedaan yang
berarti dalam mengukur level ranah kognitif yang sama. Soal esei yang baik sama
dapat mengukur ranah kognitif yang manapun seperti yang dapat diukur oleh soal
objektif yang baik, atau sebaliknya. Dan menghasilkan ranking subyek yang tidak
berbeda.
Pemilihan tipe tes yang akan digunakan lebih banyak ditentukan oleh kemampuan
dan waktu yang tersedia pada penyusun tes dari pada kemampuan peserta tes atau
aspek yang ingin diukur.
3. Aspek Kemampuan yang Diuji
Setiap bidang studi mempunyai penekanan kemampuan yang berbeda-beda.
Karena itu aspek yang diujipun haruslah yang berbeda pula. Aspek ranah kognitif
yang mana yang akan diuji harus sinkron dengan kemampuan yang ditentukan oleh
tujuan pendidikan yang telah dirumuskan terlebih dahulu. Dalam hubungan inilah
kita mengenal adanya 6 tingkatan kemampuan yang diuji, yaitu pengetahuan,
pemahaman, aplikasi, analisis, sintesis, dan evaluasi, yang lazim diberi simbol Cl.
C2, C3, C4, C5 dan C6. Di samping itu tentu juga harus diperhatikan kemampuan
dari ranah lain seperti afektif dan psikomotor. Jumlah soal untuk setiap ranah atau
untuk setiap level dalam ranah kognitif juga tidak perlu sama. Pada saat ini tes hasil
belajar lebih berorientasi kepada pengetahuan, pemahaman dan aplikasi,
sedangkan kemampuan pada level yang lebih tinggi seperti analisis, sintesis dan
evaluasi merupakan pengembangan lebih lanjut dari ketiga level kemampuan yang
disebutkan terdahulu. Hal ini tentu saja berarti bahwa jumlah soal yang mewakili
tiga level yang pertama diharapkan lebih banyak dari jumlah soal untuk tiga level
berikutnya.
4. Format Butir Soal
Baik tes objektif maupun tes esei mengenal berbagai format. Misalnya, dalam tes
objektif, acapkali dipilih format A (Pilihan Ganda), format B -(Pilihan Ganda Analisis
Hubungan Antar Hal), format C (Pilihan Ganda Analisis Kasus). atau format D
(Pilihan Ganda Kompleks). Berbagai penelitian juga telah menunjukkan bahwa

47
berbagai format butir soal ini tidak menunjukkan perbedaan efektivitas yang berarti
untuk mengukur berbagai level ranah kognitif, asalkan dikonstruksi sama baiknya.
Bahkan format butir soal B-S pun dapat mengukur level ranah kognitif yang tinggi,
asalkan dikonstruksi secara cermat oleh ahli bidang studi dan ahli konstruksi tes.
Perbedaan antar format butir soal tersebut tidak terletak pada efektivitasnya
mengukur level kemampuan, tetapi lebih banyak pada penerkaannya (dalam hal
peserta tes kurang menguasai bahan yang di tes).
5. Jumlah Butir Soal
Jumlah butir soal tentu saja tidak ada ketentuan yang pasti. Tetapi yang harus
diingat ialah jumlah butir soal berhubungan langsung dengan reliabilitas tes dan
representasi isi bidang studi yang di tes. Makin besar jumlah butir soal yang
digunakan dalam suatu tes maka kemungkinan akan makin tinggi reliabilitasnya,
baik dalam arti stabilitas maupun internal konsistensinya. Dilihat dari segi jumlah
inilah maka tes objektif mempunyai kekuatan yang lebih dari tes esei. Karena tugas
yang harus diselesaikan dalam tes objektif itu sangat singkat, maka kemungkinan
untuk menggunakan jumlah butir soal yang besar menjadi lebih besar pula.
Sedangkan tes esei tidak memungkinkan menggunakan jumlah item yang banyak.
Dengan demikian representasi bidang studi dan reliabilitas tes objektif akan lebih
baik dari tes esei.
Jumlah butir soal itu haruslah direncanakan:
a. jumlah keseluruhan.
b. jumlah untuk setiap pokok bahasan/topik/content area,
c. jumlah untuk setiap format,
d. jumlah untuk tiap kategori tingkat kesukaran.
e. jumlah untuk setiap aspek pada ranah kognitif.
Tentu saja dalam menentukan jumlah ini harus mempertimbangkan waktu yang
tersedia, biaya yang ada, kompleksitas tugas yang dituntut oleh tes, dan waktu ujian
diadakan.

6. Distribusi Tingkat Kesukaran


Pada umumnya semua ahli konstruksi tes sependapat bahwa tes yang prbaik
adalah tes yang mempunyai tingkat kesukaran di sekitar 0.50. Makin flekat ke titik
itu makin mampu tes itu membedakan antara kelompok yang piaik dan kelompok
yang kurang belajar. Tetapi tentu saja itu bukanlah satu-satunya pertimbangan
untuk menentukan distribusi tingkat kesukaran. penentuan distribusi ini juga
ditentukan oleh tujuan tes. Misalnya, bila tes dimaksudkan untuk seleksi, maka tes
harus lebih mengarah kepada yang mempunyai tingkat kesukaran yang lebih tinggi.
Tetapi yang harus diingat tes yang terlalu sukar atau terlalu mudah tidak akan
memberi informasi yang banyak.
Dalam hubungan dengan distribusi tingkat kesukaran ini juga harus diperhatikan
bahwa tes yang mempunyai tingkat kesukaran yang rendah sebaiknya diletakkan di
awal tes dan yang tinggi pada akhir perangkat tes. Ketentuan ini tidaklah
menunjukkan perbedaan yang berarti pada "power test". Perbedaan itu lebih
bersifat memberi motif untuk lebih terdorong mengerjakan seluruh butir soal.
48
7. Beberapa Pertimbangan Lain
Beberapa pertimbangan lain dalam merencanakan tes adalah:
a. apakah akan menggunakan "open book" atau "closed book"
b. apakah frekuensi pelaksanaan tes sering atau jarang
c. apakah pelaksanaan tes diumumkan sebelumnya atau mendadak
d. bagaimana mode penyajian tes.
8. Kisi-kisi tes
Kisi-kisi atau biasa juga sebagai tabel spesifikasi tes umumnya ditampilkan dalam
bentuk matriks yang menunjukkan proporsi dan jumlah angka mutlak dari setiap
aspek butir soal yang membentuk suatu perangkat tes. Dalam suatu kisi-kisi
setidak-tidaknya harus dengan mudah terbaca: (1) Pokok/Sub-pokok bahan yang
diuji, (2) Kemampuan yang diuji (level ranah kognitif), (3) Tingkat kesukaran butir
soal, dengan asumsi pertimbangan ada pada penulis soal.
Kisi-kisi yang sudah terisi menggambarkan proporsi banyaknya butir soal untuk
setiap pokok/ sub pokok bahasan dan setiap tingkat kemampuan pada ranah
kognitif.

D. Langkah-Langkah Dalam Menyusun Tes Kognitif

Fakta di lapangan bahwa tes buatan guru di sekolah-sekolah, menunjukkan tes


hasil belajar kognitif lebih dominan dibandingkan tes hasil belajar afektif dan
psikomotorik. Dengan asumsi siswa yang berubah tingkat kognisinya sebenarnya
dalam kadar tertentu telah berubah pula sikap dan perilakunya.

Dengan tidak mengurangi arti pentingnya obyek penilaian terhadap ranah afektif
dan psikomotorik, berikut ini akan dibahas tentang langkah-langkah dalam
menyusun tes kognitif. Hal ini didasarkan atas alasan bahwa tes hasil belajar
kognitif inilah yang umum dibuat dan dilakukan para guru di sekolah-sekolah.

Ada 5 (lima) langkah untuk menyusun tes kognitif yang baik yaitu sebagai berikut :
(1). Membuat “blue print” atau kisi-kisi yaitu berupa diagram matriks yang
menggambarkan secara menyeluruh isi atau bahan pelajaran dan aspek-aspek
kemampuan siswa yang berkenaan dengan bahan pelajaran tersebut. Pada
dasarnya ada 2 persoalan pokok yang dihadapi dalam menyusun tes, yaitu :
apa yang hendak diukur dan bagaimana pengukuran itu harus dilakukan.

Untuk menetapkan dengan baik apa yang hendak diukur, perlu diperhatikan
langkah-langkah sebagai berikut :
a) Buatlah daftar ruang lingkup bahan pelajaran yang akan diujikan dengan
menyebut topik-topiknya, untuk keperluan tersebut perlu dilihat kurikulum.
Daftar yang dibuat tadi dimaksudkan agar jangan sampai ada bahan
pelajaran yang penting terlewati sehingga tak teramati keberhasilannya.
49
b) Buatlah daftar satu lagi yang menunjukkan aspek-aspek kemampuan
siswa sebagai hasil belajar. Misalnya : apakah berkenaan dengan bahan
pelajaran lihat daftar ruang lingkup di atas, siswa diharapkan dapat
mengingat kembali fakta, mengerti/memahami, menggunakan, ataukah
siswa diharapkan mempunyai kemampuan berpikir yang lebih tinggi
seperti membuat analisis, sintesis atau penilaian.
c) Buatlah tabel berupa kisi-kisi yang menyatakan hubungan antara bahan
pelajaran dengan kemampuan siswa. Dengan kisi-kisi ini kita dapat
membuat kesetimbangan atau pemerataan dari bahan maupun aspek
kemampuan yang hendak diukur, karena bagaimanapun juga tes
merupakan sample atau contoh dari keseluruhan hasil belajar. Tabel yang
telah dibuat tadi akan menolong guru untuk dapat memilih dengan tepat
bagian-bagian yang penting. Bagian-bagian yang dianggap penting
tersebut selanjutnya diberikan bobot lebih besar, artinya dapat diberikan
tes lebih banyak. Yang dianggap penting dalam hal ini adalah
kemampuan-kemampuan yang esensial, yang sangat dibutuhkan siswa
pada masa mendatang, untuk mengikuti pelajaran yang lebih tinggi.
d) Berikanlah tanda pada masing-masing kotak dalam tabel yang telah
dibuat tadi sedemikian rupa sehingga dapat diketahui perbandingan
bobotnya. Misalnya dengan memberi angka 3 pada kotak yang penting,
angka 2 pada kotak yang agak penting, angka 1 pada yang kurang
penting, dan angka nol (O) pada kotak yang tidak penting. (lihat contoh
tabel).
e) Rencanakan banyaknya tes (item tes) sesuai dengan waktu yang
disediakan. Misalnya waktu yang tersedia 90 menit Untuk tes obyektif
siswa dapat menjawab dengan waktu 1 menit untuk tiap satu item tes.
Tetapi mungkin ada nomor-nomor yang memerlukan pemikiran untuk
menyelesaikan lebih dari 1 menit, sehingga untuk waktu 90 menit
diperlukan soal kira-kira 70 s/d 80 item tes. Misalnya dalam contoh
dibawah ini kita tetapkan 80 soal, jumlah ini kemudian kita bagi dalam 4
katagori :
• Aspek ingatan 30% = 30/100 x 80 = 24 soal
• Aspek pemahaman 40% = 40/100 x 80 = 32 soal
• Aspek aplikasi 20% = 20/100 x 80 = 16 soal
• Aspek analisa, sintesa, dan penilaian 10% = 10/100 x 80 = 8 soal
Jumlah = 80 soal

Tabel : Jenis Kemampuan

Jenis
Kemampuan Ingatan Pemahaman Aplikasi Analisis,sintesis, Jumlah
Ruang C1 C2 C3 Penilaian
50
Lingkup C4
1. A. 1............ 2 (6) ( ) ( ) ( )
2...........
2. B. 1............ 1 (3) ( ) ( ) ( )
2...........
3. C. 1........... 0 ( -) ( ) ( ) ( )
2...........
3........
4. D. 1.......... 1 (4) ( ) ( ) ( )
2..........
5. E. 1........... 3 (11) ( ) ( ) ( )
2...........
3...........
Bobot 30% 40% 30% 10% 100%
Jumlah Soal 24 32 24 8 80

Keterangan :
• Pembobotan jenjang kemampuan 30%, 40%, 30%, dan 10% tersebut
adalah semata-mata suatu contoh dan bukanlah merupakan sesuatu yang
pasti. Hal ini tergantung dari tujuan pembelajaran itu sendiri.
• Pada kotak A/C1 dari tabel di atas angka 2 yang berarti “agak penting”,
dan pada kotak ini diberi alokasi soal sebanyak 2/7 x 24 = 6 soal.
Sedangkam pada kotak B/C1 alokasi soal 1/7x 24 = 3 atau 4 soal dan
seterusnya sehingga pada setiap kotak dapat ditetapkan jumlah soal yang
harus dibuat. Jumlah soal yang akan dibuat tuliskan diantara tanda
kurung.

Setelah kita tetapkan tentang apa yang akan diukur, maka selanjutnya
bagaimana pengukuran itu harus dilakukan, maka langkah selanjutnya adalah
dengan mempelajari sifat-sifat berbagai bentuk tes.

(2) Mempelajari berbagai bentuk tes : dengan tujuan agar dapat memilih bentuk
tes dengan mempelajari sifat-sifat berbagai bentuk tes sebagaimana yang
telah dibahas pada uraian sebelum ini maka akan dapat ditentukan bentuk tes
yang tepat sekaligus dapat ditentukan cara mengukur berbagai aspek
kemampuan siswa.
(3) Menyusun dan mereview tes :

Langkah ini meliputi :


a. Menyusun Tes
 Menyusun Item Tes

51
Dengan selalu memperhatikan blue print, tujuan pembelajaran serta
berbagai bentuk tes, masing-masing item tes dapat ditulis dalam
selembar kertas dengan format sebagai berikut :

Jenjang Kemampuan C1 ( ) C3 ( ) C5 ( )
C2 ( ) C4 ( ) C6 ( )

Mata Ujian : Pokok Bahasan Sub Pokok Bahasan


(Konsep) (Sub Konsep)
....................................................................................................

STEM :

OPTION :(A)
(B)
(C)
(D)
(E)
KUNCI : A , B , C , D , E (lingkari)

TINGKAT KESUKARAN :
Perkiraan : Sukar Setelah Try Out : ................
Sedang
Mudah
CATATAN : ...............................................................................

 Menyusun / Merakit Tes


Setelah masing-masing item di buat, kemudian disusun berdasarkan :
(a) Pengelompokan atas kesamaan bentuk tes.
(b) Urutan kesukaran ; usahakan agar tes tidak dimulai dari yang
sukar.
(c) Beri nomor urut. Usahakan agar hanya ada satu urutan nomor
meskipun bentuknya berbeda-beda.

Contoh : Bentuk A : 1
2
3
4
B : 5
6
7
8
52
C : 9
10
11

 Buat lembar jawaban tes


Contoh : A. Pilihan ganda :

1 2 3 4
A
B
C
D

B. Benar – Salah :

5 6 7 8
(B)
(S)
C. Penjodohan :

9 10 11 12 13
(A)
(B)
(C)
(D)
(E)
(F)
(G)
(H)

D. Isian dan jawaban singkat


Buat pada masing-masing nomor, ruang yang sama
panjangnya.

E. Tes Uraian
Beri kertas atau ruang yang cukup

• Buat lembar kunci jawaban tes.


Contoh :
Mata Ujian : ..................
Tanggal : ..................

53
Nomor Kunci Bobot
A. 1. A 1
2. C 1
3. B 1
4. D 2
B. 5. S 1
6. B 1
7. S 1
8. S 1
C. 9. E 2
10. D 2
11. A 2
12. F 2
13. C 2
D. 14. Vitamin A 2
15. Molekul 2
16. Asam sulfat 2

b. Mereview Tes

Dilakukan dengan berpedoman pada pertanyaan-pertanyaan berikut :


1. Apakah distribusi item sudah cocok dengan “blue print”?
2. Apakah bagian-bagian penting sudah terwakili ?
3. Apakah item pada masing-masing soal sudah jelas dan singkat?
4. Apakah sudah cocok dengan tujuan pembelajarannya?
5. Apakah pengecoh pada pilihan ganda sudah cukup samar?
6. Apakah kunci jawaban sudah benar?
7. Apakah isi (pengetahuan) dari soal itu sudah benar?
8. Apakah urutan sudah baik?
9. Apa tidak ada nomor yang tumpang tindih?
10. Apa lembar kunci jawaban dan lembar jawaban sudah dibuat dengan
benar?
11. Apakah alokasi waktu sudah ditetapkan dan cukup?
12. Apakah petunjuk khusus (teknik menjawab) diberikan dengan jelas?

(4) Mencoba dan menganalisa hasil tes, dengan tujuan untuk memperoleh data
untuk mengukur hasil belajar siswa serta untuk menilai tes itu sendiri.

(5) Revisi dan penyusunan kembali : Langkah terakhir dalam membuat tes
kognitif ini adalah menyusun kembali tes yang selanjutnya siap untuk dipakai

54
E. Cara Menskor Soal-Soal Essay
1 Nilailah jawaban-jawaban soal essay dalam hubungannya dengan hasil
belajar yang sedang diukur.
2. Untuk soal-soal essay dengan jawaban terbatas (restricted-response
questions), berilah skor dengan point method; gunakan pedoman jawaban
sebagai petunjuk. Tulislah lebih dahulu pedoman jawabannya untuk tiap
soal atau bagian soal (dengan weighting atau pembobotan).
3. Untuk soal-soal essay dengan jawaban terbuka (extended response
questions), nilailah dengan rating method; gunakan kriteria tertentu
sebagai pedoman penilaian.
Extended-response items menuntut jawaban yang terbuka dan bebas
sehingga sering kali tidak mungkin untuk menyiapkan pedoman
jawabannya. Oleh karena itu, biasanya guru atau pembuat tes itu menilai
tiap jawaban dengan menimbang-nimbang kualitasnya dalam
hubungannya dengan kriteria yang telah ditetapkan sebelumnya, jadi
bukan menskor point demi point dengan kunci jawaban. Untuk itu bisa
dilakukan dengan mengklasifikasikan jawaban-jawaban itu ke dalam 5
tingkat; yang selanjutnya diberi nilai 0, 1, 2, 3, 4; dan A, B, C, D, dan E.
4. Nilailah semua jawaban siswa soal demi soal, dan bukan siswa demi
siswa. Dengan demikian dapat dihindarkan terjadinya halo effect.
5. Nilailah jawaban-jawaban soal essay tanpa mengetahui identitas atau
nama siswa yang mengerjakan jawaban itu.
6. Bilamana mungkin, mintalah dua atau tiga orang guru lain, yang
mengetahui masalah itu, untuk menilai tiap jawaban. Ini diperlukan untuk
mengecek keandalan skoring terhadap jawaban-jawaban essay itu.
Tentu saja hal ini tidak perlu dilakukan pada setiap penilaian, tetapi sewaktu-waktu
saja, misalnya jika diperlukan untuk memilih siswa-siswa yang dicalonkan untuk
mengikuti latihan tertentu atau untuk memilih juara sekolah, misalnya.

F. Cara Menskor Tes Objektif

a. Fill-in dan completion (te isian dan melengkapi)

Mengenai cara menilai tes bentuk ini ada dua pendapat. Yang pertama
mengatakan bahwa skor maksimum setiap bentuk fill-in sama dengan
jumlah isian yang ada pada tes tersebut. Jika pada suatu tes bentuk fill-in
ada 10 item, dan tiap item berisi satu isian, dua isian, atau tiga isian, maka
cara menilainya hitung menurut jumlah isian yang ada pada seluruh item.

Pendapat kedua mengatakan bahwa skor maksimum tes berbentuk fill-in


dihitung menurut jumlah itemnya. Tiap item dinilai satu, meskipun mungkin
jumlah isiannya tidak sama banyaknya.
55
Kami berpendapat bahwa yang lebih baik adalah pendapat yang pertama,
karena penilaian yang demikian lebih halus dan lebih adil.

Rumus penskoran untuk fill-in dan completion adalah sebagai berikut :

S = R
S = skor terakhir atau yang diharapkan
R = jumlah isian yang dijawab betul (right)

Contoh Penggunaan :
Misalkan sebuah tes berbentuk fill-in mengandung 30 isian.
Ahmad mengerjakan tes tesebut 23 isian betul, 5 isian salah, 2 isian
kosong (tidak dijawab), maka skor Ahmad = 23 (tiap isian diberi nilai satu)

b. True-false (tes benar salah)

Setiap item tes bentuk true-false diberi skor maksimum 1 (satu). Jadi,
apabila suatu item dijawab betul (sesuai dengan kunci jawaban), maka
skornya adalah 1 (satu). Akan tetapi, jika dijawab salah (tidak sesuai
dengan kunci jawaban), maka skornya 0 (nol).

Untuk menghitung akor terakhir dari seluruh item tes bentuk true false
biasanya dipergunakan rumus sebagai berikut :

R W
S atau S  R W
n 1

Keterangan :
S = skor terakhir atau yang diharapkan
R = jumlah item yang dijawab betul (right)
W = jumlah item yang dijawab salah (wrong)
n = banyaknya option; untuk true-false selalu dua
1 = bilangan tetap

Contoh penggunaan :
Umpamakan jumlah item true-false (B-S) = 20.
Seorang siswa bernama Ali dapat menjawab betul 13 item, dan salah 7
item. Maka skor yang diperoleh Ali adalah sebagai berikut :

56
13  7
S 6
2 1

Aman dapat menjawab betul 10 item, dan salah 10 item. Skor yang
diperolehnya adalah sebagai berikut :

10  10
S 0
2 1

Bakir hanya dapat menjawab 8 item betul dan 12 item salah. Maka skor
yang diperoleh Bakir adalah :

8  12
S  4
2 1

Dengan menggunakan rumus tersebut ternyata bahwa siswa yang hanya


dapat menjawab betul setengah dari jumlah item, akan mendapat skor 0
(nol). Dan siswa yang menjawab betul kurang dari setengah, akan dapat
skor minus.

c. Multiple choice (tes pilihan berganda)

Cara menskor untuk bentuk tes ini adalah sebagai berikut. Item yang
dijawab betul diberi skor 1 (satu), dan yang salah diberi skor 0 (nol).

Untuk menghitung skor terakhir dari tes yang berbentuk multiple choice
dipergunakan rumus sebagai berikut :

W
S  R
n 1

Contoh penggunaannya:
Umpamakan kita membuat tes yang berbentuk multiple choice dengan 20
item, dengan option atau alternatif jawaban (a, b, c dan d) 4 tiap item.
Seorang siswa bernama Rizki menjawab betul 14 item, dan salah 6. Maka
skor yang diperoleh Rizki dari tes tersebut adalah sebagai berikut :

6
S  14   14  2  12
4 1
57
Jika dalam mengerjakan tes yang berbentuk true false atau multiple
choice terdapat item yang tidak dijawab (dikosongkan), maka dalam
penilaian atau scoring, item yang tidak dijawab itu tidak diperhitungkan
(tidak dianggap benar atau tidak dianggap salah).
Sebagai contoh :
a. True false
Jumlah 30 item
Dijawab betul 19 item
Dijawab salah 8 item
Tidak dijawab 3 item
Skor yang diperoleh :
19  8
S  19  8  11
2 1
Jadi yang diperhitungkan di dalam scoring hanya 27 item.

b. Multiple Choice :
Jumlah 20 item
Dijawab betul 16 item
Dijawab salah 3 item
Tidak dijawab 1 item
3
Skor yang diperoleh :  16   16  1  15
4 1

Akan tetapi, ada juga yang berpendapat lain, yaitu semua item yang tidak
dijawab (dikosongkan) berarti salah. Jadi, baik item yang dijawab, tetapi
salah, maupun item yang dikosongkan, atau tidak dijawab, kedua-duanya
dianggap salah. Tentu saja hal ini bergantung pada perjanjian antara
pengetes dan yang dites. Oleh karena itu, sebelum tes dimulai, sebaiknya
guru menjelaskan terlebih dahulu bagaimana cara menskor akan
dilakkukan, dan bagaimana pula cara mengolauh skor menjadi nilai.
Dengan demikian, siswa yang dites akan lebih berhati-hati dalam
mengerjakannya.

d. Matching (tes menjodohkan)

Untuk menilai suatu tes yang berbentuk matching, diperhitungkan dari


jumlah item yang dijawab betuk saja. Rumusnya sama dengan
completion, yaitu :

58
SR

Contoh penggunaan :
a. Misalkan sebuah tes berbentuk matching banyaknya 10 item.

Ahmad dapat mengerjakan tes tersebut 7 item betul dan 3 item


salah.Maka skor yang diperoleh Ahmad =10 – 3 = 7.

Darman dapat mengerjakan 5 item betul, 3 item salah dan 2 item


dikosongkan atau tidak dijawab. Maka skor yang diperoleh darman =
5.

Jadi, dengan rumus penskoran tersebut di atas, item yang dijawab


salah dan item yang tidak dijawab atau dikosongkan kedua-duanya
dianggap salah karena yang diperhitungkan hanya item yang dijawab
betul.

b. Cara lain dalam penilaian tes berbentuk matching dapat juga


dilakukan dengan menentukan tingkat kesukaran (difficulty index) dari
tes tersebut dibandingkan dengan tes-tes bentuk lain yang digunakan
bersama-sama. Cara yang kedua ini perlu dilakukan jika kita
menganggap bahwa items yang berbentuk matching ini lebih sukar
dari pada items bentuk yang lain yang digunakan bersama-sama
dalam suatu tes.

Misalkan suatu tes terdiri atas tiga macam bentuk, yaitu true-false,
multiple choice, dan matching. Kita telah menetapkan, bahwa tingkat
kesukaran tiap item dari ketiga macam bentuk tes tersebut berturut-
turut adalah 1, 2, dan 4. ini berarti bahwa nilai tiap item yang betul
dari true-false=1, multiple choice=2, dan matching=4.

Andaikata tes yang berbentuk matching itu ada 10 item, dan Basir
dapat menjawab betul 7 item, maka skor yang diperoleh Basir = 7 x 4
= 28.

c. Skor terakhir dari tiap siswa

a) Jika suatu tes terdiri atas satu macam bentuk saja, maka skor
terakhir dari setiap siswa yang dites dihitung dengan

59
menggunakan rumus masing-masing seperti yang telah
diuraikan pada 1 sampai dengan 4 tersebut di atas.
b) Jika suatu tes terdiri atas beberapa macam bentuk, maka skor
terakhir setelah dihitung menurut masing-masing.

Misalkan suatu tes terdiri atas empat macam bentuk, yakni:

True-false = 30 item; tingkat kesukaran ditentukan 1.


Multiple-
choice = 20 item; tingkat kesukaran ditentukan 2.
Option =4.
Matching = 10 item; tingkat kesukaran ditentukan 3.
Essay = 4 item; tingkat kesukaran ditentukan 5.

Dalam menentukan tingkat kesukaran tersebut berarti sekaligus kita


telah mengadakan “pembobotan” (weighting) untuk tiap bentuk tes
menurut tingkat kesukarannya.

Seorang murid bernama Basir mengerjakan tes tersebut dengan hasil


sebagai berikut :

Betul Salah Tidak Skor


dijawab
True-false 22 6 2 S  22  6  16
Multiple- 14 6 - (2 x6)
choice S  (2 x14)   24
4 1
Matching 7 2 1 S  7 x3  21
Essay 3 - S  3 x5  15
Skor terakhir yang diperoleh Basir = 76
Skor yang diperoleh Basir sebesar 76 itu merupakan skor mentah
(raw score) yang belum diolah ke dalam skor standar atau skala
penilaian yang kita kehendaki.

Untuk mengolah skor mentah menjadi skor menurut skala 1-10


seperti yang biasa kita gunakan dalam pengisian rapor murid-murid,
diperlukan perhitungan secara statistik.

60
BAB III
VALIDITAS, RELIABILITAS TES DAN ANALISIS BUTIR SOAL

A. Validitas dan Reliabitas Tes

Banyak cara yang dilakukan oleh guru untuk menyusun tes berupa pertanyaan
yang bertujuan untuk mengukur kemampuan siswa sesuai dengan TPK yang
diharapkan. Menyusun sebuah tes yang baik ditentukan pula oleh pengalaman
seorang guru dan bagaimana situasi pelaksanaan tes tersebut. Walaupun dalam
melaksanakan tes sudah mengikuti aturan dan prosedur/cara yang telah ditentukan
namun informasi yang diperoleh dari skor hasil tes tersebut belum memperoleh
gambaran tentang kualitas tes yang dibuat.

Sebagaimana telah dikemukakan dalam uraian sebelumnya bahwa sebuah tes


yang dapat dikatakan baik sebagai alat ukur hasil belajar, minimal memiliki dua hal
yakni validitas atau ketepatan dan reliabilitas atau ketetapan. Dalam uraian berikut
ini akan dibahas macam-macam validitas dan reliabilitas.

1. Macam-macam Validitas

Validitas sebuah tes dapat diketahui dari hasil pemikiran (logical analysis) dan dari
hasil pengalaman (empirical analysis). Dua hal inilah yang menjadi dasar
pengelompokan validitas tes.

Validitas isi (content validity


Validitas logis
Validitas konstruksi (construct
validity)
Validitas
Validitas ada sekarang (concurent
validity)
Validitas Empiris
Validitas prediksi (prediction
validity)

a) Validitas Isi (Content Validity)

Validitas isi adalah validitas yang ditinjau dari segi isi tes itu sendiri sebagai
alat pengukur hasil belajar yaitu sejauh mana tes hasil tersebut isinya telah
dapat mewakili secara representatif keseluruhan konsep/materi yang

61
seharusnya diteskan. Untuk tujuan ini perlu dibuat kisi-kisi sebagai alat untuk
menentukan validitas isi. Sebuah tes dikatakan memiliki validitas isi apabila
tes tersebut mengukur isi/materi pelajaran yang diberikan sejajar dengan TPK.
Oleh karena materi yang diajarkan tertera dalam GBPP yang merupakan
penjabaran dari kurikulum maka validitas isi disebut juga dengan validitas
kurikuler.

Cara lain untuk menentukan / mengetahui validitas isi yaitu dengan meminta
bantuan ahli bidang studi untuk menelaah apakah konsep materi yang diajukan
telah memadai atau belum sebagai sampel tes.

b) Validitas Konstruksi (Construct Validity)

Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang
membangun tes tersebut benar-benar telah dapat dengan tepat mengukur
aspek-aspek berpikir (aspek kognitif, afektif, psikomotorik) seperti yang telah
dirumuskan dalam TPK.

Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan cara
memerinci dan memasangkan setiap butir soal dengan setiap aspek dalam
TPK.

Sebagai contoh, jika susunan TPK “Siswa dapat membedakan antara


perubahan fisika dan perubahan kimia”, maka butir soal pada tes; Jelaskan
perbedaan perubahan fisika dan perubahan kimia.

c) Validitas Bandingan

Validitas ini juga dikenal dengan istilah validitas empiris atau validitas ada
sekarang. Dikatakan validitas empiris sebab validitas tes tersebut ditentukan
atas dasar pengalaman yang telah diperoleh. Adapun dikatakan sebagai
validitas ada sekarang, artinya mengaitkan dengan hal yang telah ada pada
waktu yang lalu sehingga data mengenai pengalaman masa lalu pada saat
sekarang ini sudah ada.

Suatu tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Pengertian sesuai menunjukkan ada dua hal yang dipasangkan.
Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman di mana data
pengalaman tersebut sekarang sudah ada.
Jadi dapat dipahami bahwa validitas bandingan atau empiris merupakan
validitas yang ditinjau dalam hubungannya dengan alat pengukur lain sebagai
kriterium atau alat banding.

62
Misalnya seorang guru ingin mengetahui apakah tes sumatif kimia yang
disusunnya sudah valid atau belum. Untuk ini diperlukan sebuah kreiteria masa
lalu yang sekarang datanya telah ada misalnya nilai tes sumatif yang lalu.

d) Validitas Prediksi

Prediksi artinya “ramalan”, didalamnya mengandung pengertian mengenai


sesuatu hal yang akan datang yang sekarang ini belum terjadi. Sebuah tes
dikatakan memiliki validitas ramalan apabila secara tepat menunjukkan
kemampuan untuk meramalkan apa yang akan terjadi pada masa mendatang.
Misalnya tes seleksi penerimaan mahasiswa baru pada suatu perguruan tinggi
adalah sebuah tes yang diharapkan mampu meramalkan keberhasilan studi
para calon mahasiswa dalam mengikuti kuliah diperguruan tinggi tersebut pada
masa yang akan datang. Berdasarkan hasil seleksi, calon yang dinyatakan
lulus diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti kuliah
di perguruan tinggi. Sebaliknya calon yang tidak lulus karena nilai tes yang
rendah diperkirakan tidak mampu mengikuti perkuliahan di perguruan tinggi
tersebut.

Keputusan yang diambil dalam seleksi tersebut di atas untuk meramalkan


kemampuan calon mahasiswa pada masa yang akan datang mengandung
pengertian bahwa validitas ramalan itu ditandai dengan adanya kesejajaran,
kesesuaian antara nilai-nilai hasil seleksi yang diperoleh pada masa kini
dengan nilai prestasi belajar (hasil belajar) mereka setelah diterima menjadi
mahasiswa. Sebagai alat pembanding validitas prediksi adalah nilai hasil
belajar mahasiswa di perguruan tinggi, oleh karena itu nilai hasil belajar
ditetapkan sebagai kriterium. Apabila terdapat kesesuaian/ hubungan antara
tes yang diuji validitas ramalan (tes seleksi) dengan nilai hasil belajar di
perguruan tinggi sebagai kriteria, maka hubungan diantara kedua variabel
tersebut disebut hubungan searah atau dikenal dengan istilah korelasi positif.

2. Cara Menentukan Validitas Alat Ukur

Suatu tes dikatakan memiliki validitas ramalan apabila hasil tes tersebut sesuai
dengan kriteium yang telah ditentukan atau memiliki kesejajaran. Cara yang
digunakan untuk mengetahui kesejajaran adalah dengan Teknik Analisis
Korelasional Product Moment dari Karl Pearson
Rumus korelasi product moment ada 2 cara yaitu :
4) Rumus korelasi product moment dengan simpangan angka kasar

63
 xy
xy 
( x 2 )( y 2 )
Di mana :
xy = koefisien korelasi antara variabel x dan variabel y
x dan y = variabel
x = X–X
y = Y–Y
xy = jumlah perkalian x dan y
x2 = kwadrat dari x
y2 = kwadrat dari y

5) Rumus korelasi product moment dengan angka kasar

N  XY  ( X )( Y )
XY 
N  X 2
 ( X ) 2  N  Y 2
 ( Y ) 2 
xy = koefisien korelasi antara variabel x dan variabel y

Contoh : Menghitung validitas bandingan


Misal akan menghitung validitas bandingan tes hasil belajar kimia kelas I semester
I. Sebagai kriterium diambil rerata nilai ulangan harian. Nilai tes yang akan dicari
validitasnya diberi kode X dan rata-rata nilai harian diberi kode Y kemudian dibuat
tabel persiapan sebagai berikut :

Tabel : Perhitungan Validitas Bandingan

x y
No. X Y __ __ x2 y2 xy
( X  X ) (Y  Y )
1 30 23 -27.03 -24.75 730.35 612.56 668.87
2 30 23 -27.03 -24.75 730.35 612.56 668.87
3 30 27 -27.03 -20.75 730.35 430.56 560.77
4 30 27 -27.03 -20.75 730.35 430.56 560.77
5 40 27 -17.03 -20.75 289.85 430.56 353.27
6 40 30 -17.03 -17.75 289.85 315.06 302.19
7 43 30 -14.03 -17.75 196.70 315.06 248.94
8 43 30 -14.03 -17.75 196.70 315.06 248.94
9 43 33 -14.03 -14.75 196.70 217.56 206.87
10 43 33 -14.03 -14.75 196.70 217.56 206.87
11 50 33 -7.03 -14.75 49.35 217.56 103.62
12 50 40 -7.03 -7.75 49.35 60.06 54.44

64
13 50 40 -7.03 -7.75 49.35 60.06 54.44
14 50 40 -7.03 -7.75 49.35 60.06 54.44
15 53 40 -4.03 -7.75 16.20 60.06 31.19
16 53 43 -4.03 -4.75 16.20 22.56 19.12
17 53 43 -4.03 -4.75 16.20 22.56 19.12
18 53 43 -4.03 -4.75 16.20 22.56 19.12
19 53 47 -4.03 -0.75 16.20 0.56 3.02
20 57 47 -0.02 -0.75 0.00 0.56 0.02
21 57 50 -0.02 2.25 0.00 5.06 -0.06
22 57 53 -0.02 5.25 0.00 27.56 -0.13
23 57 53 -0.02 5.25 0.00 27.56 -0.13
24 60 53 2.98 5.25 8.85 27.56 15.62
25 60 53 2.98 5.25 8.85 27.56 15.62
26 63 53 5.98 5.25 35.70 27.56 31.37
27 63 53 5.98 5.25 35.70 27.56 31.37
28 70 57 12.98 9.25 168.35 85.56 120.02
29 70 57 12.98 9.25 168.35 85.56 120.02
30 70 57 12.98 9.25 168.35 85.56 120.02
31 70 60 12.98 12.25 168.35 150.06 158.94
32 73 60 15.98 12.25 255.20 150.06 195.69
33 73 63 15.98 15.25 255.20 232.56 243.62
34 73 63 15.98 15.25 255.20 232.56 243.62
35 77 70 19.98 22.25 399.00 495.06 444.44
36 77 70 19.98 22.25 399.00 495.06 444.44
37 77 70 19.98 22.25 399.00 495.06 444.44
38 80 70 22.98 22.25 527.85 495.06 511.19
39 80 73 22.98 25.25 527.85 637.56 580.12
40 80 73 22.98 25.25 527.85 637.56 580.12
Jumlah 2281 1910 8874.98 8871.50 8685.25

__
X 2281
X   57,025
N 40

__
Y 1910
Y   47,75
N 40
__
xX X
__
y Y Y

Dimasukkan ke rumus :

65
 xy
xy 
( x 2 )( y 2 )
8685,25 8685,25
 
8874,98x8871,50 78734385.07
8685,25
  0,97
8873,239

Ada dua cara menafsirkan xy


1. Mengacu pada tabel product moment
Jika xy <  tabel, korelasi tidak signifikan
Jika xy >  tabel, korelasi signifikan

2. Dengan kriterium sebagai berikut :


Antara 0,800 – 1,00 sangat tinggi
0,600 – 0,790 tinggi
0,400 – 0,590 cukup
0,200 – 0,390 rendah
0,00 – 0,190 sangat rendah

3. Validitas Item
a) Pengertian Validitas Item

Validitas item dari suatu tes adalah ketepatan mengukur yang dimiliki sebutir
item apa yang seharusnya diukur melalui butir item tersebut. Dalam tes hasil
belajar yang disusun oleh para pengajar merupakan kumpulan dari sekian
banyak butir-butir item, jadi butir-butir item merupakan bagian tak terpisahkan
dari tes hasil belajar tersebut sebagai suatu totalitas.

Validitas suatu tes sangat tergantung pada validitas yang dimiliki oleh masing-
masing butir item yang membangun tes tersebut. Bila validitas test hasil belajar
tinggi, sehingga tes hasil belajar itu sebagai totalitas dapat dikatakan sudah
tepat dalam mengukurnya, sehingga dapat dikatakan tes hasil belajar tersebut
valid dan sebaliknya bila validitasnya rendah, maka tes tersebut disebut invalid.

Rendahnya validitas tes merupakan salah satu indikator bahwa tes hasil
belajar yang telah disusun perlu dilakukan penyesuaian kembali guna
mengetahui butir-butir item mana sajakah yang menyebabkan rendahnya
validitas tes tersebut.

66
b) Cara Menentukan Validitas Item Tes Hasil Belajar

Dari uraian di atas jelaslah bahwa validitas sangat tergantung pada validitas
yang dimiliki oleh masing-masing butir item. Untuk mengetahui butir-butir item
yang mana yang valid atau tidak valid dapat menggunakan teknik korelasi.
Sebutir item dikatakan valid jika skor pada butir item yang bersangkutan
memiliki kesesuaian dengan skor totalnya. Skor total di sini sebagai variabel
terikat, sedangkan skor item sebagai variabel bebas yang bersangkutan
apabila terbukti mempunyai korelasi positif yang signifikan dengan skor
totalnya maka item tersebut dinyatakan valid.

Pada tes objektif, setiap butir soal yang dijawab dengan benar umumnya
diberi skor 1 (satu), sedangkan untuk jawaban salah diberi skor 0 (nol). Skor
total untuk masing-masing peserta tes adalah hasil penjumlahan dari setiap
skor yang dimiliki oleh masing-masing butir item.

Teknik korelasi yang digunakan dalam mencari korelasi antara variabel terikat
dengan variabel bebas (variabel II) dapat dengan cara :
a. Teknik Korelasi Pearson
b. Teknik Korelasi Point Biserial.

Rumus :

M p  Mt p
pbi 
SDt q

Di mana :
pbi = koefisien korelasi biserial, sebagai koefisien validitas item
Mp = rerata skor dari siswa (testee) yang menjawab betul untuk
butir item yang dicari validitasnya
Mt = rerata skor total
SDt = Standar deviasi dari skor total
p = proporsi siswa (testee) yang menjawab benar terhadap butir
item yang diuji validitasnya
banyaknya siswa yang menjawab benar
p =
jumlah seluruh siswa
q = proporsi siswa yang menjawab salah (q = 1 – p)

Contoh perhitungan penentuan validitas item menggunakan data hasil tes dari
20 orang siswa yang diberikan 10 butir item dalam bentuk multiple
choice/pilihan ganda : tertera pada tabel berikut.
67
Tabel : Skor hasil tes yang diikuti oleh 20 orang siswa, dengan menyajikan 10
butir item bentuk multiple choice.

Skor untuk butir item nomor Skor Total


Testee
1 2 3 4 5 6 7 8 9 10 (X)
A 0 1 0 0 0 1 0 0 0 1 3
B 1 0 1 0 1 0 1 1 1 1 7
C 0 1 0 1 1 0 0 1 1 1 6
D 1 1 1 1 1 1 1 1 1 1 10
E 1 0 1 1 0 1 0 1 1 1 7
F 0 1 0 0 0 1 0 1 0 0 3
G 1 0 0 1 1 1 1 1 1 1 8
H 1 0 1 1 1 1 1 1 1 1 9
I 0 1 0 1 0 1 0 1 0 1 5
J 1 1 1 1 1 1 1 1 1 1 10
K 0 1 1 1 1 1 1 0 0 0 6
L 0 1 1 0 1 0 1 0 1 0 5
M 0 1 0 0 1 0 1 1 0 0 4
N 1 0 1 1 0 1 0 1 1 1 7
O 1 0 0 1 1 1 1 1 1 1 8
P 0 1 0 1 0 1 0 1 0 1 5
Q 1 0 1 1 1 1 1 1 1 1 9
R 0 1 0 1 1 1 0 1 0 1 6
S 1 0 0 1 1 1 1 1 1 1 8
T 0 1 1 0 0 0 1 0 0 1 4
20=N 10 12 10 14 13 15 12 16 12 16 130=Xt

Tabel : Perhitungan Analisis Validitas Item

Skor untuk butir item nomor


Testee 1 2 3 4 5 6 7 8 9 10
Xt X t2
A 0 1 0 0 0 1 0 0 0 1 3 9
B (1) 0 1 0 1 0 1 1 1 1 (7) 49
C 0 1 0 1 1 0 0 1 1 1 6 36
D (1) 1 1 1 1 1 1 1 1 1 10 100
E (1) 0 1 1 0 1 0 1 1 1 (7) 49
F 0 1 0 0 0 1 0 1 0 0 3 9
G (1) 0 0 1 1 1 1 1 1 1 (8) 64
H (1) 0 1 1 1 1 1 1 1 1 (9) 81
I 0 1 0 1 0 1 0 1 0 1 5 25
J (1) 1 1 1 1 1 1 1 1 1 (10) 100
K 0 1 1 1 1 1 1 0 0 0 6 36
L 0 1 1 0 1 0 1 0 1 0 5 25

68
M 0 1 0 0 1 0 1 1 0 0 4 16
N (1) 0 1 1 0 1 0 1 1 1 (7) 49
O (1) 0 0 1 1 1 1 1 1 1 (8) 64
P 0 1 0 1 1 1 0 1 0 1 5 25
Q (1) 0 1 1 1 1 1 1 1 1 (9) 81
R 0 1 0 1 1 1 0 1 0 1 6 36
S (1) 0 0 1 1 1 1 1 1 1 (8) 64
T 0 1 1 0 0 0 1 0 0 1 4 16
20 = 10= 12= 13= 14= 15= 16= 17= 18= 19= 10= 130= 934=
N N1 N2 N3 N4 N5 N6 N7 N8 N9 N10 Xt Xt2
P 0,5 0,6 0,5 0,7 0,65 0,75 0,6 0,8 0,6 0,8
Q 0,5 0,4 0,5 0,3 0,35 0,25 0,4 0,2 0,4 0,2

Langkah 1. Menyiapkan tabel perhitungan untuk analisis validitas item.


2. Mencari rerata dari skor total, yaitu dengan menggunakan rumus.
Xt
t  
N
Telah diketahui X t = 130 dan N = 20. Jadi :
130
Mt   6,5
20

3. Mencari standar deviasi total dengan menggunakan rumus

 X i2   X t2 
SDt   
N  N 
Telah diketahui  X t2 = 934 X t = 130 dan N = 20. Jadi:

2
934  130 
SDt     46,7  6,5
2

20  20 

 46,7  42,25  4,45  2,11

4. Mencari Mp misalnya untuk No. 1


Mp = B D E G H J N O Q S
Total skor siswa yang menjawab betul yaitu :
B=7 H=9 Q=9
D = 10 J = 10 S=8
69
E=7 N=7
G=8 0=8
7  10  7  8  9  10  7  8  9  8
Mp   8,30
10
5. Mencari koefisien korelasi pbi untuk setiap item dengan
menggunakan rumus

M p  Mt p
pbi 
SDt q

Perhitungan-perhitungan untuk memperoleh Mp dari butir item nomor 1 sampai


dengan nomor 10.

Nomor Testee Yang Mean (Rata-rata Hitung) dari skor total yang dijawab
Item Jawabannya Betul dengan betul (Mt)
1 B-D-E-G-H-I-N-O-Q 7+10+7+8+9+10+7+8+9+8 =8,300
dan S (N1=10) 10
2 A-C-D-F-I-J-K-L-M-P- 3+6+10+3+5+10+6+5+4+5+6+4 =5,583
R dan T (N2=12) 12
3 B-D-E-H-J-K-L-N-Q 6+10+7+9+10+6+5+7+9+4 =7,300
dan T (N3=10) 10
4 C-D-E-G-H-I-J-K-N-O- 6+10+7+8+9+5+10+6+7+8+5+9+6+8 =7,429
P-Q-R-S (N4=14) 14
5 B-C-D-G-H-J-K-L-M- 7+6+10+8+9+10+6+5+4+8+9+6+8 =7,385
O-Q-R dan S (N5=13) 12
6 A-D-E-F-G-H-I-J-K-N- 3+10+7+3+8+9+5+10+4+7+8+5+9+6+8 6,933
O-P-Q-R-S (N6=15) 15

7 B-D-G-H-J-K-L-M-O- 7+10+8+9+10+6+5+4+8+9+8+4 =7,333


Q-S-T (N7=12) 12
8 B-C-D-E-F-G-H-I-M- 7+6+10+7+3+8+9+5+10+4+7+8+5+9+6+8 =7,000
N-O-P-Q-R-S (N8=16) 16
9 B-C-D-E-G-H-J-L-N- 7+6+10+7+8+9+10+5+7+8+9+8 =7,833
O-Q-S (N9=12) 12
10 A-B-C-D-E-G-H-I-J-N- 3+7+6+10+7+8+9+5+10+7+8+5+9+6+8+4 =7,000
O-P-Q-R-S-T (N10=16) 16

Untuk meringkas pembicaraan, hasil-hasil perhitungan pbi disajikan dalam tabel


sebagai berikut.

70
Tabel : perhitungan untuk mengetahui koefisien korelasi pbi dalam rangka uji
validitas item nomor 1 sampai dengan nomor 10.
Nomor M p  Mt p
Inter
Item Mp Mt SDt p Q pbi  pretasil
SDt q
1 8,300 6,5 2,11 0,50 0,50 0,853 (pbi > t) Valid
2 5,583 6,5 2,11 0,60 0,40 -0,532 Kor, Negatif Invalid
3 7,300 6,5 2,11 0,50 0,50 0,379 (pbi < t) Invalid
4 7,429 6,5 2,11 0,70 0,30 0,673 (pbi > t) Valid
5 7,385 6,5 2,11 0,65 0,30 0,572 (pbi < t) Valid
6 6,933 6,5 2,11 0,75 0,20 0,355 (pbi > t) Invalid
7 7,333 6,5 2,11 0,60 0,40 0,684 (pbi > t) Valid
8 7,000 6,5 2,11 0,80 0,20 0,474 (pbi > t) Valid
9 7,833 6,5 2,11 0,60 0,40 0,774 (pbi > t) Valid
10 7,000 6,5 2,11 0,80 0,20 0,474 (pbi > t) Valid
Catatan : Dalam pemberian interpretasi terhadap pbi ini digunakan db sebesar
(N-nr), yaitu = 20 – 2 = 18. Derajat kebebasan sebesar 18 itu lalu
dikonsultasikan kepada tabel nilai “” product moment, pada taraf
signifikansi 5% dan taraf signifikansi 1%. Hasilnya adalah sebagai
berikut.
tabel atau t pada taraf signifikansi 5% =0,444
tabel atau t pada taraf signifikansi 1% =0,561

Bertitik tolak dari hasil analisis tersebut di atas, ternyata dari sebanyak 10 butir item
yang diuji validitasnya, 7 butir item di antaranya telah dapat dinyatakan sebagai
item yang valid, yaitu item nomor 1, 4, 5, 7, 8, 9 dan 10. sedangkan 3 butir item
lainnya merupakan item yang invalid.

B. Reliabilitas Tes
a. Menentukan Reliabilitas Tes Hasil Belajar Bentuk Objektif
Dapat dilakukan dengan tiga cara :
a. Metode tes ulang (test-retest method)
b. Metode bentuk paralel (equivalent)
c. Metode belah dua (split half method)

a) Metode Tes Ulang (test-retest methode)

Dalam metode ini pengetes menggunakan alat penilaian (test) dua kali dalam
waktu yang berlainan, pengetes hanya membuat satu perangkat tes. Oleh
71
karena tesnya hanya satu dan dicobakan dua kali maka metode ini disebut
juga dengan simple test double trial method.

Misalnya tes hasil belajar kimia untuk SMU kelas II diberikan hari ini, seminggu
kemudian tes tersebut diberikan lagi pada siswa yang sama. Untuk
menentukan koefisien korelasi maka hasil penilaian yang pertama
dikorelasikan dengan hasil penilaian yang kedua. karena mengkorelasikan
hasil penilaian dari tes yang sama maka metode ini juga disebut self
corelation method (korelasi diri sendiri).

Pada umumnya hasil tes yang kedua lebih tinggi dari hasil tes yang pertama,
hal ini kemungkinan adanya carry over effect. Dalam hal ini yang penting
adanya kesejajaran hasil atau ketetapan hasil yang terlihat dari koefisien
korelasi yang tinggi. Koefisien korelasi mempunyai rentangan nilai antara –1,0
sampai +1,0. koefisien korelasi yang mendekati 1,0 merupakan koefisien
korelasi yang tinggi.

Kelemahan metode ini adalah kurang tepat untuk tes yang banyak
mengungkapkan aspek kognitif ingatan dan pemahaman. Oleh karena itu
jarak waktu pemberian tes pertama dengan kedua perlu diperhitungkan,
sebaiknya tidak terlalu dekat dan juga tidak terlalu jauh. Jika terlalu dekat
hasilnya terlalu banyak dipengaruhi oleh ingatan siswa pada jawaban yang
diberikan pada pengukuran pertama. Sebaliknya jika waktunya terlalu lama
bisa terjadi adanya perubahan pengetahuan karena siswa sudah mempelajari
sesuatu sehingga mempengaruhi koefisien reliabilitasnya.

Untuk menghitung korelasi antara hasil penilaian tes pertama dengan kedua
dapat dipergunakan teknik korelasi rank order dari Spearman, dengan
menggunakan rumus :

6 D2
  1
N ( N 2  1)

Di mana :
 (baca Rho) = Koefisien korelasi antara variabel I (skor-skor hasil tes
I) dengan variabel II (skor-skor hasil tes II).
D = Difference (beda antara rank variabel I dengan variabel
II), atau : D=RI-RII.
6 dan 1 = Bilangan konstan.
N = Banyaknya testee.

72
Contoh : Penentuan reliabilitas tes dengan Metode Tes Ulang

Seorang guru kimia ingin mengetahui apakah tes yang telah disusunnya
mempunyai reliabilitas tes yang tinggi, untuk itu guru tersebut melakukan
dengan menggunakan metode tes ulang (test-retest methode).

Tes hasil belajar kimia di kelas I semester I diikuti oleh 20 orang siswa. Tes
dilaksanakan sebanyak dua kali (selang waktu 1 minggu) dengan materi soal
yang sama. Skor yang dicapai dari dua kali tes tersebut seperti berikut:

Tabel : Skor-skor hasil tes belajar bidang studi kimia yang dilaksanakan
dua kali dan diikuti 20 orang siswa.

Skor yang dicapai pada


Siswa
Tes Pertama (I) Tes Kedua (II)
A 58 60
B 64 59
C 70 74
D 72 68
E 57 59
F 67 60
G 54 56
H 61 63
I 71 70
J 65 67
K 55 57
L 68 73
M 62 64
N 50 52
O 66 61
P 69 72
Q 56 58
R 60 62
S 63 65
T 59 61

Langkah untuk menentukan reliabilitas tes hasil belajar tersebut adalah sebagai
berikut :

1) Menghitung koefisien korelasi rho () dengan cara :


 Urutkan kedudukan peserta tes (rank) dari tes pertama (I) dan tes
kedua (II) seperti terlihat pada tabel rank.

Tabel : Rank Tes I Tabel : Rank Tes II


73
Tes Kedua
Siswa Tes Pertama (I) Rank Siswa Rank
(II)
A 58 15 A 60 13,5
B 64 9 B 59 15,5
C 70 3 C 74 1
D 72 1 D 68 5
E 57 16 E 59 15,5
F 67 6 F 60 13,5
G 54 19 G 56 19
H 61 12 H 63 9
I 71 2 I 70 4
J 65 8 J 67 6
K 55 18 K 57 18
L 68 5 L 73 2
M 62 11 M 64 8
N 50 20 N 52 20
O 66 7 O 61 11,5
P 69 4 P 72 3
Q 56 17 Q 58 17
R 60 13 R 62 10
S 63 10 S 65 7
T 59 14 T 61 11,5
 Tentukan harga D (beda) masing-masing peserta tes pada tes

74
Rank
Testee Skor (urutan kedudukan) D=R1-R2 D2
Tes I Tes II Tes I Tes II
A 58 60 15 13,5 2,5 6,25
B 64 59 9 15,5 -6,5 39,06
C 70 74 3 1 2 4,00
D 72 68 1 5 -4 16,00
E 57 59 16 15,5 1,5 2,25
F 67 60 6 13,5 2,5 6,25
G 54 56 19 19 0 0,00
H 61 63 12 9 3 9,00
I 71 70 2 4 -2 4,00
J 65 67 8 6 2 4,00
K 55 57 18 18 0 0,00
L 68 73 5 2 3 9,00
M 62 64 11 8 3 9,00
N 50 52 20 20 0 0,00
O 66 61 7 11,5 -4,5 20,25
P 69 72 4 3 1 1,00
Q 56 58 17 17 0 0,00
R 60 62 13 10 3 9,00
S 63 65 10 7 3 9,00
T 59 61 14 11,5 2,5 6,25
154,31

I dan tes II dan tentukan harga D2 dan D2.

 Substitusikan harga D2 kedalam rumus .


6D 2
  1
N ( N 2  1)
6(201,5)
  1
20(20 2  1)
1209
  1  1  0,151 5
7980
= 0,849

2) Memberikan interpretasi terhadap nilai .


Nilai  yang diperoleh dikonsultasikan dengan tabel nilai rho () dengan
menggunakan derajad kebebasan N=20. harga  tabel pada taraf
signifikan 5% dengan derajad kebebasan () sebesar 20 adalah 0,450.
ternyata  yang diperoleh dari perhitungan lebih besar dari  tabel, berarti

75
antara tes pertama dengan tes kedua terdapat korelasi positif yang
signifikan.
3) Menarik kesimpulan
Berdasarkan hasil analisis data empiris seperti di atas maka dapat
disimpulkan bahwa tes hasil belajar kimia tersebut sudah dapat
dinyatakan sebagai tes hasil belajar yang telah memiliki reliabilitas yang
tinggi (bersifat reliabel).

b) Metode Bentuk Paralel (paralel form)

Pada metode ini diperlukan dua perangkat tes yang setara baik dari segi
tujuan, tingkat kesukaran, bentuk pertanyaan, yang berbeda hanya
pertanyaannya. Oleh karena itu metode ini disebut juga alternate–forms
method (paralel forms).

Mengukur reliabilitas tes bentuk paralel dilakukan dengan menggunakan dua


perangkat tes yang diberikan kepada sekelompok subjek tanpa adanya
tenggang waktu. Hasil/skor yang diperoleh dari kedua tes tersebut dicari
korelasinya. Teknik korelasi yang digunakan adalah teknik korelasi product
moment dari Pearson. Apabila terdapat korelasi positif maka dapat dikatakan
tes hasil belajar tersebut reliabel.

Berikut ini dikemukakan sebuah contoh penentuan reliabilitas tes dengan


metode bentuk paralel.

Tes hasil belajar kimia di buat dua seri, Seri I dan Seri II masing-masing
berjumlah 30 butir soal. Test diikuti oleh 40 orang siswa SMU kelas II, hasil tes
Seri I (x) dan Seri II (y) dan dari data-data perhitungan indek korelasi dapat
dilihat pada tabel berikut ini.

Tabel : Perhitungan Penentuan Indeks Korelasi

No. X Y (X-X) (Y-Y) x2 y2 xy


1 30 23 -27.03 -24.75 730.35 612.56 668.87
2 30 23 -27.03 -24.75 730.35 612.56 668.87
3 30 27 -27.03 -20.75 730.35 430.56 560.77
4 30 27 -27.03 -20.75 730.35 430.56 560.77
5 40 27 -17.03 -20.75 289.85 430.56 353.27
6 40 30 -17.03 -17.75 289.85 315.06 302.19
7 43 30 -14.03 -17.75 196.70 315.06 248.94
8 43 30 -14.03 -17.75 196.70 315.06 248.94

76
9 43 33 -14.03 -14.75 196.70 217.56 206.87
10 43 33 -14.03 -14.75 196.70 217.56 206.87
11 50 33 -7.03 -14.75 49.35 217.56 103.62
12 50 40 -7.03 -7.75 49.35 60.06 54.44
13 50 40 -7.03 -7.75 49.35 60.06 54.44
14 50 40 -7.03 -7.75 49.35 60.06 54.44
15 53 40 -4.03 -7.75 16.20 60.06 31.19
16 53 43 -4.03 -4.75 16.20 22.56 19.12
17 53 43 -4.03 -4.75 16.20 22.56 19.12
18 53 43 -4.03 -4.75 16.20 22.56 19.12
19 53 47 -4.03 -0.75 16.20 0.56 3.02
20 57 47 -0.02 -0.75 0.00 0.56 0.02
21 57 50 -0.02 2.25 0.00 5.06 -0.06
22 57 53 -0.02 5.25 0.00 27.56 -0.13
23 57 53 -0.02 5.25 0.00 27.56 -0.13
24 60 53 2.98 5.25 8.85 27.56 15.62
25 60 53 2.98 5.25 8.85 27.56 15.62
26 63 53 5.98 5.25 35.70 27.56 31.37
27 63 53 5.98 5.25 35.70 27.56 31.37
28 70 57 12.98 9.25 168.35 85.56 120.02
29 70 57 12.98 9.25 168.35 85.56 120.02
30 70 57 12.98 9.25 168.35 85.56 120.02
31 70 60 12.98 12.25 168.35 150.06 158.94
32 73 60 15.98 12.25 255.20 150.06 195.69
33 73 63 15.98 15.25 255.20 232.56 243.62
34 73 63 15.98 15.25 255.20 232.56 243.62
35 77 70 19.98 22.25 399.00 495.06 444.44
36 77 70 19.98 22.25 399.00 495.06 444.44
37 77 70 19.98 22.25 399.00 495.06 444.44
38 80 70 22.98 22.25 527.85 495.06 511.19
39 80 73 22.98 25.25 527.85 637.56 580.12
40 80 73 22.98 25.25 527.85 637.56 580.12
Jumlah 2281 1910 8874.98 8871.50 8685.25
x y x2 y2 xy

xy
xy 
(x 2 )(y 2 )
8685,25
xy 
(8874,98)(8871,50)

77
8685,25
xy 
78734385,07
8685,25
xy 
8873,24
xy  0,9788

c) Metode Belah Dua (split half method)

Metode belah dua dalam pelaksanaannya mirip dengan metode bentuk


paralel. Pada metode ini pengetes membuat seperangkat tes dan dicobakan
satu kali. Oleh karena itu disebut juga single test single trial method.

Butir-butir soal dibagi menjadi dua bagian yang setara, biasanya soal nomor
genap dan soal nomor ganjil yang disebut belahan ganjil genap dapat juga
dibagi dengan cara mengambil separuh jumlah pada nomor awal dan separuh
pada nomor akhir.

Untuk menentukan koefisien korelasi skor dari kedua bagian tersebut


dikorelasikan. Berbeda dengan metode pertama dan kedua, koefisien korelasi
langsung ditafsirkan sebagai koefisien reliabilitas. Pada metode ketiga ini tidak
demikian, koefisien korelasi hanya diketahui koefisien reliabilitas separuh tes.

Karena korelasi tersebut hanya berlaku separo maka koefisien korelasi yang
diperoleh hanya untuk separuhnya, tidak untuk seluruh soal. Oleh sebab itu
untuk mengetahui reliabilitas seluruh tes digunakan rumus Spearman Brown.

2 1 1
2 2 2
11  atau tt  hh
1 
1  1 1
2 2
hh
Di mana :
11 = Koefisien reliabilitas tes secara keseluruhan.

 12 12 = Koefisien korelasi product moment antara separuh (1/2) tes

(belahan I) dengan separuh (1/2) tes (belahan II) tersebut.


1&2 = Bilangan konstan.

Contoh perhitungan reliabilitas dengan metode belah dua:

78
Langkah pertama melakukan analisis butir soal/analisis item. Item yang dapat
dijawab dengan benar diberi skor 1 dan yang salah diberi skor 0, berikut ini
disajikan tabel analisis 30 item tes kimia dari 15 siswa.

Tabel : Analisis Item Tes Kimia


Kelompok Atas (A) Skor Skor
No. Nomor Butir Soal Ganjil Genap
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 x y
1 1 0 1 1 1 1 1 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 13 14
2 1 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 1 1 12 14
3 1 0 1 0 0 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 13 13
4 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 1 1 0 1 1 1 0 1 11 14
5 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1 12 13
6 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 0 1 1 1 1 1 0 1 1 1 11 14
7 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 1 1 1 1 0 1 1 0 1 12 12
8 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 0 1 1 0 1 0 1 1 1 1 12 12
9 1 1 1 1 0 1 1 1 0 1 1 1 1 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1 10 14
10 1 1 1 1 0 1 1 0 1 1 1 1 1 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 1 1 11 13
11 1 1 1 1 0 0 1 1 0 1 1 1 1 1 1 0 0 1 1 1 0 1 1 1 1 0 1 1 1 1 11 12
12 1 1 1 1 0 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1 0 1 0 0 1 1 1 1 0 1 9 14
13 1 0 1 1 0 1 1 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1 0 1 1 1 1 0 1 11 12
14 1 1 0 1 0 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 1 0 1 0 1 1 0 1 10 13
15 1 1 1 0 0 1 1 1 1 1 1 1 1 1 0 1 1 0 1 0 1 1 1 0 1 1 1 0 1 1 13 10
Jml
Atas 15 11 14 12 4 14 15 14 10 15 14 15 15 15 8 9 6 13 15 14 4 15 14 8 14 10 13 14 10 15 171 194

Selanjutnya dibuat tabel perhitungan untuk mencari koefisien reliabilitas dengan


menggunakan rumus korelasi product moment.

Tabel : Perhitungan Penentuan Koefisien Reliabilitas (model ganjil- genap)


Skor Butir Soal (X-X)
No. (Y-Y) (Y) x2 y2 xy
Ganjil (x) Genap (y) (X)
1 13 14 1.60 1.07 2.56 1.14 2.91
2 12 14 0.60 1.07 0.36 1.14 0.41
3 13 13 1.60 0.07 2.56 0.00 0.01
4 11 14 -0.40 1.07 0.16 1.14 0.18
5 12 13 0.60 0.07 0.36 0.00 0.00
6 11 14 -0.40 1.07 0.16 1.14 0.18
7 12 12 0.60 -0.93 0.36 0.87 0.31
8 12 12 0.60 -0.93 0.36 0.87 0.31
9 10 14 -1.40 1.07 1.96 1.14 2.23
79
10 11 13 -0.40 0.07 0.16 0.00 0.00
11 11 12 -0.40 -0.93 0.16 0.87 0.14
12 9 14 -2.40 1.07 5.76 1.14 6.55
13 11 12 -0.40 -0.93 0.16 0.87 0.14
14 10 13 -1.40 0.07 1.96 0.00 0.01
15 13 10 1.60 -2.93 2.56 8.60 4.69
0.00 0.05 19.60 18.92 14.10
Menghitung koefisien reliabilitas separuh tes.
xy
xy 
(x 2 )(y 2 )
14.10
xy 
19.60 x18.92
14.10
xy 
370.83
14.10
xy 
19.25
xy  0.73
Selanjutnya digunakan rumus Spearman Brown untuk mengetahui koefisien
reliabilitas seluruh tes.

2 1 1
2 2
11 
1  1 1
2 2

 Rumus-rumus lain yang dapat digunakan untuk menghitung reliabilitas


metode belah dua.
(a) Rumus Flanagan (untuk belahan ganjil genap)

 S2  S2 
11  2 1  1 2 2 
 St 
Di mana :
11 = reliabilitas tes
2
S 1 = varians belahan (1) atau belahan ganjil
2
S 2 = varians belahan (2) atau belahan genap
2
S t = varians skor total

80
Varians (S2) adalah kuadrat dari standar deviasi atau simpangan baku
(S).

Varians
Dapat dihitung dengan “Statistic Calculator” atau
 X 
2

X   
2

 Dengan rumus : S 
2  N 
N
x 2
 Dengan rumus : S
N
Di mana :
S = simpangan baku (standar deviasi)
X = skor
___ ___
x = simpangan X dari X , dicari dari X - X
S2 = varians
N = banyaknya peserta tes

(b) Rumus Rulon (belahan awal-akhir)


S d2
11  1  2
St
Di mana :
d = beda (defference) antara skor belahan pertama (awal) dan
belahan akhir.
S2 = varians beda
d
St2 = varians total

Penggunaan Rumus Kuder – Richardson

Dikembangkan untuk mengatasi (menghindari) kesulitan-kesulitan yang


terjadi dengan menggunakan metode 1, 2 dan 3.

Menggunakan satu tes, sekali uji coba, tanpa melakukan pembelahan.


Rumus K – R. 20
 n   S  pq 
2
11    
 n  1  S
2

Di mana :
81
11 = Koefisien reliabilitas tes secara keseluruhan.
p = proporsi subyek didik yang menjawab item dengan benar
q = proporsi subyek didik yang menjawab item dengan salah
pq = jumlah dari hasil kali p dan q
n = jumlah item (butir tes)
S = standar deviasi dari tes (akar dari varians)

Contoh perhitungan menentukan koefisien reliabilitas menggunakan rumus


KR-20, terlebih dahulu dibuat tabel analisis soal.

82
Tabel : Perhitungan penentuan reliabilitas tes

83
 n   S  pq 
2
11    
 n  1  S
2

x 2
S2 
N
8905
S2   593,66  24,365
15
 15   24,365  3,12 
11    
15  1  24,365 
15   21,245 
11     
14   24,365 
11  1,071 0,871  0,2

Rumus K – R. 21

 M (n  M ) 
 n  1  
11  
 n  1  nSt2 
 

Di mana :
M = Mean atau rata-rata skor total

b. Menentukan Reliabilitas Tes Bentuk Uraian

Berbeda dengan tes bentuk obyektif di mana butir-butir soal yang demikian
hanya memberikan jawaban benar atau salah.
Untuk menentukan reliabilitas soal keseluruhan dilakukan analisis butir soal
terlebih dahulu seperti halnya soal bentuk obyektif. Berbeda dengan tes bentuk
obyektif di mana butir-butir soal yang demikian hanya benar atau salah yang
diberi nilai 1 atau 0, sedangkan untuk butir soal uraian penilaian atau skor
mempunyai rentangan skor antara 0 sampai dengan 10 tergantung pada bobot
setiap soal.
Pada umumnya rumus yang digunakan untuk menentukan reliabilitas bentuk
uraian adalah Rumus Alpha.

84
 n   S i 
2
11   1  
 n  1  S t2 

Di mana :
11 = Koefisien reliabilitas tes.
n = banyaknya butir item.
1 = bilangan konstan
Si2 = jumlah varians skor tiap-tiap butir item
S t2 = varians total

Contoh :
Tes hasil belajar kimia dalam bentuk uraian yang diikuti 10 orang siswa dan
soal terdiri dari 6 butir item. Rentangan bobot skor antara 0 sampai 10. Skor-
skor hasil tes tertera pada tabel berikut.

Tabel : Skor-skor hasil tes belajar kimia bentuk uraian sejumlah 6 butir item
dari 10 orang siswa .

No Nama Nomor Item Skor Total Kudrat


1 2 3 4 5 6 xt Skor Total
1 A 10 6 8 8 10 10 52 2704
2 B 6 4 4 6 6 5 31 961
3 C 8 2 6 8 7 8 39 1521
4 D 7 3 7 7 6 6 36 1296
5 E 0 5 3 2 4 4 18 324
6 F 2 4 2 8 6 8 30 900
7 G 4 3 6 6 6 6 31 961
8 H 5 5 5 7 7 7 36 1296
9 I 5 5 4 6 8 5 33 1089
10 J 3 6 3 4 6 6 28 784
Jumlah 50 43 48 62 66 65 334 11836
JK 328 201 264 418 458 451 2120

Langkah-langkah :
1. Jumlahkan skor-skor yang dicapai oleh masing-masing peserta tes yaitu
i1, i2, i3, i4,…….. i10.
2. Hitung skor total yang dicapai oleh masing-masing peserta tes (Xt) serta
hitung kuadrat dari skor total. (Xt2).
3. Hitung jumlah kuadrat item 1, 2, 3, 4, 5 dan 6.
Jk item 1 = 102 + 62 + 82 + 72 + 02 + 22 + 42 + 52 + 52 + 32 = 328
85
Jk item 2 = 201
Jk item 3 = 264
Jk item 4 = 418
Jk item 5 = 458
Jk item 6 = 451

4. Hitung varian dari skor item 1, 2, 3, 4, 5 dan 6 dengan menggunakan


rumus :

Xi12 
Xi 
2
1

S i21  N
N
502
318 
S i21  10  328  250  7,8
10 10
2
43
201 
S i22  10  1,61
10
482
264 
S i23  10  3,36
10
622
418 
Si24  10  3,36
10
662
458 
Si25  10  2,24
10
652
451 
Si26  10  2,85
10

5. Hitung jumlah varian skor item secara keseluruhan

St  Si21  Si22  Si23  Si24  Si25  Si26


= 7,8 + 1,61 + 3,36 + 3,36 + 2,24 + 2,85
= 21,22

86
6. Hitung varian total dengan menggunakan rumus

Xt 2

Xt 
2

S t2  N
N

dari tabel telah dihitung :

Xt 2 =11836 : Xt = 334

11836 
334
S t2  N
N
2
S t = 68,04

7. Menghitung koefisien reliabilitas tes dengan menggunakan rumus alpha.

 n   S i 
2
11   1  
 n  1  S t2 
 6   21,22 
11   1  
 6  1  68,08 

11  1  0312
6
5
= 0,8256

Selanjutnya dalam pemberian interpretasi terhadap koefisien reliabilitas


( 11 ) pada umumnya digunakan patokan sebagai berikut:

1. Apabila 11  0,70 berarti tes hasil belajar tersebut telah memiliki
reliabilitas yang tinggi (reliable).
2. Apabila 11  0,70 berarti tes hasil belajar tersebut belum memiliki
reliabilitas yang tinggi (un-reliable).

Selain itu pemberian interpretasi dapat juga dikonsultasikan dengan tabel “r”
product moment.

87
C. Analisis butir soal

Analisis butir soal antara lain bertujuan untuk mengkaji pertanyaan-pertanyaan agar
diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai. Dengan
mengevaluasi soal dapat diperoleh informasi tentang kualitas sebuah soal, apakah
soal itu baik, kurang baik atau buruk.

Asumsi bahwa jawaban siswa yang salah semata-mata karena siswa tidak
menguasai bahan yang ditanyakan adalah asumsi yang keliru, kesalahan tersebut
mungkin saja disebabkan oleh konstruksi butir soal yang dapat membingungkan
siswa. Oleh karena itu sebaiknya butir soal yang digunakan untuk tes telah melalui
proses analisis sehingga kesalahan jawaban siswa, mungkin disebabkan oleh
konstruksi butir soal yang keliru/salah dapat dihindarkan.

Ada tiga hal yang berkaitan dengan analisis butir soal :

a. Analisis Tingkat Kesukaran

Asumsi yang digunakan untuk memperoleh kualitas soal yang baik, di samping
memenuhi validitas dan reliabilitas, adalah adanya keseimbangan dari tingkat
kesulitan soal tersebut. Keseimbangan yang dimaksud adalah adanya soal-
soal yang termasuk mudah, sedang dan sukar secara proporsional.

Tingkat kesukaran soal dilihat dari kemampuan siswa dalam menjawabnya,


bukan dilihat dari sudut guru sebagai pembuat soal. Hal yang penting dalam
melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan
kriteria soal yang termasuk mudah, sedang dan sukar.

Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal


mudah, sedang dan sukar.
 Jumlah soal sama untuk ketiga kategori tersebut artinya soal mudah,
sedang dan sukar jumlahnya seimbang.
 Proporsi jumlah soal untuk ketiga kategori tersebut didasarkan atas kurva
normal. Perbandingan antara soal mudah, sedang dan sukar dibuat 3 : 4 :
3. Artinya 30% soal kategori mudah, 40% soal kategori sedang dan 30%
soal kategori sukar. Atau dapat digunakan perbandingan 3 : 5 : 2. Artinya
30% soal kategori mudah, 50% soal kategori sedang dan 20% soal
kategori sukar.

Bilangan yang menunjukkan sukar atau mudahnya suatu soal disebut indeks
kesukaran/difficulty index. Besarnya indeks kesukaran antara 0,0 – 1,0. Soal

88
dengan indeks kesukaran 0,0 menunjukkan bahwa soal tersebut terlalu sukar,
sebaliknya indeks 1,0 menunjukkan soal tersebut terlalu mudah.

0,0 1,0
P = 0,0 – 0,3 soal kategori sukar.
P = 0,31 – 0,70 soal kategori sedang
P = 0,71 – 1,0 soal kategori mudah

Indeks kesukaran diberi simbol P singkatan dari proporsi.

Indeks kesukaran sebuah butir soal dapat dinyatakan dengan membandingkan


antara jumlah siswa yang menjawab benar dan jumlah peserta tes.
B
P
JS
Di mana :
P = Indeks kesukaran
B = Jumlah siswa yang menjawab benar
JS = Jumlah seluruh siswa / peserta tes

Contoh :
Guru kimia memberikan 10 pertanyaan pilihan ganda kepada 30 orang siswa.
Seluruh siswa mengisi jawaban pertanyaan tersebut, setelah diperiksa hasilnya
sebagai berikut :

Bannyaknya Siswa Banyaknya Siswa


No. yang Menjawab yang Menjawab Indeks Kategori
Soal (JS) Benar (B) Kesukaran Soal
1 30 24 0,80 Mudah
2 30 21 0,70 Sedang
3 30 15 0,50 Sedang
4 30 19 0,63 Sedang
5 30 22 0,73 Mudah
6 30 10 0,33 Sedang
7 30 8 0,26 Sukar
8 30 25 0,83 Mudah
9 30 12 0,40 Sedang
10 30 6 0,20 Sukar

Dengan menggunakan rumus indeks kesukaran (P) maka dapat ditentukan


indeks kesukaran untuk setiap soal.

89
Contoh untuk soal nomor 1.
B 24
No.1 P   0,80
JS 30
B 21
No. 2 P    0,70
JS 30

Dari hasil analisis indeks kesukaran ternyata dari 10 soal tersebut memiliki 3
soal mudah, 5 soal sedang dan 2 soal sukar.

b. Analisis Daya Pembeda

Analisis daya pembeda bertujuan mengkaji butir-butir soal untuk mengetahui


kemampuan suatu soal untuk membedakan antara siswa yang tergolong
pandai, dan siswa yang tergolong kurang atau lemah.

Bila butir soal dapat dijawab oleh semua siswa berarti butir soal itu tidak
memiliki daya pembeda, dengan demikian tidak akan menghasilkan gambaran
hasil yang sesuai dengan kemampuan siswa yang sebenarnya. Angka yang
membedakan besarnya daya pembeda disebut indeks diskriminasi (D). Harga
D berkisar –1,0 sampai dengan 1,0. Indeks diskriminasi dapat saja mempunyai
harga negatif artinya anak yang pandai tidak dapat menjawab sedangkan anak
yang kurang pandai dapat menjawab dengan benar.

Untuk menentukan daya pembeda setiap butir soal akan melibatkan


pembagian kelompok atas dan kelompok bawah.

Untuk menentukan daya pembeda (D) digunakan rumus :

BA BB
D   PA  PB
JA JB

Di mana :
J = Jumlah peserta tes
JA = Jumlah peserta kelompok atas
JB = Jumlah peserta kelompok bawah
BA = Jumlah peserta kelompok atas yang menjawab benar
BB = Jumlah peserta kelompok bawah yang menjawab benar
PA = Proporsi kelompok atas yang menjawab benar
PB = Proporsi kelompok bawah yang menjawab benar

90
Langkah-langkah menentukan daya pembeda (D) :
a) Memeriksa jawaban soal semua peserta tes.
b) Membuat daftar peringkat hasil tes berdasarkan skor yang dicapai, mulai
dari skor tertinggi sampai terendah.
c) Menentukan jumlah sampel untuk kelompok atas sebanyak 27% dari
jumlah peserta tes dan 27% untuk kelompok bawah apabila kelompok
besar. Untuk kelompok kecil seluruh kelompok peserta dibagi dua sama
besar, 50% kelompok atas dan 50% kelompok bawah.
d) Menghitung jumlah siswa yang menjawab benar dari semua nomor soal,
baik pada kelompok atas maupun pada kelompok bawah

Contoh : Penentuan kelompok atas dan bawah untuk kelompok kecil.


Nama Siswa Skor
A 90
B 86
C 85 Kelompok Atas
D 80
E 76

F 72
G 70
H 69 Kelompok Bawah
I 65
J 60

Contoh : Untuk kelompok besar


90
88
85 27% Kelompok Atas
80

40
38
37
27% Kelompok Bawah
35
28

91
Contoh Perhitungan :
40 peserta mengerjakan tes kimia dengan jumlah butir soal sebanyak 30. Pola
jawaban mereka telah diurutkan dari skor tertinggi sampai skor terendah seperti
terlihat pada tabel berikut ini :

92
Tabel : Perhitungan penentuan reliabilitas tes ………….

93
Tabel : Perhitungan penentuan reliabilitas tes ………….

94
Daya beda dihitung dengan rumus :
BA BB
D   PA  PB
JA JB
Untuk soal nomor 1 BA=15, BB=12
15 12 3
D    0,2
15 15 15
Untuk soal nomor 2 :
11 10 1
D    0,066
15 15 15

Harga pembeda (D) soal nomor 3 sampai dengan 30 dapat pula dilihat pada
tabel.

No. BA BB D Keterangan

1 15 12 0.20 Jelek
2 11 10 0.07 Jelek
3 14 10 0.27 Jelek
4 12 5 0.47 Baik
5 4 0 0.27 Jelek
6 14 8 0.40 Cukup
7 15 6 0.60 Baik
8 14 9 0.33 Cukup
9 10 6 0.27 Jelek
10 15 11 0.27 Jelek
11 14 11 0.20 Jelek
12 15 6 0.60 Baik
13 15 11 0.27 Jelek
14 15 11 0.27 Jelek
15 8 3 0.33 Cukup
16 9 2 0.47 Baik
17 6 0 0.40 Cukup
18 13 9 0.27 Jelek
19 15 8 0.47 Baik
20 14 1 0.87 BaikSekali
21 4 3 0.07 Jelek
22 15 11 0.27 Jelek
23 14 10 0.27 Jelek
24 8 4 0.27 Jelek
25 14 3 0.73 BaikSekali

95
26 10 9 0.07 Jelek
27 13 0 0.87 BaikSekali
28 14 9 0.33 Cukup
29 10 4 0.40 Cukup
30 15 12 0.20 Jelek

Dari hasil analisis daya beda butir soal, ternyata terdapat 16 soal yang
termasuk kategori jelek, 6 soal cukup, 8 soal baik dan 3 soal baik sekali.

Klasifikasi daya pembeda

-1,00 0,00 1,00


daya pembeda daya pembeda daya pembeda
negatif rendah tinggi
(positif)
c. Pola Jawaban Siswa

Yang dimaksud dengan pola jawaban siswa adalah distribusi peserta dalam
hal menentukan pilihan jawaban. Pola jawaban diperoleh dengan menghitung
banyaknya peserta yang memilih pilihan jawaban (option) a, b, c, atau d atau
yang tidak memilih pilihan manapun (blangko) dalam istilah evaluasi disebut
omit, disingkat O.

Dari pola jawaban soal dapat ditentukan apakah pengecoh (distractor)


berfungsi dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh
peserta berarti pengecoh tersebut jelek. Sebaliknya sebuah pengecoh
(distractor) dapat dikatakan berfungsi dengan baik apabila pengecoh tersebut
mempunyai daya tarik yang besar bagi peserta tes yang kurang memahami
konsep atau kurang menguasai bahan. Suatu pengecoh dapat dikatakan
berfungsi baik jika paling sedikit dipilih oleh 5% peserta tes.

Dengan melihat pola jawaban soal, dapat diketahui :


a) Taraf kesukaran soal
b) Daya pembeda soal
c) Baik dan tidaknya distractor

Sesuatu distractor dapat diperlakukan dengan 3 cara :


a) Diterima, karena sudah baik
b) Ditolak, karena tidak baik
c) Ditulis kembali, karena kurang baik

96
Contoh : Dari analisis sebuah item, pola jawabannya diketahui sebagai berikut

Soal Butir 1

Pilihan jawaban a B c* d e Jumlah


Kelompok atas 5 7 15 3 0 30
Kelompok bawah 8 8 6 5 3 30

*c adalah kunci jawaban

Dari pola jawaban dapat dicari :


21
1) P  0,35
60
2) D  PA  PB
15 6 9
  
30 30 30
 0,30
3) Distraktor : semua distraktor telah berfungsi dengan baik karena sudah
dipilih oleh lebih dari 5% pengikut tes (5% pengikut tes adalah 5% x 60
orang = 3 orang).

97
BAB IV
TEKNIK PENGOLAHAN DAN PENGUBAHAN
SKOR HASIL TES MENJADI NILAI

A. Perbedaan Antara Skor dan Nilai

Jika tes sebagai alat evaluasi telah disusun dengan sebaik-baiknya, langkah
selanjutnya adalah pelaksanaan tes itu sendiri. Sampai disini pekerjaan pengukuran
dengan tes belumlah selesai, karena masih dibutuhkan pekerjaan yang tidak kalah
pentingnya yaitu Teknik Pengolahan dan Pengubahan Skor Hasil Tes Menjadi Nilai,
Masih dirasakan adanya kerancuan pengertian antara skor dan nilai. Untuk
menghindari hal di atas sebelum dilakukan pekerjaan menskor dan menilai, agar
diperoleh penilaian yan objektif perlu diketahui terlebih dahulu tentang perbedaan
skor dan nilai. Perlu untuk dijelaskan tentang perbedaan antara skor dan nilai
karena masih banyak orang menganggap bahwa skor itu mempunyai pengertian
yang sama dengan nilai.

Skor adalah hasil pekerjaan menskor (memberikan angka) yang diperoleh dengan
cara menjumlahkan angka-angka bagi setiap butir tes yang dijawab betuk oleh
siswa dengan memperhitungkan bobot jawaban betulnya.

Misalkan tes hasil belajar kimia diberikan 40 butir soal tes obyektif dengan
ketentuan bahwa untuk setiap butir soal yang dijawab benar diberikan bobot 1.
Dengan demikian bila seorang peserta dapat menjawab betul semua soal maka ia
akan mendapat skor 40 x 1 = 40. Angka 40 ini disebut Skor Maksimum Ideal (SMI).
Artinya dalam tes hasil belajar tersebut tidak mungkin ada skor yang melebihi 40.

Bila dalam tes hasil belajar itu siswa bernama Hadi dapat menjawab betul 25 butir
soal, sedangkan Rani menjawab dengan betul sebanyak 30 butir soal, maka skor
diberikan untuk Hadi adalah 25 x 1= 25 dan untuk Rani adalah 25 x 1 = 25. Jadi
angka 40, 25 dan 30 itu belum dapat disebut nilai, karena angka 40, 24 dan 30
menunjukkan banyaknya butir soal yang dijawab dengan betul setelah
diperhitungkan dengan bobot jawaban betulnya. Artinya siswa tersebut sudah
menguasai 100% tujuan pembelajaran khusus yang telah ditentukan.

Contoh lain, misalnya tes hasil belajar kimia diberi 5 butir soal hitungan
(Stoikiometri) dalam bentuk tes essay untuk setiap butir soal yang dijawab betuk
diberi bobot 10. Bila siswa yang bernama Yulia menjawab soal tersebut 3 soal
djiawab dengan betul dan 2 soal hanya ½ yang betul. Jadi skor yang diperolehnya
adalah (3x10)+(2x5)=40. Angka 40 ini merupakan skor mentah. Skor maksimum
untuk kelima butir soal ini adalah 50, Jadi skor 40 yang diperoleh Yulia
mencerminkan 80% penguasaan tujuan.
98
Nilai adalah angka (huruf) yang merupakan hasil ubahan dari skor yang sudah
dijadikan satu dengan skor-skor yang lainnya serta disesuaikan pengaturannya
dengan standar tertentu. Oleh karena itu nilai ini sering disebut dengan Skor
Standar (Standard Score).

B. Cara Pengolahan dan Pengubahan Skor Mentah Hasil Menjadi Nilai

Ada dua cara dalam pengolahan dan pengubahan skor menjadi nilai
1) Criterian Referenced Evaluation, dikenal dengan istilah penilaian beracuan
patokan (PAP).
Pengolahan dan pengubahan skor mentah menjadi nilai mengacu pada
kriterium atau patokan.
2) Norm Referenced Evaluation, dikenal dengan istilah penilaian beracuan norma
(PAN) atau penilaian beracuan kelompok (PAK).
Pengolahan dan pengubahan skor mentah menjadi nilai mengacu pada norma
atau kelompok, maksudnya nilai yang diperoleh dengan membandingkan skor
yang dicapai oleh siswa dengan skor yang dicapai oleh teman-teman
sekelompoknya.

Penilaian beracuan norma menggunakan berbagai macam skala yaitu:


1) Skala Lima (Stanfive), sering dikenal dengan istilah nilai huruf A,B,C,D dan E
Merubah skor mentah hasil tes menjadi nilai standar berskala lima atau nilai
huruf, menggunakan patokan sebagai berikut :
A
Mean + 1,5 DS
B
Mean + 0,5 DS
C
Mean - 0,5 DS
D
Mean - 1,5 DS
E

Yang apabila dilukiskan dalam bentuk kurva simetrik adalah sebagai


berikut:

99
Pada pengolahan skor mentah menjadi nilai huruf dapat dilakukan dengan
dua cara yaitu :
 Jika banyaknya skor yang diolah kurang dari 20 digunakan tabel distribusi
frekuensi tunggal.
 Jika banyaknya skor yang diolah lebih dari 20, sebaiknya digunakan tabel
distribusi frekuensi bergolong.

Berikut ini diberikan contoh menggunakan tabel distribusi tunggal.


Misalkan seorang dosen memperoleh skor mentah dari hasil tes belajar kimia
organik dari 20 orang mahasiswa sebagai berikut :
90, 36, 89, 54, 64, 73, 74, 45, 77, 60, 70, 53, 73, 71, 75, 81, 57, 82, 55, 56.
Skor mentah tersebut akan diolah menjadi nilai huruf A, B, C, D dan E (TL).
Langkah-langkah dalam mengubah skor mentah menjadi nilai standar berskala
lima adalah sebagai berikut :
a. Menyusun skor-skor mentah hasil tes tersebut di atas dalam bentuk tabel
distribusi frekuensi, skor disusun dari skor tertinggi sampai terendah.

Tabel : Distribusi Frekuensi Tunggal

Skor Mentah (X-M) (X-M)2


No.
X d d2
1. 90 23,25 540,56
2. 89 22,25 495,06
3. 82 15,25 232,56
4. 81 14,25 203,06
5. 77 10,25 105,06
6. 75 8,25 68.06
7. 74 7,25 52,56
8. 73 6,25 39,06
9. 73 6,25 39,06
10. 71 4,25 18,06
100
11. 70 3,25 10,56
12. 64 -2,75 7,56
13. 60 -6,75 45,56
14. 57 -9,75 95,06
15. 56 -10,75 115,56
16. 55 -11,75 138,06
17. 54 -12,75 162,56
18. 53 -13,75 189,06
19. 45 -21,75 473,06
20. 36 -30,75 945,56
1335 954,00 4480,62

b. Hitung nilai rata-rata (M) dengan membagi jumlah skor tersebut (X)
dengan jumlah mahasiswa atau peserta tes (N).

Rumus untuk menghitung harga M adalah :


X
M
N
1335
M  66,75
20

c. Hitung harga deviasi (d) dalam tabel untuk tiap-tiap skor dari mean (X-M)
d. Kuadratkan harga deviasi yang diperoleh kemudian jumlahkan sehingga
diperoleh harga (X-M)2 =4480,62.
e. Langkah terakhir menghitung deviasi standar (DS) dengan rumus berikut :

( X  M ) 2
DS 
N
4480,62
DS   224,031  14,96
20

Penjabaran Menjadi Nilai Huruf


Dari perhitungan-perhitungan di atas telah diperoleh nilai M (Mean) 66,75
dan DS (deviasi standar) 14,96 selanjutnya digunakan ketentuan seperti di
atas.

101
Berdasarkan hasil perhitungan di atas kemudian mengkonversi skor
mentah dari 20 orang mahasiswa ke dalam nilai huruf sebagai berikut.

Tabel Konversi

Skor Mentah Nilai Huruf


 90 A
75 – 89 B
60 – 74 C
45 – 59 D
0 – 44 E

Tabel : Konversi Skor Mentah Menjadi Nilai Huruf

No. Skor Mentah Nilai Huruf


X
1. 90 A
2. 89 B
3. 82 B
4. 81 B
5. 77 B
6. 75 B
7. 74 B
8. 73 C
9. 73 C
10. 71 C
11. 70 C
12. 64 C
13. 60 C
14. 57 D
15. 56 D
16. 55 D
17. 54 D

102
18. 53 D
19. 45 D
20. 36 E
Rerata 66.75 C

Contoh pengolahan skor mentah menjadi nilai menggunakan tabel


distribusi frekuensi bergolong.

Misal seorang dosen memperoleh skor mentah dari hasil tes belajar kimia
organik dari 25 orang mahasiswa sebagai berikut :

87,80; 45,85; 83,63; 57,42; 69,73; 71,55; 75,25; 51,00; 74,70; 66,90;
72,20; 60,03; 78,15; 73,98; 76,07; 78,75; 64,70; 78,60; 58,40; 55,68;
50,40; 72,75; 64,55; 59,15; 80,65.

Langkah-langkah dalam mengubah skor mentah menjadi nilai standar


berskala lima adalah sebagai berikut :
a. Menyusun skor-skor mentah hasil tes tersebut di atas dalam bentuk
tabel distribusi frekuensi, skor disusun dari skor tertinggi sampai
terendah.
b. Hitung nilai rata-rata (M) dengan membagi jumlah skor tersebut (X)
dengan jumlah mahasiswa atau peserta tes (N).

Rumus untuk menghitung harga M adalah :

X
M
N

1707,89
M  68,32
25

c. Hitung harga deviasi (d) dalam tabel untuk tiap-tiap skor dari mean
(X-M)
d. Kuadratkan harga deviasi yang diperoleh kemudian jumlahkan
sehingga diperoleh harga (X-M)2 .
e. Langkah terakhir menghitung deviasi standar (DS) dengan rumus
berikut :

( X  M ) 2
DS 
N
103
2990,16
DS   119,606  10,94
25

Tabel Distribusi Frekuensi Tunggal

Skor Mentah (X-M) (X-M)2


No.
X d d2
1. 87.80 19.48 379.47
2. 83.63 15.31 234.40
3. 80.65 12.33 152.03
4. 78.75 10.43 108.78
5. 78.60 10.28 105.68
6. 78.15 9.83 96.63
7. 76.07 7.75 60.12
8. 75.25 6.93 48.02
9. 74.70 6.38 40.70
10. 73.98 5.66 32.04
11. 72.75 4.43 19.62
12. 72.20 3.88 15.05
13. 71.55 3.23 10.43
14. 69.73 1.41 1.99
15. 66.90 (1.42) 2.02
16. 64.70 (3.62) 13.10
17. 64.55 (3.77) 14.21
18. 60.03 (8.29) 68.72
19. 59.15 (9.17) 84.09
20. 58.40 (9.92) 98.41
21. 57.42 (10.90) 118.81
22. 55.68 (12.64) 159.77
23. 51.00 (17.32) 299.98
24. 50.40 (17.92) 321.13
25. 45.85 (22.47) 504.95
1707.89
68.32 (0.11) 2,990.16

Penjabaran Menjadi Nilai Huruf

Dari perhitungan-perhitungan di atas telah diperoleh nilai M (Mean) 68,32


dan DS (deviasi standar) 10,94 selanjutnya digunakan ketentuan seperti di
atas.

104
Berdasarkan hasil perhitungan di atas kemudian mengkonversi skor
mentah dari 25 orang mahasiswa ke dalam nilai huruf sebagai berikut.

Tabel Konversi

Skor Mentah Nilai Huruf


 85 A
75 – 84 B
63 – 74 C
53 – 62 D
0 – 52 E

Tabel Konversi Skor Mentah Menjadi Nilai Huruf

No. Skor Mentah Nilai Huruf


X
1. 87.80 A
2. 83.63 B
3. 80.65 B
4. 78.75 B
5. 78.60 B
6. 78.15 B
7. 76.07 B
8. 75.25 B
9. 74.70 B
10. 73.98 C
11. 72.75 C
12. 72.20 C
13. 71.55 C
14. 69.73 C
15. 66.90 C
16. 64.70 C
17. 64.55 C
18. 60.03 D
19. 59.15 D
105
20. 58.40 D
21. 57.42 D
22. 55.68 D
23. 51.00 D
24. 50.40 E
25. 45.85 E

2) Skala Sembilan (Stanine), mempunyai rentangan nilai 1 - 9.

Apabila skor-skor mentah hasil tes akan diubah menjadi nilai standar
berskala sembilan maka patokan yang digunakan adalah sebagai berikut :

9
Mean + 1,75 DS
8
Mean + 1,25 DS
7
Mean + 0,75 DS
6
Mean + 0,25 DS
5
Mean – 0,25 DS
4
Mean – 0,75 DS
3
Mean – 1,25 DS
2
Mean – 1,75 DS
1

Nilai-nilai tersebut dapat di lukiskan dalan bentuk kurva normal sebagai


berikut :

106
Nilai standar berskala sembilan ini meniadakan nilai 0 dan nilai 10. Cara
pengolahan menggunakan standar ini tidak lazim digunakan.

3) Skala Sebelas (Stanel = Standard Eleven), yaitu rentangan nilai dari 0 -


10.

Rentangan nilai standar berskala sebelas ini mulai dari 0 sampai dengan
10, jadi ada 11 butir standar.

Pengubahan skor mentah menjadi nilai standar sebelas digunakan


patokan sebagai berikut.

10
M + 2,25 SD
9
M + 1,75 SD
8
M + 1,25 SD
7
M + 0,75 SD
d) 6
e) M + 0,25 SD
f) 5
M - 0,25 SD
4
M - 0,75 SD
3
107
M - 1,25 SD
g) 2
h) M - 1,75 SD
i) 1
j) M - 2,25 SD
0

Nilai-nilai tersebut dapat dilukiskan dalam bentuk kurva nominal sebagai


berikut.

Contoh:
Dari data-data perhitungan skala lima dieroleh harga M = 68,32 dan DS =
10,94.

Pengubahan skor mentah menjadi nilai standar sebelas digunakan


patokan sebagai berikut.

10
M + 2,25 SD = 68,32 + (2,25) 10,94 = 68,32 + 24,62 = 92,94
9
M + 1,75 SD = 68,32 + (1,75) 10,94 = 68,32 + 19,15 = 87.47
8
M + 1,25 SD = 68,32 + (1,25) 10,94 = 68,32 + 13.68 = 82,00
7
M + 0,75 SD = 68,32 + (0,75) 10,94 = 68,32 + 8,20 = 76,52
6
M + 0,25 SD = 68,32 + (0,25) 10,94 =68,32 + 2,74 = 71,06
5
M - 0,25 SD = 68,32 – (0,25) 10,94 = 68,32 - 2,74 = 65,58
108
4
M - 0,75 SD = 68,32 – (0,75) 10,94 = 68,32 - 8,20 = 60,12
3
M - 1,25 SD = 68,32 – (1,25) 10,94 = 68,32 - 13.68 = 54,64
2
M - 1,75 SD = 68,32 – (1,75) 10,94 = 68,32 - 19,15 = 49,17
1
M - 2,25 SD = 68,32 – (2,25) 10,94 = 68,32 - 24,62 = 13,70
0
Berdasarkan hasil perhitungan di atas kemudian mengkonversi skor
mentah dari 25 orang mahasiswa ke dalam nilai huruf sebagai berikut.

Tabel Konversi

Skor Mentah Nilai Jadi


 92 10
87 – 91 9
82 – 86 8
76 – 81 7
71 – 75 6
65 – 70 5
60 – 64 4
54 – 59 3
49 – 53 2
13 – 48 1
0 – 13 0

Tabel Konversi Skor Mentah Menjadi Nilai Huruf

No. Skor Mentah Nilai Jadi


X
1. 87.80
2. 83.63
3. 80.65
4. 78.75
5. 78.60
6. 78.15
7. 76.07
8. 75.25
9. 74.70
10. 73.98
11. 72.75
12. 72.20
13. 71.55
109
14. 69.73
15. 66.90
16. 64.70
17. 64.55
18. 60.03
19. 59.15
20. 58.40
21. 57.42
22. 55.68
23. 51.00
24. 50.40
25. 45.85

4) Nilai Standar Z (Z score).

Skor standar Z (Z–Score) adalah skor yang menunjukkan perbandingan


perbedaan skor seseorang dari rata-rata (Mean) dengan standat
deviasinya.

Pengolahan skor merubah menjadi Z skor ini banyak digunakan dalam


menentukan kejuaraan atau ranking seseorang apabila kebetulan jumlah
dari aspek-aspek yang dinilai sama. Artinya dengan hanya mengetahui
skor mentah atau berdasarkan jumlah yang diperoleh seseorang belum
dapat memberikan tafsiran yang tepat mengenai kemampuan atau
kecakapan seseorang.

Misalkan kita melihat hasil belajar dalam mata pelajaran kelompok IPA
dari seorang siswa yang bernama Yudi sebagai berikut :

Fisika = 65
Kimia = 55
Biologi = 70

Dari hasil belajar yang dicapai oleh Yudi kita mempunyai kesan bahwa
Yudi mempunyai kemampuan yang cukup dalam Fisika, kurang dalam
Kimia dan cukup baik dalam Biologi. Apakah benar interpretasi terhadap
kemampuan Yudi tersebut? Hal ini sukar untuk dijawab apabila kita tidak
mengetahui bagaimana skor yang diperoleh teman-teman sekelasnya,
berapa nilai rata-rata tiap mata pelajaran dari seluruh murid yang dites.

Untuk lebih jelasnya bagaimana kemampuan atau kepandaian Yudi itu


sebenarnya jika dibandingkan dengan teman-teman sekelasnya, perlu
110
diketahui besarnya nilai rata-rata dan deviasi standar dari tiap mata
pelajaran itu.

Dengan menggunakan rata-rata dan deviasi standar skor-skor yang


diperoleh dapat diubah menjadi Z-Skor dengan rumus sebagai berikut :

X M
Z
DS
Di mana : X = Skor yang diperoleh
M = rata-rata skor dari kelompok
DS = deviasi standar dari skor-skor tersebut

Sebagai contoh untuk mengetahui kemampuan Yudi dibandingkan


dengan teman-temannya dapat dikemukakan data sebagai berikut :

Nilai Untuk Mata Pelajaran IPA dari 3 orang siswa

Mata
Fisika Kimia Biologi Jumlah
Pelajaran

Nama Siswa
Yudi 65 55 70 190
Dian 70 60 60 190
Essy 60 70 60 190

Bila diketahui rata-rata kelas dan deviasi standar untuk masing-masing


mata pelajaran tersebut di atas adalah :

Mata Pelajaran Mean DS


Fisika 60 4,0
Kimia 45 4,0
Biologi 75 5,0

Dari data di atas kita lihat hasil rata-rata dari ketiga mata pelajaran sama
yaitu 63.33 karena jumlah ketiga mata pelajaran sama yaitu 190. berarti
secara sepintas kita katakan kepandaian atau kemampuan mereka sama.
Sebenarnya kesimpulan yang telah diambil itu belum tentu benar.

Dengan menggunakan skor standar Z (Z-Score) kita dapat mengetahui


siapa sebenarnya dari ketiga siswa tersebut di atas yang lebih baik atau
lebih tinggi prestasinya. Skor Z untuk masing-masing mata pelajaran
dihitung dengan menggunakan rumus Z.
111
Mata Z – Score
Pelajaran Jumlah
Z - Score
Nama Siswa Fisika Kimia Biologi
65  60 55  45 70  75 + 2,75
Yudi  1,25  2,5  1,0
4,0 4,0 5,0
70  60
 2,5 60  45 60  75
 3,0
+ 3,25
Dian 4,0  3,75
4,0 5,0
60  60
0 60  45 65  70
 2,0
+ 3,00
Essy 4,0
 5,0 5,0
4,0

Dari hasil Z-Skor di atas, dapat disimpulkan bahwa prestasi Dian ternyata
lebih baik dibanding prestasi Yudi dan Essy, dan prestasi Essy lebih baik
dari pada Yudi.

5) Nilai Standar T (Tscore): Mengolah Skor Mentah Menjadi Skor Standar T


(T-Score)

Yang dimaksud dengan T-Skor adalah angka skala yang menggunakan


rata-rata (Mean) sebesar 50 dan deviasi standar sebesar 10 (DS=10). T-
Score dapat diperoleh dengan cara mengalikan Z Score dengan angka 10
kemudian ditambah dengan 50.

T-Score = 10 Z + 50 atau
T-Score = 50 + 10 Z

T-Score dihitung dengan tujuan meniadakan tanda negatif yang terdapat


di depan nilai standar Z.

Sebagai contoh bagimana cara mengolah Z-Score menjadi T-Score marila


kita lihat kembali data Z-Skor dari 3 orang siswa yang telah dikemukakan
di atas.

Mata
Pelajaran
112

Nama Siswa
Z – Score
Jumlah T-Score
Fisika Kimia Biolog Z - Score
i
+ 1,25 + 2,5 - 1,0 + 2,75 (2,75x10)+50=77,5
Yudi

+ 2,5 + 3,75 - 3,0 + 3,25 (3,25x10)+50=82,5


Dian

0,0 + 5,0 - 2,0 + 3,00 (3,00x10)+50=80,0


Essy

Dengan menggunakan T-Score ternyata skor standar tertinggi juga diraih


oleh Dian, yaitu 82,5 dan terendah Yudi yaitu 77,5 sama halnya dengan
menggunakan Z-Score.

Demikianlah telah diberikan beberapa contoh tentang bagaimana cara


mengubah skor-skor hasil tes menjadi nilai standar relatif yang
mendasarkan diri pada prestasi kelompok.

Selain itu ada cara lain untuk menentukan kedudukan siswa dalam
kelompok yaitu :

a. Dengan ranking sederhana (Simple Rank)

Simple Rank adalah urutan yang menunjukkan letak/ kedudukan


seseorang dalam kelompoknya, dan dinyatakan dengan nomor atau
angka biasa.
Contoh : Skor dari ulangan Kimia bagi 20 orang siswa adalah sebagai
berikut

A = 56 F = 70 K = 60 P = 75
B = 75 G = 60 L = 65 Q = 45
C = 84 H = 75 M = 90 R = 82
D = 78 I = 48 N = 55 S = 75
E = 69 J = 80 O = 67 T = 65

Hanya dengan melihat deretan skor yang masih berserakan ini, kita belum
dapat menentukan ranking atau kedudukan seseorang dalam
kelompoknya. Untuk itu maka skor-skor tersebut terlebih dahulu harus kita
susun, urut dari skor yang paling tinggi sampai skor yang paling rendah,
dengan urutan ke bawah. Setelah itu kita tentukan urutan nomor dari atas,
yaitu nomor 1, 2, 3, 4, dan seterusnya sampai seluruh siswa memperoleh

113
nomor. Perlu diingat di sini bahwa apabila ada dua atau tiga orang yang
kebetulan memiliki skor yang sama, harus diberi nomor urut atau ranking
yang sama pula, yaitu rata-rata dari urutan orang-oranga yang memiliki
skor sama tersebut.

Untuk memahami bagaimana menentukan simple rank atau ranking


sederhana, marilah kita urutkan dahulu skor-skor A sampai dengan T, dan
terdapatlah seperti berikut ini.

Tabel Simple Rank dari 20 orang siswa

Nama Siswa Skor Ranking


M 90 1
C 84 2
R 82 3
J 80 4
D 78 5
S 75 6
P 75 7
 6789
H 75 8 7,5 dari  
B 75 9  4 
F 70 10
E 69 11
O 67 12
T 65 13  13  14 
L 65 14 13,5 dari 
K 60 15  2 
 15  16 
G 60 16 15,5 dari  
A 56 17  2 
N 55 18
I 48 19
Q 45 20

Perhatian :
1) Siswa yang mempunyai skor sama, juga mempunyai ranking yang
sama, sehingga ada nomor-nomor yang tidak digunakan sebagai
nomor urut.
2) Rank terakhir selalu sama dengan nomor urut siswa atau banyaknya
siswa dalam kelompok, kecuali ada bebarapa orang yang mempunyai
persamaan skor.

b. Dengan ranking persentase (Percentile Rank)

114
Percentile rank atau ranking persentase adalah kedudukan seseorang
dalam kelompok, yang menunjukkan banyaknya persentase yang berada
dibawahnya.

Jadi dalam hal ini siswa dibandingkan dengan siswa lain yang mempunyai
skor sama atau lebih kecil daripadanya.

Sebagai contoh :
Jika seorang siswa memiliki PR (Percentile Rank) 85, ini menunjukkan
bahwa kecakapan siswa tersebut sama atau melebihi 85% dari seluruh
kelompoknya.

Dengan ranking persentase atau percentile rank, lebih dapat diketahui


gambaran kecakapan siswa, karena angka ranking menunjukkan
besarnya persentase siswa dalam kelompok itu yang berhasil dilampaui.
Apabila hanya dengan simple rank, hanya diketahui nomor, tanpa
menunjukkan banyaknya individu yang masuk dalam kelompok. Mungkin
A mempunyai ranking 15, nampaknya nomor ini kecil, tetapi siapa tahu
bahwa seluruh kelompok memang hanya terdiri dari 15 orang, hingga A
termasuk juru kunci.

Cara menentukan PR adalah demikian :


1. Menentukan dahulu SR (Simple Rank)-nya.
2. Mencari banyaknya siswa dalam kelompok itu, yang ada di
bawahnya.
3. Mengalikan dengan 100, setelah dibagi dengan kelompok.

Contoh :
Dengan kelompok yang terdapat pada “Tabel Simple Rank untuk 20
orang”, siswa F menduduki ranking 10 dalam simple rank (SR). Maka
banyaknya siswa yang ada di bawahnya adalah 20-10 orang atau 10
orang.
10
PR untuk F adalah x 100 atau 50
20

Ini berarti bahwa siswa F itu letaknya dalam kelompok mengalahkan 50%
untuk prestasi yang bersangkutan.

Dengan contoh di atas ini dapat dikatakan bahwa untuk menentukan PR


kita tidak boleh tidak harus menentukan SR terlebih dahulu.

Rumus untuk menetukan PR adalah :


115
N  SR
PR  x100
N

Di dalam kelompok, maka PR hanya berkisar antara 1 sampai seratus,


tidak pernah ada PR 100 karena tidak ada siswa yang mengalahkan
dirinya sendiri. Cobalah untuk siswa yang mempunyai SR 1 sampai
dengan 100?

Berikut ini disajikan Percentile Rank untuk masing-masing siswa dari 20


orang siswa.

Tabel Simple Rank dari 20 Orang Siswa

Nama Siswa Skor Ranking PR

M 90 1.00 95.00%
C 84 2.00 90.00%
R 82 3.00 85.00%
J 80 4.00 80.00%
D 78 5.00 75.00%
S 75 7.50 62.50%
P 75 7.50 62.50%
H 75 7.50 62.50%
B 75 7.50 62.50%
F 70 10.00 50.00%
E 69 11.00 45.00%
O 67 12.00 40.00%
T 65 13.50 32.50%
L 65 13.50 32.50%
K 60 15.50 22.50%
G 60 15.50 22.50%
A 56 17.00 15.00%
N 55 18.00 10.00%
I 48 19.00 5.00%
Q 45 20.00 0.00%

116
117
BAB IV
PENILAIAN KEGIATAN PRAKTIKUM KIMIA

A. Hakikat Praktikum Kimia

Praktikum kimia merupakan bagian dari kegiatan pembelajaran kimia. Dan hampir
semua mata kuliah kimia diikuti dengan kegiatan praktikum di laboratorium. Tujuan
terpenting dari kegiatan praktikum tidak hanya mengajarkan bagaimana proses
kegiatan laboratorium yang benar, akan tetapi terletak pada bagaimana
kemampuan intelektual mahasiswa dapat berkembang dari kegiatan tersebut serta
bagaimana memperoleh pengalaman inkuiri seperti interpretasi data, membuat
hipotesis atau menguji hipotesis yang telah dibuat.

Menurut Pavelich dan Abraham (1977) tujuan terpenting dari kegiatan laboratorium
yang benar terletak pada bagaimana kemampuan intelektual peserta didik bisa
berkembang dari kegiatan tersebut, serta bagaimana peserta didik memperoleh
pengalaman inkuari seperti interpretasi data, membuat hipotesis, atau mengkaji
kebenaran hipotesis yang telah dibuat. Hal ini didukung oleh Kundberg (1993) yang
menyatakan bahwa kegiatan laboatorium atau praktikum bisa mendorong
perkembangan kemampuan penting diantara pengamatan yang mendetail,
pencatatan secara akurat, mendesain percobaan, analisis, statistik dan
pengoperasian alat. Kegiatan itu juga memberikan kesempatan kepada peserta
didik untuk belajar problem solving,metode ilmiah, teknik penelitian, dan
penggunaan literatur ilmiah. Lebih lanjut menurut Gott dan Duggan (1996)
praktikum memiliki tiga ranah yang saling berkaitan yaitu : (1) Aspek motivasional
yang akan mendorong minat dan keterampilan sosial, (2) penerapan pengetahuan
substantiv, dan (3) pengembangan keterampilan eksperimen. Winarno Surahmad
(1994) menyatakan bahwa kegiatan praktikum dalam kegiatan pendidikan adalah
sarana yang membiasakan peserta didik pada masalh-masalah nyata di dunia kerja.
Melalui kegiatan praktikum, siswa diharapkan memiliki keterampilan yang lebih
besar untuk berinisiatif dan mengembangkan diri. Berkaitan dengan tujuan
pembelajaran sains, maka Airasian (1994) menyatakan bahwa melalui kegiatan
praktikum, peserta didik diharapkan mampu mencapai tujuan pembelajaran sains
secara bersamaan yaitu berupa keterampilan kognitif, afektif dan psikomotorik.
Dalam hal ini aspek kognitif lebih menitikberatkan pada aspek kemampuan
menggunakan alat dan bahan, keterampilan afektif berupa belajar mandiri,
berinteraksi dan belajar saling menghargai.

Berdasarkan uraian di atas jelaslah bahwa kegiatan praktikum dilakukan tidak


hanya sekedar untuk mengecek kebenaran teori yang telah diajukan di kelas, akan

118
tetapi lebih dari itu yaitu untuk mengembangkan proses berpikir dengan timbulnya
berbagai pertanyaan dan masalah. Pertanyaan-pertanyaan dan masalah-masalah
itu akan merangsang proses berpikir, sehingga kemampuan intelektual akan
meningkat kearah kemampuan intelektual tinggi yang oleh Piaget disebut sebagai
kemempuan berpikir formal. Seringkali permasalahan sekaligus pemecahan dalam
ilmu kimia berasal dari laboratorium. Konsep-konsep ilmu kimia kebanyakan berasal
dari percobaan-percobaan yang dikembangkan dari kegiatan laboratorium.

Berikut ini dikemukakan bagan peranan laboratorium dalam pembelajaran kimia :

Jika kita amati secara seksama, hal di atas sangatlah mungkin terjadi, karena
proses pembelajaran praktikum apabila dilaksanakan dengan benar mencakup tiga
(3) aspek kemampuan secara bersamaan yaitu :
1. Ketrampilan Kognitif, mencakup :
a. Melatih agar teori dapat dimengerti
b. Agar segi-segi teori yang berlainan dapat diintegrasikan
c. Agar teori dapat diterapkan pada keadaan problem yang nyata.
2. Ketrampilan Afektif, mencakup :
a. Sikap ilmiah
b. Belajar merencanakan kegiatan secara mandiri
c. Belajar bekerja sama
d. Belajar menghargai bidangnya.
3. Ketrampilan Psikomotorik, mencakup :
a. Belajar memasang peralatan sehingga betul-betul dapat berjalan
b. Belajar memakai peralatan dan instrument tertentu.

Dalam kegiatan praktikum dapat dilaksanakan secara individu maupun


berkelompok, Wheater dan Dunleavy (1995) menyebutkan bahwa kerja kelompok
dapat memperkuat atmosfer dalam memperoleh keterampilan dan pengetahuan.
Selain alasan tersebut, mengapa metode kerja kelompok dipilih dalam kerja
praktikum, ada beberapa alasan antara lain :
a. Dalam kegiatan laboratorium tertentu beberapa tugas harus dilakukan secara
serentak dalam waktu yang bersamaan. Misalnya: memanaskan, mengamati
kenaikan suhu, mencatat waktu, menghitung jumlah tetes cairan yang terjadi
selama selang waktu tertentu dan lain sebagainya
b. Hasil kerja sama dalam kelompok biasanya lebih baik dari pada hasil
perseorangan
c. Mengembangkan sikap kooperatif, dengan bekerja kelompok mahasiswa akan
belajar untuk saling membantu, berkomunikasi, berdiskusi, membagi tugas,
menerima tanggungjawab dan mengembangkan sikap saling menghargai.

119
Memang harus diakui kerja kelompok sangat bermanfaat, namun menimbulkan
kendala dalam penilaian nantinya. Dalam penilaian dimaksud dosen dituntut
melakukan pengamatan yang kontinu dan efektif untuk menilai individu dalam
kelompok. Nilai kelompok bukanlah otomatis menjadi nilai akhir bagi setiap anggota,
karena nilai kelompok bukanlah mencerminkan integritas kemampuan dan
ketrampilan dari setiap individu. Pada kerja kelompok dalam kegiatan laboratorium,
akan terlihat adanya kemampuan yang berbeda-beda diantara para anggota.
Kemampuan yang berbeda-beda itu antara lain: pemahaman konsep, aplikasi
konsep, ketelitian ketrampilan menggunakan alat dan lain sebagainya. Oleh karena
itulah dalam penilaian kegiatan laboratorium perlu dibedakan antara nilai kelompok
dengan nilai individu dalam kelompok.

Perbedaan-perbedan tersebut merupakan aspek-aspek yang perlu diamati dan


menjadi aspek dari penilaian yang akan memberi gambaran mengenai kapasitas
atau bobot individu dalam kelompok. Aspek-aspek dimaksud dapat disususn,
ditentukan dan dikembangkan sedemikian rupa sesuai dengan kebutuhan serta
bergantung pada jenis kegiatan. Untuk selanjutnya dapat dituangkan dalam lembar
kerja yang dipergunakan sebagai instrument alat penilaian kegiatan laboratorium.

B. Sumber Penilaian Kegiatan Laboratorium.

Setelah selesai melaksanakan kegiatan laboratorium, para mahasiswa biasanya


memperoleh nilai atas penampilannya selama melakukan kegiatan laboratorium.
Akan tetapi sebagaimana telah dikemukakan pada uraian sebelumnya bahwa nilai
pekerjaan laboratorium yang dilakukan secara berkelompok bukanlah pekerjaan
yang mudah. Untuk menilai kegiatan laboratorium, pada umumnya dosen
memperoleh data atau bahan untuk penilaian dari berbagai sumber.

Adapun sumber data dimaksud antara lain :


a. Laporan:

Salah satu sumber data untuk penilaian dalam kegiatan laboratorium adalah
laporan. Laporan sebagai sumber data untuk penilaian hendaknya memiliki format
yang sistimatis, obyektif, ilmiah, komunikatif dan informatif. Sehingga kegiatan
menyusun laporan yang demikian tadi memberikan pembelajaran bagi
siswa/mahasiswa untuk menuangkan hasil kegiatan laboratorium dalam karya tulis
dengan bahasa yang baik dan benar, komunikatif, informatif, dan dapat
dipertanggung-jawabkan kebenarannya. Sehingga mahasiswa memperoleh
ketrampilan proses menulis laporan, berkomunikasi, yang pada akhirnya diharapkan
dapat menjadi sumber informasi yang lebih luas jakni bagi pengembangan ilmu
kimia. Dosen hendaknya menilai laporan praktikum bukan atas dasar penilaian

120
sekilas saja, tetapi sebelumnya dosen harus terlebih dahulu menetapkan aspek-
aspek apa saja yang akan dinilai dalam laporan tersebut selama mahasiswa
melakukan kegiatan laboratorium.

Bertolak pada asumsi laporan sebagai sumber data untuk penilaian dan dibuat
sebagai pembelajaran ketrampilan proses, maka penilaian laporan kegiatan
praktikum sebaiknya dilakukan dua kali. Pertama sebagai umpan balik kepada
siswa tentang kekurangan-kekurangan yang terdapat dalam laporan.Penilaian
kedua dilakukan setelah laporan itu diperbaiki, sehingga siswa mengetahui
kesalahan-kesalahannya dan dapat memperbaikinya.

b. Test Kegiatan Laboratorium :

Test kegiatan laboratorium digunakan pula sebagai sumber penilaian. Mengenai


test kegiatan laboratorium ini dapat berbentuk :
1. Ujian tertulis yang diadakan pada akhir semester, meliputi test teori mengenai
materi praktikum atau hal-hal yang berhubungan dengan kegiatan praktikum
2. Ujian praktek, misalnya meliputi pemeriksaan bahan, menentukan sesuatuyang
belum diketahui (unknown) mengenal dan m3engklasifikasi organisme,
merancang prosedur eksperimental dan lain sebagainya.
3. Test lisan ( pra test), dilakukan untuk setiap unit praktikum sebelum mahasiswa
melakukan percobaan di laboratorium.
c. Pengamatan langsung.
Setiap kegiatan laboratorium tertentu masih dapat lagi diperinci sesuai dengan
urutan langkah-langkah kegiatan dan kegiatan yang ditempuh dalam
melaksanakannya.
Misalnya : langkah persiapan, pelaksanan, diskusi, menyususn laporan, tindak
lanjut kegiatan dan lain-lainnya.
Dengan mengadakan pengamatan langsung setiap langkah-langkah tersebut di
atas yang dilakukan mahasiswa, mendapat nilai, baik dalam kelompok maupun
secara perorangan.

C. Nilai Individual Dalam Kelompok

Menilai mahasiswa yang bekerja sendiri secara individual tidaklah begitu sulit.
Setiap mahasiswa akan memperoleh nilai yang sesuai dengan penampilannya
sendiri. Akan tetapi menilai seorang individu mahasiswa yang bekerjasama dengan
beberapa temannya dalam kelompok sebagaimana lazimnya pada kegiatan
laboratorium akan menimbulkan kesulitan, apalagi jika kita ingin menilai lebih adil
dan obyektif.

121
Dalam satu kelas biasanya dosen membagi-bagi mahasiswa dalam beberapa
kelompok. Apabila satu kelompok telah selesai melakukan kegiatan laboratorium
tertentu, maka dosen akan memberi satu nilai tunggal untuk kelompok. Nilai
kelompok ini akan menjadi standar dalam menentukan nilai individu dalam
kelompok.

Selanjutnya untuk lebih jelasnya marilah kita perhatikan satu contoh kasus berikut
ini. Misalkan 4 orang mahasiswa yang terdiri dari A,B,C dan D bekerjasama dalam
satu kelompok melakukan satu kegiatan laboratorium tertentu. Setelah mereka
menyelesaikan seluruh kegiatan, misalkan dosen memberikan nilai “ baik “ ekivalen
angka 8 untuk seluruh kegiatan yang telah dilakukan mahasiswa (Persiapan : baik,
Pelaksanaan : baik, Hasil kegiatan umpamanya kristal bahan kimia : baik, Proses
dan Hasil diskusi : baik, Pelaksanaan tindak lanjut kegiatan : baik). Akan tetapi
secara individu bagaimanakah nilai masing-masing mahsiswa A,B,C dan D dalam
kegiatan tersebut? Apakah nilai mereka kita sama ratakan “baik”. Hal ini mungkin
bilamana kontribusi mahasiswa A=B=C=D selama melakukan kegiatan. Dalam
kenyataan sangat jarang terjadi kesamaan kontribusi seperti itu, sehingga
menyamaratakan nilai untuk masing-masing mahasiswa tidaklah adil dan obyektif.

Berkenaan dengan hal itu di bawah ini disajikan satu contoh sebagai salah satu
alternatif yang mungkin :
a. Nilai Kelompok
Untuk contoh di atas yang terdiri dari mahasiswa A,B,C dan D untuk setiap
jenis kegiatan, kelompok tersebut memperoleh nilai :
• Persiapan .........................baik.
• Pelaksanan kegiatan ....... baik.
• hasil kegiatan ................... baik.
• Diskusi ............................. baik.
• Tindak lanjut kegiatan ...... baik.

Sampai taraf ini., kita masih boleh menganggap bahwa masing-masing


mahasiswa tersebut dalam kelompok ini mendapat nilai yang sama untuk
setiap kegiatan yakni baik. Nilai ini adalah nilai kelompok dan akan kita
gunakan sebagai standar untuk langkah selanjutnya yakni untuk membedakan
nilai masing-masing mahasiswa.

b. Nilai Individu Dalam Kelompok


Misalkan jika kita akan menilai mahasiswa A dalam kelompoknya, untuk itu
kita perlu menjawab pertanyaan berikut : berapa baikkah (kualitatif, kuantitatif,
efisien dan lainnya) kontribusi A kepada kelompoknya selama berlangsungnya
kegiatan laboratorium (mulai dari persiapan sampai tindak lanjut kegiatan).
Pertanyaan ini hanya dapat kita jawab apabila sebelumnya telah tersedia
122
instrumen pengamatan yang telah diisi oleh dosen pada waktu para
mahasiswa melakukan kegiatan laboratorium(lihat uraian berikutnya).
Selanjutnya misalkan dari hasil pengamatan terhadap mahasiswa A diperoleh :
• Selama persiapan, pelaksanaan dan tindak lanjut kegiatan, mahasiswa A
kebanyakan pasif dan bersifat membiarkan teman-temanya melakukan
kegiatan.
• Selama diskusi banyak memberi kontribusi berupa ide baru dan jalan
keluar yang tepat terhadap masalah yang timbul.

Maka nilai mahasiswa A di dalam kelompoknya kira-kira :


• Persiapan .......................D.
• Pelaksanaan kegiatan ... D.
• Hasil kegiatan ................ C.
• Diskusi ........................... B.
• Tindak lanjut kegiatan ....D.

Nilai mahasiswa A di atas lebih adil, obyektif dan lebih dapat mencerminkan
performance A dalam melakukan kegiatan laboratorium. Dengan cara yang
sama dapat ditentukan nilai B,C dan D di dalam kelompoknya.

Pada umumnya evaluasi yang dilakukan dosen terhadap mahasiswa yang


melakukan kegiatan laboratorium ditekankan pada laporan /lembar kerja/
lembar jawaban tertulis yang disusun atau dibuat oleh mahasiswa setelah
mereka menyelesaikan kegiatan laboratorium.

Oleh karena itu maka sering kita menyamaratakan saja nilai mahasiswa yang
melakukan kegiatan laboratorium secara berkelompok. Hal ini karena mereka
itu bekerjasama menulis satu laporan yang akan diserahkan kepada dosen.

Padahal bilamana kita perhatikan dengan seksama, laporan itu sendiri


sebetulnya bukanlah satu-satunya sumber data untuk evaluasi. Walaupun kita
menyadari akan relevansinya laporan tersebut dengan evaluasi. Tetapi
sangatlah tidak adil kiranya bilamana hanyalah laporan saja yang digunakan
sebagai sumber untuk evaluasi, sebab masih ada sumber-sumber lain.

Untuk memberi nilai yang dirasakan adil dan mendekati kebenaran dalam kerja
laboratorium yang dilakukan secara kelompok telah disampaikan contoh dan
bagaimana menilainya. Namun jika contoh tersebut dikaitkan dengan
kenyataan dilapangan, kita akan menghadapi beberapa masalah.

123
Masalah yang sering timbul dimaksud antara lain :
a. Dosen belum menetapkan aspek-aspek kemampuan apa saja yang perlu
dinilai selama mahasiswa melakukan kegiatan laboratorium.
b. Dosen tidak punya cukup waktu untuk mengamati semua aspek
performance yang ditampilkan oleh satu kelas (20 s/d 30 Mhs) yang
melakukan kegiatan praktikum laboratorium selama 2 s/d 3 jam.
c. Dosen sering memberi penilaian berdasarkan atas ingatan atau dari
catatan-catatan yang secara insidentil dibuat oleh dosen.

Untuk menanggulangi permasalahan di atas dosen sebelum mengadakan


pengamatan, pertama-tama harus menetapkan terlebih dahulu aspek-aspek
kemampuan apa saja yang perlu dinilai selama para mahasiswa melakukan
kegiatan laboratorium.

Pengamatan dilakukan secara kontinu selama jangka waktu yang lebih


panjang, misalnya selama melakukan satu unit praktikum tertentu, satu bulan
atau satu semester, dan bukan selama tiap jam praktikum.

Adapun secara garis besarnya aspek-aspek kemampuan apa saja yang perlu
dinilai selama mahasiswa melakukan kegiatan laboratorium antara lain adalah :
a. Aspek Kognitif (pengetahuan) : yang termasuk kedalam aspek ini
misalnya : pemahaman konsep, menyimpulkan hasil.
b. Aspek Affektif (sikap) : yang termasuk aspek ini misalnya : disiplin kerja,
kreatifitas (berinisiatif), ketekunan, ketelitian, kejujuran, kerjasama,
kepemimpinan dan lain-lainnya.
c. Aspek Psikomotorik (keterampilan) : yang termasuk aspek ini misalnya
: ketrampilan menggunakan alat, ketelitian mengamati, mengukur dan lain
sebagainya.

Sudah barang tentu aspek-aspek yang dikemukakan di atas masih perlu


ditambah dan dikembangkan sesuai dengan kebutuhan serta macam kegiatan
yang dilakukan.

Selanjutnya jika aspek-aspek kemampuan yang akan diamati selama


mahasisa melakukan kegiatan laboratorium, maka langkah selanjutnya adalah
menyusun aspek-aspek tersebut dalam bentuk format instrumen yang teratur
sehingga mudah menggunakannya. Jumlah format dapat disusun satu sama
lain bervariasi dari segi teknis dan aspek kemampuan yang akan dinilai.
Bentuk instrumen itulah yang penulis maksud dengan lembar pengamatan
kegiatan laboratorium.

124
Dengan adanya lembar pengamtan yang telah siap untuk dipakai ini, maka
akan diharapkan penilaian yang diberikan guru/dosen terhadap
siswa/mahasiswa berdasarkan ingatan atau catatan yang secara insidentil
dibuat dosen dapat ditanggulangi. Untuk sekedar contoh disajikan Lembar
Pengamatan Kegiatan Laboratorium untuk dapat dipergunakan dan
dikembangkan lebih lanjut.

Contoh : Untuk dikembangkan

LEMBAR KERJA PENGAMATAN DALAM KERJA PRAKTIKUM


KETERAMPILAN

KEPEMIMPINAN

SISTEMETIKAN
KEBERSIHAN

HASIL KERJA
KERJASAMA

KEAKTIFAN

DISIPLIN

JUMLAH
KERJA
NAMA KETERANGAN

NO. ASPEK KRITERIA SKOR/NILAI


1 KETERAMPILAN - Mahasiswa dapat menggunakan alat
dengan baik.
- Hanya dapat menggunakan sebagian.
- Tidak dapat menggunakan alat.
2. KERJA SAMA - Terdapat kerjasama yang serasi antar
anggota.
- Kerjasama tak serasi.
- Tidak ada kerjasama antara anggota
kelompok.
3. AKTIFITAS - Aktif kerja dan menggunakan waktu
sesuai petunjuk.
- Keaktifan tidak terarah (main-main).
- Tak aktif dan menggunakan orang
lain.
4. DISIPLIN - Tidak melanggar tata tertib
laboratorium.
- Melanggar tata tertib, tetapi tidak
125
sampai mengganggu ketertiban
dilaboratorium.
- Melanggar tata terib sampai
mengganggu ketertiban laboratorium.
5. KEPEMIMPINAN - Mempunyai kreatifitas dan sifat
membimbing.
- Hanya mempunyai salah satu sikap
(kreatif/membimbing).
- Tidak kreatif, tidak mempunyai sifat
membimbing.
6. KEBERSIHAN - Hasil kerja bersih, alat sebelum kerja,
waktu kerja dan sesudah kerja bersih
(teliti).
- Kurang menjaga kebersihan.
- Kerjanya kotor, alat-alat waktu kerja
dan sesudah kerja kotor.
7. SISTEMATIKA - Belajar menurut petunjuk.
KERJA - Sebagian tidak menurut petunjuk.
- Bekerja seenaknya tanpa menuruti
petunjuk.
8 HASIL KERJA - Hasil kerja sesuai dengan tujuan dan
ketentuan.
- Hasil kerja tidak sempurna.
- Pekerjaan tidak berhasil atau gagal.

Keterangan :
1. Rentangan nilai yang digunakan adalah 1,2, dan 3.
2. Pengisian kolom-kolom nilai hanya dengan memakai angka 1,2,3 sesuai
dengan kriteria yang telah ditentukan.
3. Nilai akhir dari mahasiswa :

1+2+3+4+5+6+7+8
= NILAI AKHIR
8

4. Sesuai dengan kebutuhan, kolom aspek-aspek dapat ditambah atau dikurangi.

D. Beberapa Aspek Penilaian Dalam Kerja Praktikum.

Pada umumnya penilaian yang dilakukan dosen terhadap mahasiswa yang


melakukan kegiatan laboratorium ditekankan pada laporan/lembar kerja/lembar
jawaban tertulis yang disususn atau dibuat oleh mahasiswa setelah mereka
menyelesaikan kegiatan laboratorium. Oleh karena itu sering kita menyamaratakan

126
saja nilai mahasiswa yang melakukan kegiatan laboratorium secara berkelompok.
Hal ini karena mereka itu bekerjasama dalam menulis satu laporan yang akan
diserahkan kepada dosen.

Padahal bilamana kita perhatikan dengan seksama, laporan itu sendiri sebetulnya
bukanlah satu-satunya sumber data untuk penilaian. Walaupun kita menyadari akan
relevansinya laporan tersebut dengan penilaian, tetapi sangatlah tidak adil kiranya
bilamana hanyalah laporan saja yang digunakan sebagai sumber untuk penilaian.
Karena perlu dipertanyakan lebih lanjut apakah laporan tersebut mempunyai
muatan aspek-aspek kemampuan apa saja yang akan dinilai.

Jika kita telaah lebih detil penilaian terhadap kegiatan praktikum itu,tidak saja
diutamakan pada produk/hasil, tetapi juga pada prosesnya. Hal ini dikarenakan
kegiatan praktikum merupakan kegiatan yang menghubungkan aspek pengetahuan,
ketrampilan dan sikap. Penilaian aspek pengetahuan meliputi pemahaman konsep
yang terkait pada percobaan yang dilakukan. Sedangkan penilaian pada aspek
ketrampilan meliputi: ketrampilan dalam merangkai alat, ketrampilan kerja. Dan
ketelitian dalam memperoleh hasil. Sedangkan penilaian pada aspek sikap antara
lain mencakup tanggung jawab, kerapihan, dan kerja sama.

Sistem penilaian kegiatan praktikum meliputi beberapa aspek antara lain: menilai
kesiapan sebelum praktikum, proses di dalam praktikum, dan hasil dari praktikum.
Penilaian yang diberikan terhadap prestasi mahasiswa dapat digunakan sebagai
pedoman pemberian bimbingan yang tepat (penilaian formatif). Sebagai mana telah
dikemukakan pada uraian sebelumnya penilaian terhadap kegiatan praktikum, tidak
saja diutamakan pada produk, tetapi juga pada prosesnya. Hal ini disebabkan
kegiatan praktikum merupakan kegiatan yang menghubungkan aspek kognitif,
afektif, dan psikomotorik, maka penilaian yang harus dilakukan dapat meliputi ketiga
aspek tersebut.

Secara garis besar, kegiatan praktikum dapat dibagi menjadi tiga (3) tahap yaitu:
tahap kegiatan awal, tahap pelaksanan, dan tahap akhir kegiatan praktikum.
Masing-masing tahap kegiatan mempunyai karakteristik aspek kemampuan. Pada
tahap persiapan mencakup aspek kognitif dan afektif, tahap pelaksanaan mencakup
ketiga aspek kognitif, afektif, dan psikomotorik. Sedangkan pada tahap akhir
kegiatan praktikum mencakup aspek kognitif dan afektif.

Dalam melakukan penilaian, maka dapat dikembangkan format penilaian sesuai


dengan tahap praktikum dengan karakteristik kompetensi/ kemampuan pada setiap
tahap. Bentuk-bentuk penilaian yang diberikan dalam praktikum adalah :

127
1. Penilaian Tahap Awal Kegiatan Laboratorium
Penilaian pada tahap ini berhubungan dengan persiapan mahasiswa sebelum
melaksanakan praktikum, agar dapat mengikuti praktikum secara bermakna.
Aspek yang dinilai mencerminkan keadaan kognitif awal dari mahasiswa.
Menurut Bloom (1976), keadaan kognitif awal yaitu kondisi berupa
pengetahuan, ketrampilan, dan kompetensi yang dimilki seseorang diawal
proses belajarnya. Pengetahuan awal merupakan prasarat bagi mahasiswa
yang bersangkutan yang akan mengikuti proses belajar yang akan
dihadapinya. Jadi keadaan kognitif awal seorang mahasiswa yang akan
mengikuti kegiatan praktikum di laboratorium akan menentuan keberhasilannya
dalam mengikuti kegiatan praktikum.
Menurut Rusyam dkk (1989), pengetahuan awal mahasiswa terdiri dari tiga hal
yaitu:
a. Batas dan ruang lingkup pengetahuan yang dimiliki dan dikuasai
mahasiswa.
b. Tingkatan tahapan materi pengetahuan terutama kawasan pola
kemampuan (kognitif, afektif dan psikomotorik) yang telah dicapai dan
dikuasai oleh mahasiswa.
c. Kesiapan dan kematangan fungsi-fungsi psikofisik (proses kognitif)
mengamati, mengingat, berfikir efektif dan lain-lainnya.

Sesuai dengan dimensi kegiatan awal, maka penyusunan format penilaian


pada tahap persiapan, meliputi aspek kognitif dan afektif.

2. Penilaian tahap pelaksanaan kegiatan praktikum


Tahap pelaksanan kegiatan praktikum dapat dirinci dalam urutan kerja yaitu:
langkah persiapan, pelaksanaan, diskusi, dan pembuatan laporan sementara
(pengamatan). Dengan pengamatan langsung setiap langkah-langkah tersebut
yang dilakukan, mahasiswa-mahasiswa mendapat penilaian, baik dalam
kelompok maupun secara perseorangan’ Dalam pelaksanaan kegiatan
praktikum, dapat dilakukan penilaian terhadap kinerja mahasiswa. Penulaian
kinerja mahasiswa ini dapat dikembangkan untuk menguji kemampuan
mahasiswa dalam mempertunjukkan pengetahuan (learning to know) dan
ketrampilannya ( learning to do) pada berbagai situasi nyata dan konteks
tertentu. Penilaian ini sering kali menuntut mahasiswa bekerja sama dan
menerapkan ketrampilan dan pengetahuannya dalam menyelesaikan masalah
yang kompleks.

3. Penilaian tahap akhir kegiatan praktikum


Penilaian tahap akhir kegiatan praktikum ini, meliputi laporan yang disususn
mahasiswa setelah melaksanakan kegiatan praktikum. Penilaian laporan ini
harus meliputi aspek kognitif yang terkait dengan kualitas isi laporan, maupun

128
aspek afektif yang meliputi kerapihan dan sistematika penulisan laporan.Pada
umumnya laporan tersebut dibuat atau disusun dalam format tertentu
sebagaimana lazimnya tulisan ilmiah atau penelitian ilmiah.
Format laporan biasanya terdiri dari :
a. Obyek praktikum.
b. Tujuan praktikum.
c. Perumusan masalah
d. Hipotesis
e. Rancangan dan prosedur eksperimen
f. Data
g. Kesimpulan.

Selanjutnya setelah seluruh kegiatan praktikum selesai dilakukan, dosen


memberikan tes akhir yang dapat digunakan sebagai bahan untuk penilaian.
Tes akhir kegiatan laboratorium ini dapat berbentuk :
a. Ujian tertulis yang diadakan pada akhir semester meliputi tes teori
mengenai materi praktikum atau hal-hal yang berhubungan dengan
kegiatan praktikum.
b. Ujian praktik, misalnya meliputi pemeriksaan bahan, menentukan sesuatu
yang belum diketahui dan merancang prosedur eksperimental.

D. Instrumen Penilaian Kegiatan Praktikum

Untuk mengaplikasikan aspek-aspek yang harus dinilai dalam kegiatan praktikum


diperlukan instrumen penilaian yang dibuat oleh dosen/guru. Dimana instrumen
tersebut mencakup aspek-aspek kemampuan apa saja yang perlu dinilai, baik pada
tahap penilaian kegiatan awal praktikum, tahap penilaian pelaksanaan kegiatan
praktikum dan tahap penilaian kegiatan akhir praktikum.

Dalam penyusunan instrumen penilaian kegiatan praktikum, guru/dosen sebaiknya


memperhatikan beberapa faktor antara lain sebagai berikut :

a) Menetapkan kompetensi yang akan diukur pada aspek psikomotorik, karena


setiap praktikum kimia mempunyai karakteristik sendiri-sendiri.
b) Pengembangan format instrumen penilaian disesuaikan dengan karakteristik
praktikum yang dilaksanakan
c) Kegiatan penilaian praktikum kimia sebaiknya dilakukan secara terus menerus
oleh dosen atau asisten selama kegiatan praktikum berlangsung. Sehingga
kompetensi yang diharapkan dari hasil kegiatan praktikum dapat tercapai.

129
Untuk lebih jelasnya berikut ini akan diberikan beberapa contoh :

Contoh 1 :
Penilaian Praktikum Kimia Organik.

Judul Praktikum : Destilasi


Semester :
Jumlah SKS :

I. Tujuan Pembelajaran :
Mahasiswa dapat melakukan destilasi

II. Kompetensi :
a. Mahasiswa dapat merangkai alat destilasi secara benar
b. Mahasiswa dapat menggunakan alat destilasi untuk memisahkan
campuran dan pemurnian.
c. Mahasiswa dapat membedakan karakteristik metode destilasi.

III. Kegiatan yang harus dilaksanakan mahasiswa


a. Mahasiswa mempersiapkan campuran yang akan didestilasi
b. Mahasiswa merangkai alat destilasi.
c. Mahasiswa menggunakan alat destilasi
d. Mahasiswa menuliskan data pengamatan yang diperoleh

IV. Aspek kegiatan yang dinilai


a. Tahap Penilaian kegiatan awal praktikum
b. Tahap Penilaian pelaksanaan kegiatan praktikum
c. Tahap penilaian tahap alkhir

V. Teknik Penilaian
Penilaian dilakukan dengan alat bantu berupa lembar pengamatan penilaian.
Dosen/asisten memberikan tanda cek (V) pada kolom yang tersedia.

VI. Kriteria Penilaian


Penilaian dilakukan dengan menggunakan tiga katagori, yaitu: Baik, Cukup,dan
Kurang. Katagori tersebut dimasukkan ke dalam skala penilaian Baik (80-100),
Cukup (79-60) dan Kurang (<60)
Keterangan pengisian sksla penilaian adalah sebagai berikut :
a. Jika melakukan kegiatan sesuai dengan pilihan a, maka mendapat nilai
baik
b. Jika melakukan kegiatan sesuai dengan pilihan b, maka mendapat nilai
cukup

130
c. Jika melakukan kegiatan sesuai dengan pilihan c, maka mendapat nilai
kurang.

Aspek yang dinilai dalam kegiatan ini dan data pengamatan diperoleh melalui :

1. Tahap penilaian kegiatan awal praktikum


a. Aspek Kognitif :
1) Pre Test
2) Jurnal persiapan awal
b. Aspek Afektif :
1) Disiplin
2) Tanggung jawab

2. Tahap penilaian pelaksanaan kegiatan praktikum

a. Aspek Kognitif
1) Pemahaman kerja
2) Sistematika kerja

b. Aspek Psikomotorik
1) Ketrampilan dasar
2) Merangkai alat’
3) Menggunakan alat

c. Aspek Afektif
1) Disiplin
2) Kritis
3) Kerja sama

3. Tahap Penilaian Kegiatan akhir praktikum


a. Aspek Kognitif
1) Tujuan pembelajaran
2) Prosedur kerja
3) Data pengamatan
4) Kesimpulan
5) Daftar Pustaka

b. Aspek Afektif
1) Sistematika laporan
2) Kerapihan

131
Lembar Pengamatan :

Contoh 2.
Penilaian Praktikum Kimia Organik.

Judul Praktikum : Pemurnian Senyawa Organik Berwujud Kristal


Semester :
Jumlah SKS :

I. Tujuan Pembelajaran :
Mahasiswa dapat melakukan pemurnian

II. Kompetensi :
a. Mahasiswa melaksanakan langkah-langkah pemurnian dengan benar
b. Mahasiswa dapat memilih pelarut secara tepat untuk proses kristalisasi.
c. Mahasiswa dapat melakukan pemurnian senyawa organik yang berbentuk
kristal.
d. Mahasiswa dapat melakukan uji kemurnian dengan menggunakan alat
penentuan titik leleh suatu senyawa (elektrothermal)

III. Kegiatan yang harus dilaksanakan mahasiswa


a. Mahasiswa mempersiapkan contoh yang akan dimurnikan
b. Mahasiswa menentukan pelarut.
c. Mahasiswa melakukan pemurnian
d. Mahasiswa menuliskan data pengamatan yang diperoleh

IV. Aspek kegiatan yang dinilai


a. Tahap Penilaian kegiatan awal praktikum
b. Tahap Penilaian pelaksanaan kegiatan praktikum
c. Tahap penilaian tahap alkhir

V. Teknik Penilaian
Penilaian dilakukan dengan alat bantu berupa lembar pengamatan penilaian.
Dosen/asisten memberikan tanda cek (V) pada kolom yang tersedia.

VI. Kriteria Penilaian


Penilaian dilakukan dengan menggunakan tiga katagori, yaitu: Baik, Cukup,dan
Kurang. Katagori tersebut dimasukkan ke dalam skala penilaian Baik (80-100),
Cukup (79-60) dan Kurang (<60)

132
Keterangan pengisian skala penilaian adalah sebagai berikut :
a. Jika melakukan kegiatan sesuai dengan pilihan a, maka mendapat nilai
baik
b. Jika melakukan kegiatan sesuai dengan pilihan b, maka mendapat nilai
cukup
c. Jika melakukan kegiatan sesuai dengan pilihan c, maka mendapat nilai
kurang.

Aspek yang dinilai dalam kegiatan ini dan data pengamatan diperoleh melalui :

1. Tahap penilaian awal kegiatan praktikum


a. Aspek Kognitif :
1) Pre Test
2) Jurnal persiapan awal
b. Aspek Afektif :
1) Disiplin
2) Tanggung jawab

2. Tahap penilaian pelaksanaan kegiatan praktikum


a. Aspek Kognitif
1) Pemahaman kerja
2) Sistematika kerja
b. Aspek Psikomotorik
1) Ketrampilan dasar
2) Merangkai alat’
3) Menggunakan alat
c. Aspek Afektif
1) Disiplin
2) Kritis
3) Kerja sama

3 Tahap Penilaian Kegiatan akhir praktikum


a. Aspek Kognitif
1) Tujuan pembelajaran
2) Prosedur kerja
3) Data pengamatan
4) Kesimpulan
5) Daftar Pustaka
b. Aspek Afektif
1) Sistematika laporan
2) Ketrampilan

133
BAB V
PENILAIAN KETRAMPILAN PROSES

A. Pengertian

Dalam kegiatan pembelajaran selalu melibatkan guru disatu pihak dan peserta didik
dilain pihak. Sebagai seorang guru yang profesional, akan berusaha agar dalam
proses pembelajaran, siswanya mengalami proses belajar yang bermakna. Belajar
bermakna dapat tercapai jika dalam proses pembelajaran guru dapat
mengondisikan dan menyiapkan situasi yang menggiring peserta didik untuk
bertanya, mengamati, mengadakan eksperimen, dan menemukan fakta serta
konsep sendiri. Untuk mencapai hal tersebut, guru dituntut melaksanakan kegiatan
belajar mengajar dengan mengembangkan kemampuan-kemampuan atau
ketrampilan-ketrampilan dasar yang dimiliki anak-anak dididiknya. Belajar dengan
ketrampilan proses akan memberi peluang peserta didik untuk mengembangkan
ketrampilan-ketrampilan dasar yang dimiliki sekaligus mengembangkan sikap
ilmiah, dan sikap kritis.

Setiap manusia secara normal mengalami tumbuh kembang dari balita, kanak-
kanak, lalu remaja, pemuda dan menjadi manusia dewasa yang mandiri. Sebagai
manusia yang beragama, kita meyakini, ia dapat berkembang dari bayi hingga
dewasa yang mandiri karena dalam dirinya memiliki kemampuan-kamampuan,
ketrampilan-ketrampilan dan potensi-potensi yang sangat unik, dinamis dan tak
terbandingkan. Kemampuan/potensi yang dimiliki tersebut bukan berasal dari
ayahnya ataupun ibunya yang melahirkan akan tetapi anugerah dari Sang Pencipta
Tuhan Yang Maha Esa dan Maha Kuasa. Selanjutnya muncul pertanyaan yang
sangat mendasar, untuk apa kemampuan-kemampuan itu diberikan kepada
manusia? Jawabannya adalah ”kemampuan-kemampuan itu diberikan untuk
diaktualisasikan, dinyatakan, diberdayakan, dimerdekakan, dijadikan aktual,
dikembangkan, diasah terus menerus dan pada gilirannya kelak ia harus
mempertanggung jawabkan kepada Sang Pemberi”.

Berdasarkan keyakinan di atas dalam proses pembelajaran khususnya pendidikan


formal di sekolah para guru harus memberi kesempatan kepada anak didik untuk
menumbuhkan potensi, dan mengembangkan kemampuan-kemampuan yang
dimiliki anak didiknya. Para guru dapat menumbuh kembangkan ketrampilan-
ketrampilan itu dalam diri anak sesuai dengan taraf perkembangan pikirannya.

Dengan mengembangkan ketrampilan-ketrampilan memproseskan perolehan, anak


akan mampu menemukan dan mengembangkan sendiri fakta dan konsep serta
menumbuhkan dan mengembangkan sikap dan nilai yang dituntut. Dengan

134
demikian, ketrampilan-ketrampilan itu menjadi roda penggerak penemuan dan
pengembangan fakta dan konsep serta penumbuhan dan pengembangan sikap dan
nilai. Seluruh irama gerak atau tindakan dalam proses belajar mengajar seperti ini
akan menciptakan kondisi cara belajar siswa aktif.(Cony dkk. 1985) Inilah
sebenarnya yang dimaksudkan dengan pendekatan proses.

B. Pendekatan Ketrampilan Proses Dalam Pembelajaran Kimia.

Dengan semakin berkembangnya Ilmu pengetahuan dan teknologi, serta semakin


ketatnya persaingan dalam era globalisasi, mau tidak mau pendidikan yang
menempati tempat strategis harus dapat mencetak sumber daya manusia yang
mampu bersaing di lingkup nasional dan di dunia international. Dibidang IPA
tantangan tersebut memunculkan pertanyaan-pertanyaan, dan pertanyaan yang
paling mendasar antara lain adalah, mengapa kita mempelajari IPA dan bagaimana
sebaiknya pembelajaran IPA dilaksanakan.

Ada dua alasan mengapa kita mempelajari IPA. Pertama nilai intrinsik , yaitu yang
menenkankan IPA sebagai suatu kegiatan pendidikan, kedua nilai ekstrinsik yang
menekankan pemanfaatan IPA untuk IPA sendiri dan memenuhi kebutuhan
masyarakat. Jadi pengajaran IPA untuk teknologi, untuk perkembangan ekonomi
dan untuk memenuhi tuntutan pekerja-pekerja IPA, riset dan industri.

Bagaimana sebaiknya pembelajaran IPA dilaksanakan, mengajarkan IPA yang baik


tidak dapat terlepas dari karakteritik IPA itu sendiri, yaitu IPA adalah Ilmu yang lahir
dan berkembang dari observasi dan eksperimentasi. Dengan kata lain siswa harus
menghayati metode IPA dan mempraktekkannya dalam waktu belajar IPA. Inilah
yang menjadi tugas guru IPA, singkatnya dalam proses pembelajaran IPA guru
harus mengajar siswa berobservasi dan bereksperimentasi.

Kegiatan pembelajaran kimia sebagai bagian dari IPA, sudah barang tentu harus
mengacu pada kegiatan observasi dan eksperimentasi, kegiatan pembelajaran
yang demikian itu menuntut siswa belajar aktif. Melalui pendekatan ketrampilan
proses menuntut siswa harus aktif dalam proses pembelajaran kimia. Hal ini sangat
mungkin karena dalam kegiatan eksperimentasi siswa dilatih observasi,
mengumpulkan data, dan mengorganisasi data, mengumpulkan data (inference),
menyususn hipotesis, merancang eksperimen, menganalisa data, mengevaluasi
data dan menarik kesimpulan. Sedangkan dalam kegiatan observasi siswa dituntut
untuk terampil dngan menggunakan tangan dan seluruh indera dalam
memanipulasi (terampil menggunakan) alat-alat dan memperoleh data. Siswa
harus dapat membedakan mana fakta dan mana pendapat (opini), agar dalam
mengambil kesimpulan tidak keliru/salah.

135
Untuk dapat membedakan mana fakta dan mana opini berikut ini akan diberi
beberapa contoh :

C. Mengorganisasi data.

Pengamatan terhadap suatu obyek tertentu, akan diperoleh kesan-kesan/persepsi


dan pengukuran tentang obyek yang sedang diamati. Kesan-kesan dan pengukuran
dimaksud harus diorganisasikan dalam suatu catatan yang teratur, Catatan-catatan
tersebut lazim disebut data. Dalam data tersebut umumnya dibedakan data kualitatif
dan data kuantitatif.
Agar siswa dapat membedakan mana data kualitatif dan kuantitatif berikut ini
diberikan beberapa contoh :

D. Berhipotesis.

Hipotesis adalah dugaan sementara yang digunakan atau dipakai sebagai pedoman
untuk memulai eksperimen yang kebenarannya masih akan diuji atau dibuktikan,
demikianlah kira-kira definisi dari hipotesa. Perlu untuk dipahami oleh guru,siswa
tidak hanya mengetahui apa itu hipotesis, tetapi yang lebih penting adalah siswa
dapat membuat hipotesis. Dalam hal ini yang penting bagi guru adalah menuntut
siswa dengan mengajukan pertanyaan-pertanyaan yang terkait dengan data yang
telah dikumpulkan dari observasi, mendiskusikan masalah yang muncul dari
observasi tersebut, selanjutnya meminta siswa mengajukan pendapatnya yang
diduga benar, dan yang sama-sama akan diuji kebenarannya.

136
DAFTAR PUSTAKA

Arikunto, Suharsini., Dasar-Dasar Evaluasi Pendidikan, Jakarta : Bumi Aksara,


1992.
Bloom. B.S., Human Characteristik and School Learning, New York, MC. Graw Hill
Book Company, 1976.
Cingel N.A.V.D., 1980, Evaluasi Ketrampilan Kognitif Melalui Kegiatan
Laboratorium, Jakarta, P3G.
Popham, James W., Educational Evaluation, New Jersey: Prentice Hall. Inc., 1975.
Purwanto, Ngalim., Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, Bandung: PT.
Remaja Rosdakarya, 1984.
Rusvan, Dkk., Pendekatan Dalam Proses Belajar Mengajar, Bandung : Penerbit CV.
Remaja Karya, 1989.
Sastra Wijaya, Tresna, Proses Belajar Mengajar, Jakarta: Depdikbud. 1980.
Sudjana, Nana, Penilaian Hasil Proses Belajar Mengajar, Bandung : PT. Remaja
Rosdakarya, 1990,
Sudijono, Anas., Pengantar Evaluasi Pendidikan, Jakarta : Rajawali Pers., 1995.
Tobing. R.L., Clara, Menilai Kegiatan Laboratorium , Jakarta : Depdikbud, 1983
Utoma.T., Ruijter.K., Peningkatan dan Pengembangan Pendidikan, Jakarta :
Gramedia, 1985.

137

Anda mungkin juga menyukai