Nurbaity
Achmad Ridwan
Yuli Rahmawati
2017
DAFTAR ISI
2
KATA PENGANTAR
3
BAB I
PENDAHULUAN
A. Pembelajaran Kimia.
Ilmu kimia adalah ilmu yang mempelajari materi, meliputi susunan, sifat-sifat dan
perubahannya, serta perubahan energi yang menyertai perubahan materi tersebut
(Chang, 2003). Kimia sebagai disiplin ilmu memiliki banyak konsep dan topik yang
bersifat abstrak sehingga umumnya siswa kesulitan dalam menghubungkan ilmu
kimia yang abstrak dengan keadaan konkrit yang riil. Konteks dalam pembelajaran
kimia cenderung kompleks, rumit, dan lebih banyak melibatkan keterkaitan
antarkonsep sehingga siswa cenderung membuat konsep yang lebih sederhana
agar mereka mudah memahaminya (Treagust, 2000).
Jika dikaji dalam sudut padang karakteristik ilmu kimia tersebut, maka menurut
American Society Chemistry (2012), terdapat empat big ideas yang harus terdapat
dalam pembelajaran kimia yang direpresentasikan pada tabel di bawah ini.
4
Selanjutnya jika dimapping maka sebaran konsep-konsep penting dalam
pembelajaran kimia dapat diuraikan sebagai berikut:
Senyawa
Ikatan
Organik Stoikiometri Energi-
Kimia
Termokimia
Reaksi
STRUKTUR Kimia
MATERI MATERI
Redoks &
PERUBAHAN Elektrokimia
KARAKTERISTIK MATERI
MATERI
Periodik Tabel
Klasifikasi Laju Termodinamika
Materi Reaksi
Larutan Atom-Struktur
Asam Gas Atom Kesetimbangan
Basa Kimia
Elektrolit
-non
elektrolit
Ilmu kimia dianggap sulit bagi sebagian siswa. Kesulitan mempelajari kimia
disebabkan oleh kompeksnya perhitungan yang terlibat, bahasa yang jarang
digunakan dalam kehidupan sehari-hari, serta perbedaan level-level representasi
yang digunakan para ahli kimia dalam menjelaskan fenomena kimia (Gabel &
Bunce 1994 dalam Sheppard 2006). Fenomena kimia digambarkan dan dijelaskan
oleh para ahli kimia menggunakan level-level representasi yang meliputi
representasi makroskopik, mikroskopik, dan simbolik. Pada level Makroskopis,
penjelasan difokuskan pada kareakteristik kimia yang dapat diamati. Hal ini dapat
dilakukan ketika peserta didik mengamati fenomena nyata di laboratorium atau di
kehidupan sehari-hari. Pada level makroskopis meliputi perubahan warna,
5
temperatur, pH larutan, pembentukan gas, atau pembentukan endapan yang dapat
diamati selama reaksi kimia berlangsung. Contohnya, level makroskopis dari air
meliputi deskripsi fisik air pada berbagai temparatur. Pada level partikulat/ sub-
mikroskopis kimia diwakili dalam hal atom, molekul, dan ion pembentuknya
menggunakan gambar atau model molekul. Contohnya, pada level partikulat dari
air, Gabel, 2003 dalam Nyachwaya et al., 2010 menggambarkan sebagai kumpulan
molekul yang memiliki gaya tarik menarik dan terdiri dari partikel atom hidrogen dan
oksigen. Level simbolis digunakan untuk menjelaskan fenomena kimia makroskopis
secara simbolis. Pada level ini, sifat fisik dan perubahan kimia diwakili bahasa
simbol sehingga digunakan simbol-simbol kimia, mekanisme reaksi, analogi, grafik,
rumus kimia, dan persamaan matematis. Contohnya, level simbolis untuk air
menggunakan formula H2O.
Selain itu, Devetak dan Glažar (2001) menjelaskan ketergantungan ketiga level di
atas yang dihubungkan dengan pengetahuan konkrit dan abstrak.
Level
Makroskopis Visualisasi
Realitas
Sub
makroskopis Symbol
Level Penggambaran
level
realitas
Gambar 4. Keterkaitan antara tiga level representasi dalam kimia
6
Penggunaan ketiga level representasi dalam pembelajaran kimia memungkinkan
peserta didik lebih mudah mentrasfer pengetahuan yang sangat dipengaruhi oleh
gaya berpikirinya. Sehingga peserta didik dapat menjelaskan hal-hal umum dengan
baik dan hal ini dapat mengurangi miskonsepsi. Johnstone, 1991 menyebutkan
bahwa peserta didik tidak hanya harus mampu memahami ketiga level representasi,
namun juga perlu kemampuan menterjemahkan dan menghubungkan tiap tingkatan
dengan baik. Menurut penelitian (Treagust et al.,2003 dalam Nyachwaya et al.,
2010) tiga level representasi kimia menjadi bagian yang terintegrasi dan tidak
terpisahkan pada pemahaman konsep kimia. Selain itu, sangat penting untuk
memahami ketiga level representasi menjadi satu bagian utuh. Hal ini karena,
ketiganya menggambarkan dan menjelaskan fenomena yang saling berkaitan dan
dapat juga memudahkan pemahaman peserta didik.
Pembelajaran kimia selain fokus pada konsep materi itu sendiri juga harus dapat
memgembangkan keterampilan peserta didik dalam memahami aplikasi ilmu kimia
tersebut. Pembelajaran kimia harus dapat mengembangan pemahaman dan
perkembangan dalam bidang teknik, kedokteran, dan teknologi. Selanjutnya isu-isu
dan permasalahan yang berkaitan dengan inovasi dalam kimia, harus dapat
mengembangan pemahaman mengenai hubungan antara sains, teknologi, social
dan lingkungan. Pada akhirnya pembelajaran kimia harus dapat menciptakan
pembelajaran yang menarik dan relevan, sehingga pembelajaran kimia harus dapat
dikaitkan dengan kehidupan sehari-hari. Peserta didik diharapkan untuk
mengaplikasikan ilmu kimia yang mereka peroleh dalam aplikasinya dengan bidang
ilmu yang lain. Jika dilihat maka pembelajaran kimia, harus dapat membantu
peserta didik dalam:
a) Mengembangkan minat dan rasa ingin tahu terhadap kimia
b) Mengkonstruksi dan mengaplikasikan ilmu kimia dalam berbagai berbagai
bidang
c) Mengembangkan keterampilan scientific inquiry
d) Mengembangkan keterampilan berpikir saintifik, kritis, kreatif dan keterampilan
menyelesaikan masalah secara individu dan kolaboratif dalam hal yang terkait
dengan kimia
e) Mendiskusikan isu-isu terkait sains dengan menggunakan bahasa kimia
f) Memutuskan dan menilai isu-isu yang terkait dengan kimia
g) Berpikir terbuka, objektif, dan pro aktif
h) Memahami dan mengevaluasi implikasi kimia dalam aspek sosial, etika,
ekonomi, lingkungan, dan teknologi sebagai warga negara yang bertanggung
jawab.
Bertolak pada ciri khas dimaksud di atas, perlu diketahui apakah yang dimaksud
dengan observasi ( pengamatan) dan eksperimen. Observasi adalah kegiatan
menggunakan alat indera untuk memperoleh kesan atau persepsi tentang suatu
obyek yang akan diamati. Sedangkan eksperimentasi merupakan suatu kegiatan
ilmiah untuk menemukan hukum-hukum, konsep-konsep baru dalam ilmu
pengetahuan. Jadi hakekat belajar kimia adalah kimia sebagai hasil dan proses, di
mana keduanya saling terkait, sebab hasil merupakan akibat dari proses yang
dilakukan.
Oleh karena itu dalam proses pembelajaran kimia, guru hendaknya melaksanakan
kegiatan belajar mengajar dengan mengembangkan ketrampilan-ketrampilan dasar
yang dimiliki anak didiknya. Belajar dengan keterampilan proses memungkinkan
siswa mempelajari fakta, konsep yang menjadi tujuan belajar kimia, sikap Ilmiah,
dan sikap kritis.
Dewasa ini para guru masih ada yang melakukan proses pembelajaran IPA hanya
memberikan fakta dan konsep-konsep, dengan demikian guru bertindak sebagai
satu-satunya sumber informasi dengan menggunakan metode ceramah. Akibatnya
para siswa memiliki banyak pengetahuan tetapi tidak dilatih untuk menemukan
pengetahuan, tidak dilatih untuk menemukan konsep dan tidak dilatih untuk
mengembangkan ilmu pengetahuan. Latihan soal dan praktikum hanya
memantapkan pengetahuan fakta dan konsep dengan jalan pengulangan dan
penerapan sederhana. Test sebagai alat penilaian hanya dilakukan untuk
mengetahui apakah konsep dan fakta-fakta itu diketahui dan dipahami, dimana hasil
belajar yang diperoleh siswa setelah mengalami pengalaman belajar kimia
cenderung berupa ingatan dan hafalan-hafalan.
8
Memperhatikan ciri-ciri yang dikemukakan di atas, salah satu cara pembelajaran
kimia adalah memberikan peluang kepada siswa untuk mengadakan kontak dengan
benda-benda, kejadian-kejadian atau proses-proses yang terjadi di alam sekitarnya.
Dengan adanya kontak langsung antara siswa dengan hal-hal tersebut tadi akan
menumbuhkan aktifitas dengan dilakukannya observasi, eksperimen, dan
manipulasi benda-benda atau suatu obyek tertentu. Dengan adanya kontak itu akan
muncul rasa ingin tahu dan tidak dapat dihindari munculnya berbagai pertanyaan
serta usaha-usaha untuk memberi jawaban atas pertanyaan-pertanyaan yang
timbul karena rasa keingin tahuannya. Untuk memuaskan rasa keingintahuannya
maka sudak dapat dipastikan timbul masalah-masalah yang dihadapi, sekaligus
usaha-usaha pemecahan berbagai masalah yang timbul tadi dan tidak menutup
kemungkinan timbulnja masalah baru. Kondisi pembelajaran yang demikian,
wawasan siswa terus berkembang sehingga rasa ingin tahunya pun berkembang
pula. Pembelajaran kimia yang demikian, diperlukan suatu pendekatan yang dapat
menumbuhkan, mengembangkan sampai siswa menguasai sejumlah kemampuan-
kemapuan atau keterampilan fisik dan mental untuk mengamati, menyelidiki dan
mempelajari lingkungan alam yang ada disekitarnya. Pendekatan inilah yang
dikenal dengan pendekatan ketrampilan proses.
Lebih lanjut Herbet Vonsen (1986) mengemukakan bahwa ilmu kimia sebagai
bagian dari ilmu pengetahuan alam, maka didalam pembelajarannya harus ada
aktifitas yang menunjukkan siswa terlibat dalam proses , seperti observasi,
eksperimen atau pengambilan kesimpulan. Tugas mendidik yang diberikan kepada
ilmu kimia ditentukan pada metode dan cara berfikir secara ilmiah yang ditunjukkan
pada contoh kimia. Pada pembelajaran kimia tidak selalu diharuskan
menyampaikan konsep, teori, dan hukum, yang sudah ada (sudah ditemukan
sebelumnya). Selain itu Conny S (1985) mengemukakan bahwa tugas guru
bukanlah memberikan pengetahuan, melainkan menyiapkan situasi yang mnggiring
anak untuk bertanya, mengamati, mengadakan eksperimen, serta menemukan
fakta dan konsep sendiri .
Apabila kita perhatikan pendapat para ahli tersebut, maka seorang guru kimia harus
dapat menyiapkan situasi/kondisi dalam proses pembelajaran yang dapat
menggiring siswa dalam mengembangkan kemampuan-kemampuan yang
mendasar melalui pengalaman belajar sebagaimana para ilmuwan bekerja.
Sehingga diperoleh hasil belajar siswa yang berupa kemampuan kognitif, afektif dan
psikomotorik.
9
B. Evaluasi dalam Pembelajaran Kimia.
Mencermati uraian di atas seorang guru kimia dalam kegiatan pembelajaran kimia
haruslah memahami tiga aspek yang mendasar yaitu :
1. Metode Ilmiah
2. Aplikasi metode Ilmiah dalam pembelajaran kimia
3. Bagaimana menilai hasil belajar kimia.
Kita harus dapat membedakan antara metode ilmiah dengan metode mengajar
kimia. Seorang guru kimia harus memahami metode ilmiah sebelum ia dapat
mengajar kimia dengan baik. Karena mengajar kimia itu tidak hanya memberikan
informasi ilmiah atau pengetahuan tentang kimia kepada siswa, tetapi juga harus
melatih siswa bekerja sebagaimana para ilmuwan bekerja.
Sebagaimana diketahui bahwa hasil belajar sangat berkaitan erat dengan proses
pembelajaran, pembelajaran kimia tidak hanya disampaikan dalam bentuk teori,
namun disampaikan dalam bentuk praktikum di laboratorium. Pengalaman belajar
yang diperoleh akan berdampak pada perkembangan potensi kemampuan
intelektual saja, tetapi ketrampilan dan sikap. Lebih lanjut, Benyamin dan Bloom
dalam ”Taxonomi of Educational Obyectives ” mengatakan bahwa perubahan-
perubahan yang diharapkan dari pengalaman belajarnya :
1. Perubahan dalam kemampuan inteleknya ( Cognitive Domain)
2. Perubahan dalam sikapnya (Affective Domain
3. Perubahan dalam ketrampilan (Psyhomotor Domain).
10
BAB II
TINJAUAN UMUM PENILAIAN PEMBELAJARAN
A. Pengertian Penilaian
Tanpa kita sadari bahwa setiap saat kita selalu melakukan pekerjaan penilaian,
pekerjaan ini dimaksudkan untuk menjawab apakah pekerjaan yang kita lakukan
mencapai hasil atau tidak. Dalam kegiatan pembelajaran penilaian ini sering muncul
istilah yang cukup membingungkan yaitu pengukuran,penilaian, dan evaluasi.
Sebagian orang lebih cenderung mengartikan penilaian berbeda dengan evaluasi,
dan sebagian lainnya cenderung berpendapat bahwa penilaian itu sama dengan
evaluasi, yang merupakan terjemahan dari bahasa inggris evaluation.
Menurut Anwar (2002) penilaian dalam pendidikan pada prinsipnya adalah usaha
memperoleh data atau informasi untuk menetapkan suatu keputusan apakah
mahasiswa dianggap telah mencapai hasil sesuai yang diharapkan. Selanjutnya
Nitko(1996) mengemukakan penilaian adalah proses mendapatkan informasi yang
digunakan untuk mengambil suatu keputusan tentang mahasiswa, kurikulum,
program dan kebijakan pendidikan. Dari hasil penilaian yg dilakukan, akan diproleh
informasi sejauh mana efektifitas dan efesiensi dalam pencapaian tujuan
pembelajaran. Oleh karena itu penilaian hasil belajar siswa yang mencakup
perubahan tingkah laku pada aspek kognitif, afektif dan psikomotorik dengan proses
12
pembelajaran saling berkaitan satu sama lain sebab hasil merupakan akibat dari
proses pembelajaran yang dilakukan.
Penilaian (Sumarna S. 2004) merupakan salah satu kegiatan yang dilakukan untuk
mengukur dan menilai tingkat pencapaian kurikulum. Penilaian juga digunakan
untuk mengetahui kekuatan dan kelemahan yang ada dalam proses pembelajaran,
sehingga dapat dijadikan dasar untuk pengambilan dasar keputusan, misalnya
apakah proses pembelajaran sudah baik,dan dapat dilanjutkan atau masih perlu
perbaikan dan penyempurnaan. Oleh karena itu guru harus dapat menguasai materi
yang terdapat dalam kurikulum, metode pembelajaran dan menguasai berbagai
aspek dalam penilaian.
Dari contoh di atas, untuk mengadakan penilaian yang sistematis, kita harus
mengadakan langkah yang mendahuluinya yaitu pengukuran atau measurement.
Dengan demikian penilaian itu adalah tindakan/kegiatan menilai tetapi dilakukan
dengan mengukur terlebih dahulu dengan ukuran yang bersifat kuantitatif untuk
selanjutnya diinterpretasi. Jadi ada tiga istilah yang terkait dengan konsep penilaian
yang sering digunakan untuk mengetahui keberhasilan belajar peserta didik, yaitu
pengukuran yang bersifat kuantitatif, penilaian yang bersifat kualitatif,dan evaluasi
sehingga diperoleh informasi untuk membuat keputusan.
13
Tujuan Pembelajaran
(a) (b)
Dari gambar di atas, kegiatan penilaian dinyatakan oleh garis (c) yakni suatu
tindakan atau kegiatan untuk melihat sejauh mana tujuan-tujuan pembelajaran telah
dapat dicapai oleh siswa dalam bentuk hasil belajar yang diperlihatkannya setelah
siswa melalui pengalaman belajarnya (menempuh proses pembelajaran)
Sedangkan garis (b) merupakan kegiatan penilaian untuk mengetahui seberapa
efektif dan produktifnya proses pembelajaran dalam mencapaian tujuan
pembelajaran dalam bentuk hasil belajar. Sedangkan garis (a) yaitu suatu kegiatan
penilaian untuk mengetahui sejauh mana pencapaian tujuan pembelajaran.
Jika kita perhatikan dari garis a, b dan c tersebut di atas, ruang lingkup sasaran
penilaian pendidikan itu mencakup tiga sasaran pokok yaitu :
a. Penilaian program pengajaran, yaitu penilaian terhadap program pengajaran
yang meliputi tiga hal, yaitu penilaian terhadap tujuan pengajaran, penilaian
terhadap isi program pengajaran, dan penilaian terhadap strategi belajar dan
mengajar.
b. Sebagai feed-back atau umpan balik bagi perbaikan proses pembelajaran.
Kemungkinan perbaikan dapat dilakukan pada tujuan pembelajaran, kegiatan
belajar siswa, pembelajaran keterampilan proses, strategi mengajar guru,
sarana dan lain sebagainya.
c. Sebagai dasar untuk membuat laporan tentang kemajuan siswa kepada
orang tua atau kepada siswa itu sendiri. Dalam laporan tersebut disajikan
kemampuan dan kecakapan belajar siswa dalam berbagai bidang studi dalam
bentuk nilai-nilai prestasi yang dicapai oleh siswa.
14
dapat diketahui pula posisi kemampuan siswa dibandingkan dengan siswa
lainnya.
b. Untuk mengetahui keberhasilan proses pendidikan dan pembelajaran di
sekolah yakni seberapa keefektifan dan produktifnya kegiatan belajar siswa,
strategi mengajar, tujuan pembelajaran dan lain-lainnya.
c. Menindak lanjuti hasil penelitian, yaitu melakukan perbaikan dan
penyempurnaan dalam hal program pendidikan dan pengajaran serta strategi
pelaksanaannya. Perlu untuk diperhatikan, kegagalan siswa dalam hasil
belajar yang diperolehnya, hendaknya kegagalan itu tidak dipandang sebagai
kekurangan pada diri siswa semata-mata, tetapi harus dilihat pula dari
kekurangan-kekurangan pada program pengajaran yang diberikan. Bisa jadi
kesalahan terletak pada strategi dalam melaksanakan program, tidak tepatnya
metode mengajar yang dipergunakan dan alat bantu pengajaran yang dipakai
kurang tepat misalnya.
d. Memberikan pertanggungjawaban dari pihak sekolah sebagai penyelenggara
pendidikan, kepada pihak-pihak yang berkepentingan yaitu pemerintah dalam
hal ini adalah Depdiknas dan kepada masyarakat serta kepada orang tua
siswa. Lazimnya pertanggungjawaban kepada masyarakat dan orang tua
disampaikan melalui laporan kemajuan siswa yaitu dalam bentuk rapor pada
setiap akhir program, semester dan catur wulan.
Dari penjelasan di atas terdapat mata rantai yang tidak terpisahkan antara program
pengajaran, proses pembelajaran dan hasil belajar. Oleh karena itu untuk
melakukan penilaian yang sistematis harus bertumpu pada tiga unsur tersebut yang
saling berkaitan. Hasil belajar siswa yang tidak sesuai dengan harapan misalnya,
hal ini bisa terjadi bukan karena kesalahan siswa. Akan tetapi karena guru tidak
dapat melaksanakan proses pembelajaran yang menjadikan siswa belajar, atau
bisa jadi program pengajarannya yang harus ditinjau kembali. Untuk uraian
selanjutnya akan dibatasi hanya pada penilaian hasil belajar dan proses
pembelajaran.
15
b. Penilaian sumatif, adalah penilaian yang dilaksanakan pada akhir unit
program, yaitu akhir catur wulan, akhir semester, dan akhir tahun. Penilaian ini
berorientasi kepada produk bukan kepada hasil. Oleh karena itu tujuan
penilaian ini adalah untuk melihat hasil yang dicapai oleh para siswa.
c. Penilaian diagnostik, adalah penilaian yang bertujuan untuk melihat
kelemahan-kelemahan siswa serta faktor penyebabnya, sehingga berdasarkan
kelemahan-kelamahan yang ditemukan dan kedua faktor penyebabnya dapat
dilakukan tindakan dan pemberian perlakuan yang tepat. Perlakuan yang
diberikan tersebut dapat berupa bimbingan belajar, pengajaran remidial,
menemukan kasus-kasus dan lain-lainnya.
d. Penilaian penempatan, penilaian ini dilakukan dengan tujuan untuk
mengetahui keterampilan prasyarat yang diperlukan bagi suatu program
belajar seperti yang diprogramkan sebelum memulai kegiatan belajar untuk
program itu. Penilaian penempatan berorientasi kepada kesiapan siswa untuk
menghadapi program baru dan kecocokan antara kemampuan siswa dengan
program belajar.
Tes
Tes dapat didefinisikan sebagai suatu pertanyaan atau tugas atau seperangkat
tugas yang direncanakan untuk memperoleh informasi tentang trait atau atribut
pendidikan atau psikologik yang setiap butir pertanyaan atau tugas tersebut
mempunyai jawaban atau ketentuan yang dianggap benar. Dengan demikian maka
setiap tes menuntut keharusan adanya respon dari subyek (orang yang di tes) yang
dapat disimpulkan sebagai suatu trait yang dimiliki oleh subyek yang sedang dicari
informasinya. Jadi bila ada tugas atau pertanyaan yang harus dikerjakan oleh
seseorang tetapi tidak ada jawaban atau cara mengerjakan yang benar atau salah,
atau suatu usaha pengukuran yang tidak mengharuskan subyek untuk menjawab
atau mengerjakan suatu tugas, maka itu bukanlah tes.
Berikut ini dikutip beberapa definisi tes menurut beberapa penulis:
a. Test is a measure countaining a set of questions, each of which can be said
have a correct answer. (Ebel & Frisbie, 1986).
b. Test: Any planned, intrusive procedure or series of tasks used to obtain
observations. (Sax, 1980).
c. Test often connotes the presentation of a standard set of questions to be
answered. (Mehrens & Lehmann, 1973).
Tes dapat dipilah-pilah ke dalam berbagai kelompok. Bila dilihat konstruksinya
maka tes dapat diklasifikasikan sebagai berikut:
a. menurut bentuknya: Secara umum ada-dua bentuk tes, yaitu butir tes bentuk
uraian (essay test) dan butir tes bentuk objektif (objective test). Dua bentuk
butir tes ini dapat dipilah lagi ke dalam berbagai tipe.
b. menurut tipenya: Butir tes uraian dapat diklasifikasi ke dalam dua tipe, yaitu
tes uraian terbatas (restricted essay), dan tes uraian bebas (extended essay).
Butir tes objektif menurut tipenya dapat dibagi menjadi tiga, yaitu tes benar-
16
salah (true-false), butir tes menjodohkan (matching), dan butir tes pilihan
ganda (multiple choice),
c. menurut ragamnya: Tiap tipe tes tersebut dalam butir b di atas dapat dipilah
lagi ke dalam ragam butir tes, yaitu:
1) tipe tes uraian terbatas:
a) ragam tes jawaban singkat
b) ragam tes melengkapi
c) ragam tes uraian terbatas sederhana
2) tipe tes uraian bebas:
a) ragam tes uraian bebas sederhana
b) ragam tes uraian ekspresif
3) tipe tes objektif benar salah
a) ragam benar salah sederhana
b) ragam benar salah dengan koreksi
4) Tes tipe objektif menjodohkan
a) ragam menjodohkan sederhana
b) ragam menjodohkan hubungan sebab akibat
5) tipe tes objektif pilihan ganda:
a) ragam pilihan ganda biasa
b) ragam pilihan ganda hubungan antar hal
c) ragam pilihan ganda analisis kasus
d) ragam pilihan ganda kompleks
e) ragam pilihan ganda membaca diagram
Pengukuran
Pengukuran diartikan sebagai pemberian angka kepada suatu atribut atau
karakteristik tertentu yang dimiliki oleh orang, hal, atau objek tertentu menurut
aturan atau formulasi yang jelas. Misalnya untuk mengukur tinggi atau berat
seseorang dengan mudah kita memahami karena aturannya telah diketahui secara
umum. Tetapi untuk mengukur pendengaran, penglihatan atau kepekaan seseorang
jauh lebih kompleks dari itu, dan tidak semua orang dapat memahaminya. Dalam
kegiatan seperti ini mungkin saja aturan dan formulasi yang diikuti tidak lagi
sederhana. Dalam melakukannya harus diikuti seperangkat aturan atau formulasi
yang disepakati secara umum oleh para ahli. Kegiatan pengukuran itu menjadi lebih
kompleks lagi bila akan mengukur karakteristik psikologik seseorang, seperti
kecerdasan, kematangan, atau kepribadian. Dalam hal yang terakhir ini tidak semua
orang dapat memahaminya, dan tentu saja tidak semua orang dapat
melakukannya. Karena memang pengukuran itu menuntut keahlian dan latihan
tertentu.
Demikian juga halnya dengan pengukuran dalam bidang pendidikan. Kita hanya
mengukur atribut atau karakteristik peserta didik tertentu, bukan peserta didik itu
sendiri. Dosen dapat mengukur penguasaan peserta pendidikan dalam suatu mata
kuliah tertentu atau kemampuan dalam melakukan suatu keterampilan tertentu yang
telah dilatih, tetapi tidaklah mengukur peserta didik itu sendiri. Pengukuran
pendidikan adalah salah satu pekerjaan profesional guru, instruktur atau dosen.
17
Tanpa kemampuan melakukan pengukuran pendidikan, seorang guru atau dosen
tidak akan dapat mengetahui dengan persis di mana ia berada pada suatu saat
atau pada suatu kegiatan.
Berikut ini akan dikutip beberapa definisi pengukuran yang dirumuskan oleh
beberapa ahli pengukuran pendidikan dan psikologi yang acapkali dijadikan acuan
beberapa penulis.
a. Richard H. Lindeman (1967) merumuskan pengukuran sebagai "The
assignment of one or a set of numbers to each of a set of persons or objects
according to certain established rules".
b. Norman E, Gronlund (1971) secara sederhana merumuskan pengukuran
sebagai "Measurement is limited to quantitative descriptions of pupil behavior".
c. Georgia S. Adams (1964) merumuskan pengukuran sebagai "Nothing more
than careful observations of actual performance under standard conditions",
d. Victor H. Noll (1957) mengemukakan dua karakteristik utama
pengukuran, yaitu "quantitativeness" dan "constancy of units". Atas dasar dua
karakteristik ini ia menyatakan "Since measurement is a v quantitative
process,, the results of measurement are always expressed in numbers,
e. William A. Mehrens dan Irvin J. Lehmann (1973) mendefinisikan
pengukuran sebagai berikut: "Using observations, rating scales, or any other
device that allows us to obtain information in a quantitative form is
measurement",
f. Robert Li Ebel dan David A. Frisbie (1986) merumuskan pengukuran sebagai
"Measurement is a process of assigning numbers to the individual members of
a set of objects or person for the purpose of indicating differences among them
in the degree to which they possess the characteristic being measured.
g. Gilbert Sax (1980) menyatakan "Measurement: The assignment of numbers
to attributes of characteristics of persons, events, or objects according to
explicit formulations or rules".
Dari definisi yang telah dikemukakan di atas terdapat dua karakteristik pengukuran
yang utama, yaitu (1) penggunaan angka atau skala tertentu, dan (2) menurut suatu
aturan atau formula tertentu.
Karena pengukuran menggunakan angka atau skala tertentu, maka untuk lebih
memahami penggunaan angka atau skala tersebut kepada para dosen dituntut
untuk mengetahui dan memahami karakteristik angka atau skala. Skala atau angka
itu dapat diklasifikasi kedalam 4 (empat) kategori, yaitu : (1) skala nominal, yaitu
skala yang bersifat katagorikal. Misalnya, bila sebutir soal dapat dijawab benar oleh
mahasiswa, maka ia mendapat skor 1 (satu), jika ia menjawab salah maka ia
memperoleh skor 0 (nol). (2) Skala ordinal, yaitu angka yang menunjukkan adanya
urutan, tanpa mempersoalkan jarak antar urutan tersebut. Misalnya, angka yang
menunjuk urutan ranking mahasiswa dalam suatu mata kuliah tertentu. Mahasiswa
yang memperoleh ranking 1 (satu) tidak berarti dua kali lebih pandai dari
mahasiswa ranking 2 (dua). Jarak kepandaian mahasiswa ranking 1 dengan
ranking 2 tidak sama dengan jarak kepandaian mahasiswa ranking 2 dengan
ranking 3, dan seterusnya. (3) Skala atau angka interval, yaitu angka yang
menunjukkan adanya jarak yang sama dari angka yang berurutan. Misalnya, angka
Km untuk mengukur jarak. Jarak antara Km 1 dengan Km 2 sama dengan jarak
18
antara Km 3 dengan Km 4, dan seterusnya. (4) Skala atau angka rasio, yaitu angka
yang memiliki semua karakteristik angka atau skala yang terdahulu dan ditambah
dengan satu karakteristik lagi, yaitu skala tersebut berlanjut terus ke atas dan ke
bawah. Jadi memiliki nol mutlak. Misalnya, tinggi badan seorang. Bila ada tinggi
badan manusia 75 cm dan yang lainnya 150 cm, maka tinggi yang pertama
setengah dari yang kedua, atau manusia kedua 2 kali lebih tinggi dari yang
pertama. Sebaliknya seseorang yang memiliki IQ: 70 dan yang lain IQ: 140, tidak
dapat dikatakan orang kedua dua kali lebih cerdas dari yang pertama, karena skala
IQ adalah skala interval.
b. Penempatan
Dalam pelaksanaan kursus atau latihan yang singkat biasanya dilakukan tes
penempatan, untuk menentukan tempat yang paling cocok bagi seseorang untuk
dapat berprestasi dan berproduksi secara efisien dalam suatu proses pendidikan
atau pekerjaan. Tes seperti ini terutama didasarkan pada informasi tentang apa
yang telah dan apa yang belum dikuasai oleh seseorang.
c. Diagnosis dan remedial
Tes seperti ini terutama untuk mengukur kekuatan dan kelemahan seseorang dalam
kerangka memperbaiki penguasaan atau kemampuan dalam suatu program
pendidikan tertentu. Jadi sebelum dilakukan remedial, seharusnya didahului dengan
suatu tes diagnosis.
d. Umpan balik
Hasil suatu pengukuran atau skor tes tertentu dapat digunakan sebagai umpan
balik, baik bagi individu yang menempuh tes maupun bagi dosen atau instruktur
yang berusaha mentransfer kemampuan kepada mahasiswa. Suatu skor tes dapat
digunakan sebagai umpan balik, bila telah diinterpretasi. Setidak-tidaknya ada dua
19
cara menginterpretasi skor tes. yaitu dengan membandingkan skor seseorang
dengan kelompoknya yang kedua dengan melihat kedudukan skor yang diperoleh
seseorang dengan kriteria yang ditentukan sebelum tes di mulai.
Untuk yang pertama dinamakan "norm reference test" dan yang kedua dinamakan
"criterion reference test".
e. Memotiuasi dan membimbing belajar
Hasil tes seharusnya dapat memotivasi belajar mahasiswa. dan juga dapat menjadi
pembimbingan bagi mereka untuk belajar. Bagi mereka yang memperoleh skor
yang rendah seharusnya menjadi cambuk untuk lebih berhasil dalam tes yang akan
datang dan secara tepat dapat mengetahui di wilayah mana terletak kelemahannya.
Dan bagi mereka yang mendapat skor yang tinggi tentu saja hasil itu dapat menjadi
motivasi mempertahankan dan meningkatkan hasilnya, serta dapat menjadi
pedoman dalam mempelajari bahan pengayaan.
f. Perbaikan kurikulum dan program pendidikan
Salah satu peran yang penting dari penilaian pendidikan ialah mencari dasar yang
kokoh bagi perbaikan kurikulum dan program pendidikan. Perbaikan kurikulum atau
program pendidikan yang dilakukan tanpa hasil penilaian yang sistematik acapkali
menjadi usaha sia-sia yang mubazir.
g. Pengembangan ilmu
Hasil pengukuran tes. dan penilaian tentu saja akan dapat memberi sumbangan
yang berarti bagi perkembangan teori dan dasar pendidikan. Ilmu seperti
pengukuran pendidikan dan psikometrik sangat tergantung pada hasil-hasil
pengukuran, tes dan penilaian yang dilakukan sebagai kegiatan sehari-hari dosen
dan pendidik. Dari hasil itu akan diperoleh pengetahuan empirik yang sangat
berharga untuk pengembangan ilmu dan teori.
5. Etika Tes
Kegiatan pengujian berperan sangat besar dalam sistem pendidikan dan sistem
persekolahan. Karena pentingnya itu maka setiap tindakan pengujian selalu
menimbulkan kritik yang tajam dari masyarakat. Kritik tersebut tidak jarang datang
dari para ahli, di samping datang dari orang tua yang secara langsung atau tidak
langsung berkepentingan terhadap pengujian. Diantara beberapa kritik tersebut ada
beberapa yang harus menjadi perhatian sungguh-sungguh dari para praktisi dan
ahli tes, pengukuran dan penilaian. Kritik tersebut antara lain:
a. Tes senantiasa akan mencampuri rahasia pribadi peserta tes. Setiap tes
berusaha mengetahui pengetahuan dan kemampuan peserta tes, yang dapat
berarti membuka kelemahan dan kekuatan pribadi seseorang. Di dalam
masyarakat yang sangat melindungi akan hak dan rahasia pribadi, masalah ini
selalu akan menjadi gugatan atau keluhan.
b. Tes selalu menimbulkan rasa cemas peserta tes. Memang sampai batas
tertentu rasa cemas itu dibutuhkan untuk dapat mencapai prestasi terbaik.
Tetapi tes acapkali menimbulkan rasa cemas yang tidak perlu, yang justru
dapat menghambat seseorang mampu mendemonstrasikan kemampuan
terbaiknya.
20
c. Tes acapkali justru menghukum mahasiswa yang kreatif. Karena tes itu selalu
menuntut jawaban yang sudah ditentukan pola dan isinya, maka tentu saja hal
itu tidak memberi ruang gerak yang cukup bagi mahasiswa yang kreatif.
d. Tes selalu terikat pada kebudayaan tertentu. Tidak ada tes hasil belajar yang
bebas budaya. Karena itu kemampuan peserta tes untuk memberi jawaban
terbaik turut ditentukan oleh kebudayaan penyusun tes.
e. Tes hanya mengukur hasil belajar yang sederhana dan yang remeh. Hampir
tidak pernah ada tes hasil belajar yang mampu mengungkapkan tingkah laku
mahasiswa secara menyeluruh, yang justru menjadi tujuan utama pendidikan
formal apapun.
Karena banyak kritik yang tajam dari masyarakat terhadap praktek tes pendidikan,
maka para pendidik harus dapat melakukan tes dengan penuh tanggung jawab.
Untuk itu perlu ditegakkan beberapa etika tes, yang membedakan tindakan yang
etis dan tindakan yang tidak etis dalam tes secara profesional.
Praktek tes hasil belajar yang etis terutama mencakup empat hal utama:
a. Kerahasiaan hasil tes
Setiap dosen atau pengajar wajib melindungi kerahasiaan hasil tes, baik individual
maupun secara kelompok. Hasil tes hanya dapat disampaikan kepada orang
lain bila:
1) Ada izin dari mahasiswa yang bersangkutan atau orang yang
bertanggung jawab terhadap peserta didik (bagi peserta didik yang belum
dewasa). Jadi dengan demikian maka praktek menempelkan hasil tes di papan
pengumuman dengan identitas jelas peserta tes, merupakan pelanggaran
terhadap etika ini.
2) Ada tanda-tanda yang jelas bahwa hasil tes tersebut menunjukkan gejala
doping membahayakan dirinya atau membahayakan kepentingan orang lain.
3) Penyampaian hasil tes tersebut kepada orang lain jelas-jelas menguntungkan
peserta tes.
b. Keamanan tes.
Tes merupakan alat pengukur yang hanya dapat digunakan secara profesional.
Dengan demikian maka tes tidak dapat digunakan di luar batas-batas yang
ditentukan oleh profesionalisme pekerjaan guru. Dengan demikian setiap
pendidik harus dapat menjamin keamanan tes, baik sebelum digunakan maupun
sesudah digunakan.
c. Iterpretasi hasil tes
Hal yang paling mengandung kemungkinan penyalahgunaan tes adalah
penginterpretasian hasil tes secara salah. Karena itu maka interpretasi hasil tes
harus diikuti tanggung jawab profesional. Bila hasil tes diinterpretasi secara tidak
patut, dalam jangka panjang akan dapat membahayakan kehidupan peserta tes.
d Penggunaan tes
Tes hasil belajar haruslah digunakan secara patut. Bila tes hasil belajar tertentu
merupakan tes baku, maka tes tersebut harus digunakan di bawah ketentuan yang
21
berlaku bagi pelaksanaan tes baku tersebut. Tak ada tes baku yang boleh
digunakan di luar prosedur yang ditetapkan oleh tes itu sendiri.
Di samping beberapa butir seperti yang diuraikan di atas, ada beberapa petunjuk
praktis yang hendaknya ditaati oleh dosen dalam tes:
a. Pelaksanaan tes hendaknya diberi tahu terlebih dahulu kepada peserta tes;
Hanya karena pertimbangan tertentu, yang sangat penting, yang dapat
membenarkan dosen tidak memberi tahu terlebih dahulu kepada peserta tes
tentang tes yang akan dilaksanakan. Bahkan kisi-kisi tes sebaiknya diberi tahu
kepada peserta tes sebelum melaksanakan tes.
b. Sebaiknya dosen menjelaskan cara menjawab yang dituntut dalam suatu tes.
Petunjuk menjawab tes bukanlah sesuatu yang harus dirahasiakan. Petunjuk
yang bersifat menjebak harus dihindari.
c. Sebaiknya dosen justru memotivasi peserta tes mengerjakan tesnya secara
baik. Jangan sampai seorang dosen justru menakut-nakuti , mahasiswa
dengan tes.
d. Bila dosen menggunakan tes baku, maka hendaknya dosen tersebut
bertanggung jawab penuh terhadap keamanan tes tersebut. Tidak ada tes
baku yang boleh digunakan dalam latihan.
e. Seorang dosen dapat menggunakan hasil tes untuk mengidentifikasi kekuatan
dan kelemahan peserta tes, asalkan hal tersebut tetap menjadi rahasia peserta
tes dan pendidik yang bersangkutan.
f. Dosen hendaknya menghindari diri dari keterlibatan dalam bimbingan tes yang
dapat diperkirakan akan mengganggu proses belajar mahasiswa. Hal ini
menjadi penting bila dosen yang bersangkutan justru terlibat dalam
penyusunan butir tes yang digunakan.
g. Adalah tidak etis bila seorang dosen mengembangkan butir soal atau
perangkat soal yang paralel dengan suatu tes baku dengan maksud untuk
digunakan dalam bimbingan tes.
h. Adalah tidak etis untuk mendiskriminasikan mahasiswa tertentu atau kelompok
tertentu yang boleh mengikuti suatu tes atau melarang mengikuti tes.
i. Adalah tidak etis untuk memperpanjang waktu atau menyingkat waktu dari
yang ditentukan oleh petunjuk tes.
j. Dosen tidak boleh meningkatkan rasa cemas peserta tes dengan penjelasan
yang tidak perlu.
Secara lebih mendasar etika tes ini diatur dalam standar tes yang dikembangkan
oleh organisasi profesional seperti American Psychological Association (APA),
American Educational Research Association (AERA), dan fational Council on
Measurement in Education (NCME). Terakhir ketiga organisasi profesional ini
membentuk Panitia bersama untuk menyusun standar dalam tes. Mereka
menghasilkan buku yang dinamakan "Standard for Educational and Psychological
Testing (1985).
Dalam Standard ini dicantumkan berbagai tolok ukur, seperti:
1. Technical Standards for Test Construction and Evaluation:
2. Professional Standards for Test Use;
3. Standards for Particular Applications; dan
4. Standards for Administrative Procedures.
22
Semua standar ini mencakup dua aspek utama, yaitu tes hasil belajar dan tes
psikologi. Pelanggaran terhadap standar ini merupakan pelanggaran kepada etika
profesi, yang dalam hal tertentu dapat merupakan pelanggaran atau kejahatan.
Pada uraian terdahulu telah dikemukakan bahwa dalam proses belajar dan
mengajar ada empat unsur utama yang sangat berperan yaitu tujuan, bahan,
metode dan alat serta evaluasi. Berbicara tentang evaluasi sebagai salah satu
unsur dalam proses belajar mengajar tersebut akan muncul pertanyaan yang
mendasar yaitu apa yang harus dinilai itu.
Untuk menjawab pertanyaan ini perlu diketahui apa fungsi penilaian itu sendiri.
Adapun fungsi penilaian sebagaimana telah dikemukakan pada uraian sebelumnya
adalah sebagai alat untuk mengetahui keberhasilan proses dan hasil belajar. Dari
sinilah dapat dijawab bahwa obyek dari penilaian itu adalah proses pembelajaran
dan hasil belajar.
1. Hasil Belajar.
a. Ranah Kognitif
Ranah kognitif berkenaan dengan hasil belajar menurut Bloom terdiri dari
enam aspek yaitu pengetahuan atau ingatan, pemahaman, aplikasi, analisis,
sintesis, dan evaluasi. Berikut ini akan diuraikan satu persatu.
23
1). Tipe hasil belajar : Pengetahuan
24
dibedakan antara pemahaman terjemahan, penafsiran, dan
ekstrapolasi, bedakanlah hal tersebut untuk kepentingan
penyusunan soal tes hasil belajar. Krakteristik soal-soal
pemahaman sangat mudah dikenali, misalnya item pemahaman
terjemahan mengungkapkan sesuatu dengan bahasa sendiri
dengan simbol tertentu termasuk ke dalam pemahaman
terjemahan. Dapat menghubungkan hubungan antar unsur dari
keseluruhan pesan atau termasuk kedalam pemahaman penafsiran.
Item ekstrapolasi mengungkapkan kemampuan dibalik pesan yang
tertulis dalam suatu keterangan atau lisan. Sebagian item
pemahaman dapat disajikan dalam gambar, denah, diagram, atau
grafik. Dalam tes obyektif, tipe pilihan ganda dan tipe banar-salah
banyak mengungkapkan aspek pemahaman.
25
f) Dapat meramalkan sesuatu yang akan terjadi berdasarkan prinsip
dan generalisasi tertentu.
g) Dapat menentukan tindakan atau keputusan tertentu dalam
menghadapi situasi baru dengan menggunakan prinsip dan
generalisasi yang relevan.
h) Dapat menjelaskan alasan menggunakan prinsip dan generalisasi
bagi situasi baru yang dihadapi,
Untuk membuat item tes kecakapan analisis ini perlu mengenal berbagai
kecakapan yang termasuk klasifikasi analisis, yakni :
a) Dapat mengklasifikasikan kata-kata, frase-frase, atau pertanyaan-
pertanyaan dengan menggunakan kriteria analitik tertentu.
b) Dapat meramalkan sifat-sifat khusus tertentu yang tidak disebutkan
secara jelas.
c) Dapat meramalkankualitas, asumsi, atau kondisi yang implisit.
d) Dapat mengetengahkan pola, tata, atau pengaturan materi dengan
menggunakan kriteria seperti relevansi, sebab akibat, dan
peruntutan.
e) Dapat mengenal organisasi, prinsip-prinsip organisasi, dan pola-pola
materi yang dihadapi.
f) Dapat meramalkan sudut pandangan, kerangka acuan, dan tujuan
materia yang dihadapinya.
26
hubungan kausal atau urutan tertentu, atau menemukan abstraksinya atau
operasionalnya.
b. Ranah Afektif
Penilaian hasil belajar afektif kurang mendapat perhatian guru, para guru lebih
banyak menilai ranah kognitif dari pada ranah afektif. Ranah afektif ini
27
berkenaan dengan sikap dan nilai, tipe hasil belajar ini tampak pada siswa
dalam berbagai tingkah laku seperti perhatian terhadap pelajaran, disiplin,
motivasi belajar, kebiasan belajar, menghargai guru dan teman sekelas, dan
lain sebagainya.
Untuk mengetes harus diketahui beberapa jenis katagori ranah afektif sebagai
hasil belajar, yaitu :
a) Reciving/attending, yaitu semacam kepekaan dalam siswa dalam
menerima rangsangan/stimulus dari luar dalam bentuk masalah, situasi,
gejala dan lain sebagainya.
b) Responding, yakni respon yang diberikan siswa terhadap stimulasi yang
datang dari luar. Respon ini mencakup ketepatan reaksi, perasaan,
kepuasan dalam menjawab stimulus dari luar yang dihadapi.
c) Valuing (penilaian), berkenaan dengan nilai dan kepercayaan terhadap
gejala stimulus untuk selanjutnya muncul adanya kesediaan dan
kesepakatan untuk menerima nilai tadi.
d) Organisasi, yakni mengembangkan dari nilai ke dalam suatu sistem
organisasi. Yang termasuk ke dalam organisasi ialah konsep tentang nilai,
organisasi sistem nilai dan lain-lainnya.
e) Karakteristik nilai atau internalisasi nilai, yakni keterpaduan semua sistem
nilai yang telah dimiliki siswa, yang mempengaruhi pola kepribadian, dan
tingkah lakunya.
c. Ranah Psikomotorik
28
dominan jika dibandingkan dengan tipe hasil belajar bidang afektif dan
psikomotorik. Hal ini bisa jadi karena asumsi seseorang yang berubah tingkat
kognisinya sebenarnya dalam kadar tertentu telah berubah pula sifat (afektif)
dan perilakunya (psikomotorik). Meskipun demikian tidaklah harus diartikan
bidang afektif dan psikomotorik diabaikan sehingga tak perlu dilakukan
penilaian.
29
BAB II
TES SEBAGAI ALAT PENILAIAN
A. Konsep Tes.
Sejalan dengan adanya perbedaan di atas, maka perlu diciptakan alat untuk
mengukur dan menilai keadaan individu, alat inilah yang lazim disebut dengan tes.
Selanjutnya tes sebagai alat penilaian ini, bila dilihat dari segi alatnya dapat
dibedakan kedalam 2 macam yaitu tes dan non tes. Baik tes maupun non tes ini
disebut juga sebagai teknik tes.
Kegiatan mengukur itu pada umumnya tertuang dalam bentuk tes dengan berbagai
macam dan bentuknya. Dalam praktek, teknis tes inilah yang sering dipakai dalam
rangka menilai hasil belajar para siswa.
Banyak para pakar pendidikan mengemukakan apa yang dimaksud dengan tes
sebagai alat penilaian, namun apabila kita cermati dan disimpulkan dapat
dikemukakan disini bahwa yang dimaksud dengan tes adalah cara yang dapat
dipergunakan atau prosedur yang perlu ditempuh dalam rangka mengukur dan
menilai sejauh mana tujuan-tujuan instruksional telah dapat dicapai siswa, dan
seberapa efektifnya proses belajar mengajar dalam mencapai hasil belajar yang
optimal. Dari hasil pengukuran dapat diperoleh nilai yang menggambarkan tingkah
laku atau prestasi siswa, dimana nilai dari hasil tes dapat dibandingkan dengan
nilai-nilai yang dicapai oleh siswa lainnya, atau dibandingkan dengan nilai standar
tertentu.
Apapun jenis dan macamnya, tes sebgai alat penilaian adalah pertanyaan-
pertanyaan yang diberikan kepada siswa untuk mendapat jawaban dari siswa
dalam bentuk lisan (tes lisan), dalam bentuk tulisan (tes tertulis) dan dalam bentuk
tindakan/ketrampilan (tes perbuatan). Jadi sesuai dengan cara mengajukan
pertanyaan dan cara memberikan jawabannya sebagaimana tersebut di atas, maka
tes dapat dibedakan :
a. Tes tertulis : dimana pertanyaan-pertanyaan atau soal-soal yang diajukan
dan jawaban yang harus diberikan siswa dilakukan secara tertulis.
30
b. Tes lisan : yakni tes dimana pertanyaan-pertanyaan atau soal-soal yang
diajukan dan jawaban yang harus diberikan siswa dilakukan secara lisan.
c. Tes perbuatan : yaitu tes yang pertanyaan-pertanyannya dapat diajukan
dalam bentuk tulisan atau lisan akan tetapi jawaban yang harus diberikan
siswa dilakukan dalam bentuk perbuatan.
Yang dimaksud dengan standardized test ialah tes yang telah mengalami proses
standarisasi, yakni proses validasi dan keandalannya (reability) sehingga tes
tersebut benar-benar valid dan andal untuk suatu tujuan dan bagi suatu kelompok
tertentu. Pada umumnya tes ini dibuat oleh para ahli psikologi dan bayak dipakai
untuk tujuan rekruitment pegawai dalam instansi pemerintahan, perusahaan dan
militer. Di sekolah-sekolah di Indonesia, pada umumnya tes ini belum banyak
dipergunakan, hanya dibeberapa sekolah yang memiliki Lembaga Bimbingan dan
Penyuluhan yang digunakan dalam rangka seleksi siswa dan penjurusan.
Adapun tes buatan guru adalah tes yang dibuat oleh guru sendiri dengan sedikit
atau tanpa bantuan dari pihak luar, dibuat berdasarkan isi dan tujuan-tujuan
pembelajaran, menyangkut topik, kecakapan atau ketrampilan dimana penggunaan
tes ini terbatas hanya di kelas atau sekolah dimana guru tersebut mengajar. Uraian
selanjutnya dalam buku ini akan lebih mengarah dan ditekankan pada tes buatan
guru.
Dalam uraian di atas telah disampaikan tentang apa yang dimaksud dengan tes
lisan, tes tertulis dan tes praktek secara singkat. Mengingat tes hasil belajar yang
lazim digunakan oleh para guru di sekolah-sekolah adalah tes lisan dan tes tertulis
yang dibuat sendiri oleh guru, berikut ini akan dikemukanan bentuk-bentuk tes,
kebaikan dan kelemahannya.
Tes tertulis sebagai alat penilaian yang dapat dipergunakan untuk menilai proses
dan hasil belajar yang telah dilakukan terhadap siswa, ada dua jenis tes yang
utama yakni :
a) Essay type test, yang biasa disebut tes uraian yaitu suatu tes yang berbentuk
pertanyan tulisan dimana siswa dapat menjawab pertanyaan yang diajukan
tersebut secara tertulis dengan bebas (dalam tes ini jawaban tidak disediakan).
Jawaban siswa pada umumnya dapat merupakan uraian yang panjang,
31
panjang pendeknya jawaban tes ini relatif sesuai dengan kecakapan dan
pengetahuan siswa. Tes ini merupakan bentuk penilaian yang paling dikenal
dan banyak dipergunakan oleh para guru dari dulu sampai sekarang. Perlu
diperhatikan karena tes uraian memerlukan jawaban yang panjang dan waktu
yang lama, jumlah soal yang diajukan harus dibatasi dan disesuaikan dengan
waktu yang tersedia.
b) Structured response test yang biasa disebut obyektif tes, yaitu suatu tes
yang dibuat sedemikian rupa sehingga hasil tes yang diperoleh itu dapat dinilai
secara obyektif, dalam arti dinilai oleh siapapun akan menghasilkan skor yang
sama. Dalam tes ini pertanyaan-pertanyaan yang diajukan telah tersedia
jawabannya siswa atau si penjawab tinggal memilih, mengisi dan menjodohkan
dengan menggunakan tanda-tanda atau perintah seperti yang tercantum dalam
soal. Test ini disebut juga short-answer test karena jawabannya pendek-
pendek dan ringkas.
Sesuai dengan keterangan di atas obyektif tes ini terdiri dari dua jenis yaitu :
1. Completion type test, terdiri dari :
• Completion test atau tes melengkapi.
• Fill-in jawaban tes berupa mengisi titik dalam kalimat pada soal yang
dikosongkan.
2. Selection type test atau tes yang jawabannya dengan mengadakan
pilihan.
Tes jenis ini terdiri atas :
• true-false (benar – salah)
• multiple choice (pilihan ganda)
• matching (menjodohkan)
a. Tes Lisan
• Kebaikannya antara lain :
1) Tes dilakukan secara tatap muka sehingga lebih dapat menilai
kepribadian dan pengetahuan siswa yang dikuasainya.
2) Jika pertanyaan yang diajukan guru belum jelas bagi siswa, guru
dapat mengubah pertanyaan sehingga dapat dimengerti oleh
siswa.
32
3) Dari sikap dan cara siswa menjawab, guru dapat mengetahui
apa yang tersirat dan tersurat.
4) Guru dapat mengorek isi pengetahuan siswa secara detail,
sehingga dapat diketahui bidang yang dikuasai atau disenangi
siswa.
5) Hasil tes langsung dapat diketahui.
33
3) Untuk mengukur kemampuan siswa memilih diantara
perbendaharaan pengetahuannya yang sesuai untuk menjawab
suatu pertanyaan.
4) Dapat dibuat dalam waktu yang singkat
34
• Nyatakan pertanyaan sedemikian rupa sehingga jelas arah jawaban
yang diharapkan. Misalnya dngan menggunakan kata : “ Apa
berbedaan antara ........... dengan ..........” , “ Bandingkan ....... “, “
berikan alasan mengapa .......”, terangkan bagaimana cara
...............”, “buktikan .............”, “berikan kritik ............”, “uraikan
dengan kata-kata sendiri ...........”, dan lain sebagainya.
• Sesuaikan panjang pendeknya dan kompleksitas jawaban dengan
tingkat kematangan siswa.
• Usahakan agar soal essay yang akan disusun itu benar-benar dapat
menimbulkan perilaku yang dikehendaki untuk dilakukan siswa.
• Buatlah kunci (hanya untuk diketahui guru sendiri) jawaban-jawaban
secara tertulis yang diharapkan untuk memudahkan penskorannya.
• Sediakan waktu yang cukup bagi siswa untuk menuliskan jawaban.
d. Tes Obyektif
• Kebaikan tes obyektif ini antara lain :
1) Dapat dipergunakan untuk menilai bahan pelajaran dalam ruang
lingkup yang luas artinya pelajaran yang diberikan selama satu
tahun atau dua tahun dapat dites sekaligus.
2) Jawaban yang diberikan siswa dapat bebas dan terarah ( karena
dalam tes obyektif ini telah disediakan jawabannya).
3) Dapat dinilai secara obyektif, artinya siapapun yang menilainya
hasil atau skornya akan sama.
4) Memaksa siswa untuk mempelajari semua materi yang telah
disampaikan, sehingga siswa tidak dapat berspekulasi pada
bagian-bagian mana saja yang dipelajari.
5) Memudahkan guru untuk memberikan skor karena jawabannya
telah dibuat kuncinya.
35
3) Menyusun tes ini tidak mudah, memerlukan ketelitian dan
kecermatan serta membutuhkan waktu yang relatif cukup lama.
4) Jika dibandingkan dengan ter uraian, tes obyektif ini kurang
efektif dan efisien karena membutuhkan disamping waktu yang
cukup lama, juga memakan biaya dan kertas yang banyak.
Setelah diketahui kebaikan dan kelemahan dari bentuk tes obyektif ini, maka
dapat jadikan acuan oleh guru dalam membuat pertanyaan-pertanyan atau
soal dalam bentuk tes obyektif.
36
3) Tidak dapat dipakai untuk mengukur kemampuan yang lebih
komplek.
4) Adanya kesulitan dalam penilaian atau penyekorannya.
38
2) Jawaban yang lebih hendaknya mengandung kebenaran yang mirip
dengan jawaban yang benar.
3) Materi soal harus homogen, misalnya tentang satu pokok bahasan saja.
4) Buatlah dua kolom, kolom pertama berisi nomor soal, pertanyaan dan
ruang jawaban. Sedangkan kolom kedua berisi kode dan pilihan jawaban.
Berdasarkan sifat dan kegunaan jenis/bentuk di atas dapat dibuat ikhtisar seperti
dibawah ini :
IKHTISAR
Bentuk Soal
Tes Tes Tes
NO. URAIAN
Uraian Isian Obyektif
1. Dapat mengukur kemampuan siswa dalam
memecahkan masalah. ++ + ++
39
Dari ikhtisar di atas ternyata tes obyektif khususnya tes pilihan ganda merupakan
bentuk tes yang sangat menguntungkan, karena selain dapat mengukur hampir
semua aspek kemampuan siswa juga mempunyai reliabilitas penskoran yang tinggi.
Hal ini cocok untuk jumlah murid yang banyak. Atas karakteristik yang demikian
inilah tes ini dapat direkomendasikan untuk dipakai, dan bila perlu kelemahannya
dapat ditutupi dengan cara mengkombinasikan dengan tes uraian.
Tes yang baik, akan diharapkan dapat mengukur dan menilai hasil belajar siswa
yang dapat menunjukkan atau menggambarkan keadaan siswa yang sebenarnya
dalam mencapai tujuan pengajaran setelah yang bersangkutan memperoleh
pengajaran melalui proses belajar mengajar.
Sebuah tes dapat dikatakan baik sebagai alat pengukur harus memenuhi
persyaratan tes, yaitu :
a) Validitas
Sebuah tes hasil belajar disebut valid apabila tes tersebut dapat tepat mengukur
apa yang hendak diukur. Istilah “valid” sering diartikan dengan istilah tepat, benar
atau shahih. Jadi validitas dapat diartikan dengan ketepatan, kebenaran, atau
keshahihan. Dengan kata lain sebuah tes dikatakan telah memiliki “validitas”
apabila tes tersebut secara tepat, benar atau shahih telah dapat mengukur apa
yang seharusnya diukur melalui tes tersbut. Jadi tes hasil belajar kimia dapat
dinyatakan valid apabila tes hasil belajar tersebut secara tepat, benar atau shahih
telah dapat mengukur hasil belajar kimia yang telah dicapai siswa setelah
mengalami proses pembelajaran
Contoh
Untuk mengukur volume air dapat digunakan gelas ukur. Jadi gelas ukur
merupakan alat ukur untuk mengukur volume air yang tepat (valid).
Thermometer adalah alat pengukur yang valid untuk mengukur suhu
udara/tubuh.
Dalam proses belajar mengajar untuk mengukur hasil belajar siswa bukan diukur
melalui sikap siswa/kehadiran siswa, tetapi diukur melalui nilai yang diperoleh pada
waktu ulangan.
40
b) Reliabilitas
Misalnya kepada siswa kelas I SMA diberikan tes kimia secara berulang-ulang
dengan soal yang sama, tetapi berbeda waktunya dengan jarak waktu satu minggu,
ternyata hasil yang diperoleh dari tes-tes yang dilakukan tersebut relatif sama.
Mungkin saja terjadi adanya perbedaan hasil pada setiap tes yang diperoleh, tetapi
perbedaan ini disebabkan oleh adanya :
a. Pengalaman yang diperoleh pada waktu tes sebelumnya. Keadaan ini
dikatakan bahwa ada carry over effect atau practice effect yaitu adanya akibat
yang dibawa karena siswa telah mengalami kegiatan.
b. Kondisi siswa itu sendiri pada waktu mengerjakan tes tersebut misalnya siswa
dalam keadaan sakit atau baru dapat musibah yang berpengaruh pada
kejiwaan siswa.
Jadi perbedaan hasil tes yang diperoleh bukan karena alat penilaian yaitu tes, tetapi
oleh adanya 2 faktor tersebut di atas.
Koefisien reliabilitas tes dapat ditentukan dengan mengkorelasikan skor-skor yang
diperoleh dari hasil penilaian.
c) Obyektivitas
d) Praktibilitas
Sebuah tes dikatakan memiliki praktibilitas yang tinggi apabila tes tersebut bersifat
praktis, dalam pengertian mudah untuk pengadministrasiannya, mudah
dilaksanakan, mudah pemeriksaannya dan diklengkapi dengan petunjuk yang jelas
cara mengerjakannya.
41
e) Ekonomis
Yang dimaksud dengan ekonomis disini adalah bahwa pelaksanaan tes tersebut
tidak membutuhkan biaya yang mahal, tenaga yang banyak, dan waktu yang lama.
Kisi-kisi adalah suatu format atau matriks yang memuat informasi yang dapat
dijadikan pedoman untuk menulis soal atau merakit soal menjadi tes. Kisi-kisi
disusun berdasarkan tujuan penggunaan tes. Dengan demikian dapat
diperoleh berbagai macam kisi-kisi. Misalnya, kisi-kisi tes yang dimaksudkan
untuk mendiagnosa kesukaran belajar murid berbeda dengan kisi-kisi tes yang
maksudkan untuk melihat prestasi belajar peserta didik. Penyusunan kisi-kisi
merupakan langkah penting yang harus dilakukan sebelum penulisan soal.
Tanpa adanya indikator dalam kisi-kisi tidak dapat diketahui arah dan tujuan
setiap soal.
d) Komponen-komponen Kisi-kisi
Komponen yang diperlukan dalam sebuah kisi-kisi sangat ditentukan oleh
tujuan tes yang hendak disusun. Komponen-komponen ini dapat dihimpun
menjadi dua kelompok identitas dan kelompok matriks. Kelompok identitas
dicantumkan di bagian atas matriks, sedangkan kelompok matriks dicantumkan
dalam kolom-kolom yang sesuai. Komponen-komponen yang biasa digunakan
dalam penyusunan kisi-kisi tes prestasi belajar adalah sebagai berikut :
42
1. jenis sekolah/jenjang sekolah.
2. program/jurusan.
3. bidang studi/mata pelajaran.
4. tahun ajaran.
5. kurikulum yang diacu.
6. alokasi waktu.
7. jumlah soal.
8. bentuk soal.
9. Tujuan Pembelajaran
10. materi.
11. bahan kelas.
12. jumlah untuk setiap Materi Pokok
13. indikator.
14. nomor urut soal.
43
Komponen lainnya yang perlu penjelasan lebih rinci adalah materi dan
indikator. Materi dipilih/dirumuskan sebagai bagian dari beberapa materi yang
terdapat pada Materi Pokok terpilih. Pemilihan materi dilakukan berdasarkan
sub materi pokokyang akan ditanyakan dalan tes. Sedangkan indikator adalah
suatu rumusan yang menggunakan kata kerja operasional. Rumusan ini
memuat perilaku siswa dan materi yang akan diukur sesuai dengan materi
terpilih. Hal yang sangat penting dalam perumusan indikator adalah keterkaitan
indikator dengan materi, Materi Pokok dan Tujuan Pembelajaran.
Dalam penulisan kisi-kisi tes prestasi belajar, misalnya untuk ujian harian dan
ujian kenaikan kelas, para penulis kisi-kisi perlu merumuskan lebih lanjut
materi yang terpilih menjadi indikator. Perumusan ini penting karena dari
indikator yang terdapat pada kisi-kisi ini penulis soal dapat mengetahui
kemampuan murid yang hendak diukur. Karena indikator dibuat berdasarkan
materi yang berasal dari Materi pokok dan Tujuan pembelajaran tertentu maka
indikator ini dibuat untuk melihat ketercapaian tujuan pembelajaran.
Berikut ini adalah diagram yang menggambarkan proses penjabaran Tujuan
embelajaran (TP) menjadi indikator.
Keterangan diagram :
TP : berisi tujuan umum pembelajaran yang diharapkan dicapai
siswa.
PB : berisi Materi Pokok yang dipilih untuk diujikan.
Materi : berisi uraian/bagian dari Materi Pokok yang dipilih untuk
diujikan.
Rumusan materi di sini tidak harus persis sama dengan yang
terdapat dalam GBPP asalkan tidak menyimpang dari Materi
Pook yang bersangkutan.
Indikator : berisi ciri yang dapat diamati untuk digunakan sebagai
petunjuk bahwa suatu TP telah dicapai.
Panah berlabel 1 : menunjukkan bahwa indikator memberi petunjuk
(indikasi) mengenai ketercapaian TP.
44
Panah berlabel 2 : menunjukkan keterkaitan antara tiap komponen itu
dengan komponen yang mendahuluinya.
Panah berlabel 3 : menunjukkan urutan langkah-langkah antar komponen.
Karena indikator berasal dari materi dan tiap TP mempunyai beberapa materi
maka jelaslah bahwa satu TP dapat dijabarkan ke dalam beberapa indikator
sesuai materi yang telah dipilih untuk diujikan.
45
KISI-KISI PENULISAN SOAL UJIAN AKHIR
Perencanaan Tes
Tes baru akan berarti bila terdiri dari butir-butir soal yang menguji tujuan yang
penting dan mewakili ranah pengetahiian, kemampuan dan keterampilan secara
representatif. Untuk itu rnaka peranan perencanaan dalam pengujian menjadi
sangat penting. Tes tanpa rencana yang dapat dipertanggungjawabkan dapat
menjadi usaha sia-sia, bahkan mungkin akan mengganggu proses pencapaian
tujuan. Enam hal yang harus dipertimbangkan dalam perencanaan tes:
1. pengambilan sampel dan pemilihan butir soal,
2. tipe tes yang akan digunakan,
3. aspek yang akan diuji,
4. format butir soal,
5. jumlah butir soal, dan
6. distribusi tingkat kesukaran butir soal.
1. Pengambilan Sampel dan Pemilihan Butir Soal
Tes hasil belajar (achievement test) haruslah disusun atas butir-butir soal yang
terpilih, yang secara akademik dapat dipertanggung-jawabkan sebagai sampel yang
representatif dari ilmu atau bidang studi yang diuji dengan perangkat tes tersebut.
Proses pemilihan atau sampling butir soal itu tidak mungkin dapat dilakukan secara
acak (random). Hanya seorang ahli alam bidang studi yang tahu secara lebih baik
apakah butir-butir soal itu cukup representatif atau tidak. Pemilihan itu dilakukan
atas dasar pertimbangan pentingnya konsep, generalisasi, dalil, atau teori yang diuji
dalam hubungannya dengan peranannya terhadap bidang studi tersebut secara
46
keseluruhan. Karena itu tidak mungkin pemilihan itu dilakukan oleh orang dalam
bidang studi tersebut.
Untuk rnemperoleh butir-butir yang mewakili keseluruhan konsep yang dalam suatu
bidang studi, biasanya bidang studi itu dipilah-pilah beberapa pokok bahasan (major
content areas) dan sub pokok n (specific content areas). Tentu saja tidak perlu ada
jumlah butir soal sama untuk setiap pokok bahasan. Jumlah soal dalam setiap
pokok atau subpokok bahasan hendaknya sebanding dengan luas dan pokok
bahasan atau sub pokok bahasan tersebut. Sebagai tentang tingkat kepentingan
dari suatu pokok bahasan atau subpokok bahasan dapat dilihat dari kontribusinya
terhadap keseluruhan bidang studi itu atau, untuk mudahnya, keluasan
pembahasan pokok bahasan dan atau subpokok bahasan itu. Tidak ada batasan
jumlah butir soal untuk satu pokok bahasan atau suatu subpokok bahasan.
2. Tipe Tes yang Digunakan
Ebel dan Frisbie membagi tiga tipe soal: (1) esei, (2) objektif, dan (3) problem
matematik. Di samping itu masih juga dikenal soal-soal penampilan dan soal lisan.
Ada kesalahfahaman yang umum terjadi dikalangan pengguna tes, yaitu anggapan
yang menyatakan suatu tipe tes lebih baik dari tipe tes lainnya dalam mengukur
ranah kognitif tertentu. Berbagai penelitian telah menunjukkan perbedaan yang
berarti dalam mengukur level ranah kognitif yang sama. Soal esei yang baik sama
dapat mengukur ranah kognitif yang manapun seperti yang dapat diukur oleh soal
objektif yang baik, atau sebaliknya. Dan menghasilkan ranking subyek yang tidak
berbeda.
Pemilihan tipe tes yang akan digunakan lebih banyak ditentukan oleh kemampuan
dan waktu yang tersedia pada penyusun tes dari pada kemampuan peserta tes atau
aspek yang ingin diukur.
3. Aspek Kemampuan yang Diuji
Setiap bidang studi mempunyai penekanan kemampuan yang berbeda-beda.
Karena itu aspek yang diujipun haruslah yang berbeda pula. Aspek ranah kognitif
yang mana yang akan diuji harus sinkron dengan kemampuan yang ditentukan oleh
tujuan pendidikan yang telah dirumuskan terlebih dahulu. Dalam hubungan inilah
kita mengenal adanya 6 tingkatan kemampuan yang diuji, yaitu pengetahuan,
pemahaman, aplikasi, analisis, sintesis, dan evaluasi, yang lazim diberi simbol Cl.
C2, C3, C4, C5 dan C6. Di samping itu tentu juga harus diperhatikan kemampuan
dari ranah lain seperti afektif dan psikomotor. Jumlah soal untuk setiap ranah atau
untuk setiap level dalam ranah kognitif juga tidak perlu sama. Pada saat ini tes hasil
belajar lebih berorientasi kepada pengetahuan, pemahaman dan aplikasi,
sedangkan kemampuan pada level yang lebih tinggi seperti analisis, sintesis dan
evaluasi merupakan pengembangan lebih lanjut dari ketiga level kemampuan yang
disebutkan terdahulu. Hal ini tentu saja berarti bahwa jumlah soal yang mewakili
tiga level yang pertama diharapkan lebih banyak dari jumlah soal untuk tiga level
berikutnya.
4. Format Butir Soal
Baik tes objektif maupun tes esei mengenal berbagai format. Misalnya, dalam tes
objektif, acapkali dipilih format A (Pilihan Ganda), format B -(Pilihan Ganda Analisis
Hubungan Antar Hal), format C (Pilihan Ganda Analisis Kasus). atau format D
(Pilihan Ganda Kompleks). Berbagai penelitian juga telah menunjukkan bahwa
47
berbagai format butir soal ini tidak menunjukkan perbedaan efektivitas yang berarti
untuk mengukur berbagai level ranah kognitif, asalkan dikonstruksi sama baiknya.
Bahkan format butir soal B-S pun dapat mengukur level ranah kognitif yang tinggi,
asalkan dikonstruksi secara cermat oleh ahli bidang studi dan ahli konstruksi tes.
Perbedaan antar format butir soal tersebut tidak terletak pada efektivitasnya
mengukur level kemampuan, tetapi lebih banyak pada penerkaannya (dalam hal
peserta tes kurang menguasai bahan yang di tes).
5. Jumlah Butir Soal
Jumlah butir soal tentu saja tidak ada ketentuan yang pasti. Tetapi yang harus
diingat ialah jumlah butir soal berhubungan langsung dengan reliabilitas tes dan
representasi isi bidang studi yang di tes. Makin besar jumlah butir soal yang
digunakan dalam suatu tes maka kemungkinan akan makin tinggi reliabilitasnya,
baik dalam arti stabilitas maupun internal konsistensinya. Dilihat dari segi jumlah
inilah maka tes objektif mempunyai kekuatan yang lebih dari tes esei. Karena tugas
yang harus diselesaikan dalam tes objektif itu sangat singkat, maka kemungkinan
untuk menggunakan jumlah butir soal yang besar menjadi lebih besar pula.
Sedangkan tes esei tidak memungkinkan menggunakan jumlah item yang banyak.
Dengan demikian representasi bidang studi dan reliabilitas tes objektif akan lebih
baik dari tes esei.
Jumlah butir soal itu haruslah direncanakan:
a. jumlah keseluruhan.
b. jumlah untuk setiap pokok bahasan/topik/content area,
c. jumlah untuk setiap format,
d. jumlah untuk tiap kategori tingkat kesukaran.
e. jumlah untuk setiap aspek pada ranah kognitif.
Tentu saja dalam menentukan jumlah ini harus mempertimbangkan waktu yang
tersedia, biaya yang ada, kompleksitas tugas yang dituntut oleh tes, dan waktu ujian
diadakan.
Dengan tidak mengurangi arti pentingnya obyek penilaian terhadap ranah afektif
dan psikomotorik, berikut ini akan dibahas tentang langkah-langkah dalam
menyusun tes kognitif. Hal ini didasarkan atas alasan bahwa tes hasil belajar
kognitif inilah yang umum dibuat dan dilakukan para guru di sekolah-sekolah.
Ada 5 (lima) langkah untuk menyusun tes kognitif yang baik yaitu sebagai berikut :
(1). Membuat “blue print” atau kisi-kisi yaitu berupa diagram matriks yang
menggambarkan secara menyeluruh isi atau bahan pelajaran dan aspek-aspek
kemampuan siswa yang berkenaan dengan bahan pelajaran tersebut. Pada
dasarnya ada 2 persoalan pokok yang dihadapi dalam menyusun tes, yaitu :
apa yang hendak diukur dan bagaimana pengukuran itu harus dilakukan.
Untuk menetapkan dengan baik apa yang hendak diukur, perlu diperhatikan
langkah-langkah sebagai berikut :
a) Buatlah daftar ruang lingkup bahan pelajaran yang akan diujikan dengan
menyebut topik-topiknya, untuk keperluan tersebut perlu dilihat kurikulum.
Daftar yang dibuat tadi dimaksudkan agar jangan sampai ada bahan
pelajaran yang penting terlewati sehingga tak teramati keberhasilannya.
49
b) Buatlah daftar satu lagi yang menunjukkan aspek-aspek kemampuan
siswa sebagai hasil belajar. Misalnya : apakah berkenaan dengan bahan
pelajaran lihat daftar ruang lingkup di atas, siswa diharapkan dapat
mengingat kembali fakta, mengerti/memahami, menggunakan, ataukah
siswa diharapkan mempunyai kemampuan berpikir yang lebih tinggi
seperti membuat analisis, sintesis atau penilaian.
c) Buatlah tabel berupa kisi-kisi yang menyatakan hubungan antara bahan
pelajaran dengan kemampuan siswa. Dengan kisi-kisi ini kita dapat
membuat kesetimbangan atau pemerataan dari bahan maupun aspek
kemampuan yang hendak diukur, karena bagaimanapun juga tes
merupakan sample atau contoh dari keseluruhan hasil belajar. Tabel yang
telah dibuat tadi akan menolong guru untuk dapat memilih dengan tepat
bagian-bagian yang penting. Bagian-bagian yang dianggap penting
tersebut selanjutnya diberikan bobot lebih besar, artinya dapat diberikan
tes lebih banyak. Yang dianggap penting dalam hal ini adalah
kemampuan-kemampuan yang esensial, yang sangat dibutuhkan siswa
pada masa mendatang, untuk mengikuti pelajaran yang lebih tinggi.
d) Berikanlah tanda pada masing-masing kotak dalam tabel yang telah
dibuat tadi sedemikian rupa sehingga dapat diketahui perbandingan
bobotnya. Misalnya dengan memberi angka 3 pada kotak yang penting,
angka 2 pada kotak yang agak penting, angka 1 pada yang kurang
penting, dan angka nol (O) pada kotak yang tidak penting. (lihat contoh
tabel).
e) Rencanakan banyaknya tes (item tes) sesuai dengan waktu yang
disediakan. Misalnya waktu yang tersedia 90 menit Untuk tes obyektif
siswa dapat menjawab dengan waktu 1 menit untuk tiap satu item tes.
Tetapi mungkin ada nomor-nomor yang memerlukan pemikiran untuk
menyelesaikan lebih dari 1 menit, sehingga untuk waktu 90 menit
diperlukan soal kira-kira 70 s/d 80 item tes. Misalnya dalam contoh
dibawah ini kita tetapkan 80 soal, jumlah ini kemudian kita bagi dalam 4
katagori :
• Aspek ingatan 30% = 30/100 x 80 = 24 soal
• Aspek pemahaman 40% = 40/100 x 80 = 32 soal
• Aspek aplikasi 20% = 20/100 x 80 = 16 soal
• Aspek analisa, sintesa, dan penilaian 10% = 10/100 x 80 = 8 soal
Jumlah = 80 soal
Jenis
Kemampuan Ingatan Pemahaman Aplikasi Analisis,sintesis, Jumlah
Ruang C1 C2 C3 Penilaian
50
Lingkup C4
1. A. 1............ 2 (6) ( ) ( ) ( )
2...........
2. B. 1............ 1 (3) ( ) ( ) ( )
2...........
3. C. 1........... 0 ( -) ( ) ( ) ( )
2...........
3........
4. D. 1.......... 1 (4) ( ) ( ) ( )
2..........
5. E. 1........... 3 (11) ( ) ( ) ( )
2...........
3...........
Bobot 30% 40% 30% 10% 100%
Jumlah Soal 24 32 24 8 80
Keterangan :
• Pembobotan jenjang kemampuan 30%, 40%, 30%, dan 10% tersebut
adalah semata-mata suatu contoh dan bukanlah merupakan sesuatu yang
pasti. Hal ini tergantung dari tujuan pembelajaran itu sendiri.
• Pada kotak A/C1 dari tabel di atas angka 2 yang berarti “agak penting”,
dan pada kotak ini diberi alokasi soal sebanyak 2/7 x 24 = 6 soal.
Sedangkam pada kotak B/C1 alokasi soal 1/7x 24 = 3 atau 4 soal dan
seterusnya sehingga pada setiap kotak dapat ditetapkan jumlah soal yang
harus dibuat. Jumlah soal yang akan dibuat tuliskan diantara tanda
kurung.
Setelah kita tetapkan tentang apa yang akan diukur, maka selanjutnya
bagaimana pengukuran itu harus dilakukan, maka langkah selanjutnya adalah
dengan mempelajari sifat-sifat berbagai bentuk tes.
(2) Mempelajari berbagai bentuk tes : dengan tujuan agar dapat memilih bentuk
tes dengan mempelajari sifat-sifat berbagai bentuk tes sebagaimana yang
telah dibahas pada uraian sebelum ini maka akan dapat ditentukan bentuk tes
yang tepat sekaligus dapat ditentukan cara mengukur berbagai aspek
kemampuan siswa.
(3) Menyusun dan mereview tes :
51
Dengan selalu memperhatikan blue print, tujuan pembelajaran serta
berbagai bentuk tes, masing-masing item tes dapat ditulis dalam
selembar kertas dengan format sebagai berikut :
Jenjang Kemampuan C1 ( ) C3 ( ) C5 ( )
C2 ( ) C4 ( ) C6 ( )
STEM :
OPTION :(A)
(B)
(C)
(D)
(E)
KUNCI : A , B , C , D , E (lingkari)
TINGKAT KESUKARAN :
Perkiraan : Sukar Setelah Try Out : ................
Sedang
Mudah
CATATAN : ...............................................................................
Contoh : Bentuk A : 1
2
3
4
B : 5
6
7
8
52
C : 9
10
11
1 2 3 4
A
B
C
D
B. Benar – Salah :
5 6 7 8
(B)
(S)
C. Penjodohan :
9 10 11 12 13
(A)
(B)
(C)
(D)
(E)
(F)
(G)
(H)
E. Tes Uraian
Beri kertas atau ruang yang cukup
53
Nomor Kunci Bobot
A. 1. A 1
2. C 1
3. B 1
4. D 2
B. 5. S 1
6. B 1
7. S 1
8. S 1
C. 9. E 2
10. D 2
11. A 2
12. F 2
13. C 2
D. 14. Vitamin A 2
15. Molekul 2
16. Asam sulfat 2
b. Mereview Tes
(4) Mencoba dan menganalisa hasil tes, dengan tujuan untuk memperoleh data
untuk mengukur hasil belajar siswa serta untuk menilai tes itu sendiri.
(5) Revisi dan penyusunan kembali : Langkah terakhir dalam membuat tes
kognitif ini adalah menyusun kembali tes yang selanjutnya siap untuk dipakai
54
E. Cara Menskor Soal-Soal Essay
1 Nilailah jawaban-jawaban soal essay dalam hubungannya dengan hasil
belajar yang sedang diukur.
2. Untuk soal-soal essay dengan jawaban terbatas (restricted-response
questions), berilah skor dengan point method; gunakan pedoman jawaban
sebagai petunjuk. Tulislah lebih dahulu pedoman jawabannya untuk tiap
soal atau bagian soal (dengan weighting atau pembobotan).
3. Untuk soal-soal essay dengan jawaban terbuka (extended response
questions), nilailah dengan rating method; gunakan kriteria tertentu
sebagai pedoman penilaian.
Extended-response items menuntut jawaban yang terbuka dan bebas
sehingga sering kali tidak mungkin untuk menyiapkan pedoman
jawabannya. Oleh karena itu, biasanya guru atau pembuat tes itu menilai
tiap jawaban dengan menimbang-nimbang kualitasnya dalam
hubungannya dengan kriteria yang telah ditetapkan sebelumnya, jadi
bukan menskor point demi point dengan kunci jawaban. Untuk itu bisa
dilakukan dengan mengklasifikasikan jawaban-jawaban itu ke dalam 5
tingkat; yang selanjutnya diberi nilai 0, 1, 2, 3, 4; dan A, B, C, D, dan E.
4. Nilailah semua jawaban siswa soal demi soal, dan bukan siswa demi
siswa. Dengan demikian dapat dihindarkan terjadinya halo effect.
5. Nilailah jawaban-jawaban soal essay tanpa mengetahui identitas atau
nama siswa yang mengerjakan jawaban itu.
6. Bilamana mungkin, mintalah dua atau tiga orang guru lain, yang
mengetahui masalah itu, untuk menilai tiap jawaban. Ini diperlukan untuk
mengecek keandalan skoring terhadap jawaban-jawaban essay itu.
Tentu saja hal ini tidak perlu dilakukan pada setiap penilaian, tetapi sewaktu-waktu
saja, misalnya jika diperlukan untuk memilih siswa-siswa yang dicalonkan untuk
mengikuti latihan tertentu atau untuk memilih juara sekolah, misalnya.
Mengenai cara menilai tes bentuk ini ada dua pendapat. Yang pertama
mengatakan bahwa skor maksimum setiap bentuk fill-in sama dengan
jumlah isian yang ada pada tes tersebut. Jika pada suatu tes bentuk fill-in
ada 10 item, dan tiap item berisi satu isian, dua isian, atau tiga isian, maka
cara menilainya hitung menurut jumlah isian yang ada pada seluruh item.
S = R
S = skor terakhir atau yang diharapkan
R = jumlah isian yang dijawab betul (right)
Contoh Penggunaan :
Misalkan sebuah tes berbentuk fill-in mengandung 30 isian.
Ahmad mengerjakan tes tesebut 23 isian betul, 5 isian salah, 2 isian
kosong (tidak dijawab), maka skor Ahmad = 23 (tiap isian diberi nilai satu)
Setiap item tes bentuk true-false diberi skor maksimum 1 (satu). Jadi,
apabila suatu item dijawab betul (sesuai dengan kunci jawaban), maka
skornya adalah 1 (satu). Akan tetapi, jika dijawab salah (tidak sesuai
dengan kunci jawaban), maka skornya 0 (nol).
Untuk menghitung akor terakhir dari seluruh item tes bentuk true false
biasanya dipergunakan rumus sebagai berikut :
R W
S atau S R W
n 1
Keterangan :
S = skor terakhir atau yang diharapkan
R = jumlah item yang dijawab betul (right)
W = jumlah item yang dijawab salah (wrong)
n = banyaknya option; untuk true-false selalu dua
1 = bilangan tetap
Contoh penggunaan :
Umpamakan jumlah item true-false (B-S) = 20.
Seorang siswa bernama Ali dapat menjawab betul 13 item, dan salah 7
item. Maka skor yang diperoleh Ali adalah sebagai berikut :
56
13 7
S 6
2 1
Aman dapat menjawab betul 10 item, dan salah 10 item. Skor yang
diperolehnya adalah sebagai berikut :
10 10
S 0
2 1
Bakir hanya dapat menjawab 8 item betul dan 12 item salah. Maka skor
yang diperoleh Bakir adalah :
8 12
S 4
2 1
Cara menskor untuk bentuk tes ini adalah sebagai berikut. Item yang
dijawab betul diberi skor 1 (satu), dan yang salah diberi skor 0 (nol).
Untuk menghitung skor terakhir dari tes yang berbentuk multiple choice
dipergunakan rumus sebagai berikut :
W
S R
n 1
Contoh penggunaannya:
Umpamakan kita membuat tes yang berbentuk multiple choice dengan 20
item, dengan option atau alternatif jawaban (a, b, c dan d) 4 tiap item.
Seorang siswa bernama Rizki menjawab betul 14 item, dan salah 6. Maka
skor yang diperoleh Rizki dari tes tersebut adalah sebagai berikut :
6
S 14 14 2 12
4 1
57
Jika dalam mengerjakan tes yang berbentuk true false atau multiple
choice terdapat item yang tidak dijawab (dikosongkan), maka dalam
penilaian atau scoring, item yang tidak dijawab itu tidak diperhitungkan
(tidak dianggap benar atau tidak dianggap salah).
Sebagai contoh :
a. True false
Jumlah 30 item
Dijawab betul 19 item
Dijawab salah 8 item
Tidak dijawab 3 item
Skor yang diperoleh :
19 8
S 19 8 11
2 1
Jadi yang diperhitungkan di dalam scoring hanya 27 item.
b. Multiple Choice :
Jumlah 20 item
Dijawab betul 16 item
Dijawab salah 3 item
Tidak dijawab 1 item
3
Skor yang diperoleh : 16 16 1 15
4 1
Akan tetapi, ada juga yang berpendapat lain, yaitu semua item yang tidak
dijawab (dikosongkan) berarti salah. Jadi, baik item yang dijawab, tetapi
salah, maupun item yang dikosongkan, atau tidak dijawab, kedua-duanya
dianggap salah. Tentu saja hal ini bergantung pada perjanjian antara
pengetes dan yang dites. Oleh karena itu, sebelum tes dimulai, sebaiknya
guru menjelaskan terlebih dahulu bagaimana cara menskor akan
dilakkukan, dan bagaimana pula cara mengolauh skor menjadi nilai.
Dengan demikian, siswa yang dites akan lebih berhati-hati dalam
mengerjakannya.
58
SR
Contoh penggunaan :
a. Misalkan sebuah tes berbentuk matching banyaknya 10 item.
Misalkan suatu tes terdiri atas tiga macam bentuk, yaitu true-false,
multiple choice, dan matching. Kita telah menetapkan, bahwa tingkat
kesukaran tiap item dari ketiga macam bentuk tes tersebut berturut-
turut adalah 1, 2, dan 4. ini berarti bahwa nilai tiap item yang betul
dari true-false=1, multiple choice=2, dan matching=4.
Andaikata tes yang berbentuk matching itu ada 10 item, dan Basir
dapat menjawab betul 7 item, maka skor yang diperoleh Basir = 7 x 4
= 28.
a) Jika suatu tes terdiri atas satu macam bentuk saja, maka skor
terakhir dari setiap siswa yang dites dihitung dengan
59
menggunakan rumus masing-masing seperti yang telah
diuraikan pada 1 sampai dengan 4 tersebut di atas.
b) Jika suatu tes terdiri atas beberapa macam bentuk, maka skor
terakhir setelah dihitung menurut masing-masing.
60
BAB III
VALIDITAS, RELIABILITAS TES DAN ANALISIS BUTIR SOAL
Banyak cara yang dilakukan oleh guru untuk menyusun tes berupa pertanyaan
yang bertujuan untuk mengukur kemampuan siswa sesuai dengan TPK yang
diharapkan. Menyusun sebuah tes yang baik ditentukan pula oleh pengalaman
seorang guru dan bagaimana situasi pelaksanaan tes tersebut. Walaupun dalam
melaksanakan tes sudah mengikuti aturan dan prosedur/cara yang telah ditentukan
namun informasi yang diperoleh dari skor hasil tes tersebut belum memperoleh
gambaran tentang kualitas tes yang dibuat.
1. Macam-macam Validitas
Validitas sebuah tes dapat diketahui dari hasil pemikiran (logical analysis) dan dari
hasil pengalaman (empirical analysis). Dua hal inilah yang menjadi dasar
pengelompokan validitas tes.
Validitas isi adalah validitas yang ditinjau dari segi isi tes itu sendiri sebagai
alat pengukur hasil belajar yaitu sejauh mana tes hasil tersebut isinya telah
dapat mewakili secara representatif keseluruhan konsep/materi yang
61
seharusnya diteskan. Untuk tujuan ini perlu dibuat kisi-kisi sebagai alat untuk
menentukan validitas isi. Sebuah tes dikatakan memiliki validitas isi apabila
tes tersebut mengukur isi/materi pelajaran yang diberikan sejajar dengan TPK.
Oleh karena materi yang diajarkan tertera dalam GBPP yang merupakan
penjabaran dari kurikulum maka validitas isi disebut juga dengan validitas
kurikuler.
Cara lain untuk menentukan / mengetahui validitas isi yaitu dengan meminta
bantuan ahli bidang studi untuk menelaah apakah konsep materi yang diajukan
telah memadai atau belum sebagai sampel tes.
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang
membangun tes tersebut benar-benar telah dapat dengan tepat mengukur
aspek-aspek berpikir (aspek kognitif, afektif, psikomotorik) seperti yang telah
dirumuskan dalam TPK.
Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan cara
memerinci dan memasangkan setiap butir soal dengan setiap aspek dalam
TPK.
c) Validitas Bandingan
Validitas ini juga dikenal dengan istilah validitas empiris atau validitas ada
sekarang. Dikatakan validitas empiris sebab validitas tes tersebut ditentukan
atas dasar pengalaman yang telah diperoleh. Adapun dikatakan sebagai
validitas ada sekarang, artinya mengaitkan dengan hal yang telah ada pada
waktu yang lalu sehingga data mengenai pengalaman masa lalu pada saat
sekarang ini sudah ada.
Suatu tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Pengertian sesuai menunjukkan ada dua hal yang dipasangkan.
Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman di mana data
pengalaman tersebut sekarang sudah ada.
Jadi dapat dipahami bahwa validitas bandingan atau empiris merupakan
validitas yang ditinjau dalam hubungannya dengan alat pengukur lain sebagai
kriterium atau alat banding.
62
Misalnya seorang guru ingin mengetahui apakah tes sumatif kimia yang
disusunnya sudah valid atau belum. Untuk ini diperlukan sebuah kreiteria masa
lalu yang sekarang datanya telah ada misalnya nilai tes sumatif yang lalu.
d) Validitas Prediksi
Suatu tes dikatakan memiliki validitas ramalan apabila hasil tes tersebut sesuai
dengan kriteium yang telah ditentukan atau memiliki kesejajaran. Cara yang
digunakan untuk mengetahui kesejajaran adalah dengan Teknik Analisis
Korelasional Product Moment dari Karl Pearson
Rumus korelasi product moment ada 2 cara yaitu :
4) Rumus korelasi product moment dengan simpangan angka kasar
63
xy
xy
( x 2 )( y 2 )
Di mana :
xy = koefisien korelasi antara variabel x dan variabel y
x dan y = variabel
x = X–X
y = Y–Y
xy = jumlah perkalian x dan y
x2 = kwadrat dari x
y2 = kwadrat dari y
N XY ( X )( Y )
XY
N X 2
( X ) 2 N Y 2
( Y ) 2
xy = koefisien korelasi antara variabel x dan variabel y
x y
No. X Y __ __ x2 y2 xy
( X X ) (Y Y )
1 30 23 -27.03 -24.75 730.35 612.56 668.87
2 30 23 -27.03 -24.75 730.35 612.56 668.87
3 30 27 -27.03 -20.75 730.35 430.56 560.77
4 30 27 -27.03 -20.75 730.35 430.56 560.77
5 40 27 -17.03 -20.75 289.85 430.56 353.27
6 40 30 -17.03 -17.75 289.85 315.06 302.19
7 43 30 -14.03 -17.75 196.70 315.06 248.94
8 43 30 -14.03 -17.75 196.70 315.06 248.94
9 43 33 -14.03 -14.75 196.70 217.56 206.87
10 43 33 -14.03 -14.75 196.70 217.56 206.87
11 50 33 -7.03 -14.75 49.35 217.56 103.62
12 50 40 -7.03 -7.75 49.35 60.06 54.44
64
13 50 40 -7.03 -7.75 49.35 60.06 54.44
14 50 40 -7.03 -7.75 49.35 60.06 54.44
15 53 40 -4.03 -7.75 16.20 60.06 31.19
16 53 43 -4.03 -4.75 16.20 22.56 19.12
17 53 43 -4.03 -4.75 16.20 22.56 19.12
18 53 43 -4.03 -4.75 16.20 22.56 19.12
19 53 47 -4.03 -0.75 16.20 0.56 3.02
20 57 47 -0.02 -0.75 0.00 0.56 0.02
21 57 50 -0.02 2.25 0.00 5.06 -0.06
22 57 53 -0.02 5.25 0.00 27.56 -0.13
23 57 53 -0.02 5.25 0.00 27.56 -0.13
24 60 53 2.98 5.25 8.85 27.56 15.62
25 60 53 2.98 5.25 8.85 27.56 15.62
26 63 53 5.98 5.25 35.70 27.56 31.37
27 63 53 5.98 5.25 35.70 27.56 31.37
28 70 57 12.98 9.25 168.35 85.56 120.02
29 70 57 12.98 9.25 168.35 85.56 120.02
30 70 57 12.98 9.25 168.35 85.56 120.02
31 70 60 12.98 12.25 168.35 150.06 158.94
32 73 60 15.98 12.25 255.20 150.06 195.69
33 73 63 15.98 15.25 255.20 232.56 243.62
34 73 63 15.98 15.25 255.20 232.56 243.62
35 77 70 19.98 22.25 399.00 495.06 444.44
36 77 70 19.98 22.25 399.00 495.06 444.44
37 77 70 19.98 22.25 399.00 495.06 444.44
38 80 70 22.98 22.25 527.85 495.06 511.19
39 80 73 22.98 25.25 527.85 637.56 580.12
40 80 73 22.98 25.25 527.85 637.56 580.12
Jumlah 2281 1910 8874.98 8871.50 8685.25
__
X 2281
X 57,025
N 40
__
Y 1910
Y 47,75
N 40
__
xX X
__
y Y Y
Dimasukkan ke rumus :
65
xy
xy
( x 2 )( y 2 )
8685,25 8685,25
8874,98x8871,50 78734385.07
8685,25
0,97
8873,239
3. Validitas Item
a) Pengertian Validitas Item
Validitas item dari suatu tes adalah ketepatan mengukur yang dimiliki sebutir
item apa yang seharusnya diukur melalui butir item tersebut. Dalam tes hasil
belajar yang disusun oleh para pengajar merupakan kumpulan dari sekian
banyak butir-butir item, jadi butir-butir item merupakan bagian tak terpisahkan
dari tes hasil belajar tersebut sebagai suatu totalitas.
Validitas suatu tes sangat tergantung pada validitas yang dimiliki oleh masing-
masing butir item yang membangun tes tersebut. Bila validitas test hasil belajar
tinggi, sehingga tes hasil belajar itu sebagai totalitas dapat dikatakan sudah
tepat dalam mengukurnya, sehingga dapat dikatakan tes hasil belajar tersebut
valid dan sebaliknya bila validitasnya rendah, maka tes tersebut disebut invalid.
Rendahnya validitas tes merupakan salah satu indikator bahwa tes hasil
belajar yang telah disusun perlu dilakukan penyesuaian kembali guna
mengetahui butir-butir item mana sajakah yang menyebabkan rendahnya
validitas tes tersebut.
66
b) Cara Menentukan Validitas Item Tes Hasil Belajar
Dari uraian di atas jelaslah bahwa validitas sangat tergantung pada validitas
yang dimiliki oleh masing-masing butir item. Untuk mengetahui butir-butir item
yang mana yang valid atau tidak valid dapat menggunakan teknik korelasi.
Sebutir item dikatakan valid jika skor pada butir item yang bersangkutan
memiliki kesesuaian dengan skor totalnya. Skor total di sini sebagai variabel
terikat, sedangkan skor item sebagai variabel bebas yang bersangkutan
apabila terbukti mempunyai korelasi positif yang signifikan dengan skor
totalnya maka item tersebut dinyatakan valid.
Pada tes objektif, setiap butir soal yang dijawab dengan benar umumnya
diberi skor 1 (satu), sedangkan untuk jawaban salah diberi skor 0 (nol). Skor
total untuk masing-masing peserta tes adalah hasil penjumlahan dari setiap
skor yang dimiliki oleh masing-masing butir item.
Teknik korelasi yang digunakan dalam mencari korelasi antara variabel terikat
dengan variabel bebas (variabel II) dapat dengan cara :
a. Teknik Korelasi Pearson
b. Teknik Korelasi Point Biserial.
Rumus :
M p Mt p
pbi
SDt q
Di mana :
pbi = koefisien korelasi biserial, sebagai koefisien validitas item
Mp = rerata skor dari siswa (testee) yang menjawab betul untuk
butir item yang dicari validitasnya
Mt = rerata skor total
SDt = Standar deviasi dari skor total
p = proporsi siswa (testee) yang menjawab benar terhadap butir
item yang diuji validitasnya
banyaknya siswa yang menjawab benar
p =
jumlah seluruh siswa
q = proporsi siswa yang menjawab salah (q = 1 – p)
Contoh perhitungan penentuan validitas item menggunakan data hasil tes dari
20 orang siswa yang diberikan 10 butir item dalam bentuk multiple
choice/pilihan ganda : tertera pada tabel berikut.
67
Tabel : Skor hasil tes yang diikuti oleh 20 orang siswa, dengan menyajikan 10
butir item bentuk multiple choice.
68
M 0 1 0 0 1 0 1 1 0 0 4 16
N (1) 0 1 1 0 1 0 1 1 1 (7) 49
O (1) 0 0 1 1 1 1 1 1 1 (8) 64
P 0 1 0 1 1 1 0 1 0 1 5 25
Q (1) 0 1 1 1 1 1 1 1 1 (9) 81
R 0 1 0 1 1 1 0 1 0 1 6 36
S (1) 0 0 1 1 1 1 1 1 1 (8) 64
T 0 1 1 0 0 0 1 0 0 1 4 16
20 = 10= 12= 13= 14= 15= 16= 17= 18= 19= 10= 130= 934=
N N1 N2 N3 N4 N5 N6 N7 N8 N9 N10 Xt Xt2
P 0,5 0,6 0,5 0,7 0,65 0,75 0,6 0,8 0,6 0,8
Q 0,5 0,4 0,5 0,3 0,35 0,25 0,4 0,2 0,4 0,2
X i2 X t2
SDt
N N
Telah diketahui X t2 = 934 X t = 130 dan N = 20. Jadi:
2
934 130
SDt 46,7 6,5
2
20 20
M p Mt p
pbi
SDt q
Nomor Testee Yang Mean (Rata-rata Hitung) dari skor total yang dijawab
Item Jawabannya Betul dengan betul (Mt)
1 B-D-E-G-H-I-N-O-Q 7+10+7+8+9+10+7+8+9+8 =8,300
dan S (N1=10) 10
2 A-C-D-F-I-J-K-L-M-P- 3+6+10+3+5+10+6+5+4+5+6+4 =5,583
R dan T (N2=12) 12
3 B-D-E-H-J-K-L-N-Q 6+10+7+9+10+6+5+7+9+4 =7,300
dan T (N3=10) 10
4 C-D-E-G-H-I-J-K-N-O- 6+10+7+8+9+5+10+6+7+8+5+9+6+8 =7,429
P-Q-R-S (N4=14) 14
5 B-C-D-G-H-J-K-L-M- 7+6+10+8+9+10+6+5+4+8+9+6+8 =7,385
O-Q-R dan S (N5=13) 12
6 A-D-E-F-G-H-I-J-K-N- 3+10+7+3+8+9+5+10+4+7+8+5+9+6+8 6,933
O-P-Q-R-S (N6=15) 15
70
Tabel : perhitungan untuk mengetahui koefisien korelasi pbi dalam rangka uji
validitas item nomor 1 sampai dengan nomor 10.
Nomor M p Mt p
Inter
Item Mp Mt SDt p Q pbi pretasil
SDt q
1 8,300 6,5 2,11 0,50 0,50 0,853 (pbi > t) Valid
2 5,583 6,5 2,11 0,60 0,40 -0,532 Kor, Negatif Invalid
3 7,300 6,5 2,11 0,50 0,50 0,379 (pbi < t) Invalid
4 7,429 6,5 2,11 0,70 0,30 0,673 (pbi > t) Valid
5 7,385 6,5 2,11 0,65 0,30 0,572 (pbi < t) Valid
6 6,933 6,5 2,11 0,75 0,20 0,355 (pbi > t) Invalid
7 7,333 6,5 2,11 0,60 0,40 0,684 (pbi > t) Valid
8 7,000 6,5 2,11 0,80 0,20 0,474 (pbi > t) Valid
9 7,833 6,5 2,11 0,60 0,40 0,774 (pbi > t) Valid
10 7,000 6,5 2,11 0,80 0,20 0,474 (pbi > t) Valid
Catatan : Dalam pemberian interpretasi terhadap pbi ini digunakan db sebesar
(N-nr), yaitu = 20 – 2 = 18. Derajat kebebasan sebesar 18 itu lalu
dikonsultasikan kepada tabel nilai “” product moment, pada taraf
signifikansi 5% dan taraf signifikansi 1%. Hasilnya adalah sebagai
berikut.
tabel atau t pada taraf signifikansi 5% =0,444
tabel atau t pada taraf signifikansi 1% =0,561
Bertitik tolak dari hasil analisis tersebut di atas, ternyata dari sebanyak 10 butir item
yang diuji validitasnya, 7 butir item di antaranya telah dapat dinyatakan sebagai
item yang valid, yaitu item nomor 1, 4, 5, 7, 8, 9 dan 10. sedangkan 3 butir item
lainnya merupakan item yang invalid.
B. Reliabilitas Tes
a. Menentukan Reliabilitas Tes Hasil Belajar Bentuk Objektif
Dapat dilakukan dengan tiga cara :
a. Metode tes ulang (test-retest method)
b. Metode bentuk paralel (equivalent)
c. Metode belah dua (split half method)
Dalam metode ini pengetes menggunakan alat penilaian (test) dua kali dalam
waktu yang berlainan, pengetes hanya membuat satu perangkat tes. Oleh
71
karena tesnya hanya satu dan dicobakan dua kali maka metode ini disebut
juga dengan simple test double trial method.
Misalnya tes hasil belajar kimia untuk SMU kelas II diberikan hari ini, seminggu
kemudian tes tersebut diberikan lagi pada siswa yang sama. Untuk
menentukan koefisien korelasi maka hasil penilaian yang pertama
dikorelasikan dengan hasil penilaian yang kedua. karena mengkorelasikan
hasil penilaian dari tes yang sama maka metode ini juga disebut self
corelation method (korelasi diri sendiri).
Pada umumnya hasil tes yang kedua lebih tinggi dari hasil tes yang pertama,
hal ini kemungkinan adanya carry over effect. Dalam hal ini yang penting
adanya kesejajaran hasil atau ketetapan hasil yang terlihat dari koefisien
korelasi yang tinggi. Koefisien korelasi mempunyai rentangan nilai antara –1,0
sampai +1,0. koefisien korelasi yang mendekati 1,0 merupakan koefisien
korelasi yang tinggi.
Kelemahan metode ini adalah kurang tepat untuk tes yang banyak
mengungkapkan aspek kognitif ingatan dan pemahaman. Oleh karena itu
jarak waktu pemberian tes pertama dengan kedua perlu diperhitungkan,
sebaiknya tidak terlalu dekat dan juga tidak terlalu jauh. Jika terlalu dekat
hasilnya terlalu banyak dipengaruhi oleh ingatan siswa pada jawaban yang
diberikan pada pengukuran pertama. Sebaliknya jika waktunya terlalu lama
bisa terjadi adanya perubahan pengetahuan karena siswa sudah mempelajari
sesuatu sehingga mempengaruhi koefisien reliabilitasnya.
Untuk menghitung korelasi antara hasil penilaian tes pertama dengan kedua
dapat dipergunakan teknik korelasi rank order dari Spearman, dengan
menggunakan rumus :
6 D2
1
N ( N 2 1)
Di mana :
(baca Rho) = Koefisien korelasi antara variabel I (skor-skor hasil tes
I) dengan variabel II (skor-skor hasil tes II).
D = Difference (beda antara rank variabel I dengan variabel
II), atau : D=RI-RII.
6 dan 1 = Bilangan konstan.
N = Banyaknya testee.
72
Contoh : Penentuan reliabilitas tes dengan Metode Tes Ulang
Seorang guru kimia ingin mengetahui apakah tes yang telah disusunnya
mempunyai reliabilitas tes yang tinggi, untuk itu guru tersebut melakukan
dengan menggunakan metode tes ulang (test-retest methode).
Tes hasil belajar kimia di kelas I semester I diikuti oleh 20 orang siswa. Tes
dilaksanakan sebanyak dua kali (selang waktu 1 minggu) dengan materi soal
yang sama. Skor yang dicapai dari dua kali tes tersebut seperti berikut:
Tabel : Skor-skor hasil tes belajar bidang studi kimia yang dilaksanakan
dua kali dan diikuti 20 orang siswa.
Langkah untuk menentukan reliabilitas tes hasil belajar tersebut adalah sebagai
berikut :
74
Rank
Testee Skor (urutan kedudukan) D=R1-R2 D2
Tes I Tes II Tes I Tes II
A 58 60 15 13,5 2,5 6,25
B 64 59 9 15,5 -6,5 39,06
C 70 74 3 1 2 4,00
D 72 68 1 5 -4 16,00
E 57 59 16 15,5 1,5 2,25
F 67 60 6 13,5 2,5 6,25
G 54 56 19 19 0 0,00
H 61 63 12 9 3 9,00
I 71 70 2 4 -2 4,00
J 65 67 8 6 2 4,00
K 55 57 18 18 0 0,00
L 68 73 5 2 3 9,00
M 62 64 11 8 3 9,00
N 50 52 20 20 0 0,00
O 66 61 7 11,5 -4,5 20,25
P 69 72 4 3 1 1,00
Q 56 58 17 17 0 0,00
R 60 62 13 10 3 9,00
S 63 65 10 7 3 9,00
T 59 61 14 11,5 2,5 6,25
154,31
75
antara tes pertama dengan tes kedua terdapat korelasi positif yang
signifikan.
3) Menarik kesimpulan
Berdasarkan hasil analisis data empiris seperti di atas maka dapat
disimpulkan bahwa tes hasil belajar kimia tersebut sudah dapat
dinyatakan sebagai tes hasil belajar yang telah memiliki reliabilitas yang
tinggi (bersifat reliabel).
Pada metode ini diperlukan dua perangkat tes yang setara baik dari segi
tujuan, tingkat kesukaran, bentuk pertanyaan, yang berbeda hanya
pertanyaannya. Oleh karena itu metode ini disebut juga alternate–forms
method (paralel forms).
Tes hasil belajar kimia di buat dua seri, Seri I dan Seri II masing-masing
berjumlah 30 butir soal. Test diikuti oleh 40 orang siswa SMU kelas II, hasil tes
Seri I (x) dan Seri II (y) dan dari data-data perhitungan indek korelasi dapat
dilihat pada tabel berikut ini.
76
9 43 33 -14.03 -14.75 196.70 217.56 206.87
10 43 33 -14.03 -14.75 196.70 217.56 206.87
11 50 33 -7.03 -14.75 49.35 217.56 103.62
12 50 40 -7.03 -7.75 49.35 60.06 54.44
13 50 40 -7.03 -7.75 49.35 60.06 54.44
14 50 40 -7.03 -7.75 49.35 60.06 54.44
15 53 40 -4.03 -7.75 16.20 60.06 31.19
16 53 43 -4.03 -4.75 16.20 22.56 19.12
17 53 43 -4.03 -4.75 16.20 22.56 19.12
18 53 43 -4.03 -4.75 16.20 22.56 19.12
19 53 47 -4.03 -0.75 16.20 0.56 3.02
20 57 47 -0.02 -0.75 0.00 0.56 0.02
21 57 50 -0.02 2.25 0.00 5.06 -0.06
22 57 53 -0.02 5.25 0.00 27.56 -0.13
23 57 53 -0.02 5.25 0.00 27.56 -0.13
24 60 53 2.98 5.25 8.85 27.56 15.62
25 60 53 2.98 5.25 8.85 27.56 15.62
26 63 53 5.98 5.25 35.70 27.56 31.37
27 63 53 5.98 5.25 35.70 27.56 31.37
28 70 57 12.98 9.25 168.35 85.56 120.02
29 70 57 12.98 9.25 168.35 85.56 120.02
30 70 57 12.98 9.25 168.35 85.56 120.02
31 70 60 12.98 12.25 168.35 150.06 158.94
32 73 60 15.98 12.25 255.20 150.06 195.69
33 73 63 15.98 15.25 255.20 232.56 243.62
34 73 63 15.98 15.25 255.20 232.56 243.62
35 77 70 19.98 22.25 399.00 495.06 444.44
36 77 70 19.98 22.25 399.00 495.06 444.44
37 77 70 19.98 22.25 399.00 495.06 444.44
38 80 70 22.98 22.25 527.85 495.06 511.19
39 80 73 22.98 25.25 527.85 637.56 580.12
40 80 73 22.98 25.25 527.85 637.56 580.12
Jumlah 2281 1910 8874.98 8871.50 8685.25
x y x2 y2 xy
xy
xy
(x 2 )(y 2 )
8685,25
xy
(8874,98)(8871,50)
77
8685,25
xy
78734385,07
8685,25
xy
8873,24
xy 0,9788
Butir-butir soal dibagi menjadi dua bagian yang setara, biasanya soal nomor
genap dan soal nomor ganjil yang disebut belahan ganjil genap dapat juga
dibagi dengan cara mengambil separuh jumlah pada nomor awal dan separuh
pada nomor akhir.
Karena korelasi tersebut hanya berlaku separo maka koefisien korelasi yang
diperoleh hanya untuk separuhnya, tidak untuk seluruh soal. Oleh sebab itu
untuk mengetahui reliabilitas seluruh tes digunakan rumus Spearman Brown.
2 1 1
2 2 2
11 atau tt hh
1
1 1 1
2 2
hh
Di mana :
11 = Koefisien reliabilitas tes secara keseluruhan.
78
Langkah pertama melakukan analisis butir soal/analisis item. Item yang dapat
dijawab dengan benar diberi skor 1 dan yang salah diberi skor 0, berikut ini
disajikan tabel analisis 30 item tes kimia dari 15 siswa.
2 1 1
2 2
11
1 1 1
2 2
S2 S2
11 2 1 1 2 2
St
Di mana :
11 = reliabilitas tes
2
S 1 = varians belahan (1) atau belahan ganjil
2
S 2 = varians belahan (2) atau belahan genap
2
S t = varians skor total
80
Varians (S2) adalah kuadrat dari standar deviasi atau simpangan baku
(S).
Varians
Dapat dihitung dengan “Statistic Calculator” atau
X
2
X
2
Dengan rumus : S
2 N
N
x 2
Dengan rumus : S
N
Di mana :
S = simpangan baku (standar deviasi)
X = skor
___ ___
x = simpangan X dari X , dicari dari X - X
S2 = varians
N = banyaknya peserta tes
82
Tabel : Perhitungan penentuan reliabilitas tes
83
n S pq
2
11
n 1 S
2
x 2
S2
N
8905
S2 593,66 24,365
15
15 24,365 3,12
11
15 1 24,365
15 21,245
11
14 24,365
11 1,071 0,871 0,2
Rumus K – R. 21
M (n M )
n 1
11
n 1 nSt2
Di mana :
M = Mean atau rata-rata skor total
Berbeda dengan tes bentuk obyektif di mana butir-butir soal yang demikian
hanya memberikan jawaban benar atau salah.
Untuk menentukan reliabilitas soal keseluruhan dilakukan analisis butir soal
terlebih dahulu seperti halnya soal bentuk obyektif. Berbeda dengan tes bentuk
obyektif di mana butir-butir soal yang demikian hanya benar atau salah yang
diberi nilai 1 atau 0, sedangkan untuk butir soal uraian penilaian atau skor
mempunyai rentangan skor antara 0 sampai dengan 10 tergantung pada bobot
setiap soal.
Pada umumnya rumus yang digunakan untuk menentukan reliabilitas bentuk
uraian adalah Rumus Alpha.
84
n S i
2
11 1
n 1 S t2
Di mana :
11 = Koefisien reliabilitas tes.
n = banyaknya butir item.
1 = bilangan konstan
Si2 = jumlah varians skor tiap-tiap butir item
S t2 = varians total
Contoh :
Tes hasil belajar kimia dalam bentuk uraian yang diikuti 10 orang siswa dan
soal terdiri dari 6 butir item. Rentangan bobot skor antara 0 sampai 10. Skor-
skor hasil tes tertera pada tabel berikut.
Tabel : Skor-skor hasil tes belajar kimia bentuk uraian sejumlah 6 butir item
dari 10 orang siswa .
Langkah-langkah :
1. Jumlahkan skor-skor yang dicapai oleh masing-masing peserta tes yaitu
i1, i2, i3, i4,…….. i10.
2. Hitung skor total yang dicapai oleh masing-masing peserta tes (Xt) serta
hitung kuadrat dari skor total. (Xt2).
3. Hitung jumlah kuadrat item 1, 2, 3, 4, 5 dan 6.
Jk item 1 = 102 + 62 + 82 + 72 + 02 + 22 + 42 + 52 + 52 + 32 = 328
85
Jk item 2 = 201
Jk item 3 = 264
Jk item 4 = 418
Jk item 5 = 458
Jk item 6 = 451
Xi12
Xi
2
1
S i21 N
N
502
318
S i21 10 328 250 7,8
10 10
2
43
201
S i22 10 1,61
10
482
264
S i23 10 3,36
10
622
418
Si24 10 3,36
10
662
458
Si25 10 2,24
10
652
451
Si26 10 2,85
10
86
6. Hitung varian total dengan menggunakan rumus
Xt 2
Xt
2
S t2 N
N
11836
334
S t2 N
N
2
S t = 68,04
n S i
2
11 1
n 1 S t2
6 21,22
11 1
6 1 68,08
11 1 0312
6
5
= 0,8256
1. Apabila 11 0,70 berarti tes hasil belajar tersebut telah memiliki
reliabilitas yang tinggi (reliable).
2. Apabila 11 0,70 berarti tes hasil belajar tersebut belum memiliki
reliabilitas yang tinggi (un-reliable).
Selain itu pemberian interpretasi dapat juga dikonsultasikan dengan tabel “r”
product moment.
87
C. Analisis butir soal
Analisis butir soal antara lain bertujuan untuk mengkaji pertanyaan-pertanyaan agar
diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai. Dengan
mengevaluasi soal dapat diperoleh informasi tentang kualitas sebuah soal, apakah
soal itu baik, kurang baik atau buruk.
Asumsi bahwa jawaban siswa yang salah semata-mata karena siswa tidak
menguasai bahan yang ditanyakan adalah asumsi yang keliru, kesalahan tersebut
mungkin saja disebabkan oleh konstruksi butir soal yang dapat membingungkan
siswa. Oleh karena itu sebaiknya butir soal yang digunakan untuk tes telah melalui
proses analisis sehingga kesalahan jawaban siswa, mungkin disebabkan oleh
konstruksi butir soal yang keliru/salah dapat dihindarkan.
Asumsi yang digunakan untuk memperoleh kualitas soal yang baik, di samping
memenuhi validitas dan reliabilitas, adalah adanya keseimbangan dari tingkat
kesulitan soal tersebut. Keseimbangan yang dimaksud adalah adanya soal-
soal yang termasuk mudah, sedang dan sukar secara proporsional.
Bilangan yang menunjukkan sukar atau mudahnya suatu soal disebut indeks
kesukaran/difficulty index. Besarnya indeks kesukaran antara 0,0 – 1,0. Soal
88
dengan indeks kesukaran 0,0 menunjukkan bahwa soal tersebut terlalu sukar,
sebaliknya indeks 1,0 menunjukkan soal tersebut terlalu mudah.
0,0 1,0
P = 0,0 – 0,3 soal kategori sukar.
P = 0,31 – 0,70 soal kategori sedang
P = 0,71 – 1,0 soal kategori mudah
Contoh :
Guru kimia memberikan 10 pertanyaan pilihan ganda kepada 30 orang siswa.
Seluruh siswa mengisi jawaban pertanyaan tersebut, setelah diperiksa hasilnya
sebagai berikut :
89
Contoh untuk soal nomor 1.
B 24
No.1 P 0,80
JS 30
B 21
No. 2 P 0,70
JS 30
Dari hasil analisis indeks kesukaran ternyata dari 10 soal tersebut memiliki 3
soal mudah, 5 soal sedang dan 2 soal sukar.
Bila butir soal dapat dijawab oleh semua siswa berarti butir soal itu tidak
memiliki daya pembeda, dengan demikian tidak akan menghasilkan gambaran
hasil yang sesuai dengan kemampuan siswa yang sebenarnya. Angka yang
membedakan besarnya daya pembeda disebut indeks diskriminasi (D). Harga
D berkisar –1,0 sampai dengan 1,0. Indeks diskriminasi dapat saja mempunyai
harga negatif artinya anak yang pandai tidak dapat menjawab sedangkan anak
yang kurang pandai dapat menjawab dengan benar.
BA BB
D PA PB
JA JB
Di mana :
J = Jumlah peserta tes
JA = Jumlah peserta kelompok atas
JB = Jumlah peserta kelompok bawah
BA = Jumlah peserta kelompok atas yang menjawab benar
BB = Jumlah peserta kelompok bawah yang menjawab benar
PA = Proporsi kelompok atas yang menjawab benar
PB = Proporsi kelompok bawah yang menjawab benar
90
Langkah-langkah menentukan daya pembeda (D) :
a) Memeriksa jawaban soal semua peserta tes.
b) Membuat daftar peringkat hasil tes berdasarkan skor yang dicapai, mulai
dari skor tertinggi sampai terendah.
c) Menentukan jumlah sampel untuk kelompok atas sebanyak 27% dari
jumlah peserta tes dan 27% untuk kelompok bawah apabila kelompok
besar. Untuk kelompok kecil seluruh kelompok peserta dibagi dua sama
besar, 50% kelompok atas dan 50% kelompok bawah.
d) Menghitung jumlah siswa yang menjawab benar dari semua nomor soal,
baik pada kelompok atas maupun pada kelompok bawah
F 72
G 70
H 69 Kelompok Bawah
I 65
J 60
40
38
37
27% Kelompok Bawah
35
28
91
Contoh Perhitungan :
40 peserta mengerjakan tes kimia dengan jumlah butir soal sebanyak 30. Pola
jawaban mereka telah diurutkan dari skor tertinggi sampai skor terendah seperti
terlihat pada tabel berikut ini :
92
Tabel : Perhitungan penentuan reliabilitas tes ………….
93
Tabel : Perhitungan penentuan reliabilitas tes ………….
94
Daya beda dihitung dengan rumus :
BA BB
D PA PB
JA JB
Untuk soal nomor 1 BA=15, BB=12
15 12 3
D 0,2
15 15 15
Untuk soal nomor 2 :
11 10 1
D 0,066
15 15 15
Harga pembeda (D) soal nomor 3 sampai dengan 30 dapat pula dilihat pada
tabel.
No. BA BB D Keterangan
1 15 12 0.20 Jelek
2 11 10 0.07 Jelek
3 14 10 0.27 Jelek
4 12 5 0.47 Baik
5 4 0 0.27 Jelek
6 14 8 0.40 Cukup
7 15 6 0.60 Baik
8 14 9 0.33 Cukup
9 10 6 0.27 Jelek
10 15 11 0.27 Jelek
11 14 11 0.20 Jelek
12 15 6 0.60 Baik
13 15 11 0.27 Jelek
14 15 11 0.27 Jelek
15 8 3 0.33 Cukup
16 9 2 0.47 Baik
17 6 0 0.40 Cukup
18 13 9 0.27 Jelek
19 15 8 0.47 Baik
20 14 1 0.87 BaikSekali
21 4 3 0.07 Jelek
22 15 11 0.27 Jelek
23 14 10 0.27 Jelek
24 8 4 0.27 Jelek
25 14 3 0.73 BaikSekali
95
26 10 9 0.07 Jelek
27 13 0 0.87 BaikSekali
28 14 9 0.33 Cukup
29 10 4 0.40 Cukup
30 15 12 0.20 Jelek
Dari hasil analisis daya beda butir soal, ternyata terdapat 16 soal yang
termasuk kategori jelek, 6 soal cukup, 8 soal baik dan 3 soal baik sekali.
Yang dimaksud dengan pola jawaban siswa adalah distribusi peserta dalam
hal menentukan pilihan jawaban. Pola jawaban diperoleh dengan menghitung
banyaknya peserta yang memilih pilihan jawaban (option) a, b, c, atau d atau
yang tidak memilih pilihan manapun (blangko) dalam istilah evaluasi disebut
omit, disingkat O.
96
Contoh : Dari analisis sebuah item, pola jawabannya diketahui sebagai berikut
Soal Butir 1
97
BAB IV
TEKNIK PENGOLAHAN DAN PENGUBAHAN
SKOR HASIL TES MENJADI NILAI
Jika tes sebagai alat evaluasi telah disusun dengan sebaik-baiknya, langkah
selanjutnya adalah pelaksanaan tes itu sendiri. Sampai disini pekerjaan pengukuran
dengan tes belumlah selesai, karena masih dibutuhkan pekerjaan yang tidak kalah
pentingnya yaitu Teknik Pengolahan dan Pengubahan Skor Hasil Tes Menjadi Nilai,
Masih dirasakan adanya kerancuan pengertian antara skor dan nilai. Untuk
menghindari hal di atas sebelum dilakukan pekerjaan menskor dan menilai, agar
diperoleh penilaian yan objektif perlu diketahui terlebih dahulu tentang perbedaan
skor dan nilai. Perlu untuk dijelaskan tentang perbedaan antara skor dan nilai
karena masih banyak orang menganggap bahwa skor itu mempunyai pengertian
yang sama dengan nilai.
Skor adalah hasil pekerjaan menskor (memberikan angka) yang diperoleh dengan
cara menjumlahkan angka-angka bagi setiap butir tes yang dijawab betuk oleh
siswa dengan memperhitungkan bobot jawaban betulnya.
Misalkan tes hasil belajar kimia diberikan 40 butir soal tes obyektif dengan
ketentuan bahwa untuk setiap butir soal yang dijawab benar diberikan bobot 1.
Dengan demikian bila seorang peserta dapat menjawab betul semua soal maka ia
akan mendapat skor 40 x 1 = 40. Angka 40 ini disebut Skor Maksimum Ideal (SMI).
Artinya dalam tes hasil belajar tersebut tidak mungkin ada skor yang melebihi 40.
Bila dalam tes hasil belajar itu siswa bernama Hadi dapat menjawab betul 25 butir
soal, sedangkan Rani menjawab dengan betul sebanyak 30 butir soal, maka skor
diberikan untuk Hadi adalah 25 x 1= 25 dan untuk Rani adalah 25 x 1 = 25. Jadi
angka 40, 25 dan 30 itu belum dapat disebut nilai, karena angka 40, 24 dan 30
menunjukkan banyaknya butir soal yang dijawab dengan betul setelah
diperhitungkan dengan bobot jawaban betulnya. Artinya siswa tersebut sudah
menguasai 100% tujuan pembelajaran khusus yang telah ditentukan.
Contoh lain, misalnya tes hasil belajar kimia diberi 5 butir soal hitungan
(Stoikiometri) dalam bentuk tes essay untuk setiap butir soal yang dijawab betuk
diberi bobot 10. Bila siswa yang bernama Yulia menjawab soal tersebut 3 soal
djiawab dengan betul dan 2 soal hanya ½ yang betul. Jadi skor yang diperolehnya
adalah (3x10)+(2x5)=40. Angka 40 ini merupakan skor mentah. Skor maksimum
untuk kelima butir soal ini adalah 50, Jadi skor 40 yang diperoleh Yulia
mencerminkan 80% penguasaan tujuan.
98
Nilai adalah angka (huruf) yang merupakan hasil ubahan dari skor yang sudah
dijadikan satu dengan skor-skor yang lainnya serta disesuaikan pengaturannya
dengan standar tertentu. Oleh karena itu nilai ini sering disebut dengan Skor
Standar (Standard Score).
Ada dua cara dalam pengolahan dan pengubahan skor menjadi nilai
1) Criterian Referenced Evaluation, dikenal dengan istilah penilaian beracuan
patokan (PAP).
Pengolahan dan pengubahan skor mentah menjadi nilai mengacu pada
kriterium atau patokan.
2) Norm Referenced Evaluation, dikenal dengan istilah penilaian beracuan norma
(PAN) atau penilaian beracuan kelompok (PAK).
Pengolahan dan pengubahan skor mentah menjadi nilai mengacu pada norma
atau kelompok, maksudnya nilai yang diperoleh dengan membandingkan skor
yang dicapai oleh siswa dengan skor yang dicapai oleh teman-teman
sekelompoknya.
99
Pada pengolahan skor mentah menjadi nilai huruf dapat dilakukan dengan
dua cara yaitu :
Jika banyaknya skor yang diolah kurang dari 20 digunakan tabel distribusi
frekuensi tunggal.
Jika banyaknya skor yang diolah lebih dari 20, sebaiknya digunakan tabel
distribusi frekuensi bergolong.
b. Hitung nilai rata-rata (M) dengan membagi jumlah skor tersebut (X)
dengan jumlah mahasiswa atau peserta tes (N).
c. Hitung harga deviasi (d) dalam tabel untuk tiap-tiap skor dari mean (X-M)
d. Kuadratkan harga deviasi yang diperoleh kemudian jumlahkan sehingga
diperoleh harga (X-M)2 =4480,62.
e. Langkah terakhir menghitung deviasi standar (DS) dengan rumus berikut :
( X M ) 2
DS
N
4480,62
DS 224,031 14,96
20
101
Berdasarkan hasil perhitungan di atas kemudian mengkonversi skor
mentah dari 20 orang mahasiswa ke dalam nilai huruf sebagai berikut.
Tabel Konversi
102
18. 53 D
19. 45 D
20. 36 E
Rerata 66.75 C
Misal seorang dosen memperoleh skor mentah dari hasil tes belajar kimia
organik dari 25 orang mahasiswa sebagai berikut :
87,80; 45,85; 83,63; 57,42; 69,73; 71,55; 75,25; 51,00; 74,70; 66,90;
72,20; 60,03; 78,15; 73,98; 76,07; 78,75; 64,70; 78,60; 58,40; 55,68;
50,40; 72,75; 64,55; 59,15; 80,65.
X
M
N
1707,89
M 68,32
25
c. Hitung harga deviasi (d) dalam tabel untuk tiap-tiap skor dari mean
(X-M)
d. Kuadratkan harga deviasi yang diperoleh kemudian jumlahkan
sehingga diperoleh harga (X-M)2 .
e. Langkah terakhir menghitung deviasi standar (DS) dengan rumus
berikut :
( X M ) 2
DS
N
103
2990,16
DS 119,606 10,94
25
104
Berdasarkan hasil perhitungan di atas kemudian mengkonversi skor
mentah dari 25 orang mahasiswa ke dalam nilai huruf sebagai berikut.
Tabel Konversi
Apabila skor-skor mentah hasil tes akan diubah menjadi nilai standar
berskala sembilan maka patokan yang digunakan adalah sebagai berikut :
9
Mean + 1,75 DS
8
Mean + 1,25 DS
7
Mean + 0,75 DS
6
Mean + 0,25 DS
5
Mean – 0,25 DS
4
Mean – 0,75 DS
3
Mean – 1,25 DS
2
Mean – 1,75 DS
1
106
Nilai standar berskala sembilan ini meniadakan nilai 0 dan nilai 10. Cara
pengolahan menggunakan standar ini tidak lazim digunakan.
Rentangan nilai standar berskala sebelas ini mulai dari 0 sampai dengan
10, jadi ada 11 butir standar.
10
M + 2,25 SD
9
M + 1,75 SD
8
M + 1,25 SD
7
M + 0,75 SD
d) 6
e) M + 0,25 SD
f) 5
M - 0,25 SD
4
M - 0,75 SD
3
107
M - 1,25 SD
g) 2
h) M - 1,75 SD
i) 1
j) M - 2,25 SD
0
Contoh:
Dari data-data perhitungan skala lima dieroleh harga M = 68,32 dan DS =
10,94.
10
M + 2,25 SD = 68,32 + (2,25) 10,94 = 68,32 + 24,62 = 92,94
9
M + 1,75 SD = 68,32 + (1,75) 10,94 = 68,32 + 19,15 = 87.47
8
M + 1,25 SD = 68,32 + (1,25) 10,94 = 68,32 + 13.68 = 82,00
7
M + 0,75 SD = 68,32 + (0,75) 10,94 = 68,32 + 8,20 = 76,52
6
M + 0,25 SD = 68,32 + (0,25) 10,94 =68,32 + 2,74 = 71,06
5
M - 0,25 SD = 68,32 – (0,25) 10,94 = 68,32 - 2,74 = 65,58
108
4
M - 0,75 SD = 68,32 – (0,75) 10,94 = 68,32 - 8,20 = 60,12
3
M - 1,25 SD = 68,32 – (1,25) 10,94 = 68,32 - 13.68 = 54,64
2
M - 1,75 SD = 68,32 – (1,75) 10,94 = 68,32 - 19,15 = 49,17
1
M - 2,25 SD = 68,32 – (2,25) 10,94 = 68,32 - 24,62 = 13,70
0
Berdasarkan hasil perhitungan di atas kemudian mengkonversi skor
mentah dari 25 orang mahasiswa ke dalam nilai huruf sebagai berikut.
Tabel Konversi
Misalkan kita melihat hasil belajar dalam mata pelajaran kelompok IPA
dari seorang siswa yang bernama Yudi sebagai berikut :
Fisika = 65
Kimia = 55
Biologi = 70
Dari hasil belajar yang dicapai oleh Yudi kita mempunyai kesan bahwa
Yudi mempunyai kemampuan yang cukup dalam Fisika, kurang dalam
Kimia dan cukup baik dalam Biologi. Apakah benar interpretasi terhadap
kemampuan Yudi tersebut? Hal ini sukar untuk dijawab apabila kita tidak
mengetahui bagaimana skor yang diperoleh teman-teman sekelasnya,
berapa nilai rata-rata tiap mata pelajaran dari seluruh murid yang dites.
X M
Z
DS
Di mana : X = Skor yang diperoleh
M = rata-rata skor dari kelompok
DS = deviasi standar dari skor-skor tersebut
Mata
Fisika Kimia Biologi Jumlah
Pelajaran
Nama Siswa
Yudi 65 55 70 190
Dian 70 60 60 190
Essy 60 70 60 190
Dari data di atas kita lihat hasil rata-rata dari ketiga mata pelajaran sama
yaitu 63.33 karena jumlah ketiga mata pelajaran sama yaitu 190. berarti
secara sepintas kita katakan kepandaian atau kemampuan mereka sama.
Sebenarnya kesimpulan yang telah diambil itu belum tentu benar.
Dari hasil Z-Skor di atas, dapat disimpulkan bahwa prestasi Dian ternyata
lebih baik dibanding prestasi Yudi dan Essy, dan prestasi Essy lebih baik
dari pada Yudi.
T-Score = 10 Z + 50 atau
T-Score = 50 + 10 Z
Mata
Pelajaran
112
Nama Siswa
Z – Score
Jumlah T-Score
Fisika Kimia Biolog Z - Score
i
+ 1,25 + 2,5 - 1,0 + 2,75 (2,75x10)+50=77,5
Yudi
Selain itu ada cara lain untuk menentukan kedudukan siswa dalam
kelompok yaitu :
A = 56 F = 70 K = 60 P = 75
B = 75 G = 60 L = 65 Q = 45
C = 84 H = 75 M = 90 R = 82
D = 78 I = 48 N = 55 S = 75
E = 69 J = 80 O = 67 T = 65
Hanya dengan melihat deretan skor yang masih berserakan ini, kita belum
dapat menentukan ranking atau kedudukan seseorang dalam
kelompoknya. Untuk itu maka skor-skor tersebut terlebih dahulu harus kita
susun, urut dari skor yang paling tinggi sampai skor yang paling rendah,
dengan urutan ke bawah. Setelah itu kita tentukan urutan nomor dari atas,
yaitu nomor 1, 2, 3, 4, dan seterusnya sampai seluruh siswa memperoleh
113
nomor. Perlu diingat di sini bahwa apabila ada dua atau tiga orang yang
kebetulan memiliki skor yang sama, harus diberi nomor urut atau ranking
yang sama pula, yaitu rata-rata dari urutan orang-oranga yang memiliki
skor sama tersebut.
Perhatian :
1) Siswa yang mempunyai skor sama, juga mempunyai ranking yang
sama, sehingga ada nomor-nomor yang tidak digunakan sebagai
nomor urut.
2) Rank terakhir selalu sama dengan nomor urut siswa atau banyaknya
siswa dalam kelompok, kecuali ada bebarapa orang yang mempunyai
persamaan skor.
114
Percentile rank atau ranking persentase adalah kedudukan seseorang
dalam kelompok, yang menunjukkan banyaknya persentase yang berada
dibawahnya.
Jadi dalam hal ini siswa dibandingkan dengan siswa lain yang mempunyai
skor sama atau lebih kecil daripadanya.
Sebagai contoh :
Jika seorang siswa memiliki PR (Percentile Rank) 85, ini menunjukkan
bahwa kecakapan siswa tersebut sama atau melebihi 85% dari seluruh
kelompoknya.
Contoh :
Dengan kelompok yang terdapat pada “Tabel Simple Rank untuk 20
orang”, siswa F menduduki ranking 10 dalam simple rank (SR). Maka
banyaknya siswa yang ada di bawahnya adalah 20-10 orang atau 10
orang.
10
PR untuk F adalah x 100 atau 50
20
Ini berarti bahwa siswa F itu letaknya dalam kelompok mengalahkan 50%
untuk prestasi yang bersangkutan.
M 90 1.00 95.00%
C 84 2.00 90.00%
R 82 3.00 85.00%
J 80 4.00 80.00%
D 78 5.00 75.00%
S 75 7.50 62.50%
P 75 7.50 62.50%
H 75 7.50 62.50%
B 75 7.50 62.50%
F 70 10.00 50.00%
E 69 11.00 45.00%
O 67 12.00 40.00%
T 65 13.50 32.50%
L 65 13.50 32.50%
K 60 15.50 22.50%
G 60 15.50 22.50%
A 56 17.00 15.00%
N 55 18.00 10.00%
I 48 19.00 5.00%
Q 45 20.00 0.00%
116
117
BAB IV
PENILAIAN KEGIATAN PRAKTIKUM KIMIA
Praktikum kimia merupakan bagian dari kegiatan pembelajaran kimia. Dan hampir
semua mata kuliah kimia diikuti dengan kegiatan praktikum di laboratorium. Tujuan
terpenting dari kegiatan praktikum tidak hanya mengajarkan bagaimana proses
kegiatan laboratorium yang benar, akan tetapi terletak pada bagaimana
kemampuan intelektual mahasiswa dapat berkembang dari kegiatan tersebut serta
bagaimana memperoleh pengalaman inkuiri seperti interpretasi data, membuat
hipotesis atau menguji hipotesis yang telah dibuat.
Menurut Pavelich dan Abraham (1977) tujuan terpenting dari kegiatan laboratorium
yang benar terletak pada bagaimana kemampuan intelektual peserta didik bisa
berkembang dari kegiatan tersebut, serta bagaimana peserta didik memperoleh
pengalaman inkuari seperti interpretasi data, membuat hipotesis, atau mengkaji
kebenaran hipotesis yang telah dibuat. Hal ini didukung oleh Kundberg (1993) yang
menyatakan bahwa kegiatan laboatorium atau praktikum bisa mendorong
perkembangan kemampuan penting diantara pengamatan yang mendetail,
pencatatan secara akurat, mendesain percobaan, analisis, statistik dan
pengoperasian alat. Kegiatan itu juga memberikan kesempatan kepada peserta
didik untuk belajar problem solving,metode ilmiah, teknik penelitian, dan
penggunaan literatur ilmiah. Lebih lanjut menurut Gott dan Duggan (1996)
praktikum memiliki tiga ranah yang saling berkaitan yaitu : (1) Aspek motivasional
yang akan mendorong minat dan keterampilan sosial, (2) penerapan pengetahuan
substantiv, dan (3) pengembangan keterampilan eksperimen. Winarno Surahmad
(1994) menyatakan bahwa kegiatan praktikum dalam kegiatan pendidikan adalah
sarana yang membiasakan peserta didik pada masalh-masalah nyata di dunia kerja.
Melalui kegiatan praktikum, siswa diharapkan memiliki keterampilan yang lebih
besar untuk berinisiatif dan mengembangkan diri. Berkaitan dengan tujuan
pembelajaran sains, maka Airasian (1994) menyatakan bahwa melalui kegiatan
praktikum, peserta didik diharapkan mampu mencapai tujuan pembelajaran sains
secara bersamaan yaitu berupa keterampilan kognitif, afektif dan psikomotorik.
Dalam hal ini aspek kognitif lebih menitikberatkan pada aspek kemampuan
menggunakan alat dan bahan, keterampilan afektif berupa belajar mandiri,
berinteraksi dan belajar saling menghargai.
118
tetapi lebih dari itu yaitu untuk mengembangkan proses berpikir dengan timbulnya
berbagai pertanyaan dan masalah. Pertanyaan-pertanyaan dan masalah-masalah
itu akan merangsang proses berpikir, sehingga kemampuan intelektual akan
meningkat kearah kemampuan intelektual tinggi yang oleh Piaget disebut sebagai
kemempuan berpikir formal. Seringkali permasalahan sekaligus pemecahan dalam
ilmu kimia berasal dari laboratorium. Konsep-konsep ilmu kimia kebanyakan berasal
dari percobaan-percobaan yang dikembangkan dari kegiatan laboratorium.
Jika kita amati secara seksama, hal di atas sangatlah mungkin terjadi, karena
proses pembelajaran praktikum apabila dilaksanakan dengan benar mencakup tiga
(3) aspek kemampuan secara bersamaan yaitu :
1. Ketrampilan Kognitif, mencakup :
a. Melatih agar teori dapat dimengerti
b. Agar segi-segi teori yang berlainan dapat diintegrasikan
c. Agar teori dapat diterapkan pada keadaan problem yang nyata.
2. Ketrampilan Afektif, mencakup :
a. Sikap ilmiah
b. Belajar merencanakan kegiatan secara mandiri
c. Belajar bekerja sama
d. Belajar menghargai bidangnya.
3. Ketrampilan Psikomotorik, mencakup :
a. Belajar memasang peralatan sehingga betul-betul dapat berjalan
b. Belajar memakai peralatan dan instrument tertentu.
119
Memang harus diakui kerja kelompok sangat bermanfaat, namun menimbulkan
kendala dalam penilaian nantinya. Dalam penilaian dimaksud dosen dituntut
melakukan pengamatan yang kontinu dan efektif untuk menilai individu dalam
kelompok. Nilai kelompok bukanlah otomatis menjadi nilai akhir bagi setiap anggota,
karena nilai kelompok bukanlah mencerminkan integritas kemampuan dan
ketrampilan dari setiap individu. Pada kerja kelompok dalam kegiatan laboratorium,
akan terlihat adanya kemampuan yang berbeda-beda diantara para anggota.
Kemampuan yang berbeda-beda itu antara lain: pemahaman konsep, aplikasi
konsep, ketelitian ketrampilan menggunakan alat dan lain sebagainya. Oleh karena
itulah dalam penilaian kegiatan laboratorium perlu dibedakan antara nilai kelompok
dengan nilai individu dalam kelompok.
Salah satu sumber data untuk penilaian dalam kegiatan laboratorium adalah
laporan. Laporan sebagai sumber data untuk penilaian hendaknya memiliki format
yang sistimatis, obyektif, ilmiah, komunikatif dan informatif. Sehingga kegiatan
menyusun laporan yang demikian tadi memberikan pembelajaran bagi
siswa/mahasiswa untuk menuangkan hasil kegiatan laboratorium dalam karya tulis
dengan bahasa yang baik dan benar, komunikatif, informatif, dan dapat
dipertanggung-jawabkan kebenarannya. Sehingga mahasiswa memperoleh
ketrampilan proses menulis laporan, berkomunikasi, yang pada akhirnya diharapkan
dapat menjadi sumber informasi yang lebih luas jakni bagi pengembangan ilmu
kimia. Dosen hendaknya menilai laporan praktikum bukan atas dasar penilaian
120
sekilas saja, tetapi sebelumnya dosen harus terlebih dahulu menetapkan aspek-
aspek apa saja yang akan dinilai dalam laporan tersebut selama mahasiswa
melakukan kegiatan laboratorium.
Bertolak pada asumsi laporan sebagai sumber data untuk penilaian dan dibuat
sebagai pembelajaran ketrampilan proses, maka penilaian laporan kegiatan
praktikum sebaiknya dilakukan dua kali. Pertama sebagai umpan balik kepada
siswa tentang kekurangan-kekurangan yang terdapat dalam laporan.Penilaian
kedua dilakukan setelah laporan itu diperbaiki, sehingga siswa mengetahui
kesalahan-kesalahannya dan dapat memperbaikinya.
Menilai mahasiswa yang bekerja sendiri secara individual tidaklah begitu sulit.
Setiap mahasiswa akan memperoleh nilai yang sesuai dengan penampilannya
sendiri. Akan tetapi menilai seorang individu mahasiswa yang bekerjasama dengan
beberapa temannya dalam kelompok sebagaimana lazimnya pada kegiatan
laboratorium akan menimbulkan kesulitan, apalagi jika kita ingin menilai lebih adil
dan obyektif.
121
Dalam satu kelas biasanya dosen membagi-bagi mahasiswa dalam beberapa
kelompok. Apabila satu kelompok telah selesai melakukan kegiatan laboratorium
tertentu, maka dosen akan memberi satu nilai tunggal untuk kelompok. Nilai
kelompok ini akan menjadi standar dalam menentukan nilai individu dalam
kelompok.
Selanjutnya untuk lebih jelasnya marilah kita perhatikan satu contoh kasus berikut
ini. Misalkan 4 orang mahasiswa yang terdiri dari A,B,C dan D bekerjasama dalam
satu kelompok melakukan satu kegiatan laboratorium tertentu. Setelah mereka
menyelesaikan seluruh kegiatan, misalkan dosen memberikan nilai “ baik “ ekivalen
angka 8 untuk seluruh kegiatan yang telah dilakukan mahasiswa (Persiapan : baik,
Pelaksanaan : baik, Hasil kegiatan umpamanya kristal bahan kimia : baik, Proses
dan Hasil diskusi : baik, Pelaksanaan tindak lanjut kegiatan : baik). Akan tetapi
secara individu bagaimanakah nilai masing-masing mahsiswa A,B,C dan D dalam
kegiatan tersebut? Apakah nilai mereka kita sama ratakan “baik”. Hal ini mungkin
bilamana kontribusi mahasiswa A=B=C=D selama melakukan kegiatan. Dalam
kenyataan sangat jarang terjadi kesamaan kontribusi seperti itu, sehingga
menyamaratakan nilai untuk masing-masing mahasiswa tidaklah adil dan obyektif.
Berkenaan dengan hal itu di bawah ini disajikan satu contoh sebagai salah satu
alternatif yang mungkin :
a. Nilai Kelompok
Untuk contoh di atas yang terdiri dari mahasiswa A,B,C dan D untuk setiap
jenis kegiatan, kelompok tersebut memperoleh nilai :
• Persiapan .........................baik.
• Pelaksanan kegiatan ....... baik.
• hasil kegiatan ................... baik.
• Diskusi ............................. baik.
• Tindak lanjut kegiatan ...... baik.
Nilai mahasiswa A di atas lebih adil, obyektif dan lebih dapat mencerminkan
performance A dalam melakukan kegiatan laboratorium. Dengan cara yang
sama dapat ditentukan nilai B,C dan D di dalam kelompoknya.
Oleh karena itu maka sering kita menyamaratakan saja nilai mahasiswa yang
melakukan kegiatan laboratorium secara berkelompok. Hal ini karena mereka
itu bekerjasama menulis satu laporan yang akan diserahkan kepada dosen.
Untuk memberi nilai yang dirasakan adil dan mendekati kebenaran dalam kerja
laboratorium yang dilakukan secara kelompok telah disampaikan contoh dan
bagaimana menilainya. Namun jika contoh tersebut dikaitkan dengan
kenyataan dilapangan, kita akan menghadapi beberapa masalah.
123
Masalah yang sering timbul dimaksud antara lain :
a. Dosen belum menetapkan aspek-aspek kemampuan apa saja yang perlu
dinilai selama mahasiswa melakukan kegiatan laboratorium.
b. Dosen tidak punya cukup waktu untuk mengamati semua aspek
performance yang ditampilkan oleh satu kelas (20 s/d 30 Mhs) yang
melakukan kegiatan praktikum laboratorium selama 2 s/d 3 jam.
c. Dosen sering memberi penilaian berdasarkan atas ingatan atau dari
catatan-catatan yang secara insidentil dibuat oleh dosen.
Adapun secara garis besarnya aspek-aspek kemampuan apa saja yang perlu
dinilai selama mahasiswa melakukan kegiatan laboratorium antara lain adalah :
a. Aspek Kognitif (pengetahuan) : yang termasuk kedalam aspek ini
misalnya : pemahaman konsep, menyimpulkan hasil.
b. Aspek Affektif (sikap) : yang termasuk aspek ini misalnya : disiplin kerja,
kreatifitas (berinisiatif), ketekunan, ketelitian, kejujuran, kerjasama,
kepemimpinan dan lain-lainnya.
c. Aspek Psikomotorik (keterampilan) : yang termasuk aspek ini misalnya
: ketrampilan menggunakan alat, ketelitian mengamati, mengukur dan lain
sebagainya.
124
Dengan adanya lembar pengamtan yang telah siap untuk dipakai ini, maka
akan diharapkan penilaian yang diberikan guru/dosen terhadap
siswa/mahasiswa berdasarkan ingatan atau catatan yang secara insidentil
dibuat dosen dapat ditanggulangi. Untuk sekedar contoh disajikan Lembar
Pengamatan Kegiatan Laboratorium untuk dapat dipergunakan dan
dikembangkan lebih lanjut.
KEPEMIMPINAN
SISTEMETIKAN
KEBERSIHAN
HASIL KERJA
KERJASAMA
KEAKTIFAN
DISIPLIN
JUMLAH
KERJA
NAMA KETERANGAN
Keterangan :
1. Rentangan nilai yang digunakan adalah 1,2, dan 3.
2. Pengisian kolom-kolom nilai hanya dengan memakai angka 1,2,3 sesuai
dengan kriteria yang telah ditentukan.
3. Nilai akhir dari mahasiswa :
1+2+3+4+5+6+7+8
= NILAI AKHIR
8
126
saja nilai mahasiswa yang melakukan kegiatan laboratorium secara berkelompok.
Hal ini karena mereka itu bekerjasama dalam menulis satu laporan yang akan
diserahkan kepada dosen.
Padahal bilamana kita perhatikan dengan seksama, laporan itu sendiri sebetulnya
bukanlah satu-satunya sumber data untuk penilaian. Walaupun kita menyadari akan
relevansinya laporan tersebut dengan penilaian, tetapi sangatlah tidak adil kiranya
bilamana hanyalah laporan saja yang digunakan sebagai sumber untuk penilaian.
Karena perlu dipertanyakan lebih lanjut apakah laporan tersebut mempunyai
muatan aspek-aspek kemampuan apa saja yang akan dinilai.
Jika kita telaah lebih detil penilaian terhadap kegiatan praktikum itu,tidak saja
diutamakan pada produk/hasil, tetapi juga pada prosesnya. Hal ini dikarenakan
kegiatan praktikum merupakan kegiatan yang menghubungkan aspek pengetahuan,
ketrampilan dan sikap. Penilaian aspek pengetahuan meliputi pemahaman konsep
yang terkait pada percobaan yang dilakukan. Sedangkan penilaian pada aspek
ketrampilan meliputi: ketrampilan dalam merangkai alat, ketrampilan kerja. Dan
ketelitian dalam memperoleh hasil. Sedangkan penilaian pada aspek sikap antara
lain mencakup tanggung jawab, kerapihan, dan kerja sama.
Sistem penilaian kegiatan praktikum meliputi beberapa aspek antara lain: menilai
kesiapan sebelum praktikum, proses di dalam praktikum, dan hasil dari praktikum.
Penilaian yang diberikan terhadap prestasi mahasiswa dapat digunakan sebagai
pedoman pemberian bimbingan yang tepat (penilaian formatif). Sebagai mana telah
dikemukakan pada uraian sebelumnya penilaian terhadap kegiatan praktikum, tidak
saja diutamakan pada produk, tetapi juga pada prosesnya. Hal ini disebabkan
kegiatan praktikum merupakan kegiatan yang menghubungkan aspek kognitif,
afektif, dan psikomotorik, maka penilaian yang harus dilakukan dapat meliputi ketiga
aspek tersebut.
Secara garis besar, kegiatan praktikum dapat dibagi menjadi tiga (3) tahap yaitu:
tahap kegiatan awal, tahap pelaksanan, dan tahap akhir kegiatan praktikum.
Masing-masing tahap kegiatan mempunyai karakteristik aspek kemampuan. Pada
tahap persiapan mencakup aspek kognitif dan afektif, tahap pelaksanaan mencakup
ketiga aspek kognitif, afektif, dan psikomotorik. Sedangkan pada tahap akhir
kegiatan praktikum mencakup aspek kognitif dan afektif.
127
1. Penilaian Tahap Awal Kegiatan Laboratorium
Penilaian pada tahap ini berhubungan dengan persiapan mahasiswa sebelum
melaksanakan praktikum, agar dapat mengikuti praktikum secara bermakna.
Aspek yang dinilai mencerminkan keadaan kognitif awal dari mahasiswa.
Menurut Bloom (1976), keadaan kognitif awal yaitu kondisi berupa
pengetahuan, ketrampilan, dan kompetensi yang dimilki seseorang diawal
proses belajarnya. Pengetahuan awal merupakan prasarat bagi mahasiswa
yang bersangkutan yang akan mengikuti proses belajar yang akan
dihadapinya. Jadi keadaan kognitif awal seorang mahasiswa yang akan
mengikuti kegiatan praktikum di laboratorium akan menentuan keberhasilannya
dalam mengikuti kegiatan praktikum.
Menurut Rusyam dkk (1989), pengetahuan awal mahasiswa terdiri dari tiga hal
yaitu:
a. Batas dan ruang lingkup pengetahuan yang dimiliki dan dikuasai
mahasiswa.
b. Tingkatan tahapan materi pengetahuan terutama kawasan pola
kemampuan (kognitif, afektif dan psikomotorik) yang telah dicapai dan
dikuasai oleh mahasiswa.
c. Kesiapan dan kematangan fungsi-fungsi psikofisik (proses kognitif)
mengamati, mengingat, berfikir efektif dan lain-lainnya.
128
aspek afektif yang meliputi kerapihan dan sistematika penulisan laporan.Pada
umumnya laporan tersebut dibuat atau disusun dalam format tertentu
sebagaimana lazimnya tulisan ilmiah atau penelitian ilmiah.
Format laporan biasanya terdiri dari :
a. Obyek praktikum.
b. Tujuan praktikum.
c. Perumusan masalah
d. Hipotesis
e. Rancangan dan prosedur eksperimen
f. Data
g. Kesimpulan.
129
Untuk lebih jelasnya berikut ini akan diberikan beberapa contoh :
Contoh 1 :
Penilaian Praktikum Kimia Organik.
I. Tujuan Pembelajaran :
Mahasiswa dapat melakukan destilasi
II. Kompetensi :
a. Mahasiswa dapat merangkai alat destilasi secara benar
b. Mahasiswa dapat menggunakan alat destilasi untuk memisahkan
campuran dan pemurnian.
c. Mahasiswa dapat membedakan karakteristik metode destilasi.
V. Teknik Penilaian
Penilaian dilakukan dengan alat bantu berupa lembar pengamatan penilaian.
Dosen/asisten memberikan tanda cek (V) pada kolom yang tersedia.
130
c. Jika melakukan kegiatan sesuai dengan pilihan c, maka mendapat nilai
kurang.
Aspek yang dinilai dalam kegiatan ini dan data pengamatan diperoleh melalui :
a. Aspek Kognitif
1) Pemahaman kerja
2) Sistematika kerja
b. Aspek Psikomotorik
1) Ketrampilan dasar
2) Merangkai alat’
3) Menggunakan alat
c. Aspek Afektif
1) Disiplin
2) Kritis
3) Kerja sama
b. Aspek Afektif
1) Sistematika laporan
2) Kerapihan
131
Lembar Pengamatan :
Contoh 2.
Penilaian Praktikum Kimia Organik.
I. Tujuan Pembelajaran :
Mahasiswa dapat melakukan pemurnian
II. Kompetensi :
a. Mahasiswa melaksanakan langkah-langkah pemurnian dengan benar
b. Mahasiswa dapat memilih pelarut secara tepat untuk proses kristalisasi.
c. Mahasiswa dapat melakukan pemurnian senyawa organik yang berbentuk
kristal.
d. Mahasiswa dapat melakukan uji kemurnian dengan menggunakan alat
penentuan titik leleh suatu senyawa (elektrothermal)
V. Teknik Penilaian
Penilaian dilakukan dengan alat bantu berupa lembar pengamatan penilaian.
Dosen/asisten memberikan tanda cek (V) pada kolom yang tersedia.
132
Keterangan pengisian skala penilaian adalah sebagai berikut :
a. Jika melakukan kegiatan sesuai dengan pilihan a, maka mendapat nilai
baik
b. Jika melakukan kegiatan sesuai dengan pilihan b, maka mendapat nilai
cukup
c. Jika melakukan kegiatan sesuai dengan pilihan c, maka mendapat nilai
kurang.
Aspek yang dinilai dalam kegiatan ini dan data pengamatan diperoleh melalui :
133
BAB V
PENILAIAN KETRAMPILAN PROSES
A. Pengertian
Dalam kegiatan pembelajaran selalu melibatkan guru disatu pihak dan peserta didik
dilain pihak. Sebagai seorang guru yang profesional, akan berusaha agar dalam
proses pembelajaran, siswanya mengalami proses belajar yang bermakna. Belajar
bermakna dapat tercapai jika dalam proses pembelajaran guru dapat
mengondisikan dan menyiapkan situasi yang menggiring peserta didik untuk
bertanya, mengamati, mengadakan eksperimen, dan menemukan fakta serta
konsep sendiri. Untuk mencapai hal tersebut, guru dituntut melaksanakan kegiatan
belajar mengajar dengan mengembangkan kemampuan-kemampuan atau
ketrampilan-ketrampilan dasar yang dimiliki anak-anak dididiknya. Belajar dengan
ketrampilan proses akan memberi peluang peserta didik untuk mengembangkan
ketrampilan-ketrampilan dasar yang dimiliki sekaligus mengembangkan sikap
ilmiah, dan sikap kritis.
Setiap manusia secara normal mengalami tumbuh kembang dari balita, kanak-
kanak, lalu remaja, pemuda dan menjadi manusia dewasa yang mandiri. Sebagai
manusia yang beragama, kita meyakini, ia dapat berkembang dari bayi hingga
dewasa yang mandiri karena dalam dirinya memiliki kemampuan-kamampuan,
ketrampilan-ketrampilan dan potensi-potensi yang sangat unik, dinamis dan tak
terbandingkan. Kemampuan/potensi yang dimiliki tersebut bukan berasal dari
ayahnya ataupun ibunya yang melahirkan akan tetapi anugerah dari Sang Pencipta
Tuhan Yang Maha Esa dan Maha Kuasa. Selanjutnya muncul pertanyaan yang
sangat mendasar, untuk apa kemampuan-kemampuan itu diberikan kepada
manusia? Jawabannya adalah ”kemampuan-kemampuan itu diberikan untuk
diaktualisasikan, dinyatakan, diberdayakan, dimerdekakan, dijadikan aktual,
dikembangkan, diasah terus menerus dan pada gilirannya kelak ia harus
mempertanggung jawabkan kepada Sang Pemberi”.
134
demikian, ketrampilan-ketrampilan itu menjadi roda penggerak penemuan dan
pengembangan fakta dan konsep serta penumbuhan dan pengembangan sikap dan
nilai. Seluruh irama gerak atau tindakan dalam proses belajar mengajar seperti ini
akan menciptakan kondisi cara belajar siswa aktif.(Cony dkk. 1985) Inilah
sebenarnya yang dimaksudkan dengan pendekatan proses.
Ada dua alasan mengapa kita mempelajari IPA. Pertama nilai intrinsik , yaitu yang
menenkankan IPA sebagai suatu kegiatan pendidikan, kedua nilai ekstrinsik yang
menekankan pemanfaatan IPA untuk IPA sendiri dan memenuhi kebutuhan
masyarakat. Jadi pengajaran IPA untuk teknologi, untuk perkembangan ekonomi
dan untuk memenuhi tuntutan pekerja-pekerja IPA, riset dan industri.
Kegiatan pembelajaran kimia sebagai bagian dari IPA, sudah barang tentu harus
mengacu pada kegiatan observasi dan eksperimentasi, kegiatan pembelajaran
yang demikian itu menuntut siswa belajar aktif. Melalui pendekatan ketrampilan
proses menuntut siswa harus aktif dalam proses pembelajaran kimia. Hal ini sangat
mungkin karena dalam kegiatan eksperimentasi siswa dilatih observasi,
mengumpulkan data, dan mengorganisasi data, mengumpulkan data (inference),
menyususn hipotesis, merancang eksperimen, menganalisa data, mengevaluasi
data dan menarik kesimpulan. Sedangkan dalam kegiatan observasi siswa dituntut
untuk terampil dngan menggunakan tangan dan seluruh indera dalam
memanipulasi (terampil menggunakan) alat-alat dan memperoleh data. Siswa
harus dapat membedakan mana fakta dan mana pendapat (opini), agar dalam
mengambil kesimpulan tidak keliru/salah.
135
Untuk dapat membedakan mana fakta dan mana opini berikut ini akan diberi
beberapa contoh :
C. Mengorganisasi data.
D. Berhipotesis.
Hipotesis adalah dugaan sementara yang digunakan atau dipakai sebagai pedoman
untuk memulai eksperimen yang kebenarannya masih akan diuji atau dibuktikan,
demikianlah kira-kira definisi dari hipotesa. Perlu untuk dipahami oleh guru,siswa
tidak hanya mengetahui apa itu hipotesis, tetapi yang lebih penting adalah siswa
dapat membuat hipotesis. Dalam hal ini yang penting bagi guru adalah menuntut
siswa dengan mengajukan pertanyaan-pertanyaan yang terkait dengan data yang
telah dikumpulkan dari observasi, mendiskusikan masalah yang muncul dari
observasi tersebut, selanjutnya meminta siswa mengajukan pendapatnya yang
diduga benar, dan yang sama-sama akan diuji kebenarannya.
136
DAFTAR PUSTAKA
137