Anda di halaman 1dari 19

EVALUASI PROSES DAN HASIL PEMBELAJARAN

KIMIA

“PENGUKURAN”

Disusun Oleh:

Kelompok : 9 ( Sembilan )

Nama : Siti Nurhasanah (06101281520062)

Msy. Wulandari (06101381520028)

Dwita Amalia (06101381520044)

Program Studi : Pendidikan Kimia Palembang

Dosen Pembimbing : Dr. Effendi Nawawi, M.Si

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN


UNIVERSITAS SRIWIJAYA
2018
A. Pengukuran dalam pendidikan

Pengukuran adalah penentuan besaran, dimensi, atau kapasitas, biasanya


terhadap suatu standar atau satuan pengukuran. Pengukuran tidak hanya terbatas
pada kuantitas fisik, tetapi juga dapat diperluas untuk mengukur hampir semua
benda yang bisa dibayangkan, seperti tingkat ketidakpastian, atau kepercayaan
konsumen.
Pengukuran adalah proses pemberian angka-angka atau label kepada unit
analisis untuk merepresentasikan atribut-atribut konsep. Proses ini seharusnya
cukup dimengerti orang walau misalnya definisinya tidak dimengerti. Hal ini
karena antara lain kita sering kali melakukan pengukuran.
Menurut Cangelosi (1995) yang dimaksud dengan pengukuran
(Measurement) adalah suatu proses pengumpulan data melalui pengamatan
empiris untuk mengumpulkan informasi yang relevan dengan tujuan yang telah
ditentukan. Dalam hal ini guru menaksir prestasi siswa dengan membaca atau
mengamati apa saja yang dilakukan siswa, mengamati kinerja mereka, mendengar
apa yang mereka katakan, dan menggunakan indera mereka seperti melihat,
mendengar, menyentuh, mencium, dan merasakan. Menurut Zainul dan Nasution
(2001) pengukuran memiliki dua karakteristik utama yaitu: 1) penggunaan angka
atau skala tertentu; 2) menurut suatu aturan atau formula tertentu.
Measurement (pengukuran) merupakan proses yang mendeskripsikan
performance siswa dengan menggunakan suatu skala kuantitatif (system angka)
sedemikian rupa sehingga sifat kualitatif dari performance siswa tersebut
dinyatakan dengan angka-angka (Alwasilah et al.1996). Pernyataan tersebut
diperkuat dengan pendapat yang menyatakan bahwa pengukuran merupakan
pemberian angka terhadap suatu atribut atau karakter tertentu yang dimiliki oleh
seseorang, atau suatu obyek tertentu yang mengacu pada aturan dan formulasi
yang jelas. Aturan atau formulasi tersebut harus disepakati secara umum oleh para
ahli (Zainul & Nasution, 2001). Dengan demikian, pengukuran dalam bidang
pendidikan berarti mengukur atribut atau karakteristik peserta didik tertentu.
Dalam hal ini yang diukur bukan peserta didik tersebut, akan tetapi karakteristik
atau atributnya. Senada dengan pendapat tersebut, Secara lebih ringkas, Arikunto
dan Jabar (2004) menyatakan pengertian pengukuran (measurement) sebagai
kegiatan membandingkan suatu hal dengan satuan ukuran tertentu sehingga
sifatnya menjadi kuantitatif.

1. Pengertian Daya Beda


Daya pembeda (item discriminination) adalah untuk menentukan dapat
tidaknya suatu soal membedakan kelompok dalam aspek yang diukur sesuai
dengan perbedaan yang ada dalam kelomppok itu. Indeks yang digunakan dalam
membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes
yang berkemampuan rendah. Indeks ini menunjukkan kesesuaian antara fungsi
soal dengan fungsi tes secara keseluruhan.
Mengetahui daya pembeda item itu penting sekali, sebab salah satu dasar
yang dipegang untuk menyusun butir-butir item tes hasil belajar adalah adanya
anggapan, bahwa kemampuan antara siswa yang satu dengan siswa yang lain itu
berbeda-beda, dan bahwa butir-butir tes hasil belajar itu haruslah mampu
memberikan hasil tes yang mencerminkan adanya perbedaan-perbedaan
kemampuan yang terdapat di kalangan siswa tersebut.
Angka yang menunjukkan besarnya daya pembeda disebut indeks
diskriminasi, disingkat D. Seperti halnya indeks kesukaran, indeks diskriminasi
(daya pembeda) ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks
kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi ada
tanda negatif.
Daya pembeda item itu dapat diketahui melalui atau dengan melihat besar
kecilnya angka indeks diskriminasi item. Angka indeks diskriminasi item adalah
sebuah angka yang menunjukkan besar kecilnya daya pembeda yang dimiliki oleh
sebutir item. Daya pembeda pada dasarnya dihitung atas dasar pembagian siswa
ke dalam dua kelompok, yaitu kelompok atas yakni kelompok yang tergolong
pandai, dan kelompok bawah, yaitu kelompok siswa yang tergolong bodoh.
Dalam hubungan ini, jika sebutir item memiliki angka indeks diskriminasi item
dengan tanda positif, hal ini merupakanmpetunjuk bahwa butir item tersebut telah
memiliki daya pembeda, dalam arti bahwa siswa yang termasuk kategori pandai
lebih banyak yang dapat menjawab dengan betul terhadap butir item yang
bersangkutan, sedangkan siswa yang termasuk kategori bodoh lebih banyak yang
menjawab salah.
Jika sebutir item angka indeks diskriminasinya = 0,00 (nihil), maka hal ini
menunjukkan bahwa butir item yang bersangkutan tidak memiliki daya pembeda
sama sekali, dalam arti bahwa jumlah siswa kelompok atas yang jawabannya betul
(atau salah) sama dengan jumlah siswa kelompok bawah yang jawabannya betul.
Jadi diantara kedua kelompok siswa tersebut tidak ada perbedaannya sama sekali,
atau perbedaannya sama dengan nol.
Adapun apabila angka indeks diskriminasi item dari sebutir item bertanda
negatif, maka pengertian yang terkandung didalamnya adalah, bahwa butir item
yang bersangkutan lebih banyak dijawab betul oleh siswa kelompok bawah
ketimbang siswa kelompok atas.

2. Pengertian Taraf Sukar


Asumsi yang digunakan untuk memperoleh kwalitas yang baik, disamping
memenuhi validitas dan reliabilitas adalah daya keseimbangan dari tingkat
kesulitan soal tersebut. Keseimbangan yang dimaksutkan adalah adanya soal-soal
yang termasuk mudah sedang dan sukar secara porposional. Tingkat kesukaran
soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawabnya,
bukan dilihat dari segi guru dalam melakukan analisis pembuat soal.
Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal
kategori mudah sedang dan sukar.Pertimbangan pertama adalah adanya
keseimbangan, yakni jumlah soal sama untuk ke tiga kategori tersebut. dan ke dua
proposi jumlah soal untuk ke tiga kategori tersebut artinya sebagian besar soal
berada dalam kategori sedang sebagian lagi termasuk kategori mudah dan sukar
dengan proporsi yang seimbang.
Perbandingan antara soal mudah sedang sukar bisa di buat 3-4-3. Artinya,
30% soal kategori mudah 40% soal kategori sedang dan 30% lagi soal kategori
sukar.
Di samping itu oleh karena suatu tes dimaksutkan untuk memisahkan antara
murid-murid yang betul-betul mempelajari suatu pelajaran dengan murid-murid
yang tidak mempelajari pelajaran itu, maka tes atau item yang baik adalah tes atau
item yang betul-betul dapat memisahkan ke dua golongan murid tadi. Jadi setiap
item disamping harus mempunyai derajat kesukaran tertentu, juga harus mampu
membedakan antara murid yang pandai dengan murid yang kurang pandai.
Setelah judgment dilakukan oleh guru kemudian soal tersebut di uji cobakan dan
dianalisis apakah judgment tersebut sesuai atau tidak.
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu
sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi
usaha pemecahannya. Sebaliknya soal yang terlalu sukar akan menyebabkan
siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi
karena diluar jangkauannya.
Seorang akan menjadi hafal akan kebiasaan gurunya dalam pembuatan
soal. Dengan kebiasaaan ini maka siswa akan belajar giat untuk menghadapi
ulangan dengan guru yang terbiasa memberikan soal sukar, sedangkan siswa akan
malas belajar bila akan ujian dengan guru yang terbiasa dengan soal ulangan yang
mudah-mudah.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut
dengan indeks kesukaran. Besarnya indeks kesukaran antara 0,00 sampai dengan
1,0. Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks
kesukaran 0,00 menunjukkan kalau soal itu terlalu sukar, sebaliknya indeks 1,0
menunjukkan bahwa soalnya terlalu mudah. Indeks kesukaran butir yang baik
berkisar antara 0,3-0,7 paling baik pada 0,5.
Dalam istilah evaluasi, indeks kesukaran ini diberi simbol P singkatan ari
proporsi. Dengan demikian maka soal dengan P = 0,70 lebih mudah jika
dibandingkan dengan P = 0,20. sebaliknya soal dengan P = 0,30 lebih sukar
daripada soal dengan P = 0,80.

3. Pengertian Bias Butir


Beberapa ahli memberikan batasan tentang bias butir, diantaranya Shepard
(Adams, 1992) dan Mazor et al. (1995). Suatu tes dikatakan bias jika dua orang
peserta tes dengan kemampuan yang sama dari kelompok yang berbeda tidak
memperoleh peluang menjawab benar yang sama. Anastasi dan Urbina (2001),
butir dikatakan bias apabila butir tersebut ditempuh oleh dua kelompok budaya
atau lebih yang memiliki kemampuan sama tetapi menunjukkan probabilitas
sukses yang berbeda dalam menjawab butir tersebut. Artinya, butir bias terlihat
dari respon peserta tes yang mempunyai kemampuan sama, tetapi tidak memiliki
peluang sama untuk memperoleh jawaban benar.
Bias butir merupakan salah satu ancaman terhadap validitas pengukuran
karena skor tercemar oleh sesuatu yang tidak direncanakan untuk diukur. Apabila
suatu butir relatif lebih sulit untuk kelompok yang memiliki budaya dan latar
belakang pengalaman tertentu berarti butir tersebut bias. Bias butir dalam suatu
pengukuran mengindikasikan adanya kesalahan sistematik dalam pengukuran
tersebut.
Dalam terminologi psikometri bias butir disebut Diferential Item Functioning
(DIF). DIF adalah perbedaan probabilitas sukses menempuh butir dari dua
kelompok yang berbeda setelah mengontrol tingkat kemampuan

4. Pengertian Responden Ability

Responden ability adalah pihak-pihak yang dijadikan sebagai sampel dalam


sebuah penelitian atau pengukuran. Subjek penelitian juga membahas
karakteristik subjek yang digunakan dalam penelitian, termasuk penjelasan
mengenai populasi, sampel dan teknik sampling (acak/non-acak) yang digunakan.
Subjek penelitian atau responden ability dapat terdiri dari tiga level, yaitu:

1. Mikro merupakan level terkecil dari subjek penelitian, dan hanya berupa
individu.
2. Meso merupakan level subjek penelitian dengan jumlah anggota lebih
banyak, misal keluarga dan kelompok.
3. Makro merupakan level subjek penelitian dengan anggota yang sangat
banyak, seperti masyarakat atau komunitas luas.

Peran subjek penelitian adalah memberikan tanggapan dan informasi terkait data
yang dibutuhkan oleh peneliti, serta memberikan masukan kepada peneliti, baik
secara langsung maupun tidak langsung.
B. Cara Mencari Daya Beda dan Taraf Kesukaran Suatu Item Soal
1. Daya Beda
Daya beda adalah kemampuan suatu item soal untuk membedakan antara
testee yang kurang pandai dengan testee yang lebih menguasai materi. Untuk
menentukan besarnya indeks daya beda, harus membedakan testee kelompok atas
dengan testee kelompok bawah, yaitu kelompok dengan nilai tertinggi dengan
kelompok dengan nilai terendah.
Rumus daya beda :

𝐵𝐴 𝐵𝐵
𝐷= −
𝐽𝐴 𝐽𝐵

Keterangan :
D = daya beda
JA = jumlah testee kelompok atas
JB = Jumlah testee kelompok bawah
BA = Jumlah testee kelompok atas yang menjawab pertanyaan dengan benar
BB = Jumlah testee kelompok bawah yang menjawab pertanyaan dengan benar

Misalkan kita ingin mencari daya beda dengan bank data soal seperti dibawah ini :

No Nama Butir Item

1 2 3 4 5 6 7 8 9 10 Tot

1 A 1 0 1 0 1 1 1 1 1 1 8
2 B 0 0 1 0 1 0 0 1 1 1 5

3 C 0 1 0 0 0 1 0 1 0 1 4
4 D 1 1 0 0 1 1 0 0 1 0 5
5 E 1 1 1 1 1 1 0 0 0 0 6
6 F 1 0 1 0 1 0 1 0 0 0 4
7 G 1 1 1 1 1 1 1 0 0 0 7

8 H 0 1 0 1 1 1 1 1 1 1 8
Untuk mencari daya bedanya, terlebih dahulu kita harus membedakan antara
kelompok atas dengan kelompok bawah (Kelompok dengan nilai tertinggi dengan
kolompok nilai terendah):

Subyek Total Skor (t) Ket

A 8
H 8
G 7 Kel. Atas
E 6
B 5
D 5
C 4 Kel. Bawah
F 4

Daya beda untuk item no.6 :

Subyek Total Skor (t) Ket jawaban

A 8 1
H 8 1
G 7 Kel. Atas 1
E 6 1
B 5 0
D 5 1
C 4 Kel. Bawah 1
F 4 0

D = 1 – 0,5
D = 0,5

Kualitas daya beda :


0,00 – 0,20 : Jelek
0,21 – 0,40 : cukup
0,41 – 0,70 : baik
0,71 – 1,00 : baik sekali

2. Taraf Kesukaran
Soal yang baik adalah soal yang disusun berdasarkan kaidah langkah –
langkah penyusunan tes. Oleh karena itu, suatu tes yang telah disusun masih harus
dibuktikan kembali sejauh mana kualitas soal tersebut. Salah satu kriteria yang
digunakan untuk menentukan kualitas sebuah soal itu baik atau tidak yaitu dengan
mencari taraf kesukaranya. Soal yang baik adalah apabila soal tersebut tidak
terlalu mudah dan tidak terlalu sukar.

Rumus indeks kesukaran :

𝐵
𝐼𝑛𝑑𝑒𝑘𝑠 𝐾𝑒𝑠𝑢𝑘𝑎𝑟𝑎𝑛 =
𝐽𝑆

B = banyaknya siswa yang menjawab soal benar


JS = jumlah peserta tes

Kualitas taraf kesukaran :


0,00 – 0,30 : sukar
0,31 – 0,70 : sedang
0,71 – 1,00 : mudah
C. KONSTRUKSI BUTIR SOAL
1. Konstruksi Butir Soal Uraian

a. Butir soal tipe jawaban melengkapi


Untuk memeperoleh butir soal tipe jawaban melengkapi yang baik, ada beberapa
petunjuk yang diharapkan membantu :

1. Konstruksilah butir soal yang mengukur hasil belajar yang penting saja. Hasil
belajar yang remeh (trivial) tidak perlu diujikan. Misalnya:
Lemah : jumlah bayi yang meninggal sebelum mencapai usia enam tahun di
kecamatan ini tahun lalu adalah…
Lebih baik : Di Kecamatan ini jumlah bayi yang meninggal sebelum mencapai
usia lima tahun dalam dua tahun terakhir adalah…..untuk setiap seribu penduduk.

2. Konstruksilah butir soal yang mengandung permasalahan yang bersifat spesifik.


Butir soal itu haruslah menjamin bahwa hanya peserta tes yang menguasai isi
pelajaran yang dapat menjawab soal itu dengan baik. Misalnya:
Lemah : Daun tembakau mengandung….
Lebih baik : Bahan yang berbahaya bagi kesehatan yang terdapat dalam daun
tembakau adalah….

3. Konstruksilah butir soal yang mengharuskan peserta member jawaban yang


secara faktual benar. Misalnya:
Lemah : Orang merokok akan….
Lebih Baik : Kebiasaan merokok akan menyebabkan penyakit….

4. Konstruksilah butir soal dengan menggunakan bahasa yang jelas, dan tidak
mengandung arti yang mendua. Misalnya:
Lemah : Ibukota Kuwait yang diduduki Irak adalah….
Lebih baik : Ibukota Kuwait adalah…

5. Bila yang ditanyakan menyangkut angka atau jumlah dari satu satuan tertentu,
maka sebaiknya nyatakan satuan tersebut dalam soal. Misalnya:
Lemah : Seorag anak umur 12 tahun sebaiknya setia hari minum susu….
Lebih baik : Seorang aak umur 12 tahu sebaiknya setiap hari minum susu …
gelas

6. Setiap butir soal sebaiknya hanya berisi satu jawaban yang harus dikerjakan
oleh peserta tes. Misalnya:
Lemah : Suatu propinsi dibagi menjadi beberapa …. Yang selanjutnya dibagi
lagi menjadi beberapa ….dan kemudian dibagi lagi menjadi beberapa …., dan
akhir unit terkecil disebut….
Lebih baik : Propinsi Jawa barat dibagi menjadi…. Kabupaten dan kota madya.

b. Butir soal tipe jawaban singkat

Berikut ini beberapa petunjuk untuk menulis butir soal jawaban singkat,
yang disertai contoh sederhana.

1. Perguakanlah kata-kata yang menutut jawaban yang singkat dan tertentu.


Jawaban itu haruslah satu kata satu frasa, sebuah angka, atau sebuah symbol.
Misalnya:
Lemah : Disebut apakah hewan pemakan hewan lain dan tumbuh-tumbuhan?
Lebih Baik : Termasuk klasifikasi apakah hewan pemakan hewan lain dn
tumbuh-tumbuhan?

2. Jangan sampai pertanyaan yang diajukan menjadi tes bahasa seangkan


maksudnya untuk menguji materi pelajaran lain. Misalnya:
Lemah : Apakah istilah yang digunakan untuk menanyakan kedatangan
Columbus ke Benua Amerika tahun 1942?
Lebih baik : Siapkah yang menemukan benua Amerika rahun 1942?

3. Untuk menanyakan istilah atau definisi sebaiknya digunakan kalimat Tanya


secara langsung . kalimat lain yang mendahului kalimat Tanya, yang dimaksudkan
untuk menjelaskan pertanyaan, acapkali mengakibatkan pertanyaan menjadi
kabur.
Misalnya:
Lemah : Setiap mahasiswa harus menaati peraturan sekoah. Ketaatan kepada
aturan sekolah itu dalam P4 apa namanya?
Lebih Baik : sikap yang menganjurkan memelihara kebersihan kelas sesuai
dengan sila keberapa dari pancasila?

4. Dalam menanyakan masalah perhitungan guru harus menentukan tingkat


ketepatan, terutama untuk angka decimal. Apakah cukup anga buat saja, atau
berapa angka dibelakang koma. Misalnya;
Lemah : Berapakah 10 : 6?
Lebih baik : Berapakah 10 : 6 (bulatkan sampai 2 angka dibelakang koma)?

5. Sebaiknya hanya satu jawaban untuk satu pertanyaan. Misalnya:


Lemah : Siapakah proklamator kemerdekaan Indonesia?
Lebih baik : Siapakah yang membacakan teks Proklamasi Kemerdekaan
Indonesia tanggal 17 Agustus 1945?

2. Konstruksi Butir Soal Pilihan Ganda

Berikut ini akan dikemukakan beberapa prinsip pokok dalam konstruksi butir soal
tipe pilihan ganda.
1) Saripati permasalahan harus ditempatkan pada pokok soal (stem).

Inti permasalahan dalam butir soal tersebut harus dicantumkan dalam


rumusan pokok soal, sehingga dengan membaca pokok soal, mahasiswa sudah
dapa menentukan jawaban sebelum dilajutkan membaca pilihan jawaban.
Persyaratan ini tidak berlaku bagi pengembangan butir soal kesusasteraan. Contoh
: Yang kurang baik.
Pulau Jawa adalah pulau yang….
A. Yang menghasilkan banyak minyak
B. Penduduk terpadat
C. Dijadikan objek wisata
D. Mendapat julukan pulau perca

Contoh : yang lebih baik


Pulau yang terpadat penduduknya di Indonesia adalah pulau…
A. Sumatera
B. Jawa
C. Kalimantan
D. Sulawesi

Contoh yang kedua lebih baik dari contoh yang pertama karena dengan membaca
pokok soal mahasiswa sudah medapatkan jawaban sebelum membaca pulihan A,
B, C dan D.

2) Hindari pengulangan kata-kata yang sama dalam pilihan. Peniadaan


pengulangan kata berarti menyangkut waktu menulis dan membaca serta
menghemat tempat.
Contoh : Yang kurang baik.
Pulau yang terpadat penduduknya di Indonesia adalah….
A. Pulau Sumatera
B. Pulau Jawa
C. Pulau Kalimantan
D. Pulau Sulawesi
Sebaiknya pada pilihan jawaban tidak diberi kata pulau.

3) Hindari rumusan kata yang berlebihan. Tidak selalu penjelasan terinci


mempermudah pengertian, justru dapat membingungkan dan mengaburkan
pengertian. Yang penting rumusan yang baik yang berisi, padat, dan jelas tanpa
kata-kata “kembang”.
Contoh : Yang kurang baik.
Kalau butir soal 2 ditambah rumusannya menjadi:
Pulau yang terpadat penduduknya di Indonesia sehingga sukar untuk
meningkatkan produksi pangan adalah pulau….
A Pulau Sumatera
B Pulau Jawa
C Pulau Kalimantan
D Pulau Sulawesi

Tambahan kata-kata “sehingga sukar untuk meningkatkan produksi pangan“


membuat pengertian pernyataan menjadi kabur , dan kalimat yang harus dibaca
lebih panjang.
4) Kalau pokok soal merupakan pernyataan yang belum lengkap, maka kata
atau kata-kata yang melengkapi harus diletakkan pada ujung pernyataan, bukan di
tengah-tengah kalimat. Contoh : Yang kurang baik.

Menurut De Bakey, ….adalah penyebab penyakit penyempitan pembuluh darah.


A. Cholesterol
B. Kelebihan berat
C. Merokok
D. Tekanan batin

Contoh : yang lebih baik


Menurut De bakey, penyakit penyempitan pembuluh darah disebabkan oleh….
A. Cholesterol
B. Kelebihan berat
C. Merokok
D. Tekanan batin

5) Susunan alternative jawaban yang dibuat teratur dan sederhana. Cara


menyusun alternative jawaban dibuat berderet dari atas ke bawah. Kalau yang
dideretkan itu terdidi dari satu kata, urutkan ke bawah dibuat berdasarkan
alphabet, kalau yang dideretkan bilangan, urutan ke bawah berdasarkan bilangan
yang makin bertambah besar atau makin menurun, atau diurutkan berdasarkan
panjang kalimat.

6) Hindari penggunaan kata-kata teknis atau ilmiah atau istilah yang aneh atau
mentereng. Perlu diingat bahwa tes yang dikembangkan bertujuan untuk
mengukur materi pelajaran, kalau materi tersebut tidak menyangkut
perbendaharaan, janganlah menggunakan istilah teknik atau aneh. Contoh : Yang
kurang baik.
Apakah kritik utama ahli psikologi terhadap tes?
A. Tes menimbulkan ancienty
B. Tes selalu disertai cultural bias
C. Tes hanya mengukur hal-hal yang trivial
D. Tes tergantung pada kemampuan kognitif guru
Contoh : yang lebih baik
Apakah kritik utama ahli psikologi terhadap tes?
A. Tes menimbulkan rasa cemas
B. Tes sangat tergantung ada nilai budaya tertentu
C. Tes mengukur hasil belajar yang tidak penting
D. Tes sangat ditentukan oleh pengetahuan guru

7) Semua pilihan jawaban harus homogeny dan tidak dimungkinkan sebagai


jawaban benar. Cirri khas pilihan ganda dari tes objektif yang lain pada pilihan
ganda semua laternatif jawaban ada kemungkinan sebagai jawaban yang benar,
sehingga mahasiswa terpaksa membaca dan memikirkan semua pilihan dan
menentukan yang mana yang paling tepat untuk menjawab pertanyaan tersebut.
Hindari pengecoh yang dengan melihat sepintas siswa sudah dapat menentukan
pengecoh tersebut tidak ada sangkutannya dengan pokok soal atau pengecoh
tersebut adalah jawaban yang tidak masuk akal.

Contoh : Yang kurang baik.


Siapakah diantara nama-nama di bawah ini yang menemukan telepon?
A. Bell
B. Marconi
C. Morse
D. Pasteur
Pilihan jawaban D. Pasteur tidak ada sangkut pautnya dengan pertanyaan.

Contoh : yang lebih baik


Siapakah di antara nama-nama di bawah ini yang menemukan telepon?
A. Bell
B. Marconi
C. Morse
D. Edison
8) Hindari keadaan dimana jawaban yang benar selalu ditulis lebih panjang
dari jawaban yang salah. Ada kecenderungan siswa memilih jawaban yang lebih
panjang dan lebih terinci sebagai jawaban yang benar. Oleh karena itu, penulis
soal berusaha agar pengecoh dan jawaban yang benar ditulis sama panjang dengan
rincian yang sama pula.

9) Hindari adanya petunjuk/ indikator pada jawaban yang benar.


Contoh : Yang kurang baik.
Agar air panas dalam teko tidak cepat dingin, maka teko tersebut dibungkus
dengan….

A. Kain
B. Seng
C. Tembaga
D. Timah

Pilihan B,C, dan D termasuk logam, A bukan logam. Dalam contoh ini A jawaban
yang benar, ada petunjuk bahwa A lain dari 3 pilihan berikutnya.
Contoh : yang lebih baik
Air pnas akan bertahan panas jika disimpan dalam bejana yang terbuat dari…
A. Aluminium
B. Keramik
C. plastic
D. seng

10) Hindari menggunakan pilihan yang berbunyi “semua diatas benar” atau
“tidak satupun yang diatas benar”. Adanya pilihan semacam ini sebenarnya
mengurangi jumlah alternatif pilihan, karena kalau siswa sudah mengenal satu
atau dua diantara empat pilihan sebagai jawaban pilihan ketiga siswa tersebut
akan memilih “semua jawaban di atas benar”. Hal yang sama berlaku untuk “tidak
satupun yang diatas benar”.
11) Gunakan tiga atau lebih alternatif pilihan.

12) Pokok soal diusahakan tidak menggunakan ungkapan atau kata-kata yang
bermakna tidak tentu, misalnya: kebanyakan, sringkali, kadang-kadang dan
sejenisnya.
Contoh : Yang kurang baik.
Kebanyakan hewan hidupnya di dalam air, brnafas dengan….
A. Insang
B. Kulit
C. Paru-paru
D. Insang dan paru-paru

Contoh : yang lebih baik


Berudu bernafas dengan….
A. Insang
B. Kulit
C. Paru-paru
D. Insang dan paru-paru

13) Pokok soal sedapat mungkin dalam pernyataan atau pernyataan positif. Jika
terpaksa menggunakan negative maka kata negative tersebut digaris bawahi atau
ditulis tebal.
Contoh : Yang kurang baik.
Pada semua tumbuhan yang berhijau daun, fotosintesis tidak akan terjadi tanpa….
A. Udara, tanah, dan air
B. Cahaya, udara, dan tanah
C. Air, cahaya, dan udara
D. Air tanah, dan cahaya

Contoh : yang lebih baik


Pada semua tumbuhan yang berhijau daun, fotosintesis akan terjadi bila
terdapat…
A. Udara, tanah, dan air
B. Cahaya, udara, dan tanah
C. Air, cahaya, dan udara
D. Air tanah, dan cahaya
DAFTAR PUSTAKA

Arikunto, S & Jabar. 2004. Evaluasi Program Pendidikan. Jakarta: Bumi Aksara

Calongesi, J.S. 1995. Merancang Tes untuk Menilai Prestasi Siswa. Bandung :
ITB

http://restoe-ibu.blogspot.co.id/2012/01/cara-mencari-daya-beda-dan-taraf.html

Tayibnapis, F.Y. 2000. Evaluasi Program. Jakarta: Rineka Cipta

Zainul & Nasution. 2001. Penilaian Hasil belajar. Jakarta: Dirjen Dikti.

Anda mungkin juga menyukai