Makalah
Disusun untuk memenuhi tugas Mata Kuliah Evaluasi Pendidikan biologi
Dosen Pengajar: 1. Prof. Dr. Nuryani Y. Rustaman, M.Pd
2. Dr. Ana Ratna Wulan, M.Pd
Oleh
Didi Nur Jamaludin 1103321
Supriyadi 1103875
PENDIDIKAN BIOLOGI
SEKOLAH PASCASARJANA
UNIVERSITAS PENDIDIKAN INDONESIA
2012
A. Pendahuluan
Dalam proses pendidikan di tingkat sekolah, faktor guru memegang peran
penting dalam menciptakan pembelajaran yang bermutu dan bermakna. Terdapat tiga
tugas utama guru dalam proses pembelajaran, yaitu (1) membuat persiapan
pembelajaran, (2) melaksanakan kegiatan belajar mengajar, dan (3) melakukan
evaluasi pembelajaran dan memanfaatkan umpan balik (Rustaman, 2005:7). Ketiga
tahapan tersebut merupakan satu kesatuan, saling tergantung, saling berpengaruh, dan
memiliki tingkat kepentingan yang sama dalam mencapai tujuan pembelajaran.
Evaluasi merupakan komponen penting dari proses pembelajaran dantelah
ditetapkanstandar nasional tentang tuntutan bahwa guru harus memiliki kemampuan
dalam mengevaluasi siswa. Meskipun seorang guru telah memiliki pengetahuan dan
keterampilan mengajar, pengetahuan tentang evaluasi merupakan syarat dalam
mengindikasi pembelajaran yang efektif.Kemampuan guru dalam menilai belajar
siswa akan memiliki dampak besar pada seberapa baik siswa berhasil. Menurut Hitam
dan Wiliam (1998), penilaian kelas dilakukan secara teratur, bila dilakukan
menggunakan praktek-praktek yang sehat, memiliki hasil positif pada prestasi siswa.
NSES mendefinisikan asesmen sebagai suatu proses sistematik dan variatif
yang meliputi pengumpulan data yang berperan untuk umpan balik dalam Pendidikan.
Lebih lanjut Faichhney memberikan pengertian asesmen merupakan suatu proses yang
membantu guru untuk memahami prestasi, penampilan dan perkembangan siswa
(NRC:1996)
Evaluasi hasil belajar dalam pembelajaran IPA lebih tepat jika dimaknai
sebagai asesmen.Asesmen lebih sesuai karena sejalan dengan hakikat IPA sebagai
proses, produk, dan nilai, sehingga yang diukur tidak hanya hasil belajar tetapi juga
proses belajar.Asesmen merupakan proses penting karena hasilnya dapat digunakan
untuk merencanakan pengajaran, memandu belajar siswa, menentukan tingkat/urutan,
membuat perbedaan, menentukan untuk pendidikan lanjut, pengembangan teori
pendidikan, merumuskan kebijakan, mengalokasikan sumberdaya, dan mengevaluasi
kurikulum (NRC, 1996:76). Oleh karena itu asesmen perlu direncanakan,
dilaksanakan, dan dianalisis dengan baik sehingga berfungsi sebagaimana mestinya.
tergolong low achievers dari pada peserta didik yang biasa. Umpan balik yang
diberikan dalam proses asesmen formatif mempunyai pengaruh substansial dan
signifikan kepada peserta biasa dan peserta didik low achievers. Asesmen formatif
terutama dapat memperbaiki 3 bidang, yaitu: (1) belajar efektif, (2) mengurangi
akibat negatif dari belajar, (3) peran manajerial belajar.
Bila fokus belajar di sekolah dipusatkan kepada budaya rewards, maka peserta
didik akan terbiasa mengejar angka atau nilai tinggi ketimbang memperbaiki budaya
belajar. Karena itu maka dalam pembelajaran yang terpenting ialahmenanamkan
budaya berhasil (a culture of success), bukan budaya nilai tinggi. Dalam hal ini
asesmen formatif dapat menjadi alat yang efektif.Penerapan asesmen formatif untuk
meningkatkan proses, hasil dan standar pendidikan, yaitu:(1) umpan balik dalam
asesmen formatif (peserta didik, guru) (2) Swa asesmen (self assessment).
Komponen utama umpan balik antara lain: (a) mengingatkan peserta didik
akan tujuan yang ingin dicapai, (b) Kenyataan yang dicapai oleh peserta didik. Upaya
memberikan umpan balik efektif (oleh guru), dapat dilakukan dengan berbagai strategi
antara lain: (1) Dengan memfasilitasi swa asesmen setiap siswa untuk melakukan
refleksi diri; (2) mendorong terjadinya dialog antar teman, antarsiswa dan antara guru
dengan siswa; (3) memberikan gambaran kepada setiap siswa tentang kinerja yang
dianggap bermutu; (4)
dengan kinerja yang diharapkan; (5) merespon kebutuhan siswa; (6) didasarkan pada
kriteria dan standar yang tetap, agar siswa dapat menetapkan langkah untuk
mencapainya secara konsisten pula; (7) mendorong motivasi belajar dan pembentukan
kepercayaan diri kepada tiap siswa.
Manfaat
merupakan nilai interinsik proses pembelajaran. Swa asesmen juga suatu aspek
pendidikan untuk menanamkan kepribadian yang mampu melakukan self control.
Secara psikologis, pengendalian diri itu akanterbentuk bila peserta didik dapat
melakukan internal locus of control pada diri mereka. Keuntungan belajar swa
asesmen antara lain dapat membelajarkan siswa: (a) bertanggung jawab atas proses
belajarnya sendiri; (b) mampu menetapkan langkah berikutnya dalam belajar; (c)
dapat bangkit kembali, walau mengalami kegagalan; (d) menjadi pembelajar yang
percaya diri; (e)
Kelemahan
berhubungan dengan situasi bermasalah. Sementara iru, Gamire dan Pearson (2006)
menyatakan bahwa kemampuan untuk mengasesmen terdiri tiga komponen.
Komponen-komponen ini adalah pengetahuan tentang asesmen, keterampilan berpikir
kritis dan asesmen reflektif, dan kemampuan dalam penggunaan pengetahuan konten
untuk memecahkan masalah praktis yakni mengases,mengevaluasi, dan meningkatkan
pembelajaran siswa.
Dalam pendidikan IPA, kemampuan dalam melakukan asesmen meliputi
pemahaman tentang fungsi, tujuan dan prinsip asesmen yang berkualitas. Asesmen
berfungsi untuk mengestimasi tingkat prestasi siswa setelah diberikan suatu pengaruh
pendidikan dan lingkungan, (Faisal dalam Rustaman,-:-). Sementara, menurut
Terrence Croocks (dalam Moss) asesmen berfungsi memandu siswa untuk : (1)
menilai apayang penting dipelajari; (2) mengetahui minat serta motivasi belajarnya;
(3) menilai kemampuan belajarnya; (4) mengembangkan strategi belajar (5) menilai
keterampilan yang dimilikinya; (6) merencanakan waktu belajarnya.
Asesmen asesmen harus diperhatikan prinsip-prinsip asesmen yang baik yakni
kondisi lingkungan asesmen yang konstruktif dan positif. Prinsip-prinsip tersebut
terdiri dari:
1. Pemikiran yang jelas dan komunikasi efektif; Meskipun tingkat pencapaian sering
kali diterjemahkan menjadi skor, ada dua fakta penting yang perlu dipahami. Pertama,
angka bukanlah satu-satunya cara untuk menyatakan pencapaian. Kita dapat
memanfaatkan kata-kata, gambar, ilustrasi, contoh, dan berbagai cara lainnya. Kedua,
simbol untuk menyatakan pencapaian siswa sama bermaknanya dan sama bergunanya
dengan definisi pencapaian dan kualitas penilaian yang digunakan untuk
menghasilkannya.
2. Guru yang memegang peranan; Guru berperan mengarahkan penilaian untuk
menentukan apa yang harus dipelajari oleh siswa dan apa yang siswa rasakan
berkaitan dengan penilaian yang dilakukan. Dalam berbagai konteks pendidikan, hasil
penilaian tingkat kotamadya/kabupaten, provinsi, nasional seolah-olah dianggap
sebagai satu-satunya hasil penilaian yang menentukan. Penilaian ini bahkan tidak
dapat disamakan dengan dengan penilaian kelas yang dilakukan oleh guru, berkaitan
dengan dampaknya terhadap keadaan siswa. Gurulah yang menentukan bagaimana
bentuk interaksi yang dilakukan dengan siswanya, rata-rata sebanyak satu kali setiap
dua atau tiga menit (mengajukan pertanyaan dan menginterpretasikan jawaban,
mengamati kinerja siswa, memeriksa pekerjaan rumah, menggunakan tes dan kuis).
Umumnya, penilaian dalam kelas berlangsung secara terus menerus.Dengan
demikian, jelas bahwa penilaian kelas adalah penilaian yang paling mudah dilakukan
oleh guru. Tidak perlu diragukan lagi, guru adalah pengendali sistem penilaian yang
menentukan keefektifan sekolah.
3. Siswa sebagai pengguna yang harus diperhatikan; Siswa adalah pihak yang paling
memanfaatkan hasil penilaian. Melalui penilaian kelas, mereka dapat mempelajari
kinerjanya serta mempelajari standar kualitas kinerjanya dari guru. Tidak seorang
pun, selain siswa, yang dapat memanfaatkan menggunakan hasil penilaian kelas yang
dilakukan oleh guru untuk menetapkan apa yang dapat mereka harapkan dari diri
mereka sendiri. Siswa dapat memperkirakan peluang keberhasilannya berdasarkan
kinerja yang ditunjukkan oleh hasil penilaian sebelumnya. Tidak ada satu keputusan
lain yang dapat memberikan pengaruh lebih besar pada keberhasilan siswa.
4. Sasaran yang jelas dan sesuai;Kita tidak dapat menilai hasil pendidikan secara
efektif jika kita tidak mengetahui dan memahami apa sebenarnya nilai keluaran
tersebut. Ada berbagai jenis keluaran dari sistem pendidikan kita, mulai dari
penguasaan materi sampai kemampuan menyelesaikan masalah yang kompleks.
5. Penilaian yang baik; Penilaian yang baik merupakan suatu keharusan dalam setiap
konteks penilaian. Lima standard yang harus dipenuhi untuk mencapai penilaian yang
baik meliputi: sasaran pencapaian yang jelas, maksud/tujuan yang jelas, metode yang
sesuai, kinerja contoh yang layak, pembatasan, dan adanya upaya untuk mencegah
kesalahan pengukuran.
6. Perhatian terhadap dampak
antarpersonal;
Kita
harus
selalu
berusaha
adalah
kemampuannya untuk menjadikan siswa sebagai mitra penuh dalam proses penilaian.
Siswa yang mampu mendalami sasaran pencapaian secara menyeluruh mampu secara
7
percaya diri melakukan evaluasi, baik terhadap hasil kerjanya sendiri maupun hasil
kerja temannya.Tantangan yang kita hadapi dalam penilaian kelas adalah memastikan
bahwa siswa memiliki seluruh informasi yang diperlukannya, dalam bentuk yang
mudah dipahami, pada waktu yang tepat sehingga dapat digunakan secara efektif.
Asesmen yang baik hendaknya memenuhi standar spesifik asesmen berkualitas
yang terdiri dari (a) target yang jelas dan tepat; (b) tujuan asesmen yang jelas; (c)
metode yang sesuai dengan target dan tujuan; (d) penentuan sampel yang tepat; dan (e)
pencegahan atau minimalisir terhadap bias dan eror dalam menilai.
Sejalan dengan uraian diatas, asesmen dikatakan baik jika memenuhi
pesyaratan tes:
1. Validitas; Anderson (dalam Arikunto, 2008; 65) A test is valid is measure what it
purpose to measure atau dapat artikan sebuah tes dikatakan disebut valid, jika dapat
tepat mengukur apa yang hendak diukur.
2. Reliabilitas; Tes yang reliabel (dapat dipercaya), jika memberikan hasil yang tetap
apabila diteskan berkali-kali. Anderson (dalam Arikunto, 2008; 87) A reliable
measure in one that provides consistent and stable indication of the characteristic
being investigated.
3. Objektivitas; Tes yang baik harus bersifat objektif, tidak ada unsur pribadi
(subjektivitas) yang mempengaruhi. Arikunto (2008) faktor yang mempengaruhi
subjektivitas.
4. Bentuk tes; Tes yang berbentuk uraian akan memberikan peluang untuk memberikan
penilaian subjektif, oleh karena itu dalam mengvaluasi tes perlu rentangan derajat
skor dalam item soal uraian.
5. Penilai; Subjektivitas penilai akan dapat mempengerahi secara leluasa terutama
dalam bentuk tes uraian, seperti faktor kesan terhadap siswa, tulisan, bahasa,
kelelahan dsb, untuk menghindari hal tersebut maka penilai dalam melakukan
evaluasi pertama secara kontinuitas (terus menerus) dalam arti bisa dilakukan lebih
dari 2 kali dan komprehensip yakni menyeluruh isi materi, aspek berpikir dan teknik
tes yang diguakan.
6. Praktibilitas (Practicability); Tes dikatakan memiliki praktibilitas yang tinggi,
apabila bersifat praktis dan mudah pengadminstrasian termasuk mudah dilaksanakan,
mudah pemeriksaan dan dilengkapi petunjuk yang jelas.
7. Ekonomis; Tes yang baik tidak terlalu membutuhkan biaya yang terlalu mahal,
tenaga yang banyak dan waktu yang lama.
Sejalan dengan perkembangan pendidikan, peranan dan pelaksanaan asesmen
mengalami perubahan dari asesmen pendidikan masa lalu ke asesmen pendidikan
masa sekarang yakni sebagai berikut:
Tabel 2. Perkembangan pendidikan, peranan dan pelaksanaan asesmen mengalami
perubahan dari asesmen pendidikan masa lalu ke asesmen pendidikan masa
sekarang
Peranan
Guru
Siswa
Kepala Sekolah
Pelaksanaan
Tujuan
Penggunaan
Dulu
Mengajar
Sekarang
Mendefinisikan hasil pembelajaran,
mengajar, melaksanakan penilaian
utama
Dinilai
Menginterpretas
i hasil ujian
terstandard
Dulu
Sekarang
Akuntabilitas
Penyaringan
hasil pengujian
dari atas ke
bawah
Akuntabilitas, pembelajaran
Penyaringan hasil pengujian dari
atas ke bawah dan dari kelas ke atas
Sasaran
Bersifat umum
Tidak terbuka
Sangat terarah
Bersifat terbuka
Metode
Terutama berupa
respon terpilih
Tabel 3 Perubahan fokus yang terjadi pada standar penilaian berdasarkan National
Science Education Standard in the United States
Hal yang dikurangi
Menilai yang mudah diukur
Menilai pengetahuan
memiliki ciri yang jelas
yang
Menilai pengetahuan
berstruktur baik
Menilai pengetahuan
bersifat ilmiah
yang
Menilai untuk
dipahami siswa
yang
mempelajari
kaya
apa
dan
yang
Pengembangan
penilaian
eksternal hanya oleh ahli
4. Jenis Validitas
Tes yang jika dapat digunakan untuk mengukur tujuan tertentu, maka tes tersebut
dikatakan valid. R.L. Thondrike dan H.P Hagen (1977 dalam Arifin, 2009) mengatakan
validity is always in relation to a spesific decesion or use. Sugiyomo (2011; 350)
validitas internal instrumen berupa tes harus memneuhi validitas kontruksi dan validitas
isi, jika instrumen untuk mengukur sikap cukup menggunakan validitas kontruksi. Jenis
validitas yang dikembangkan Arikunto (2008) sebagai berikut.
a. Validas logis
Tes yang valid, secara logis sesuai dengan aturan yang telah ditentukan, misalnya soal
yang lazim digunakan untuk jenjang SMP secara logis sesuai dengan materi SMP,
kecuali jika digunakan untuk kepentingan seleksi khusus olimpiade. Semua alat
evaluasi, soal harus tersusun secara validitas logis.
b. Validitas empiris
Tes yang valid secara pengalaman (empiris) sudah teruji. Validitas empiris meliputi
empat hal berikut.
1. Validitas isi (content validity)
Tes dikatakan mempunyai validitas isi, jika dapat mengukur isi materi dan tujuan
pembelejaran. Soal objektif maupun soal uraian dapat dapat dilakukan validitas isi
oleh pakar ahli melaui judment. Seorang guru biologi jika akan memastikan soal
untuk diagnostik peserta didik maka harus meninjau validitas isi.
2. Validitas kontruksi (construct validity)
Tes memiliki validitas kontruksi, apabila butir-butir soal dapat mengukur aspek
berpikir siswa. Seorang guru biologi jika memberikan soal postes untuk
diagnostik peserta didik maka harus meninjau validitas kontruksi. Antara validitas
isi dan kontruksi, keduanya saling berkaitan
11
Nomor soal:
N
o
Jenis soal:
Aspek yang ditelaah
ya
tidak
A. Materi
Soal sesuai dengan indikator
Batasan pertanyaan dan jawaban yang diharapkan jelas
Isi materi sesuai dengan tujuan tes
Isi materi sesuai dengan jenjang sekolah
B. Kontruksi
5
Ada petunjuk soal tentang menjawab soal
6
Ada pedoman penskoran
7
Gambar, grafik, label, diagram dan sejenisnya disajikan dengan
jelas dan terbaca
C. Bahasa
8
Rumusan soal komunikatif
9
Rumusan soal tidak menggunakan kata yang menimbulkan
penafsiran ganda
10 Rumusan soal tidak menggunakan negatif ganda
11 Menggunakan bahasa baku
Catatan;
1
2
3
4
2. Validitas
Sebuah instrumen dikatakan valid apabila valis secara logis, isi, empiris, prediksi,
sehingga dapat mengungkapkan data dari variabel yang diteliti secara tepat. Sebuah tes
dapat diukur tingkat kevalidan dengan meggunakan teknik korelasi product moment yang
ditemukan oleh Pearson dengan rumus sebagai berikut:
a. Korelasi product moment dengan simpangan
rxy=
xy
( x 2 )( y 2)
Keterangan:
rxy
= koefisien korelasi antara variabel X dan variabel Y, dua variabel yang
dikorelasikan (x= X-Xrata-rata dan y= Y-Yrata-rata)
xy = jumlah perkalian skor item dan skor total
x2 = jumlah kuadrat skor item
y2 = jumlah kuadrat skor total
b. Korelasi product moment dengan angka kasar
13
rxy=
N XY X Y
[ N X ( X ) ] [N Y
2
(Y ) ]
Keterangan:
rxy
= koefisien korelasi tiap item
N
= banyaknya subjek uji coba
X = jumlah skor item
Y
= jumlah skor total
X2 = jumlah kuadrat skor item
Y2 = jumlah kuadrat skor total
XY = jumlah perkalian skor item dan skor total
Penafsiran nilai koefisien korelasi dapat menggunakan dua cara:
a. Mengacu pada standar koefesien korelasi, yang dijelaskan pada tabel 5.
Tabel 5. Interval koefesien korelasi
Interval rxy
0,00 rxy 0,20
0,20 < rxy 0,40
0,40 < rxy 0,60
0,60 < rxy 0,80
0,80 < rxy < 0,10
Kriteria
sangat rendah
Rendah
Cukup
Tinggi
sangat tinggi
pbi =
MpMt
St
P
q
Keterangan:
pbi
= koefisien korelas biseral
Mp = rerata skor dari subjek yang menjawab betul bagi item yang dicari
validitasnya
Mt
= rerata skor total
St
= Standar deviasi dari skor total
p
= proporsi siswa yang menjawab benar (p = banyaknya siswa yang benar)
14
3. Reliabilitas
Alat instrumen evaluasi untuk dapat digunakan sebagai alat ukur yang dapat
dipercaya, harus memiliki nilai reliabel, sehingga ketika akan digunakan mempunyai
ukuran yang konsisten. Anastasi (1976 dalam Arifin, 2009) reliability refers to the
consistency of score obtained by the same persons when reexamined the same test on
different occasion or white different sets of equivalent items or under other variable
exmining conditions. Arikunto (2008) menjelaskan cara mengukur reliabilitas soal,
dengan menggunakan tiga teknik;
a.
Tes tipe I
80
50
60
90
Tes tipe II
83
53
62
94
15
b.
n
S2 pq
)(
)
n1
S2
Keterangan:
r11 = reliabilitas tes secara keseluruhan
p
= proporsi siswa yang menjawab benar
q
= proporsi siswa yang menjawab salah (q =1 p)
pq = jumlah hasil perkalian antara p dan q
n
= banyaknya item
S
= standar deviasi dari tes (standar deviasi adalah akar dari varians)
Kriteria reliabel soal tes dapat dianalisis dengan cara membandingkan r11 dengan
harga rtabel yang sesuai pada tabel harga produk moment maka dikatakan soal yang
16
diujikan reliabel. Harga r11 yang diperoleh diinterpretasikan dengan derajat reabilitas
pada tabel 7 dibawah ini.
Penafsiran nilai koefisien korelasi dapat menggunakan dua cara:
1). Mengacu pada standar koefesien korelasi, yang dijelaskan pada tabel 6.
Tabel 7. Interval reliabilias (r11)
Interval r11
0,00 r11 0,20
0,40
0,20 dari
< r11 Arikunto
0,40 < r11 0,60
2).
0,60 < r11 0,80
0,80 < r11 dapat
0,10
Kriteria
sangat rendah
Rendah
Cukup
Tinggi
sangat tinggi
Diadaptasi
(2008)
r11
soal yang diujikan reliabel. rtabel product moment dengan =5%. Jika r11 > rtabel
maka alat ukur dikatakan reliabel.
2. Penggunaan rumus K-R 21
M (nM )
n
r 11=
( 1
)
2
n1
nSt
( )
Keterangan;
M = rerata skor total
S 2t
= standar deviasi total
3. Penggunaan rumus Spearman-Brown.
Analisis reliabilitas menggunakan rumus speraman-brown, dikenal dengan metode
belah dua (split half method) yakni dengan dua cara membelah butir soal, 1)
membelah item-item genap dan item-item ganjil, 2) membelah item nomor awal da
akhir, sehingga agar dapat membelah butir soal harus genap. Oleh karena itu indek
korelasi menunjukan hubungan dua belahan instrument, adapun rumusnya sebagai
berikut.
17
2 xr1 1
r 11=
22
(1+ r 1 1 )
22
r1 1
22
atau r ganjil-genap
(Arikunto, 2002)
belahan, seringkali menunjukan hasil yang berbeda, jika hasilnya negatif maka menunjukan
tes yang tidak reliabel dan jika hasilnya positif maka dapat diukur dengan menggunakan
indeks reliabelitas. Oleh karena itu dalam menggunakan penelitian, kita dapat menggunakan
salah satu teknik yang dipandang dapat menghasilkanhasil yang lebih baik.
4. Penggunaan rumus Flanagan
Teknik menggunakan rumus Flanagan, dapat dilakukan dengan teknik dua belahan
gajil dan genap seperti halnya rumus speraman-brown. Rumus Flanagan sebagi
berikut.
V xV
r 11=2(1 1 2 )
Vt
dimana V =
( X )
N
N
Keterangan:
V1 = varians beahan pertama (varians skor butir-butir ganjil)
V2 = varians belahan kedua (varians skor butir-butir genap)
Vt = varians total (Arikunto, 2002).
5. Penggunaan rumus Rulon
Teknik menggunakan rumus Flanagan, dapat dilakukan dengan teknik dua belahan
gajil dan genap seperti halnya rumus speraman-brown. Rumus Flanagan sebagi
berikut.
r 11=1
Vd
Vt
Keterangan:
Vd = varians different
d
= skor belahan awal dikurangi skor belahan akhir (Arikunto, 2002).
Penggunaan rumus Alpha
Penggunaan rumus Alpha, secara khusus untuk mengukur reliabilitas soal dalam
6.
1. Menentukan gradien penilaian tiap item soal, misalnya soal 1, penskoran antara
0-5, soal 2 penskoran antara 0-10 dst.
2. Menghitung koefisien korelasi dengan menggunakan rumus alpha;
2
r11
n
(
)(1 2 1 )
( n1)
1
dimana
( X )2
N
N
Keterangan:
r11 = reliabilitas yang dicari
21 = jumlah varians skor setiap item soal
21
A
B
C
D
E
F
G
H
I
J
Skor total
Kuadrat skor
total
2704
961
1521
1296
324
900
961
1296
1086
784
11836
10
6
8
7
0
2
4
5
5
3
50
6
4
2
3
5
4
3
5
5
6
43
8
4
6
7
3
2
6
5
4
3
48
8
6
8
7
2
8
6
7
6
4
62
10
6
7
6
4
6
6
7
8
6
66
10
5
8
6
4
8
6
7
5
6
65
52
31
39
36
18
30
31
36
33
28
334
328
201
264
418
458
451
2120
Jumlah
Jumlah
kuadrat
Diketahui
= 7,8;
2
= 1,61;
= 3,36;
4 = 3,36 5
= 2,24;
4. Tingkat kesulitan
Tingkat kesulitan bisanya digunakan untuk menganalisa soal jenis objektif. Soal
yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu sulit, soal yang terlalu
mudah akan menyebabkan peserta didik tidak dapat merangsang berfikit tingkat tinggi,
sedangkan soal yang terlalu sulit akan menyebabkan siswa berputus asa. Sriyati (2012)
menuturkan keseimbangan tingat kesulitan mengacu pada kurva normal yakni 30%
mudah, 50% sedang dan 20% sulit. Keseimbangan tingkat kesulitan pada prinsipnya
mengacu pada tujuan tes, jika tes tersebut digunakan untuk menseleksi kompetisi
olimpiade mata pelajaran, maka bisa saja proporsi tigkat kesulitan bisa diterapkan hingga
diatas 75%.
Analisa tingkat kesulitan, dapat dijadikan dalam penyusunan soal, seperti soal
yang mudah akan menjadi lebih baik jika diposisikan di awal soal, mengingat soal yang
mudah dapat meningkatkan motivasi siswa untuk mengerjakan soal. Analisis pokok uji
dapat dilakukan dengan mengukur tingkat kesulitan soal, sebagai berikut.
B
JS
Keterangan:
P = indek kesulitan
B = banyaknya siswa yang menjawab benar.
JS = jumlah seluruh siswa peserta tes.
P
Kriteria
0,00 P 0,30
0,30 < P 0,70
0,70 < P 1,00
Sulit
Sedang
Mudah
20
dengan mengacu pada nilai yang diperoleh berdasarkan tes. Rumus yang digunakan
untuk mencari daya pembeda sebagai berikut.
DP=
BA BB
=PAPB
JA JB
Keterangan:
DP
JA
JB
BA
BB
PA
PB
=
=
=
=
=
=
=
daya pembeda
banyaknya peserta kelompok atas
banyaknya peserta kelompok bawah
banyaknya peserta kelompok atas yang menjawab benar
banyaknya peserta kelompok bawah yang menjawab benar
proporsi peserta kelompok atas yang menjawab benar
proporsi peserta kelompok bawah yang menjawab benar
Kriteria
Jelek
Cukup
Baik
Baik sekali
* Diadaptasi dari Arikunto (2008).
pada
21
Contoh analisis sebuah item soal tipe pilihaan ganda (multiple choice), sebagai
berikut. Diketahui jumlah siswa 60, kunci jawaban ada di pilihan D, pada table 9 berikut.
Tabel 9. Analisis item soal
Pilihan jawaban
Kelompok atas
Kelompok bawah
Jumlah
A
5
8
13
B
6
11
17
C
3
8
11
D*
16
3
19
Jumlah
30
30
60
Tes uraian memiliki keunggulan dalam menggali pengetahuan peserta didik, namun
dalam melakukan penilaian memiliki kesulitan yang lebih tinggi dibandingkan tes
objektif dan kecenderungan bersifat subjektif, oleh karena itu perlu cara untuk
mencari solusi atas kesulitan dan subjektivitas penilaian, sebagai berikut:
1. Menyusun bentuk uraian objektif
Pensokoran bentuk uraian objektif, biasanya digunakan dalam penskoran jawaban
uraian yang singkat. Skor hanya ditentukan 2 kategori yakni benar diberi skor 1,
diberi salah skor 0, misalnya jawaban uraian berupa mitokondria, jika benar skor1
dan jika salah skor 0.
2. Menyusun bentuk uraian non objektif
Dalam penskoran soal uraian non objektif, skor dijabarkan dalam bentuk
rentangan, besarnya rentangan
jawaban. Misalnya penjelasan tahapan glikolisis rentangan skor 1-10, dengan isi
jawaban meliputi reaksi enzimatis, pembentukan air dan subtrat, pembentukan
ATP dan NADPH. Guru dapat menilai soal dengan mengacu pada kelengkapan
jawaban sol uraian.
3. Pendekatan metode pengoreksian
a. Metode per lembar, yakni guru mengoreksi soal uraian pada tiap lembar dari
soal nomor awal sampai soal akhir. Keunggulan metode tersebut memerlukan
waktu yang lebih cepat, tinjauan biaya lebih murah, namun kelemahannya
penilaian skor antara peserta didik satu dengan yang lainnya cenderung
berbeda pada kualitas jawaban yang sama, sehingga untuk mengatasinya perlu
menyusun bentuk uraian objektif maupun uraian non objektif yang sudah
dijelaskan sebelumnya.
b. Metode per nomor, yakni guru mengoreksi soal uraian pada tiap nomor untuk
seluruh peserta didik, sebagai contoh guru mengoreksi nomor 1 untuk seluruh
peserta didik, kemudina dilanjutkan nomor 2 untuk seluruh peserta didik dan
seterusnya. Keunggulan metode tersebut akan sangat membantu dalam
memberikan skor dan membandingkatan jawaban antara peserta didik, namun
kekurangannya membutuhkan waktu yang lebih lama dibandingkan metode per
lembar.
c. Metode bersilang, yakni guru mengoreksi jawaban peserta didik dengan jalan
hasil koreksi dari satu korektor, kemudian dikoreksi (dinilai) ke korektor
lainnya. Keunggulan metode tersebut faktor subjektif bisa dikurangi namun
23
kelemahnnya membutuhkan waktu lebih lama dan tenaga yang lebih banyak.
Metode bersilang dianjurkan dalam penilaian untuk kepentingan yang bersifat
selektif, misalnya dalam penentuan tingkat peserta didik.
d. Point method merupakan metode pengkoreksian jawaban dibandingkan dengan
jawaban ideal yang telah ditetapkan dalam kunci jawaban, sehingga penskoran
sangat bergantung dengan tingkat kepadanan. Metode tersebut sangat tepat
digunakan untuk uraian terbatas.
e. Rating method yaitu setiap jawaban peserta didik ditetapkan dalam salah satu
kelompok yang sudah dipilah-pilah berdasarkan kualitasnya, misalnya sebuah
soal akan diberi skor antara 0-10, metode ini seperti penyusunan bentuk uraian
non objektif, sehingga tepat digunakan pada soal uraian soal uraian bebas
b. Pengembangan tes bentuk objektif
Tes bentuk objektif memiliki keunggulan mudah dikoreksi dan unsur objektifnya
lebih kuat dibandingkan soal uraian, sehingga siapapun yang mengoreksi maka akan
sama hasilnya. Perkembangan teknologi juga ikut membantu penilaian tes objektif
dalam sistem komputerisasi, sehingga aplikasinya sering digunakan misalnya tes
seleksi perguruan tinggi, tes toefl, tes CPNS. Kelemahan tes bentuk objektif
dimungkinkan unsur jawaban spekulasi menjadi benar dan jawaban peserta didik
terbatas sehingga belum bisa mengeksplor pengetahuan peserta didik lebih luas. Oleh
karena itu perlu meragamkan bentuk tes pilihan ganda diantaranya sebagai berikut:
1. Pilihan ganda (multiple choice)
Pilihan ganda merupakan jenis soal yang sering digunakan, karena memiliki
keunggulan diantaranya 1) mudah dikoreksi, 2) memiliki pengecoh (distraktor
yang banyak, 3) pengukuran untuk validitas dan reliabelitas lebih mudah.
Implimentasi dalam tes yang standar digunakan dalam proses pembelajaran
hendaknya memperhatikan hal-hal sebagai berikut:
a. Petunjuk soal jelas, meliputi teknis pengisian, waktu pelaksanaan dsb.
b. Bahasa dalam soal pilihan ganda standar baku.
c. Jika ada gambar, tabel atau bagan tersusun jelas dan komunikatif.
d. Memiliki komposisi soal yang mudah, sedang dan sulit. Soal yang mudah
hendaknya diletakan urutan bagian depan, karena dapat memotivasi peserta
didik dalam menjawab soal, namun jika soal sulit kecenderungan siswa
motivasi akan menurun khususnya bagi peserta didik dengan prestasi
golongan lower.
24
e. Pola jawaban soal tidak mengarahkan membentuk pola seperti jawaban no 1-5
kunci jawaban AAAAA dan kunci jawaban no 6-10 BBBBB, karena dapat
membantu spekulasi jawaban peserta didik.
f. Penggunaan soal negatif, sebaiknya diberi tanda khusus dengan bercetak tebal
seperti kecuali atau ditulis miring kecuali, untuk memperhatikan kejelasan
pada peserta tes.
g. Tidak menggunakan negatif ganda, karena akan menjadi kesulitan peserta
didik dalam memahami soal. Contoh soal pertanyaan negatif ganda sebegai
berikut. Organela sel yang tidak telibat langsung dalam sintesis protein
kecuali, jika disusun pertanyaan yang tepat maka kata negatif cukup satu
saja.
Soal pilihan ganda untuk kepentingan penelitian menyusunan tes sangat perlu
diperhatiakan validitas, reliabelitas, tingkat kesukaran, daya pembeda dan
pengecoh, sehingga dalam penyusunan
pola
25
b.
A.
B.
C.
D.
E.
Uji Benedik
Uji Fehling
Uji Biuret
Uji lemak
26
n
I
++++
+++
+
+
II
++++
++
+
+++
III
++
++
++
++
IV
+
++++
+
Keterangan:
tanda positif (+) menunjukan kadar tingkat senyawa tertentu dan
tanda negatif (-) menunjukan tidak ada senyawa tertentu
Pilihan makanan yang tepat sesuai dengan hasil uji makanan diatas adalah:
A. I
B. II
C. III
D. IV
E. I dan III
Jawaban D, karena uji biuret merupakan uji protein. Makanan yang mengandung
banyak protein pada makanan IV
f. Pertanyaan berkaitan dengan susunan dengan pernyataan yang tidak lengkap,
contoh.
Proses peredaran darah.
1. Darah masuk ke serambi kiri
2. Darah dari vena kava inferior menuju serambi kanan
3. Darah dipompa dari bilik kanan menuju paru-paru
4. Darah di pompa dari bilik kiri ke aorta
5. Darah melewati vena pulmonalis
6. Darah melewati arteri pulmonalis
Urutan peredaran darah dari darah yang banyak CO2
menjadi darah
banyak O2 adalah
A. 1-2-6-5-4-1
B. 5-4-6-5-1-4
C. 2-3-5-6-4-1
D. 2-3-6-5-1-4
E. 5-3-6-5-1-4
Jawaban D
2. Menjodohkan (Matching)
Soal tipe menjodohkan memiliki persamaan dengan soal tipe pilihan ganda yakni
pada memilih jawaban yang tepat, namun yang membedakan dua tipe tersebut
pada soal tipe menjodohkan soal berada pada kolom khusus dan jawaban berada
pada kolom khusus, jumlah jawaban biasanya melebihi jumlah soal dengan tujuan
sebagai pengecoh (distractor), berikut contohnya.
27
kelompok B
a. mitokondia
b. paru-paru
c. alveolus
d. osmosis
e. difusi
f. emfisema
g. asidosis
h. golgi
i. tekanan besar
j. tekanan kecil
28
DAFTAR PUSTAKA
Arifin, Zaenal. (2009). Evaluasi Pembelajaran. Bandung: PT Remaja Rosdakarya.
Arikunto, S. (2002). Prosedur Penelitian suatu Pendekatan Praktek. Edisi V. Jakarta:
Rineka Cipta
___________(2008). Dasar-Dasar Evaluasi Pendidikan (edisi revisi). Jakarta: PT Bumi
Aksara.
NRC.(1996). National
Academic Press
Science
Education
Standards.Washington:
National
Press
Sriyati, Siti. (2012). Bahan Ajar Pembelajaran Analisis Pokok Uji. Bandung: UPI. Tidak
diterbitkan. [on line] at http://ebookbrows.com. (10 Februari 2012)
Stiggins, R.J. (1994). Student-centered Classroom Assessment. New York: Macmillan
College Publishing Company.
Sugiyono. (2007). Statistika untuk Penelitian. Bandung: Alfabeta.
29