Anda di halaman 1dari 30

LITERASI ASESMEN DAN ANALISIS POKOK UJI

Makalah
Disusun untuk memenuhi tugas Mata Kuliah Evaluasi Pendidikan biologi
Dosen Pengajar: 1. Prof. Dr. Nuryani Y. Rustaman, M.Pd
2. Dr. Ana Ratna Wulan, M.Pd

Oleh
Didi Nur Jamaludin 1103321
Supriyadi 1103875

PENDIDIKAN BIOLOGI
SEKOLAH PASCASARJANA
UNIVERSITAS PENDIDIKAN INDONESIA
2012

A. Pendahuluan
Dalam proses pendidikan di tingkat sekolah, faktor guru memegang peran
penting dalam menciptakan pembelajaran yang bermutu dan bermakna. Terdapat tiga
tugas utama guru dalam proses pembelajaran, yaitu (1) membuat persiapan
pembelajaran, (2) melaksanakan kegiatan belajar mengajar, dan (3) melakukan
evaluasi pembelajaran dan memanfaatkan umpan balik (Rustaman, 2005:7). Ketiga
tahapan tersebut merupakan satu kesatuan, saling tergantung, saling berpengaruh, dan
memiliki tingkat kepentingan yang sama dalam mencapai tujuan pembelajaran.
Evaluasi merupakan komponen penting dari proses pembelajaran dantelah
ditetapkanstandar nasional tentang tuntutan bahwa guru harus memiliki kemampuan
dalam mengevaluasi siswa. Meskipun seorang guru telah memiliki pengetahuan dan
keterampilan mengajar, pengetahuan tentang evaluasi merupakan syarat dalam
mengindikasi pembelajaran yang efektif.Kemampuan guru dalam menilai belajar
siswa akan memiliki dampak besar pada seberapa baik siswa berhasil. Menurut Hitam
dan Wiliam (1998), penilaian kelas dilakukan secara teratur, bila dilakukan
menggunakan praktek-praktek yang sehat, memiliki hasil positif pada prestasi siswa.
NSES mendefinisikan asesmen sebagai suatu proses sistematik dan variatif
yang meliputi pengumpulan data yang berperan untuk umpan balik dalam Pendidikan.
Lebih lanjut Faichhney memberikan pengertian asesmen merupakan suatu proses yang
membantu guru untuk memahami prestasi, penampilan dan perkembangan siswa
(NRC:1996)
Evaluasi hasil belajar dalam pembelajaran IPA lebih tepat jika dimaknai
sebagai asesmen.Asesmen lebih sesuai karena sejalan dengan hakikat IPA sebagai
proses, produk, dan nilai, sehingga yang diukur tidak hanya hasil belajar tetapi juga
proses belajar.Asesmen merupakan proses penting karena hasilnya dapat digunakan
untuk merencanakan pengajaran, memandu belajar siswa, menentukan tingkat/urutan,
membuat perbedaan, menentukan untuk pendidikan lanjut, pengembangan teori
pendidikan, merumuskan kebijakan, mengalokasikan sumberdaya, dan mengevaluasi
kurikulum (NRC, 1996:76). Oleh karena itu asesmen perlu direncanakan,
dilaksanakan, dan dianalisis dengan baik sehingga berfungsi sebagaimana mestinya.

Keberhasilan asesmen sangat tergantung pada pengetahuan dan keterampilan guru


dalam memilih dan mengembangkan jenis asesmen dalam mengukur kompetensi
siswa, sehingga, pemahaman tentang prinsip dasar asesmen yang berkualitas harus
dipahami oleh guru agar dapat melakukan asesmen terhadap siswa secara tepat.
Dalam melakukan asesmen harus memperhatikan hal penting untuk menjamin
kualitas soal atau instrumen yang digunakan dalam menilai, yakni penggunaan analisis
pokok uji. Analisis pokok uji merupakan serangkaian proses pengujian perangkat
asesmen dengan tujuan: (a) sebagai upaya memperbaiki atau meningkatkan kualitas
tes; (b) mengidentifikasi soal yang baik, kurang baik dan jelek; (c) mendiagnostik
kemampuan siswa; (d) mengevaluasi pelaksanaan pembelajaran untuk menjadi lebih
baik (Rustaman: 2007)
Makalah ini menyajikan uraian mengenai literasi asesmen dan analisis pokok uji
yang merupakan dasar pengetahuan dalam mengembangkan perangkat asesmen
khususnya dalam pembelajaran IPA.
B. Asesmen Formatif dan Asesmen Sumatif
Michael Scriven (1981) mengutip pendapat Bob Shake:
tastes the soup, thats formative; when

When the cook

the guests taste the soup, thats

summative.Asesmen tumbuh dan berkembang menjadi bagian penting dari proses


pendidikan secara keseluruhan. Asesmen sebagai bagian keseluruhan langkah proses
pendidikan, sama pentingnya dengan langkah lain dalam proses pembelajaran
(Rustaman:2012).
1. Asesmen Formatif
Hasil (20) penelitian yang direviu menunjukkan inovasi, termasuk peningkatan
pelaksanaan asesmen formatif, peningkatan hasil belajar secara substansial dan
signifikan. Typical effect sizes dari eksperimen asesmen formatif berkisar antara 0.4
dan 0,7 yang berarti asesmen formatif berpengaruh sangat besar terhadap gain hasil
belajar. Perbaikan pada asesmen formatif

lebih membantu peserta didik yang

tergolong low achievers dari pada peserta didik yang biasa. Umpan balik yang
diberikan dalam proses asesmen formatif mempunyai pengaruh substansial dan
signifikan kepada peserta biasa dan peserta didik low achievers. Asesmen formatif

terutama dapat memperbaiki 3 bidang, yaitu: (1) belajar efektif, (2) mengurangi
akibat negatif dari belajar, (3) peran manajerial belajar.
Bila fokus belajar di sekolah dipusatkan kepada budaya rewards, maka peserta
didik akan terbiasa mengejar angka atau nilai tinggi ketimbang memperbaiki budaya
belajar. Karena itu maka dalam pembelajaran yang terpenting ialahmenanamkan
budaya berhasil (a culture of success), bukan budaya nilai tinggi. Dalam hal ini
asesmen formatif dapat menjadi alat yang efektif.Penerapan asesmen formatif untuk
meningkatkan proses, hasil dan standar pendidikan, yaitu:(1) umpan balik dalam
asesmen formatif (peserta didik, guru) (2) Swa asesmen (self assessment).
Komponen utama umpan balik antara lain: (a) mengingatkan peserta didik
akan tujuan yang ingin dicapai, (b) Kenyataan yang dicapai oleh peserta didik. Upaya
memberikan umpan balik efektif (oleh guru), dapat dilakukan dengan berbagai strategi
antara lain: (1) Dengan memfasilitasi swa asesmen setiap siswa untuk melakukan
refleksi diri; (2) mendorong terjadinya dialog antar teman, antarsiswa dan antara guru
dengan siswa; (3) memberikan gambaran kepada setiap siswa tentang kinerja yang
dianggap bermutu; (4)

memperkecil kesenjangan antara kenyataan kinerja siswa

dengan kinerja yang diharapkan; (5) merespon kebutuhan siswa; (6) didasarkan pada
kriteria dan standar yang tetap, agar siswa dapat menetapkan langkah untuk
mencapainya secara konsisten pula; (7) mendorong motivasi belajar dan pembentukan
kepercayaan diri kepada tiap siswa.
Manfaat

swa asesmen proses pembelajaran adalah bahwa swa asesmen

merupakan nilai interinsik proses pembelajaran. Swa asesmen juga suatu aspek
pendidikan untuk menanamkan kepribadian yang mampu melakukan self control.
Secara psikologis, pengendalian diri itu akanterbentuk bila peserta didik dapat
melakukan internal locus of control pada diri mereka. Keuntungan belajar swa
asesmen antara lain dapat membelajarkan siswa: (a) bertanggung jawab atas proses
belajarnya sendiri; (b) mampu menetapkan langkah berikutnya dalam belajar; (c)
dapat bangkit kembali, walau mengalami kegagalan; (d) menjadi pembelajar yang
percaya diri; (e)

menjadi pembelajar yang aktif dalam proses pembelajaran; (f)

menjadi lebih independen dan bermotivasi tinggi.

Swa asesmen di lingkungan sekolah dikatakan efektif apabilaproses swa


asesmen mendapat dukungan dan tuntunan dari manajemen dan pimpinan sekolah.
Pimpinan dan manajemen sekolah harus pula memberikan dukungan yang berbeda
untuk setiap siswa sesuai dengan kebutuhan siswa (karena hakekat swa asesmen
beragam setiap siswa). Kemajuan peserta didik dalam melakukan swa asesmen
senantiasa dimonitor, sehingga secara terukur dapat dilihat adanya perbaikan dan
kemajuan.Capaian standar nasional oleh setiap individu siswa haruslah menjadi tolok
ukur bagi manajemen dan siswa sehingga secara terukur dapat dilihat capaiannya.
Pimpinan dan manajemen sekolah dapat menunjukkan suatu proses swa asesmen
yang dapat dicontoh oleh siswa. Pihak sekolah juga melibatkan pihak luar (orang tua,
masyarakat atau pimpinan dinas pendidikan di daerahnya) untuk memperkuat proses
swa asesmen siswa.
2. Asesmen sumatif.
Asesmen sumatif bentuk penilaian yang mengukur outcome belajar siswa yang
dilaksanakan setelah proses pembelajaran. Asesmen formatif memiliki kelebihan dan
kelemahan antara lain:
Tabel 1. Asesmen formatif memiliki kelebihan dan kelemahan
Kekuatan

Kelemahan

Sangat dibutuhkan untuk menentukan


nilai akhir siswa

Membuat ketergantungan yang berlebihan


pada hasil asesmen sumatif

Dapat meningkatkan akuntabilitas guru /


program / sekolah

Dapat meningkatkan berbagai upaya yang


tidak benar hanya untuk mencapai hasil
asesmen sumatif yang tinggi

Dapat digunakan untuk menentukan


efektifitas proses pembelajaran.

Dapat mendorong guru untuk melakukan


pendidikan untuk tes / pembelajaran
tentang tes

Dapat memotivasi keterlibatan peserta


didik dalam proses pembelajaran

Tidak banyak informasi yang dapat


dipetik untuk perbaikan pembelajaran.

Dapat meningkatkan penguasaan materi


pembelajaran peserta didik

Peserta menjadikan tes sebagai tujuan


belajar, bukan perubahan tingkah laku
untuk menghadapi masa depan.
4

Pelaksanaan asesmen sumatif dapat memberikan informasipenting antara lain:


(1) informasi tentang tingkat penguasaan (mastery) oleh siswa dalam mata pelajaran
tertentu; (2) sebagai dasar bagi membandingkan hasil belajar siswa dengan kelompok
norma atau kriteria kinerja eksternal; (3) alat untuk menentukan keefektifan proses
pembelajaran yang telah dilakukan; (4) informasi obyektif sebagai dasar memberikan
nilai akhir; (5) data komparatif untuk menentukan kedudukan siswa; (6) alat untuk
menentukan tanggung jawab guru dan sekolah tentang proses belajar siswa; (7)
informasi spesifik tentang isi pembelajaran yang dapat dipakai sebagai dasar bagi
orang tua / guru di pendidikan berikutnya; (8) informasi diagnostik tentang kekuatan
dankelemahan kinerja siswa; (9) data untuk menentukan tingkat capaian program atau
kriteria capaian standar dalam kurikulum (Rustaman:2012)
C. Literasi Asesmen
Literasi asesmen merupakan kemampuan dalam memahami prinsip-prinsip
dasar asesmen yang berkualitas, dan bertindak sesuai tujuan pembelajaran yang
dirancang

dengan mengupayakan penggunaan yang seimbang berbagai asesmen

alternatif. Selanjutnya semua asesmen tersebut digunakan sebagai pemandu dalam


mengambil keputusan dan sebagai alat bantu mengajar (teaching tools) untuk
memanusiakan peserta didik (Stiggins,1994:8). Orang yang mampu melakukan
penilaian dan memahami prinsip dasar penilaian disebut assessment literates.Literasi
asesmen juga mencakuppengetahuan tetang seberapa sering asesmen dilakukan, apa
yang harus diases, dan bagaimana mempersiapkan siswa untuk diases.
Pentingnya literasi asesmen ditekankan oleh Heritage (2007:141), yang
menyatakan, "Para guru belajar bagaimana mengajar tanpa belajar banyak tentang
bagaimana menilai". Lebih lanjut, Stiggins (2004:16) menegaskan bahwa seperempat
sampai sepertiga waktu guru semestinya digunakan untuk penilaian terkait proses
pembelajaran. Oleh karena itu, guru harus mengetahui dan memahami prinsip-prinsip
penilaian.
Kemampuan untuk mengases diri sendiri dan orang lain membutuhkan
pemikiran kritis danreflektif. Menurut King dan Kitchener (1994) perbedaan antara
pemikiran kritis dan reflektif bahwa berpikir kritis berfokus pada logika induktif atau
deduktif, sedangkan berpikir reflektif berfokus pada asumsi tentang pengetahuan yang
5

berhubungan dengan situasi bermasalah. Sementara iru, Gamire dan Pearson (2006)
menyatakan bahwa kemampuan untuk mengasesmen terdiri tiga komponen.
Komponen-komponen ini adalah pengetahuan tentang asesmen, keterampilan berpikir
kritis dan asesmen reflektif, dan kemampuan dalam penggunaan pengetahuan konten
untuk memecahkan masalah praktis yakni mengases,mengevaluasi, dan meningkatkan
pembelajaran siswa.
Dalam pendidikan IPA, kemampuan dalam melakukan asesmen meliputi
pemahaman tentang fungsi, tujuan dan prinsip asesmen yang berkualitas. Asesmen
berfungsi untuk mengestimasi tingkat prestasi siswa setelah diberikan suatu pengaruh
pendidikan dan lingkungan, (Faisal dalam Rustaman,-:-). Sementara, menurut
Terrence Croocks (dalam Moss) asesmen berfungsi memandu siswa untuk : (1)
menilai apayang penting dipelajari; (2) mengetahui minat serta motivasi belajarnya;
(3) menilai kemampuan belajarnya; (4) mengembangkan strategi belajar (5) menilai
keterampilan yang dimilikinya; (6) merencanakan waktu belajarnya.
Asesmen asesmen harus diperhatikan prinsip-prinsip asesmen yang baik yakni
kondisi lingkungan asesmen yang konstruktif dan positif. Prinsip-prinsip tersebut
terdiri dari:
1. Pemikiran yang jelas dan komunikasi efektif; Meskipun tingkat pencapaian sering
kali diterjemahkan menjadi skor, ada dua fakta penting yang perlu dipahami. Pertama,
angka bukanlah satu-satunya cara untuk menyatakan pencapaian. Kita dapat
memanfaatkan kata-kata, gambar, ilustrasi, contoh, dan berbagai cara lainnya. Kedua,
simbol untuk menyatakan pencapaian siswa sama bermaknanya dan sama bergunanya
dengan definisi pencapaian dan kualitas penilaian yang digunakan untuk
menghasilkannya.
2. Guru yang memegang peranan; Guru berperan mengarahkan penilaian untuk
menentukan apa yang harus dipelajari oleh siswa dan apa yang siswa rasakan
berkaitan dengan penilaian yang dilakukan. Dalam berbagai konteks pendidikan, hasil
penilaian tingkat kotamadya/kabupaten, provinsi, nasional seolah-olah dianggap
sebagai satu-satunya hasil penilaian yang menentukan. Penilaian ini bahkan tidak
dapat disamakan dengan dengan penilaian kelas yang dilakukan oleh guru, berkaitan
dengan dampaknya terhadap keadaan siswa. Gurulah yang menentukan bagaimana

bentuk interaksi yang dilakukan dengan siswanya, rata-rata sebanyak satu kali setiap
dua atau tiga menit (mengajukan pertanyaan dan menginterpretasikan jawaban,
mengamati kinerja siswa, memeriksa pekerjaan rumah, menggunakan tes dan kuis).
Umumnya, penilaian dalam kelas berlangsung secara terus menerus.Dengan
demikian, jelas bahwa penilaian kelas adalah penilaian yang paling mudah dilakukan
oleh guru. Tidak perlu diragukan lagi, guru adalah pengendali sistem penilaian yang
menentukan keefektifan sekolah.
3. Siswa sebagai pengguna yang harus diperhatikan; Siswa adalah pihak yang paling
memanfaatkan hasil penilaian. Melalui penilaian kelas, mereka dapat mempelajari
kinerjanya serta mempelajari standar kualitas kinerjanya dari guru. Tidak seorang
pun, selain siswa, yang dapat memanfaatkan menggunakan hasil penilaian kelas yang
dilakukan oleh guru untuk menetapkan apa yang dapat mereka harapkan dari diri
mereka sendiri. Siswa dapat memperkirakan peluang keberhasilannya berdasarkan
kinerja yang ditunjukkan oleh hasil penilaian sebelumnya. Tidak ada satu keputusan
lain yang dapat memberikan pengaruh lebih besar pada keberhasilan siswa.
4. Sasaran yang jelas dan sesuai;Kita tidak dapat menilai hasil pendidikan secara
efektif jika kita tidak mengetahui dan memahami apa sebenarnya nilai keluaran
tersebut. Ada berbagai jenis keluaran dari sistem pendidikan kita, mulai dari
penguasaan materi sampai kemampuan menyelesaikan masalah yang kompleks.
5. Penilaian yang baik; Penilaian yang baik merupakan suatu keharusan dalam setiap
konteks penilaian. Lima standard yang harus dipenuhi untuk mencapai penilaian yang
baik meliputi: sasaran pencapaian yang jelas, maksud/tujuan yang jelas, metode yang
sesuai, kinerja contoh yang layak, pembatasan, dan adanya upaya untuk mencegah
kesalahan pengukuran.
6. Perhatian terhadap dampak

antarpersonal;

Kita

harus

selalu

berusaha

melaksanakan penilaian yang baik, mengkomunikasikan hasilnya secara hati-hati dan


pribadi, dan mengantisipasi hasilnya sehingga dapat mempersiapkan diri untuk
memberikan dukungan terhadap siswa yang pencapaiannya rendah. Semakin muda
siswa, semakin penting adanya bimbingan bagi mereka.
7. Penilaian sebagai pembelajaran; Penilaian dan pengajaran dapat menjadi suatu
kesatuan. Potensi terbesar yang tersimpan dalam penilaian kelas

adalah

kemampuannya untuk menjadikan siswa sebagai mitra penuh dalam proses penilaian.
Siswa yang mampu mendalami sasaran pencapaian secara menyeluruh mampu secara
7

percaya diri melakukan evaluasi, baik terhadap hasil kerjanya sendiri maupun hasil
kerja temannya.Tantangan yang kita hadapi dalam penilaian kelas adalah memastikan
bahwa siswa memiliki seluruh informasi yang diperlukannya, dalam bentuk yang
mudah dipahami, pada waktu yang tepat sehingga dapat digunakan secara efektif.
Asesmen yang baik hendaknya memenuhi standar spesifik asesmen berkualitas
yang terdiri dari (a) target yang jelas dan tepat; (b) tujuan asesmen yang jelas; (c)
metode yang sesuai dengan target dan tujuan; (d) penentuan sampel yang tepat; dan (e)
pencegahan atau minimalisir terhadap bias dan eror dalam menilai.
Sejalan dengan uraian diatas, asesmen dikatakan baik jika memenuhi
pesyaratan tes:
1. Validitas; Anderson (dalam Arikunto, 2008; 65) A test is valid is measure what it
purpose to measure atau dapat artikan sebuah tes dikatakan disebut valid, jika dapat
tepat mengukur apa yang hendak diukur.
2. Reliabilitas; Tes yang reliabel (dapat dipercaya), jika memberikan hasil yang tetap
apabila diteskan berkali-kali. Anderson (dalam Arikunto, 2008; 87) A reliable
measure in one that provides consistent and stable indication of the characteristic
being investigated.
3. Objektivitas; Tes yang baik harus bersifat objektif, tidak ada unsur pribadi
(subjektivitas) yang mempengaruhi. Arikunto (2008) faktor yang mempengaruhi
subjektivitas.
4. Bentuk tes; Tes yang berbentuk uraian akan memberikan peluang untuk memberikan
penilaian subjektif, oleh karena itu dalam mengvaluasi tes perlu rentangan derajat
skor dalam item soal uraian.
5. Penilai; Subjektivitas penilai akan dapat mempengerahi secara leluasa terutama
dalam bentuk tes uraian, seperti faktor kesan terhadap siswa, tulisan, bahasa,
kelelahan dsb, untuk menghindari hal tersebut maka penilai dalam melakukan
evaluasi pertama secara kontinuitas (terus menerus) dalam arti bisa dilakukan lebih
dari 2 kali dan komprehensip yakni menyeluruh isi materi, aspek berpikir dan teknik
tes yang diguakan.
6. Praktibilitas (Practicability); Tes dikatakan memiliki praktibilitas yang tinggi,
apabila bersifat praktis dan mudah pengadminstrasian termasuk mudah dilaksanakan,
mudah pemeriksaan dan dilengkapi petunjuk yang jelas.

7. Ekonomis; Tes yang baik tidak terlalu membutuhkan biaya yang terlalu mahal,
tenaga yang banyak dan waktu yang lama.
Sejalan dengan perkembangan pendidikan, peranan dan pelaksanaan asesmen
mengalami perubahan dari asesmen pendidikan masa lalu ke asesmen pendidikan
masa sekarang yakni sebagai berikut:
Tabel 2. Perkembangan pendidikan, peranan dan pelaksanaan asesmen mengalami
perubahan dari asesmen pendidikan masa lalu ke asesmen pendidikan masa
sekarang
Peranan
Guru

Siswa
Kepala Sekolah

Pelaksanaan
Tujuan

Penggunaan

Dulu
Mengajar

Sekarang
Mendefinisikan hasil pembelajaran,
mengajar, melaksanakan penilaian
utama

Dinilai
Menginterpretas
i hasil ujian
terstandard

Menilai diri sendiri dan teman


Menginterpretasi hasil ujian dan
menyediakan dukungan terhadap
penilaian kelas

Dulu

Sekarang

Akuntabilitas
Penyaringan
hasil pengujian
dari atas ke
bawah

Akuntabilitas, pembelajaran
Penyaringan hasil pengujian dari
atas ke bawah dan dari kelas ke atas

Sasaran

Bersifat umum
Tidak terbuka

Sangat terarah
Bersifat terbuka

Metode

Terutama berupa
respon terpilih

Terutama berupa penilaian kinerja


dan essay dengan beberapa respon
terpilih

Sementara itu, Berdasarkan National Science Education Standard in the United


States (National Research Council, 1996: 100) perubahan fokus yang terjadi pada
standard penilaian adalah sebagai berikut.
9

Tabel 3 Perubahan fokus yang terjadi pada standar penilaian berdasarkan National
Science Education Standard in the United States
Hal yang dikurangi
Menilai yang mudah diukur

Hal yang diutamakan


Menilai yang paling berharga

Menilai pengetahuan
memiliki ciri yang jelas

yang

Menilai pengetahuan
berstruktur baik

Menilai pengetahuan
bersifat ilmiah

yang

Menilai pemahaman dan pemikiran ilmiah

Menilai untuk mempelajari


apa yang tidak dipahami
siswa
Hanya melakukan penilaian
atas pencapaian

Menilai untuk
dipahami siswa

yang

mempelajari

kaya

apa

dan

yang

Menilai pencapaian dan peluang untuk


belajar

Penilaian akhir dilakukan


oleh guru

Siswa terlibat dalam penilaian yang sedang


berlangsung atas hasil kerjanya dan hasil
kerja temannya

Pengembangan
penilaian
eksternal hanya oleh ahli

Guru terlibat dalam pengembangan penilaian


eksternal

D. Analisis Pokok Uji


1. Pengertian
Analisis pokok uji adalah suatu prosedur yang sistematis, untuk menyelidiki
informasi-informasi khusus terhadap alat evaluasi yang disusun.
2. Tujuan
Analisis pokok uji lebih banyak digunakan pada alat evauasi yang bersifat
obejektif seperi tes pilihan ganda (multiple choice), mengengingat untuk tes yang
bersifat uraian belum banyak dikaji tentang standar baku yang digunakan, namun
demikian semua alat evaluasi dapat dianalisis pokok uji sesuai dengan ketentuan
masing-masing. Tujuan analisis pokok uji sebagai berikut.
a. Upaya memperbaiki atau meningkatkan kualitas alat evaluasi.
10

b. Mengidentifikasi soal yang baik, kurang baik dan jelek.


c. Mendiagnostik kemampuan siswa.
d. Mengevaluasi pelaksanaan pembelajaran untuk menjadi lebih baik.
3.
a.
b.
c.
d.
e.
f.

Aspek analisis pokok uji meliputi,


Penyusunan instrumen
Menentukan tingkat validitas soal.
Menentukan tingkat reliabilitas soal.
Menentukan tingkat kesulitan soal (difficulty level of an item).
Menentukan daya pembeda (discriminating power).
Menentukan pengecoh.

4. Jenis Validitas
Tes yang jika dapat digunakan untuk mengukur tujuan tertentu, maka tes tersebut
dikatakan valid. R.L. Thondrike dan H.P Hagen (1977 dalam Arifin, 2009) mengatakan
validity is always in relation to a spesific decesion or use. Sugiyomo (2011; 350)
validitas internal instrumen berupa tes harus memneuhi validitas kontruksi dan validitas
isi, jika instrumen untuk mengukur sikap cukup menggunakan validitas kontruksi. Jenis
validitas yang dikembangkan Arikunto (2008) sebagai berikut.
a. Validas logis
Tes yang valid, secara logis sesuai dengan aturan yang telah ditentukan, misalnya soal
yang lazim digunakan untuk jenjang SMP secara logis sesuai dengan materi SMP,
kecuali jika digunakan untuk kepentingan seleksi khusus olimpiade. Semua alat
evaluasi, soal harus tersusun secara validitas logis.
b. Validitas empiris
Tes yang valid secara pengalaman (empiris) sudah teruji. Validitas empiris meliputi
empat hal berikut.
1. Validitas isi (content validity)
Tes dikatakan mempunyai validitas isi, jika dapat mengukur isi materi dan tujuan
pembelejaran. Soal objektif maupun soal uraian dapat dapat dilakukan validitas isi
oleh pakar ahli melaui judment. Seorang guru biologi jika akan memastikan soal
untuk diagnostik peserta didik maka harus meninjau validitas isi.
2. Validitas kontruksi (construct validity)
Tes memiliki validitas kontruksi, apabila butir-butir soal dapat mengukur aspek
berpikir siswa. Seorang guru biologi jika memberikan soal postes untuk
diagnostik peserta didik maka harus meninjau validitas kontruksi. Antara validitas
isi dan kontruksi, keduanya saling berkaitan
11

3. Validitas empiris atau validitas ada sekarang (concurrent validity)


Tes memiliki validitas empiris jika secara pengalaman, sudah pernah diujikan dan
untuk perhitungan dijelaskan pada pembahasan dibawah ini.
4. Validitas prediksi (predictive validity)
Tes memiliki validitas empiris, jika dapat memprediksi kemampuan peserta didik,
sebagai contoh tes masuk perguruan tinggi diharapkan dapat menyeleksi
mahasiswa yang dapat mampu mengikuti proses studi perguruan tinggi.
Prinsip analisa soal yang valid disesuaikan dengan kegunaan evaluasi, agar
memperoleh tingkat kevalidan Grounlund (1977 dalam Arifin, 2009) menjelaskan ada
tiga faktor yang mempengaruhi validitas soal sebagai berikut
a. faktor instrumen evaluasi
Kualitas instrumen termasuk daya pembeda, tingkat kesulitan, pengecoh, bahasa
yang komunikatif da jelas sangat mempengaruhi validitas soal
b. faktor administrasi dan penskoran
Proses adminstrasi dan penskoran yang tidak tepat akan mempengaruhi validitas
soal, diantaranya semakin banyak siswa yang bekerjasama dalam tes (contek menyontek),
maka nilai kevalidan menjadi bekurang, karena tes tidak bisa mengukur secara akurat
kemampuan peserta didik
c. faktor jawaban dari peserta didik
Peserta didik yang memilih jawaban dengan mandiri atau spekulasi akan
mempengaruhi kevalidan tes.

5. Analisis pokok uji


1. Penyusunan instrumen
Analisis pokok uji berkaitan dengan penyusunan instrumen meliputi standar
penggunaan bahasa dalam menyusun tes maupun non tes, petunjuk instrumen dan
proporsi jumlah instrumen yang digunakan berkaitan dengan waktu yang dibutuhkan
peserta tes (testee). Penyusunan instrumen yang mengacu hal tersebut akan meningkatkan
kualitas hasil evaluasi.
Arifin (2009; 132) menjealaskan penyusunan intrumen baik soal pilihan ganda
dan uraian, dapat dianalisis sebagai berikut; 1) secara rasional dan 2) secara empiris.
Tabel 4. Telaah soal secara rasional
12

Nomor soal:
N
o

Jenis soal:
Aspek yang ditelaah

ya

tidak

A. Materi
Soal sesuai dengan indikator
Batasan pertanyaan dan jawaban yang diharapkan jelas
Isi materi sesuai dengan tujuan tes
Isi materi sesuai dengan jenjang sekolah
B. Kontruksi
5
Ada petunjuk soal tentang menjawab soal
6
Ada pedoman penskoran
7
Gambar, grafik, label, diagram dan sejenisnya disajikan dengan
jelas dan terbaca
C. Bahasa
8
Rumusan soal komunikatif
9
Rumusan soal tidak menggunakan kata yang menimbulkan
penafsiran ganda
10 Rumusan soal tidak menggunakan negatif ganda
11 Menggunakan bahasa baku
Catatan;
1
2
3
4

2. Validitas
Sebuah instrumen dikatakan valid apabila valis secara logis, isi, empiris, prediksi,
sehingga dapat mengungkapkan data dari variabel yang diteliti secara tepat. Sebuah tes
dapat diukur tingkat kevalidan dengan meggunakan teknik korelasi product moment yang
ditemukan oleh Pearson dengan rumus sebagai berikut:
a. Korelasi product moment dengan simpangan
rxy=

xy
( x 2 )( y 2)

Keterangan:
rxy
= koefisien korelasi antara variabel X dan variabel Y, dua variabel yang
dikorelasikan (x= X-Xrata-rata dan y= Y-Yrata-rata)
xy = jumlah perkalian skor item dan skor total
x2 = jumlah kuadrat skor item
y2 = jumlah kuadrat skor total
b. Korelasi product moment dengan angka kasar
13

rxy=

N XY X Y

[ N X ( X ) ] [N Y
2

(Y ) ]

Keterangan:
rxy
= koefisien korelasi tiap item
N
= banyaknya subjek uji coba
X = jumlah skor item
Y
= jumlah skor total
X2 = jumlah kuadrat skor item
Y2 = jumlah kuadrat skor total
XY = jumlah perkalian skor item dan skor total
Penafsiran nilai koefisien korelasi dapat menggunakan dua cara:
a. Mengacu pada standar koefesien korelasi, yang dijelaskan pada tabel 5.
Tabel 5. Interval koefesien korelasi
Interval rxy
0,00 rxy 0,20
0,20 < rxy 0,40
0,40 < rxy 0,60
0,60 < rxy 0,80
0,80 < rxy < 0,10

Kriteria
sangat rendah
Rendah
Cukup
Tinggi
sangat tinggi

Diadaptasi dari Arikunto (2008).


b. Hasil rxy dikonsultasikan dengan rtabel product moment dengan =5%. Jika rxy >
rtabel maka alat ukur dikatakan valid. Untuk mengukur validitas pengukuran
keterampilan kooperatif dilakukan dengan uji korelasi spearman rho. Hasil
korelasi menghasilkan signifikansi 0,05 maka terdapat kesesuaian yang
signifikan (Sugiyono, 2007).
Rumus validitas lain dapat menggunakan rumus pbi sebagai berikut:

pbi =

MpMt
St

P
q

Keterangan:
pbi
= koefisien korelas biseral
Mp = rerata skor dari subjek yang menjawab betul bagi item yang dicari
validitasnya
Mt
= rerata skor total
St
= Standar deviasi dari skor total
p
= proporsi siswa yang menjawab benar (p = banyaknya siswa yang benar)
14

jumlah seluruh siswa


= proporsi siswa yang menjawab salah, (q = 1-p)

3. Reliabilitas
Alat instrumen evaluasi untuk dapat digunakan sebagai alat ukur yang dapat
dipercaya, harus memiliki nilai reliabel, sehingga ketika akan digunakan mempunyai
ukuran yang konsisten. Anastasi (1976 dalam Arifin, 2009) reliability refers to the
consistency of score obtained by the same persons when reexamined the same test on
different occasion or white different sets of equivalent items or under other variable
exmining conditions. Arikunto (2008) menjelaskan cara mengukur reliabilitas soal,
dengan menggunakan tiga teknik;
a.

Metode bentuk pararel (equivalent)


Tes yang reliabel jika 2 tes atau lebih diujikan kepada siswa, misalnya ada 2 jenis tes
dengan tingkat kesulitan sama, namun butir soal yang berbeda kemudian diteskan
kepada siswa dan hasil kedua tes dikorelasikan, contohnya pada tabel 5 berikut ini,
siswa yang memiliki hasil belajar tinggi akan tetap terlihat tinggi pada tipe soal I dan
II khususnya pada peserta didik kode A dan D dan peserta didik dengan kode A dan
D menunjukan hasil belajar yang lebih rendah, sehingga tes tipe I dan II menunjukan
hasil yang reliabel, walaupun ada perbedaan angka tapi secara umum siswa yang
diteskan tipe II mengalami kenaikan yang sama. Hasil yang tidak reliabel jika hasil
belajar tipe II nilai yang diperoleh peserta didik kebalikannya dengan tipe I misal
peserta didik kode A tes tipe I memperoleh nilai 80 dan nilai tes tipe II nilai 50,
sedangkan peserta didik kode B tes tipe I memperoleh nilai 50 dan nilai tes tipe II
nilai 90. Reliabilitas memiliki makna kekonsistenan, soal yang reliabel semestinya
dapat menunjukan hasil yang konsisten pada prestasi siswa golongan upper dan
lower.
Tabel 6. Pengukuran reliabilitas menggunakan metode bentuk pararel
Kode peserta didik
A
B
C
D

Tes tipe I
80
50
60
90

Tes tipe II
83
53
62
94

15

b.

Metode tes ulang (test-retest method)


Tes yang reliabel jika 1 tes telah diujikan 2 dua kali atau lebih kepada siswa yang
sama, hasil tes kedua dapat dihitung korelasinya. Pendekatan metode tes ulang
hampir sama dengan bentuk pararel namun yang berbeda tes yang akan digunakan
pada metode tes ulang terdiri satu jenis. Metode tes ulang menjadi tipe tes yang
sering digunakan untuk mengukur reliabilitas khususnya evaluasi yang sifatnya non
objektif seperti tes uraian. Ada beberapa trik-trik penerapan yang biasa digunakan
untuk menerapkan reliabilitas menggunakan metode tes ulang yakni dengan
pemberian suatu tes dilakukan pada hari tertentu, kemudian diberikan tes lagi pada
H+1 dan H+7, kemudian dapat dinilai tingkat reliabelnya.

c. Menggunakan rumus reliabilitas


Analisis relibilitas dengan menggunakan rumus reliabilitas, dapat dilakukan dengan
memberikan tes hanya 1 kali dan dapat diukur tingkat reliabilitasnya.
1. Penggunaan rumus K-R 20
Analisis realibilitas bentuk tes pilihan ganda menggunakan KR-20 yang
dikemukakan oleh Kuder dan Richardson. (Arikunto, 2008) bahwa penggunaan
rumus KR 20 dapat menghasilkan tingkat relibilitas dibandingkan dengan KR 21,
kedua rumus tersebut tanpa menggunakan teknik belahan ganjil-genap atau awalakhir.
r 11=(

n
S2 pq
)(
)
n1
S2

Keterangan:
r11 = reliabilitas tes secara keseluruhan
p
= proporsi siswa yang menjawab benar
q
= proporsi siswa yang menjawab salah (q =1 p)
pq = jumlah hasil perkalian antara p dan q
n
= banyaknya item
S
= standar deviasi dari tes (standar deviasi adalah akar dari varians)
Kriteria reliabel soal tes dapat dianalisis dengan cara membandingkan r11 dengan
harga rtabel yang sesuai pada tabel harga produk moment maka dikatakan soal yang

16

diujikan reliabel. Harga r11 yang diperoleh diinterpretasikan dengan derajat reabilitas
pada tabel 7 dibawah ini.
Penafsiran nilai koefisien korelasi dapat menggunakan dua cara:
1). Mengacu pada standar koefesien korelasi, yang dijelaskan pada tabel 6.
Tabel 7. Interval reliabilias (r11)
Interval r11
0,00 r11 0,20
0,40
0,20 dari
< r11 Arikunto
0,40 < r11 0,60
2).
0,60 < r11 0,80
0,80 < r11 dapat
0,10

Kriteria
sangat rendah
Rendah
Cukup
Tinggi
sangat tinggi

Diadaptasi

(2008)

Kriteria reliabel soal tes


dianalisis dengan cara
membandingkan

r11

dengan harga rtabel yang


sesuai

pada tabel harga produk


moment maka dikatakan

soal yang diujikan reliabel. rtabel product moment dengan =5%. Jika r11 > rtabel
maka alat ukur dikatakan reliabel.
2. Penggunaan rumus K-R 21
M (nM )
n
r 11=
( 1
)
2
n1
nSt

( )

Keterangan;
M = rerata skor total
S 2t
= standar deviasi total
3. Penggunaan rumus Spearman-Brown.
Analisis reliabilitas menggunakan rumus speraman-brown, dikenal dengan metode
belah dua (split half method) yakni dengan dua cara membelah butir soal, 1)
membelah item-item genap dan item-item ganjil, 2) membelah item nomor awal da
akhir, sehingga agar dapat membelah butir soal harus genap. Oleh karena itu indek
korelasi menunjukan hubungan dua belahan instrument, adapun rumusnya sebagai
berikut.

17

2 xr1 1
r 11=

22

(1+ r 1 1 )

22

Nilai rxy dalam belahan ini disebut dengan istilah

r1 1
22

atau r ganjil-genap
(Arikunto, 2002)

Hasil analisa reliabilitas menggunakan rumus Speraman-Brown

dengan teknik dua

belahan, seringkali menunjukan hasil yang berbeda, jika hasilnya negatif maka menunjukan
tes yang tidak reliabel dan jika hasilnya positif maka dapat diukur dengan menggunakan
indeks reliabelitas. Oleh karena itu dalam menggunakan penelitian, kita dapat menggunakan
salah satu teknik yang dipandang dapat menghasilkanhasil yang lebih baik.
4. Penggunaan rumus Flanagan

Teknik menggunakan rumus Flanagan, dapat dilakukan dengan teknik dua belahan
gajil dan genap seperti halnya rumus speraman-brown. Rumus Flanagan sebagi
berikut.
V xV
r 11=2(1 1 2 )
Vt

dimana V =

( X )
N
N

Keterangan:
V1 = varians beahan pertama (varians skor butir-butir ganjil)
V2 = varians belahan kedua (varians skor butir-butir genap)
Vt = varians total (Arikunto, 2002).
5. Penggunaan rumus Rulon

Teknik menggunakan rumus Flanagan, dapat dilakukan dengan teknik dua belahan
gajil dan genap seperti halnya rumus speraman-brown. Rumus Flanagan sebagi
berikut.
r 11=1

Vd
Vt

Keterangan:
Vd = varians different
d
= skor belahan awal dikurangi skor belahan akhir (Arikunto, 2002).
Penggunaan rumus Alpha
Penggunaan rumus Alpha, secara khusus untuk mengukur reliabilitas soal dalam

6.

bentuk uraian, maka dapat dilakukan dengan langkah berikut.


18

1. Menentukan gradien penilaian tiap item soal, misalnya soal 1, penskoran antara
0-5, soal 2 penskoran antara 0-10 dst.
2. Menghitung koefisien korelasi dengan menggunakan rumus alpha;
2

r11

n
(
)(1 2 1 )
( n1)
1

dimana

( X )2
N
N

Keterangan:
r11 = reliabilitas yang dicari
21 = jumlah varians skor setiap item soal
21

= varians total (Arikunto, 2002).

Contoh perhitugan mencari reliabilitas soal uraian pada tabel 8:


Tabel 8. Perhitugan mencari reliabilitas soal uraian
N
Nama
Nomor Itom
o
1
2
3
4
5
6
1
2
3
4
5
6
7
8
9
10

A
B
C
D
E
F
G
H
I
J

Skor total

Kuadrat skor
total

2704
961
1521
1296
324
900
961
1296
1086
784
11836

10
6
8
7
0
2
4
5
5
3
50

6
4
2
3
5
4
3
5
5
6
43

8
4
6
7
3
2
6
5
4
3
48

8
6
8
7
2
8
6
7
6
4
62

10
6
7
6
4
6
6
7
8
6
66

10
5
8
6
4
8
6
7
5
6
65

52
31
39
36
18
30
31
36
33
28
334

328

201

264

418

458

451

2120

Jumlah
Jumlah
kuadrat
Diketahui

= 7,8;
2

2,85 dan varian total (

= 1,61;

= 3,36;

4 = 3,36 5

= 2,24;

berjumlah 68,40, kemudian dimasukan dala rumus alpha

diperoleh 0,83, sehingga interpretasi tingkat reliabilitas sangat tinggi (Arikunto,


2008).
19

4. Tingkat kesulitan

Tingkat kesulitan bisanya digunakan untuk menganalisa soal jenis objektif. Soal
yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu sulit, soal yang terlalu
mudah akan menyebabkan peserta didik tidak dapat merangsang berfikit tingkat tinggi,
sedangkan soal yang terlalu sulit akan menyebabkan siswa berputus asa. Sriyati (2012)
menuturkan keseimbangan tingat kesulitan mengacu pada kurva normal yakni 30%
mudah, 50% sedang dan 20% sulit. Keseimbangan tingkat kesulitan pada prinsipnya
mengacu pada tujuan tes, jika tes tersebut digunakan untuk menseleksi kompetisi
olimpiade mata pelajaran, maka bisa saja proporsi tigkat kesulitan bisa diterapkan hingga
diatas 75%.
Analisa tingkat kesulitan, dapat dijadikan dalam penyusunan soal, seperti soal
yang mudah akan menjadi lebih baik jika diposisikan di awal soal, mengingat soal yang
mudah dapat meningkatkan motivasi siswa untuk mengerjakan soal. Analisis pokok uji
dapat dilakukan dengan mengukur tingkat kesulitan soal, sebagai berikut.
B
JS
Keterangan:
P = indek kesulitan
B = banyaknya siswa yang menjawab benar.
JS = jumlah seluruh siswa peserta tes.
P

Tingkat kesulitan diinterpretasikan pada tabel 9, dibawah ini.


Tabel 9. Interval tingkat kesulitan
Interval P

Kriteria

0,00 P 0,30
0,30 < P 0,70
0,70 < P 1,00

Sulit
Sedang
Mudah

* Diadaptasi dari Arikunto (2008).


5. Daya pembeda
Analisis pokok uji soal objektif misalnya multiple choice dapat dilakukan dengan
mengukur daya pembeda soal. Tahapan awal dalam pengukuran daya pembeda, dengan
cara menentukan kelompok atas (upper group) dan kelompok bawah (lower group),

20

dengan mengacu pada nilai yang diperoleh berdasarkan tes. Rumus yang digunakan
untuk mencari daya pembeda sebagai berikut.
DP=

BA BB

=PAPB
JA JB

Keterangan:
DP
JA
JB
BA
BB
PA
PB

=
=
=
=
=
=
=

daya pembeda
banyaknya peserta kelompok atas
banyaknya peserta kelompok bawah
banyaknya peserta kelompok atas yang menjawab benar
banyaknya peserta kelompok bawah yang menjawab benar
proporsi peserta kelompok atas yang menjawab benar
proporsi peserta kelompok bawah yang menjawab benar

Tabel 10. Interval daya pembeda


Interval DP
0,00 DP 0,20
0,20 < DP 0,40
0,40 < DP 0,70
0,70 < DP 1,00

Kriteria
Jelek
Cukup
Baik
Baik sekali
* Diadaptasi dari Arikunto (2008).

6. Tingkat pengecoh (distraktor)


Tingkat pengecoh merupakan distribusi peserta tes (testee) dalam memilih jawaban,
dengan melihat pola jawaban soal dapat diketahui, 1) taraf kesulitan, 2) daya
pembeda soal, 3) baik dan tidaknya pengecoh (distraktor). Daya pembeda yang jelek,
diduga terjadi akibat adanya pengecoh (distraktor) yang tidak berfungsi dengan baik,
sehingga untuk peningkatan tingkat daya pembemda maka pilihan jawaban dapat
diganti yang lebih baik. Suatu distraktor dapat diperlakukan dengan cara, 1) diterima
karena sudah baik, 2) ditolak kareana tidak baik, 3) ditulis kembali karena kurang
baik (Arikunto, 2008; 220). Sriyati (2012) menuturkan analisis pengecoh dilakukan
denagan memperhatikan ciri sebagai berikut, sebagai berikut.
a. Ada yang memilih, khususnya dari kelompok bawah kelompok bawah
b. Dipilih lebih banyak oleh kelompok rendah dari pada kelompok tinggi
c. Jumlah pemilih kelompok tinggi pada pengecoh itu tidak menyamai

pada

kelompok rendah yang memilih kunci jawaban yang benar.


d. Minimial distraktor dipilih oleh peserta tes sebanyak 5%.

21

Contoh analisis sebuah item soal tipe pilihaan ganda (multiple choice), sebagai
berikut. Diketahui jumlah siswa 60, kunci jawaban ada di pilihan D, pada table 9 berikut.
Tabel 9. Analisis item soal
Pilihan jawaban
Kelompok atas
Kelompok bawah
Jumlah

A
5
8
13

B
6
11
17

C
3
8
11

D*
16
3
19

Jumlah
30
30
60

1). Tingkat kesulitan


P = 16 = 0,3 Tingkat kesulitan soal tergolong tipe sulit
60
2). Daya pembeda
DP = PA-PB = 0,53-0,1 = 0,43
Daya pembeda soal tergolong baik
3). Pengecoh soal, tergolong sudah baik, karena tiap distraktor (pengecoh) terpilih
oleh peserta didik 5% dari jumlah peserta didik atau minimal 3 orang memilih
distraktor.
Perkembangan analisis pokok uji, sangat dibantu oleh kajian statistik dan aplikasi
teknologi seperti Microsoft Office Excel, SPSS dll.
7. Pengembangan tes
a. Pengembangan tes bentuk uraian
Arifin (2009; 129) menjelaskan bentuk tes uraian ditinjau dari luas sempitnya materi
dibedakan menjadi dua jenis, sebagai berikut:
1. Uraian terbatas (restricted respons items)
Peserta didik dalam menjawab tes uraian memiliki batasan-batasan tertentu,
sebagai contoh sebagai berikut:
1) Jelaskan yang dimaksud dengan fotorespirasi
2) Jelaskan proses gilkolisis dan siklus krebs?
3) . merupakan organela yang berfungsi dalam respirasi seluler
2. Uraian bebas (extended respons items)
Peserta didik dalam menjawab tes uraian ini memiliki kebebasan dengan cara dan
sistematika sendiri, sebagai contoh sebagai berikut:
1) Jelaskan manfaat perkembangan bioteknologi?
2) Jelaskan dampak pencemaran insektisida?
22

Tes uraian memiliki keunggulan dalam menggali pengetahuan peserta didik, namun
dalam melakukan penilaian memiliki kesulitan yang lebih tinggi dibandingkan tes
objektif dan kecenderungan bersifat subjektif, oleh karena itu perlu cara untuk
mencari solusi atas kesulitan dan subjektivitas penilaian, sebagai berikut:
1. Menyusun bentuk uraian objektif
Pensokoran bentuk uraian objektif, biasanya digunakan dalam penskoran jawaban
uraian yang singkat. Skor hanya ditentukan 2 kategori yakni benar diberi skor 1,
diberi salah skor 0, misalnya jawaban uraian berupa mitokondria, jika benar skor1
dan jika salah skor 0.
2. Menyusun bentuk uraian non objektif
Dalam penskoran soal uraian non objektif, skor dijabarkan dalam bentuk
rentangan, besarnya rentangan

ditentukan berdasarkan dengan kompleksitas

jawaban. Misalnya penjelasan tahapan glikolisis rentangan skor 1-10, dengan isi
jawaban meliputi reaksi enzimatis, pembentukan air dan subtrat, pembentukan
ATP dan NADPH. Guru dapat menilai soal dengan mengacu pada kelengkapan
jawaban sol uraian.
3. Pendekatan metode pengoreksian
a. Metode per lembar, yakni guru mengoreksi soal uraian pada tiap lembar dari
soal nomor awal sampai soal akhir. Keunggulan metode tersebut memerlukan
waktu yang lebih cepat, tinjauan biaya lebih murah, namun kelemahannya
penilaian skor antara peserta didik satu dengan yang lainnya cenderung
berbeda pada kualitas jawaban yang sama, sehingga untuk mengatasinya perlu
menyusun bentuk uraian objektif maupun uraian non objektif yang sudah
dijelaskan sebelumnya.
b. Metode per nomor, yakni guru mengoreksi soal uraian pada tiap nomor untuk
seluruh peserta didik, sebagai contoh guru mengoreksi nomor 1 untuk seluruh
peserta didik, kemudina dilanjutkan nomor 2 untuk seluruh peserta didik dan
seterusnya. Keunggulan metode tersebut akan sangat membantu dalam
memberikan skor dan membandingkatan jawaban antara peserta didik, namun
kekurangannya membutuhkan waktu yang lebih lama dibandingkan metode per
lembar.
c. Metode bersilang, yakni guru mengoreksi jawaban peserta didik dengan jalan
hasil koreksi dari satu korektor, kemudian dikoreksi (dinilai) ke korektor
lainnya. Keunggulan metode tersebut faktor subjektif bisa dikurangi namun
23

kelemahnnya membutuhkan waktu lebih lama dan tenaga yang lebih banyak.
Metode bersilang dianjurkan dalam penilaian untuk kepentingan yang bersifat
selektif, misalnya dalam penentuan tingkat peserta didik.
d. Point method merupakan metode pengkoreksian jawaban dibandingkan dengan
jawaban ideal yang telah ditetapkan dalam kunci jawaban, sehingga penskoran
sangat bergantung dengan tingkat kepadanan. Metode tersebut sangat tepat
digunakan untuk uraian terbatas.
e. Rating method yaitu setiap jawaban peserta didik ditetapkan dalam salah satu
kelompok yang sudah dipilah-pilah berdasarkan kualitasnya, misalnya sebuah
soal akan diberi skor antara 0-10, metode ini seperti penyusunan bentuk uraian
non objektif, sehingga tepat digunakan pada soal uraian soal uraian bebas
b. Pengembangan tes bentuk objektif
Tes bentuk objektif memiliki keunggulan mudah dikoreksi dan unsur objektifnya
lebih kuat dibandingkan soal uraian, sehingga siapapun yang mengoreksi maka akan
sama hasilnya. Perkembangan teknologi juga ikut membantu penilaian tes objektif
dalam sistem komputerisasi, sehingga aplikasinya sering digunakan misalnya tes
seleksi perguruan tinggi, tes toefl, tes CPNS. Kelemahan tes bentuk objektif
dimungkinkan unsur jawaban spekulasi menjadi benar dan jawaban peserta didik
terbatas sehingga belum bisa mengeksplor pengetahuan peserta didik lebih luas. Oleh
karena itu perlu meragamkan bentuk tes pilihan ganda diantaranya sebagai berikut:
1. Pilihan ganda (multiple choice)
Pilihan ganda merupakan jenis soal yang sering digunakan, karena memiliki
keunggulan diantaranya 1) mudah dikoreksi, 2) memiliki pengecoh (distraktor
yang banyak, 3) pengukuran untuk validitas dan reliabelitas lebih mudah.
Implimentasi dalam tes yang standar digunakan dalam proses pembelajaran
hendaknya memperhatikan hal-hal sebagai berikut:
a. Petunjuk soal jelas, meliputi teknis pengisian, waktu pelaksanaan dsb.
b. Bahasa dalam soal pilihan ganda standar baku.
c. Jika ada gambar, tabel atau bagan tersusun jelas dan komunikatif.
d. Memiliki komposisi soal yang mudah, sedang dan sulit. Soal yang mudah
hendaknya diletakan urutan bagian depan, karena dapat memotivasi peserta
didik dalam menjawab soal, namun jika soal sulit kecenderungan siswa
motivasi akan menurun khususnya bagi peserta didik dengan prestasi
golongan lower.

24

e. Pola jawaban soal tidak mengarahkan membentuk pola seperti jawaban no 1-5
kunci jawaban AAAAA dan kunci jawaban no 6-10 BBBBB, karena dapat
membantu spekulasi jawaban peserta didik.
f. Penggunaan soal negatif, sebaiknya diberi tanda khusus dengan bercetak tebal
seperti kecuali atau ditulis miring kecuali, untuk memperhatikan kejelasan
pada peserta tes.
g. Tidak menggunakan negatif ganda, karena akan menjadi kesulitan peserta
didik dalam memahami soal. Contoh soal pertanyaan negatif ganda sebegai
berikut. Organela sel yang tidak telibat langsung dalam sintesis protein
kecuali, jika disusun pertanyaan yang tepat maka kata negatif cukup satu
saja.
Soal pilihan ganda untuk kepentingan penelitian menyusunan tes sangat perlu
diperhatiakan validitas, reliabelitas, tingkat kesukaran, daya pembeda dan
pengecoh, sehingga dalam penyusunan

perlu memperhatikan beberapa

pola

sebagai berikut (Arifin, 2009; 132):


Petunjuk.
Pilihlah jawaban soal pilihan ganda dengan jawaban menulis huruf A, B, C, D
atau E sesuai dengan jawaban yang paling tepat.
a. Distracters yaitu setiap pertanyaan atau pernyataan mempunyai beberapa
pilihan jawaban yang salah dan satu pilihan jawaban yang paling tepat,
contoh.
1. Jika darah seorang ditetesi serum anti A tidak menggumpal dan ditetesi
serum anti B menggumpal, kemungkinan golongan darahnya...
A. A
B. AB
C. A dan AB
D. O
E. B
Jawaban A
b. Analisis hubungan antara hal yakni bentuk soal dapat digunakan untuk
menunjukan pernyataan (statement) dan alasan (reason), sehingga siswa
dapat diketahui tingkat pemahamanya lebih tinggi. Jenis soal ini diperlukan
keterangan untuk memilih jawaban misalnya.
a. Jika pernyataan benar, alasan benar dan alasan merupakan sebab dari
pernyataan.

25

b.

Jika pernyataan benar, alasan benar tetapi merupakan alasan tidak

merupakan sebab dari pernyataan.


c. Jika pernyataan benar tetapi alasan salah.
d. Jika pernyataan salah tetapi alasan benar.
e. Jika pernyataan salah tetapi alasan salah.
Soal:
Retikulum endoplasma halus berfungsi dalam sintesis protein sebab di bagian
retikulum endoplasma melekat ribosom.
Penjelasan:
1. Retikulum endoplasma halus berfungsi dalam sintesis lemak (pernyatan
salah)
2. Retikulum endoplasma (RE) terdapat ribosom yang dikenal dalam RE
kasar (pernyataan benar)
Jadi jawabannya D
c. Variasi negatif yakni setiap pertanyaan atau pernyataan memiliki jawaban
yang benar namun disediakan jawaban yang salah. Tugas peserta didik

A.
B.
C.
D.
E.

memilih jawaban yang salah, contoh.


Faktor-faktor yang mempengaruhi pembekuan darah, Kecuali...
Tromboplastin
Trombokinase
CaVitamin K
K+
Jadi jawabanya E
d. Variasi berganda yaitu memilih beberapa kemungkinan jawaban yang hampir
semuanya benar, tetapi ada satu jawaban yang paling benar contoh.
Sintesis polipeptida dimulai pada saat
A. Menempelnya ribosom subunit kecil dan sub unit besar
B. mRNA meninggalkan nukleus ke sitosol
C. Ribosom bertemu mRNA kodon AUG
D. Ribosom melekat pada RE
E. mRNA menempel ribosom
Jawaban C
e. Pertanyaaan dalam bentuk studi kasus.
Ibu Misa sedang memilih makanan yang dapat meningkatkan perkembangan
otak anaknya, suatu ketika dia bertanya dengan Supriyono anak SMA N 3
Lampung untuk memastikan pilihan makanan yang tepat untuk buah hatinya,
melalui uji praktikum diperoleh data sebagai berikut:
Makana

Uji Benedik

Uji Fehling

Uji Biuret

Uji lemak
26

n
I
++++
+++
+
+
II
++++
++
+
+++
III
++
++
++
++
IV
+
++++
+
Keterangan:
tanda positif (+) menunjukan kadar tingkat senyawa tertentu dan
tanda negatif (-) menunjukan tidak ada senyawa tertentu
Pilihan makanan yang tepat sesuai dengan hasil uji makanan diatas adalah:
A. I
B. II
C. III
D. IV
E. I dan III
Jawaban D, karena uji biuret merupakan uji protein. Makanan yang mengandung
banyak protein pada makanan IV
f. Pertanyaan berkaitan dengan susunan dengan pernyataan yang tidak lengkap,
contoh.
Proses peredaran darah.
1. Darah masuk ke serambi kiri
2. Darah dari vena kava inferior menuju serambi kanan
3. Darah dipompa dari bilik kanan menuju paru-paru
4. Darah di pompa dari bilik kiri ke aorta
5. Darah melewati vena pulmonalis
6. Darah melewati arteri pulmonalis
Urutan peredaran darah dari darah yang banyak CO2

menjadi darah

banyak O2 adalah
A. 1-2-6-5-4-1
B. 5-4-6-5-1-4
C. 2-3-5-6-4-1
D. 2-3-6-5-1-4
E. 5-3-6-5-1-4
Jawaban D
2. Menjodohkan (Matching)
Soal tipe menjodohkan memiliki persamaan dengan soal tipe pilihan ganda yakni
pada memilih jawaban yang tepat, namun yang membedakan dua tipe tersebut
pada soal tipe menjodohkan soal berada pada kolom khusus dan jawaban berada
pada kolom khusus, jumlah jawaban biasanya melebihi jumlah soal dengan tujuan
sebagai pengecoh (distractor), berikut contohnya.

27

Petunjuk: Dibawah ini terdapat dua kelompok A dan kelompok B, pasangkan


antara kelompok A dan B yang memiliki hubungan yang tepat, dengan mengisi
kode huruf yang sesuai di kelompok A.
Kelompok A
1. Proses pertukaran O2 dan CO2 melalui proses... (e)
2. (c)... tempat pertukaran udara pernapasan
3. Proses ekspirasi, keadaan di rongga dada...(i)
4. (a)... Organela respirasi
5. Kadar HCO3- menyebabkan(g)

kelompok B
a. mitokondia
b. paru-paru
c. alveolus
d. osmosis
e. difusi
f. emfisema
g. asidosis
h. golgi
i. tekanan besar
j. tekanan kecil

3. Soal tipe benar salah


Soal tipe benar salah, memiliki tingkat pengecoh yang paling sedikit jika
dibandingkan dengan tipe soal pilihan objektif, berikut ini contohnya.
Petunjuk, berilah tanda silang pada huruf B jika pernyataan benar dan huruf S jika
jawaban pernyataan salah
1. B- S : Semua mamalia tidak bisa terbang
2. B- S : Ribosom melekat pada RE kasar
3. B- S : Penderita hemofili lebih didominasi pada laki-laki

28

DAFTAR PUSTAKA
Arifin, Zaenal. (2009). Evaluasi Pembelajaran. Bandung: PT Remaja Rosdakarya.
Arikunto, S. (2002). Prosedur Penelitian suatu Pendekatan Praktek. Edisi V. Jakarta:
Rineka Cipta
___________(2008). Dasar-Dasar Evaluasi Pendidikan (edisi revisi). Jakarta: PT Bumi
Aksara.
NRC.(1996). National
Academic Press

Science

Education

Standards.Washington:

National

Rustaman, Nuryani (___) Assesment Literacy Pdf. PPT


Rustaman, N.Y. dkk.(2005). Strategi Belajar Mengajar Biologi. Malang: UM

Press

Sriyati, Siti. (2012). Bahan Ajar Pembelajaran Analisis Pokok Uji. Bandung: UPI. Tidak
diterbitkan. [on line] at http://ebookbrows.com. (10 Februari 2012)
Stiggins, R.J. (1994). Student-centered Classroom Assessment. New York: Macmillan
College Publishing Company.
Sugiyono. (2007). Statistika untuk Penelitian. Bandung: Alfabeta.

29