Anda di halaman 1dari 17

TEKNIK PENGUJIN RELIABLITAS TES DAN TEKNIK ANALISIS REABILITAS TES

TEKNIK PEMERIKSAAN, PEMBERIAN SKOR, PENGOLAHAN HASIL TES DAN ANALISIS THEM TEST
Aulia Zakial Pikri, Annisa Yustika, Dola Aria Fitri, Ema Nurhaliza dan Rifa Onivia
Dosen Pengampu :
RILLA GINA GUNAWAN, M,Pd.
AAN PUTRA, M.Pd.
Jurusan Tadris Matematika Fakultas Tarbiyah dan Keguruan
Institut Agama Islam Negeri (IAIN) Kerinci

PENDAHULUAN
Reliabilitas sebuah tes dipegaruhui oleh perencanaan dan konsruktif, seuah tes
dapat dikatakan memiliki tingkat kepercayaan yang tinggi jika tes tersebut dapat
memberikan hasil yang tetap apabila diujikan berulang ulang kali.Dan suatu alat penilaian
dikatakan mempunyai kualitas yang baik apabila alat tersebut memiliki reliabilitas
(ketetapan atau keajegan) dan relibilitas alat tes terjamin kualitasnya.

Pada hakikatnya pemberian skor (scoring) adalah proses pengubahan jawaban instrumen
menjadi angka-angka yang merupakan nilai kuantitatif dari suatu jawaban terhadap item
dalam instrumen. Angka-angka hasil penilaian selanjutnya diproses menjadi nilai-nilai
(grade). Skor adalah hasil pekerjaan menyekor (memberikan angka) yang diperoleh dari
penjumlahan angka-angka dalam setiap butir soal yang di jawab dengan benar oleh testee,
dan memperhitungkan bobot jawaban, sedangkan nilai adalah angka atau huruf yang
merupakan hasil konversi (rubahan) dari penjumlahan skor yang disesuaikan pengaturannya
dengan standar tertentu yang pada dasarnya merupakan lambang kemampuan testee
terhadap materi atau bahan yang diteskan.Oleh sebab itu kami akan membahas tentang
realibitas tes dalam teknik pemeriksaan sekor dan pengelola hasil tes dan teknik analisis
them test.
PEMBAHASAN
1. Teknik Pengujian Reabilitas Tes
A. TEKNIK PEMERIKSAAN DAN PENILAIAN SKOR
Pada hakikatnya pemberian skor (scoring) adalah proses pengubahan jawaban
instrumen menjadi angka-angka yang merupakan nilai kuantitatif dari suatu jawaban
terhadap item dalam instrumen. Angka-angka hasil penilaian selanjutnya diproses
menjadi nilai-nilai (grade). Skor adalah hasil pekerjaan menyekor (=memberikan
angka) yang diperoleh dengan jalan menjumlahkan angka-angka bagi setiap butir
item yang oleh testee telah dijawab dengan betul, dengan memperhitungkan bobot
jawaban betulnya. Adapun yang dimaksud dengan nilai adalah angka (bisa juga
huruf), yang merupakan hasil ubahan dari skor yang sudah dijadikan satu dengan
skor-skor lainnya, serta disesuaikan pengaturannya dengan standar tertentu. Itulah
sebabnya mengapa nilai sering disebut skor standar.
Skor adalah hasil pekerjaan menyekor (memberikan angka) yang diperoleh dari
angka-angka dari setiap butir soal yang telah di jawab oleh test dengan benar,
dengan mempertimbangkan bobot jawaban betulnya.
1. Teknik pemeriksaan hasil tes tertulis
Sebagai mana telah dibahas dalam materi sebelumnya bahwa tes hasil belajar
yang diselenggarakan secara tertulis dapat dibedakan menjadi dua golongan
yaitu tes hasil belajar tertulis bentuk uraian dan tes hasil belajar tertulis bentuk
objektif, kedua bentuk tes hasil itu memiliki karakteristik yang berbeda.
2. Teknik pemeriksaan hasil tes hasil belajar bentuk uraian
Tenik ini dilakukan dengan begitu soal tes uraian selesai disusun hendaknya
tester segera membuat kunci jawaban/pedoman jawaban, kunci jawaban ini
digunakan sebagai pegangan atau patokan dalam pemeriksaan atau
pengoreksian terhadap tes hasil tes uraian dengan cara membandingkan antara
jawaban yang diberikan oleh teste dengan kunci jawaban yang dibuat oleh
tester.
Dalam pelaksanaan pemeriksaan hasil – hasil tes hasil tes uraian ini terdapat dua hal
yang harus dipertimbangkan yaitu:
1. Pengolahan dan penentuan nilai hasil tes hasil belajar
Artinya apabila nantinya pengolahan dan penentuan nilai hasil tes uraian itu
didasarkan pada standar mutlak maka, prosedur pemeriksaannya adalah
sebagai berikut :
a) Membaca jawaban yang diberikan oleh teste dan membandingkannya dengan
kunci jawaban yang sudah dibuat.
b) Atas dasar hasil perbandingan antara jawaban teste dengan kunci jawaban
tersebut, tester dapat memberikan skor untuk setiap butir soal dan menuliskan
pada jawaban teste tersebut.
c) Menjumlahkan skor-skor tersebut dalam pengolahan dan penentuan nilai lebih
lanjut.
d) Pengolahan dan penentuan nilai hasil tes subjektif itu didasarkan pada standar
relatif.
Artinya apabila nantinya pengolahan dan penentuan nilai didasarkan pada standar
relatif maka prosedur pemeriksaannya sebagai berikut :
1. Memeriksa jawaban atas soal nomor satu misalnya yang diberikan oleh selurus
teste sehingga diperoleh gambaran maka dapat diketahui mana teste yang
lengkap,kurang lengkap dan tidak tepat sama sekali.
2. Memberikan skor terhadap jawaban tersebut misalkan jawaban yang tepat
diberi skor 5, kurang tepat 3.
3. Setelah jawaban atas seluruh teste tersebut selesai maka dapat dilakukan
penjumlahan skor yang nantinya dijadikan bahan untuk mengolah nilai.

3. Teknik pemeriksaan hasil tes hasil belajar bentuk objektif


Memeriksa atau mengoreksi jawaban atas soal tes objektif pada umumnya
dilakukan dengan jalan menggunakan kunci jawaban, ada beberapa macam
kunci jawaban yang dapat dipergunakan untuk mengoreksi jawaban soal tes
objektif, yaitu sebagai berikut :
1) Kunci berdampingan ( strip keys )
Kunci jawaban berdamping ini terdiri dari jawaban – jawaban yang benar
yang ditulis dalam satu kolom yang lurus dari atas kebawah, adapun cara
menggunakannya adalah dengan meletakan kunci jawaban tersebut
berjajar dengan lembar jawaban yang akan diperiksa kemudian
cocokanlah dengan lembar jawaban yang diberikan oleh tested an apabila
jawaban yang diberikan oleh teste benar maka diberi tanda ( + ) dan
apabila salah diberi tanda ( – ).
2) Kunci system karbon ( carbon system key )
Pada kunci jawaban system ini teste diminta membubuhkan tanfda silang (
X ) pada salah satu jawaban yang mereka anggap benar kemudian kunci
jawaban yang telah dibuat oleh teste tersebut diletakan diatas lembar
jawaban teste yang sudah ditumpangi karbon kemudian tester
memberikan lingkaran pada setiap jawaban yang benar sehingga ketika
diangkat maka, dapat diketahui apabila jawaban teste yang berada diluar
lingkaran berarti salah sedangkan yang berada didalam adalah benar.
3) Kunci system tusukan ( panprick system key )
Pada dasarnya kunci system tusukan adalah sama dengan kunci system
karbon. Letak perbedaannya ialah pada kunci sitem ini, untuk jawaban
yang benar diberi tusukan dengan paku atau alat penusuk lainnya
sementara lembar jawaban teste berada dibawahnya, sehingga tusukan
tadi menembus lembar jawaban yang ada dibawahnya. Jawaban yang
benar akan tekena tusukan dsedangkan yang salah tidak.
4) Kunci berjendela ( window key )
Prosedur kunci berjendela ini adalah sebagai berikut :
 Ambilah blanko lembar jawaban yang masih kosong
 Pilihan jawaban yang benar dilubangi sehingga seolah – olah
menyerupai jendela
 Lembar jawaban teste diletakan dibawah kunci berjendela
 Melalui lubang tersebut kita dapat membuat garis vertical dengan
pencil warna sehingga jawaban yang terkena pencil warna tersebut
berarti benar dan sebaliknya.
4. Teknik pemeriksaan dalam rangka menilai hasil tes lisan
Pemeriksaan atau koreksi yang dilaksanakan dalam rangka menilai jawaban –
jawaban testee pada tes hasil belajar secara lisan, pada umumnya bersifat
subjektif, sebab dalam tes lisan itu tester tidak berhadapan dengan lembar
jawaban soal yang wujudnya adalah benda mati, melainkan berhadapan
dengan individu atau makhluk hidup yang masing – masing mempunyai cirri
dan karakteristik berbeda sehingga memungkinkan bagi tester untuk bertindak
kurang atau bahkan tidak objektif.
Dalam hubungan ini, pemeriksaan terhadap jawaban testee hendaknya
dikendalikan oleh pedoman yang pasti, misalnya sebagai berikut :
a) Kelengkapan jawaban yang diberikan oleh testee.
Pernyataan tersebut mengandung makna “ apakah jawaban yang
diberikan oleh testee sudah memenuhi semua unsure yang seharusnya
ada dan sesuai dengan pedoman/ kunci jawanban yang telah disusun oleh
tester
b) Kelancaran testee dalam mengemukakan jawaban
Mencakup apakah dalam memberikan jawaban lisan atas soal – soal yang
diajukan kepada testee itu cukup lancer sehingga mencerminkan tingkat
pemahaman testee terhadap materi pertanyaan yang diajukan kepadanya
c) Kebenaran jawaban yang dikemukakan
Jawaban panjang yang dikemukakan oleh testee secara lancar dihadapan
tester, belum tentu merupakan jawaban yang benar sehingga tester harus
benar – benar memperhatikan jawaban testee tersebut, apakah jawaban
testee itu mengandung kadar kebenaran yang tinggi atau sebaliknya.
d) Kemampuan testee dalam mempertahankan pendapatnya
Maksudnya, apakah jawaban yang diberikan dengan penuh kenyakinan
akan kebenarannya atau tidak. Jawaban yang diberikan oleh testee secara
ragu – ragu merupakan salah satu indicator bahwa testee kurang
menguasai materi yang diajukan kepadanya tersebut.
Demikian seterusnya, penguji dapat menambahkan unsure lain yang
dirasa perlu dijadikan bahan penilaian seperti : perilaku, kesopanan,
kedisiplinan dalam menghadapi penguji ( tester )
5. Teknik pemeriksaan dalam rangka menilai hasil tes perbuatan
Dalam tes perbuatan ini pemeriksaan hasil – hasil tes nya dilakukan dengan
menggunakan observasi ( pengamatan ). Sasaran yang perlu diamati adalah
tingkah laku, perbuatan, sikap dan lain sebagainya. Untuk dapat menilai hasil
tes perbuatan itu diperlukan adanya instrument tertentu dan setiap gejala
yang muncul diberikan skor tertentu pula.
Contoh: misalkan instrument yang dipergunakan dalam mengamati calon guru
yang melaksanakan praktek mengajar, aspek – aspek yang diamati meliputi 17
unsur dengan skor minimum 1 (satu) dan maksimum 5 (lima).
a. Pemberian skor pada tes uraian
Pada tes uraian ini, pemberian skor umumnya mendasar pada bobot soal
yang diberikan pada setiap butir soal, atas dasar tingkat kesulitan atau
banyak sedikitnya unsure yang harus terdapat dalam jawaban yang
dianggap jawaban paling benar.
Sebagai contoh misalkan tes subyektif memberikan lima butir soal,
pembuat soal (tester) telah menetapkan bahwa kelima butir dari soal
tersebut mempunyai derajat kesukaran yang sama dan unsure yang
terdapat pada setiap butir soal telah dibuat sama banyaknya, maka atas
dasar itu tester dapat menetapkan bahwa setiap jawaban yang dijawab
oleh testee benar diberikan skor maksimum 10 jika hanya benar
setengahnya maka diberi 5 dan apa bila tidak menyangkut sama sekali
diberi skor 0 dan seterusnya.
b. Pemberian skor pada tes obyektif
Pada tes obyektif, untuk memberikan skor pada umumnya digunakan
rumus correction for guessing atau sering dikenal dengan istilah denda.
Untuk pemberian skor pada tes obyektif ini dibagi menjadi 3 bentuk
yaitu:
1) Untuk tes obyektif ben true-false misalkan, setiap item diberi skor 1
(satu), apabila seorang testee menjawab dengan benar maka diberi
skor 1 (satu) namun apabila dijawab salah maka skornya 0 (nihil).
Adapun cara untuk menghitung skor terakhir dari seluruh item
bentuk ini, dapat digunakan dua macam rumus yaitu:
Rumus yang memperhitungkan denda yaitu:
S = R – W dibagi o – 1
Dimana :
S = skor yang dicari
R = jumlah jawaban benar
W = jumlah jawaban salah
O = option, jawaban yang kemungkinan benar or salah
1 = bilangan konstan
rumus yang tidak memperhitungkan denda yaitu :
S=R

sedangkan untuk tes obyektif bentuk matching,fill in dan completion


perhitungan skor akhir pada umumnya tidak memperhitungkan sanksi
berupa denda sehingga rumus yang digunakan yaitu :
S=R
adapun untuk tes obyektif bentuk multiple choice items dapat digunakan
salah satu dari dua buah rumus yaitu rumus yang memperhitungkan
denda dan rumus yang tidak memperhitungkan denda.
Rumus perhitungan skor dengan memperhitungkan denda :
S = R – ( W dibagi o – 1 )
Sedangkan untuk rumus yang mangabaikan denda yaitu:
S=R
Sasaran yang diamati adalah tingkah laku, perbuatan, sikap dan
sebagainya. Untuk dapat menilai hasil tes perbuatan diperlukan
instrumen-instrumen tertentu dan setiap gejala yang muncul diberikan
skor tertentu.
Ada dua hal penting dalam pengolahan dan pengubahan skor mentah
menjadi skor standar atau nilai, yaitu:
1) Dalam pengolahan dan pengubahan skor mentah menjadi nilai itu
ada dua cara, yaitu:
- Bahwa pengolahan dan pengubahan skor mentah menjadi nilai itu
dilakukan dengan mengacu atau mendasarkan diri pada kriterium
(patokan).
- Bahwa pengolahan dan pengubahan skor mentah menjadi nilai itu
dilakukan dengan mengacu atau mendasarkan diri pada norma
atau kelompok.
2) Pengolahan dan pengubahan skor mentah menjadi nilai itu dapat
menggunakan berbagai macam skala, yaitu: skala lima dengan nilai
huruf A, B, C, D dan F. Skala Sembilan dengan nilai 1 sampai
dengan 9. Skala sebelas dengan rentang nilai mulai dar 0 sampai
dengan 10.
Cara Memberi Skor Mentah untuk Tes Uraian
Pada tes uraian, pemberian skor didasarkan pada bobot
(weight) yang diberikan pada setiap butir soal, didasarkan dan
disesuaikan dengan tingkat kesulitan dari soal tersebut dan atau
banyak sedikitnya unsur yang terdapat dalam jawaban yang
dianggap paling benar.

B. STANDAR PENILAIAN
Menurut Badan Standar Nasional Penilaian (BSNP), Penilaian adalah prosedur
yang digunakan untuk mendapatkan informasi tentang prestasi atau kinerja peserta
didik, standar penilaian oleh peserta didik mencakup beberapa standar berikut ini:
1) Standar Umum Penilaian
Merupakan aturan main dari aspek-aspek umum dalam pelaksanaan
penilaian. Adapun prinsip-prinsipnya, yaitu:
- Pemilihan teknik penilaian disesuaikan dengan karakteristik mata pelajaran
serta jenis informasi yang ingin diperoleh dari peserta didik.
- Informasi yang dihimpun mencangkup ranah-ranah yang sesuai dengan standar
isi dan standar kompetensi lulusan.
- Informasi mengenai perkembangan prilaku peserta didik dilakukan secara
berkala pada kelompok mata pelajarn masing-masing.
- Pendidik harus selalu mencatat perilaku peserta didik yang menonjol, baik yang
bersifat positif maupun negative dalam buku catatan perilaku.
- Melakukan sekurang-kurangnya tiga kali ulangan harian menjelang ulangan
tengah semester dan tiga kali menjelang ulangan akhir semester.
- Pendidik harus menggunakan teknik penilaian yang bervariasi sesuai dengan
kebutuhan.
- Pendidik harus selalu memeriksa dan memberi balikan kepada peserta didik
atas hasil kerjanya sebelum memberikan tugas lanjutan.
- Pendidik harus memiliki catatan kumulatif tentang hasil penilaian untuk setiap
peserta didik yang berada dibawah tanggung jawabnya.
- Pendidik melakukan ulangan tangah dan akhir semester untuk menilai
penguasaan kompetensi sesuai dengan tuntutan dalam standar kompetensi
(SK) dan standar lulusan (SL).
- Pendidik yang dibei tugas menangani pengembangan diri harus melaporkan
kegiatan peserta didik kepada wali kelas.
- Pendidik menjaga kerahasiaan pribadi peserta didik dan tidak disampaikan paa
pihak lain tanpa ijin dengan yang bersangkutan atau kepada orang tua/wali
murid.
2). Standar Perencanaan Penilaian
Merupakan prinsip-prinsip yang harus dipedomani bagi pendidik. Ada tujuh
prinsip standar perencanaan penilaian:
- Pendidik harus membuat rencana penilaian secara terpadu dengan silabus dan
rencana pembelajarannya.
- Pendidik haru mengembangkan criteria pencapaian kompetensi dasar (KD)
sebagai dasar penilaian.
- Pendidik menentukan teknik penilaian dan instrument penilaiannya sesuai
dengan indicator pencapaian KD .
- Pendidik harus menginformasikan seawal mungkin kepada peserta didik
tentang aspek-aspek yang dinilai dan criteria pencapaiannya.
- Pendidik menuangkan seluruh komponen penilaian terhadap ke dalam kisi-kisi
penilaian.
- Pendidik membuat instrument berdasarkan kisi-kisi yang telah dibuat dan
dilengkapi dengan pedoman penskoran sesuai dengan teknik penilaian yang
digunakan.
- Pendidik menggunakan acuan criteria dalam menentukan nilai peserta didik.
3). Standar Pelaksanaan Penilaian
Standar pelaksanaan oleh pendidik meliputi:
- Pendidik melakukan kegiatan penilaian sesuai dengan re rencana penilaian
yang telah disusun awal kegiatan pembelajaran.
- Pendidikan menganalisis kualitas instrument dengan mengacu padaPendidikan
menganalisis kualitas instrument dengan mengacu pada persyaratan
instrument serta menggunakan acuan criteria.
- Pendidik menjamin pelaksanaan ulanagn dan ujian yang bebas dari
kemungkinan terjadinya tindak kecurangan.
- Pendidik memeriksa pekerjaan peserta didik dan memberikan umpan balik dan
komentar yang bersifat mendidik.
4). Standar Pengelolaan dan Pelaporan hasil Penilaian
Standar Pengelolaan dan Pelaporan hasil Penilaian oleh pendidik meliputi:
- Pemberian skor untuk setiap komponen yang dinilai.
- Penggabungan skor yang diperoleh dari berbagai teknik dengan bobot
tertentu sesuai dengan aturan yang telah ditetapkan.
- Penentuan satu nilai dalam bentuk angka untuk setiap mata pelajaran, serta
menyampaikan kepada wali kelas untuk ditulis dalam buku laporan pendidikan
masing-masing peserta didik.
- Pendidik menulis deskripsi naratif tentang akhlak mulia, kepribadian, dan
potensi peserta didik yang disampaikan kepada wali kelas.
- Pendidik bersama wali kelas menyampaikan hasil penilaiannya dalam rapat
dewan guru untuk menentukan kenaikan kelas.
- Pendidik bersama wali kelas menyampaikan hasil penilaian kepada rapat
dewan guru untuk menentukan kelulusan peserta didik pada akhir satuan
pendidikan dengan mengacu pada persyaratan kelulusan satuan pendidikan.
- Pendidik bersama wali kelas menyampaikan hasil penilaiannya kepada orang
tua/wali peserta didik.
5). Standar Pemanfaatan Hasil penilaian
Sesuai dengan pedoman umum penilaian yang dikeluarkan oleh BSNP, ada lima
standar pemanfaatan hasil penilaian, yaitu:
- Pendidik mengklasifikasikan peserta didik berdasar tingkat ketuntasan
pencapaian standar kompetesi (SK) dan dan kompetensi dasar (KD)
- Pendidik menyampaikan balikan kepadan peserta didik tentang tingkat capaian
hasil belajar pada setiap KD disertai dengan dengan rekomondasi tindak lanjut
yang harus dilakukan.
- Bagi peserta didik yang belum mencapai standar ketuntasan, pendidik harus
melakukan pembelajaran remedial agar setiap peserta didik dapat mencapai
standar ketuntasan yang dipersyaratkan.
- Kepada peserta didik yang telah mencapai standar ketuntasanyang
dipersyaratkan dan dianggap memiliki keunggulan, pendidik dapat
memberikan layanan pengayaan.
- Pendidik menggunakan hasil penilaian untuk mengevaluasi efektivitas kegiatan
pembelajaran dan merencanakan barbagai upaya tindak lanjut.

a. Standar penilaian oleh Satuan Pendidikan


Ada dua pokok yang harus diperhatikan dalam penilaian hasil belajar
menurut standar ini:
1) Standar penentuan pendidikan kelas, standar ini terdiri dari tiga hal
pokok, yaitu:
- Pada akhir tahun pelajaran, satuan pendidikan menyelenggarakan
ulangan kenaikan kelas.
- Satuan pendidikan menetapkan Sandar ketuntasan Balajar Minimal
(SKBM) pada setiap mata pelajaran. SKBM harus ditingkatkan secara
berencana dan berkala.
- Satuan Pendidikan menyelenggarakan rapat dewan pendidikan untuk
menentukan kenaikan kelas setiap peserta didik.
2) Standar Penentuan kelulusan
- Pada akhir jenjang pendidikan, satuan pendidikan menyelenggarakan
ujian sekolah pada kelompok mata pelajaran IPTEKS.
- Satuan pendidikan menyelenggarakan rapat dewan pendidikan untuk
menentukan nilai akhir peserta didik.
- Satuan pendidikan menentukan kelulusan peserta didik berdasarkan
criteria kelulusan yang ditetapkan dalam peraturan pemerintah
No.19/2005 pasal 7 ayat (1)
2. Teknik Analisis Item Tes
Penganalisaan terhadap butir-butir item tes hasil belajar dapat dilakukan dari
tiga segi, yaitu:
(1) Segi derajat kesukaran itemnya,
(2) Segi daya pembeda itemnya,
(3) Segi fungsi distraktornya.
A. Teknik Analisis Derajat Kesukaran Item
Derajat kesukaran item atau taraf kesulitan butir-butir item tes hasil belajar
heruslah seimbang atau sedang, dalam artian tidak terlalu sukar dan tidak terlalu
sulit. Hal inilah yang membuat bermutu atau tidaknya butir-butir item tes hasil
belajar. Untuk mengetahui tingkat kesulitan butir item tes hasil belajar dikenal
dengan istilah difficulty index (angka index kesukaran item) dalam dunia evaluasi
belajar umumnya dilambangkan dengan huruf P (proporstion). Angka indek
kesukaran item itu dapat diperoleh dengan menggunakan rumus yang dikemukakan
oleh Du Bois, yaitu:
P = QUOTE Di mana :
P = Proportion = proporsi = proporsa = difficulty index = angka indek kesukaran item
Np = Banyaknya testee yang dapat menjawab dengan betul terhadap butir item yang
bersangkutan
N = Jumlah testee yang mengikuti tes hasil belajar.
Rumus lainnya adalah:
QUOTE Di mana :
P = Proportion = proporsi = proporsa = difficulty index = angka indek kesukaran item.
B = Banyaknya testee yang dapat menjawab dengan betul terhadap butir item yang
bersangkutan
JS = Jumlah testee yang mengikuti tes hasil belajar.
Dalam kaitan dengan hasil analisis item dari segi derajat kesukaran, maka tindak
lanjut yang perlu dilakukan oleh tester adalah sbegai berikut:
1. Untuk butir-butir item yang berdasarkan hasil analisis dalam kategori baik,
seyogyanya butir item tersebut segera dicatat dalam buku bank soal.
2. Untuk butir-butir item yang masuk dalam kategori terlalu sukar ada tiga
kemungkinan yaitu: (1) butir item tersebut dibuang atau tidak dikelaurkan lagi
dalam tes hasil belajar yang akan datang; (2) diteliti ulang, dilacak dan ditelusuri
untuk mengetahui factor kesulitan dari butir item tersebutsetelah ada perbaikan
maka buitr item terdebut dapat dikeluarkan lagi dalam tes hasil belajar yang
akan datang; (3) butir item yang terlalu sukar tidak digunakan dalam tes hasil
belajar tetapi dimanfaatkan untuk tes-tes yang lain seperti tes seleksi yang
sifatnya ketat, dengan tujuan testee yang berkemampuan rendah akan mudah
tersisihkan dari seleksi.
3. Untuk butir item yang masuk dalam kategori mudah juga terdapat tiga
kemungkinan yaitu: (1) buti item tersebut tidak dipakai dalam tes hasil belajar
slanjutnya, (2) diteliti ulang, dilacak dan di telusuri faktornya, setelah ada
perbaikan dapat dikeluarkan lagi pada tes hasil belajar berikunya untuk
mengetahui derajat kesukarannya lebih baik ataukah tidak,(3) sama seperti
halnya butir item yang sukar, butir item ini dapat digunakan dalam tes seleksi
yang sifatnya longgar atau tes formalitas saja, tetapi tidak digunakan dalam tes
hasil belajar.
Kelemahan utama yang terdapat pada angka indeks kesukaran rata-rata P
ialah, adanya hubungan yang terbalik antara derajat kesukaran item dengan
angka indek itu sendiri. Karena makin rendah angka indeks kesukaran item yang
dimiliki oleh sebutir item akan semkain tinggi derajat kesukaran item tersebut,
sebaliknya semakin tinggi angka indeks kesukaran yang dimiliki oleh sebutir
item, maka derajat kesukaran item tersebut semakin rendah. Jadi hubunga
diantara keduanya hubungan yang berlawanan arah.
Cara kedua yang dapat ditempuh dalam mencari atau menghitung angka
indeks kesukaran item adalah dengan menggunakan skala kesukaran linear.
Skala kesukaran linear ini disusun dengan cara mentransformasikan nilai P
menjadi nilai z, dimana perubahan dari P ke z itu dilakukan dengan berkonsultasi
pada tebal nilai z yang pada umumnya dilampirkan pada buku-buku statistik.
--Langkah pertama: Mengoreksi nilai P Kotor (Pk) menjadi nilai P bersih (Pb)
dengan menggunakan rumus :
Di mana :
Pb = P bersih.
Pk = P kotor.
a = Alternatif atau option yang disediakan atau dipasangkan pada butir item
yang bersangkutan.
1 = Bilangan konstan.
--Langkah kedua: mentransformasikan nilai P bersih (Pb) menjadi z
--Langkah ketiga: mencari atau menghitung anka indek dengan
menggunakan indeks Davis yang diberi lambang D, yang diperoleh dengan
menggunakan rumus: D = 21,063 z +50 keuntungan menggunakan indeks ini
adalah kita dapat terhindar dari tanda minus yang dimungkinkan terjadi apabila
kita menggunakan skala kesukaran linier.
B. Teknik Analisis Daya Pembeda Item
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk
dapat membedakan ( mendiskriminasi) antara testee yang berkemampuan tinggi
( pandai), dengan testee yang berkemampuan rendah (= bodoh). Mengetahui daya
pembeda item itu penting sekali, sebab salah satu dasar yang dipegangi untuk
menyusun butir-butir item tes hasil belajar adalah adanya anggapan, bahwa
kemampuan antara testee yang satu dengan testee yang lain itu berbeda-beda, dan
bahwa butir-butir item tes hasil belajar itu haruslah mampu memberikan hasil tes
yang mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat di
kalangan testee tersebut. Daya pembeda item dapat diketahui dengan cara melihat
besar kecilnya angka indeks diskriminasi item, yaitu angka yang nenunjukkan besar
kecilnya daya pembeda (diskrimnasi power) butir item. Untuk mengetahui angka
indeks ini dapat menggunakan rumus
D = PA-PB atau D = PH-PL
Dimana:
D = discriminatory power
PA atau PH = proporsi testee kelompok atas yang dapat menjawab betul butir item
yang bersangkutan. PA atau PH ini dapat diperoleh dengan rumus :
QUOTE
Dimana:
BA= banyaknya testee kelompok atas yang dapat menjawab dengan betul butir
item yang bersangkutan.
JA= jumlah testee yang termasuk dalam kelompok atas.
PH atau PL = proporsi tes kelompok bawah yang dapat menjawab dengan betul
butir item yang bersangkutan. PH atau PL diperoleh dengan cara:
QUOTE
Dimana:
BB= banyaknya testee kelompok bawah yang dapat menjawab dengan betul butir
item yang bersangkutan.
JA= jumlah testee yang termasuk dalam kelompok bawah.
Rumus kedua untuk mengetahui angka indeks daya pembeda adalah dengan
menggunakan teknik korelasi Phi (Ø).
QUOTE
Dimana:
Ø = angka indeks korelasi Phi; p = proporsi seluruh testee yang jawabannya betul;
PH= proportion of the higher group; PL= proportion of the lower group; 2 =
bilangan konstan; q = proporsi seluruh testee yang jawabannya salah, dimana q =
(1- p).
C. Teknik Analisis Fungsi Distraktor
Pada saat membicarakan tentang tes obyektif bentuk multiple choice item telah
dikemukakan bahwa pada tes obyektif bentuk multiple choice item tersebut untuk
setiap butir item yang dikeluarkan dalam tes hasil belajar telah dilengkapi dengan
beberapa kemungkinan jawaban, atau yang sering dikenal dengan istilah option
atau alternatif.
Option atau alternatif itu jumlahnya berkisar antara tiga sampai dengan lima
buah, dan dari kemungkinan-kemungkinan jawaban yang terpasang pada setiap
butir item itu, salah satu diantaranya adalah merupakan jawaban betul (= kunci
jawaban); sedangkan sisanya adalah merupakan jawaban salah. Jawaban-jawaban
salah itulah yang biasa dikenal dengan istilah distractor (distraktor = pengecoh).
Tujuan utama dari pemasangan distraktor pada setiap butir item itu adalah, agar
dari sekian banyak testee yang mengikuti tes hasil belajar ada yang tertarik atau
terangsang untuk memilihnya, sebab mereka menyangka bahwa distraktor yang
mereka pilih itu merupakan jawaban betul. Jadi mereka pilih itu merupakan
jawaban betul. Jadi mereka terkecoh. Tentu saja, makin banyak testee yang
terkecoh, maka kita dapat menyatakan bahwa distraktoritu makin dapat
menjalankan fungsinya dengan sebaik-baiknya.
Distraktor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila
distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5% dari seluruh peserta
tes. Misalnya, tes hasil belajar diikuti oleh 100 orang testee. Distraktor yang
dipasang pada item tersebut dapat dinyatakan berfungsi apabila minimal 5% orang
dari 100 orang testee itu sudah “terkecoh” untuk memilih distraktor tersebut.
DAFTAR PUSTAKA

Sukardi. E, dan Maramis. W. F. Penilaian Keberhasilan Belajar,Jakarta:Erlangga:University


Press,1986.
Bistok Sirait. Menyusun Tes Hasil Belajar. Semarang Press, 1985.
Atwi Suparman, Desain Instruksional, Jakarta: PAU ,1997.
Arikunto, Suahrsimi. 2010. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
Purwanto, M. Ngalim. 2010. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung:
Remaja Rosda karya,
Sudijono, Anas. 2001. Pengantar Evaluasi Pendidikan, Jakarta: Raja Grafindo Persada

Anda mungkin juga menyukai