Anda di halaman 1dari 16

MAKALAH

Evaluasi Pembelajaran Biologi


“Analisis Instrumen Tes (Objektif dan Essay)”

Dosen Pengampu:
Dr. Heffi Alberida, M. Si
Ria Anggriyani, M. Pd

Oleh:
Kelompok 5
Fhadilah Rusva Wulan (22031066)
Silvia Ramadani (22031040)
Vernika Zafit (22031113)

Departemen Biologi
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Negeri Padang
2023
1
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa karena telah melimpahkan
rahmat dan berkah-Nya sehingga penulis dapat menyelesaikan tugas penulisan makalah
kelompok yang berjudul “Analisis Instrumen Tes (Objektif dan Essay)” ini dengan baik dan
tanpa kendala apapun.

Pada kesempatan ini, penulis juga mengucapkan terima kasih kepada pihak yang telah membantu
sekaligus memberi dukungan dalam penyusunan makalah ini, terutama dosen pengajar ibu
Dr.Heffi Alberida,M.Si, kedua orang tua dan teman-teman seperjuangan.

Penulis memohon maaf bila masih terdapat kekurangan dalam penyusunan makalah ini, baik
secara materi maupun penyampaian dalam karya tulis ini. Penulis juga menerima kritik serta
saran dari pembaca agar dapat membuat makalah dengan lebih baik di kesempatan berikutnya.

Penulis berharap makalah ini memberikan manfaat dan dampak besar sehingga dapat menjadi
inspirasi bagi pembaca, terutama mahasiswa program studi pendidikan biologi.

Padang, 10 September 2023

Penulis

2
DAFTAR ISI

KATA PENGANTAR……………………………………………………………………….2
DAFTAR ISI…………………………………………………………………………………3
BAB I PENDAHULUAN
1. Latar Belakang…………………………………………………………….4
2. Rumusan Masalah…………………………………………………………5
3. Tujuan………………………………………………………………….......5
BAB II PEMBAHASAN
1. Analisis Isi…………………………………………………………………6
2. Analisis Konstruk………………………………………………………….7
3. Analisis Item……………………………………………………………….8
4. Validitas…………………………………………………………………….8
5. Reliabilitas………………………………………………………………….9
6. Daya Pembeda……………………………………………………………,,11
7. Indeks kesukaran…………………………………………………………..11
8. Kualitas Option……………………………………………………………12

a. Anates……………………………………………………………...12
b. SPSS……………………………………………………………….13
BAB III PENUTUP
1 Kesimpulan……………………………………………………………………………,,..15
2 Saran……………………………………………………………………………………...15
DAFTAR PUSTAKA………………………………………………………………………..16

3
BAB I
PENDAHULUAN

1.1 Latar Belakang


Instrumen dalam lingkup evaluasi didefinisikan sebagai perangkat untuk mengukur hasil
belajar siswa yang mencakup hasil belajar dalam ranah kognitif, afektif dan psikomotor.
Bentuk instrumen dapat berupa tes dan non tes. Instrumen bentuk tes mencakup: tes uraian
(uraian objektif dan uraian bebas, tes pilihan ganda, jawaban singkat, menjodohkan, benar
salah, unjuk kerja (performance test), dan portofolio. Instrumen bentuk non tes mencakup:
wawancara, angket dan pengamatan (observasi. "sebelum instrumen digunakan hendaknya
dianalisis terlebih dahulu. Dua karakteristik penting dalammenganalisis instrumen adalah
validitas dan reliabilitasnya.
Instrumen dikatakan valid (tepat, absah) apabila instrumen digunakan untuk mengukur
apa yang seharusnya diukur. Instrumen untuk mengukur kemampuan siswa sekolah dasar
tidak tepat jika digunakan pada siswa "sekolah menengah. dalam hal ini sasaran kepada
siapa instrumen itu ditujukan merupakan salah satu aspek yang harus dipertimbangkan
dalam menganalisis validitas suatu instrumen. Aspek lainnya misalnya kesesuaian indikator
dengan butir soal, penggunaan bahasa, kesesuaian dengan kurikulumyang berlaku, kaidah
kaidah dalam penulisan butir soal dan sebagainya.
Upaya untuk mengukur seberapa jauh tujuan-tujuan pembelajaran yang telahtercapai,
dapat dilakukan dengan evaluasi, dalam hal ini evaluasi hasil belajar. Alatukur untuk
mengevaluasi hasil belajar tersebut digunakan tes. Tes adalah cara (yangdapat dipergunakan)
atau prosedur yang (yang perlu ditempuh) dalam rangkapengukuran dan penilaian di bidang
pendidikan. Salah satu bentuk tes hasil belajaradalah tes pilihan ganda. Tes pilihan ganda
adalah bentuk tes obyektif yangmempunyai ciri utama kunci jawaban jelas dan pasti
sehingga hasilnya dapat diskorsecara obyektif.
Artinya setelah siswa mengerjakan soal dalam bentuk tes pilihanganda maka siswa
tersebut akan memperoleh skor yang sama jika hasil pekerjaanyadiperiksa oleh lebih dari
satu pemeriksa. Hal ini disebabkan setiap jawaban diberiskor yang sudah pasti dan tidak
mengenal jawaban di antara benar dan salah ataujawaban benar sebagian saja soal pilihan
ganda terdiri dari pernyataan dan pertanyaanyang harus dijawab oleh siswa atau melengkapi
dengan memilih salah satu daribeberapa alternatif yang tersedia. Satu di antaranya adalah
yang paling benar, lainnyadisebut pengecoh. Guru yang berkompeten dapat memengaruhi
keberhasilan siswa dalam pembelajaran, karena guru yang berkompeten mampu
memberikan jalan keluar bagi siswa yang mengalami kesulitan belajar. Solusi yang tepat
akan membantu siswa dalam meningkatkan prestasi belajarnya.

4
1.2 Rumusan Masalah
 Bagaimana langkah langkah mengembangakan instrumen tes
 Bagaimana pendekatan analisis isi
 Bagaimana analisis konstruk dan analisis item pada terhadap instrumen tes
 Bagaimana validitas, reliabilitas, anates, dan SPSS terhadap instrumen tes (objektif dan
essay)

1.3 Tujuan
Tujuan analisis instrumen tes (baik objektif maupun essay) dalam evaluasi pembelajaran
biologi adalah untuk mengukur pencapaian siswa terhadap tujuan pembelajaran yang telah
ditetapkan dalam mata pelajaran biologi.

5
BAB II
PEMBAHASAN
Secara harfiyah, kata “tes” berasal dari bahasa Perancis Kuno: testum dengan arti: “piring untuk
menyisihkan logam-logam mulia” (maksudnya dengan menggunakan alat berupa piring itu akan
dapat diperoleh jenis-jenis logam mulia yang nilainya sangat tinggi) dalam bahasa inggris ditulis
dengan test yang dalam bahasa Indonesia diterjemahkan dengan “tes”, “ujian” atau “percobaan”.
Menururt Suharsimi Arikunto, tes adalah serentetan pertanyaan atau latihan serta alat lain yang
digunakan untuk mengukur keterampilan, pengetahuan, intelegensi, kemampuan atau bakat yang
di miliki oleh individu atau kelompok. Menurut Eko Putro Widoyoko tes adalah “salah satu alat
untuk melakukan pengukuran, yaitu untuk mengumpulkan informasi karakteristik suatu obyek.
Di antara objek tes adaalah kemampuan peserta didik.6 Kemampuan peserta didik dalam
menjawab pertanyaan apabila tes yang digunakan adalah tes tertulis.
Berdasarkan uraian di atas dapat disimpulkan bahwa tes merupakan alat ukur untuk mendapatkan
informasi hasil belajar siswa yang memerlukan jawaban atau respon benar atau salah. kemudian
hasilnya diolah sehingga dapat digunakan untuk mengambil keputusan mengenai siswa ataupun
kesimpulan yang menggambarkan tingkah laku siswa tersebut.

A. Analisis Isi
Analisis isi adalah sebuah teknik yang digunakan untuk menganalisis dan memahami
teks. Analisis isi juga dapat diartikan sebagai Teknik penyelidikan yang berusaha
menguraikan secara objektif, sistematik dan kuantitatif. Menurut H.D. Laswell analisis
seperti ini disebut dengan semantik kuntitatif. Digunakan untuk mengukur sejauh mana
tes mencerminkan apa yang akan diukur dari kemampuan siswa sehubungan dengan
tujuan pembelajaran yang ingin dicapai. Validitas isi mengukur lebih pada ranah kognitif
siswa seperti yang tercantum dalam kurikulum. Penilaiannya harus dicocokkan dengan
Tujuan Instruksional Khusus (TIK). Karena itu isi tes hendaknya sesuai dengan
pokokpokok bahasan yang diberikan kepada siswa. Cara penilaian validitas isi dapat
dilakukan oleh beberapa judges kalau bisa 3 atau 5 orang, usahakan jangan meminta
judges dalam jumlah genap agar tidak sulit menarik kesimpulan jika ada dua pendapat
yang berlainan bisa ada penengah. Jika validitas isi ini digunakan untuk instrumen
penelitian, para pakar penilai dapat diambil dari berbagai komponen, misalnya dari guru,
dosen pembimbing dan pakar bidang studi. Baik guru sebagai pembuat tes maupun
mahasiswa yang membuat instrumen harus jujur jika tes atau instrumennya tidak valid,
sebab validitas isi suatu tes dikatakan sahih kalau isinya sesuai dengan substansi yang
dikehendaki TIK. Butirbutir yang ada dalam tes merupakan perpanjangan tangan dari
TIK yang ditentukan sebelumnya. Validitas isi tidak bisa diukur dengan angka, karena
hasil penilaiannya berupa penyesuaian substansi tes dengan TIK yang diambil dari
kurikulum. Isi tes harus mencerminkan substansi yang terkandung di dalam TIK, karena
itu pada waktu menyusun tes harus selalu mengacu pada “Blue Print” yang dibuat sesuai
dengan TIK. Misalnya dalam TIK pada pertemuan pertama perkuliahan metode
6
penelitian disebutkan bahwa setelah mengikuti perkuliahan ini mahasiswa dapat: 1)
menjelaskan hakikat penelitian ilmiah minimal 80% benar, 2) membedakan ciri penelitian
kualitatif dan kuantitatif minimal 80% benar. Maka butir-butir tes harus mencerminkan
tentang kedua hal tersebut di atas, agar mahasiswa memiliki kemampuan kedua hal
tersebut di atas. Dengan demikian tes tersebut harus dapat mengukur pokok bahasan yang
dibahas pada setiap pertemuan dengan benar.

B. Analisis Konstruksi
Analisis konstruksi tes adalah telaah terhadap seperangkat tes hasil belajar, apakah
seperangkat tes hasil belajar tersebut layak sebagai tes yang baik dalam arti valid, reliable,
objektif, dan praktis. Validitas konstruk merupakan salah satu tipe validitas internal
rasional suatu instrumen yang menunjukkan sejauh mana instrumen tersebut mengungkap
suatu trait atau konstruk teoretik yang hendak diukurnya. Masih tetap mengacu pada
kompetensi dasar tetapi berbeda dengan validitas isi yang mengukur tes dari substansi
soal, validitas konstruksi menitik beratkan pada tes yang setiap butirnya membangun
setiap aspek berpikir yang disebutkan dalam kompetensi dasar. Validitas ini biasanya
dipakai untuk mengukur kesahihan aspek psikologis seperti minat, bakat, kelelahan,
intelegensia dan lain-lain. Dengan demikian validitas konstruksi ini tidak berarti
membangun phisik seperti jembatan, rumah dan lain sebagainya, tetapi bangun pengertian
di sini artinya sejauh mana tes dapat diartikan menurut bangun pengertian itu. Jadi
validitas konstruk tidak membangun secara phisik kelihatan mata, tetapi bangun
pengertian konsep. Misalnya dalam kompetensi dasar tertulis: mahasiswa akan dapat
menjelaskan proses “evaluasi diri” minimal 80% benar. Tes menyiratkan tentang bangun
pengertian evaluasi diri. Selanjutnya untuk menguji validitas konstruksi digunakan:
1) Pengujian validitas konvergen
2) Pengujian validitas diskriminan
3) Pengujian stabilitas dan keajegan.
Pelaksanaan uji validitas konvergen melalui uji empirik, yaitu dengan cara
mengkorelasikan sekor total dengan sekor faktor, diasumsikan bahwa antara sekor total
dengan sekor faktor terdapat korelasi yang signifikan. Kemudian untuk pengujian validitas
diskriminan dengan cara mengkorlasikan tiap-tiap faktor, artinya sekor faktor yang satu
dikorelasikan dengan sekor faktor yang lain, diasumsikan bahwa masing-masing faktor
tidak berkorelasi secara signifikan. Ini berarti bahwa tiap faktor secara khusus mengukur
aspek tertentu. Sedangkan pengujian stabilitas dan keajegan melalui cara tes ulang dan
pengujian konsistensi dengan uji belah dua. Untuk stabilitasnya dapat dilakukan dengan
cara membandingkan hasil tes antar kelompok. Mengenai validitas konstruk atau validitas
bangun pengertian Ary mencontohkan ketika Dall mulai membuat skala kematangan
sosial Vineland yang merumuskan bangun pengertian kematangan sosial sebagai suatu
gabungan unsur yang saling berkaitan meliputi: menolong diri sendiri, kesibukan,
komunikasi dan hubungan sosial. Unsur-unsur tersebut merupakan aspek dari bangun
pengertian itu yang harus dimasukkan dalam tes tentang kematangan sosial. Validitas
bangun pengertian merupakan perpaduan antara pendekatan logis dan empiris. Misalnya

7
jika seorang peneliti ingin mengukur aspek “kelelahan” siswa melalui tes, maka
komponen yang diukur tidak hanya kelelahan siswa secara phisik, perlu juga dimasukkan
komponen kelelahan psikis. Namun demikian, jika peneliti hanya mau mengukur
komponen phisik saja, maka tes harus benar-benar dibuat khusus untuk mengukur
kelelahan phisik siswa. Melalui tes yang diberikan, peneliti menguji validitas bangun
pengertian kelelahan yang butirbutir tesnya tetap mengacu pada “blue print” yang
diturunkan dari kompetensi dasar. Dengan demikian butir-butir tes untuk mengukur
komponen-komponen tentang kelelahan tersebut merupakan pendekatan logis dari
validitas bangun pengertian.

C. Analisis Item
Analisis item tes adalah proses pengkajian butir-butir tes hasil belajar yang didasarkan pada
jawaban siswa terhadap tes tersebut, sehingga dapat diketahui kualitas dari suatu tes sebagai alat
pengukur hasil belajar siswa. Ada dua model analisis yang dapat dilakukan, yaitu analisis
kualitatif dan analisis kuantitatif:
Analisis kualitatif adalah analisis yang dilakukan oleh teman sejawat dalam rumpun keahlian
yang sama. Tujuannya adalah untuk menilai materi, kontruksi dan apakah bahasa yang
digunakan sudah memenuhi pedoman dan sudah bisa dipahami oleh siswa.
Analisis kuantitatif dilakukan dengan cara mengujicobakan instrument yang telah dianalisis
secara kualitatif kepada sejumlah siswa yang memiliki karakteristik sama dengan siswa yang
akan diuji dengan instrument tersebut. Analisis soal secara kuantitatif menekankan pada analisis
karakteristik internal tes melalui data yang diperoleh secara empiris.Karakteristik internal secara
kuantitatif dimaksudkan meliputi validitas, reliabilitas, daya pembeda, tingkat kesukaran serta
efektifitas fungsi pengecoh (distraktor).
1. Validitas
Validitas berasal dari kata validity, yang dapat diartikan sebagai ketepatan atau
kesahihan; yaitu sejauhmana sebuah instrumen atau alat ukur mampu atau berhasil
mengukur apa yang seharusnya di ukur. Suatu instrumen dikatakan memiliki validitas
yang baik jika hasil pengukurannya tepat dan cermat.
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan hasil pengalaman. Dua
hal tersebut, hal yang pertama akan menghasilkan validitas logis (Logis validity) dan
hal yang kedua diperoleh validitas empiris (empirical validity). Dua hali inilah yang
dijadikan dasar pengelompokan validitas. Secara garis besar ada dua macam validitas,
yaitu : validitas tes dan validitas butir tes.
1) Validitas Tes Adapun jenis validitas tes secara umum dapat
dikelompokkan ke dalam 2 (dua) pengelompokan, yaitu: validitas logis
dan validitas empiris.
a. Validitas Logis Validitas logis mengandung arti logika atau
penalaran. Dengan demikian maka validitas logis untuk
sebuah instrumen evaluasi menunjukan pada kondisi bagi
8
sebuah instrumen yang memenuhi persyaratan valid
berdasarkan hasil penalaran dan sudah dirancang secara
baik, sesuai dengan teori dan ketentuan yang berlaku.
ketepatan mengukur, disebut tes hasil belajar yang telah
memiliki validitas logis (logocal validity). Istilah lain
untuk validitas logika adalah : Validitas rasional, Validitas
Ideal, atau Validitas Das Sollen.

b) Validitas Empiris Yang dimaksud dengan validitas empiris adalah


memiliki pengertian pengalaman, sehingga sebuah instrumen
dikatakan memiliki validitas empiris apabila sudah diuji dari
pengalaman. Dengan validitas empiris tidak dapat diperoleh hanya
dengan jalan menyususn instrumen berdasarkan ketentuan seperti
halnya validitas logis, tetapi harus dibuktikan dengan hasil analisis
yang dilakukan terhadap data hasil pengamatan di lapangan, Ada
dua cara untuk mengetahui apakah tes hasil belajar itu sudah
memiliki validitas empiris ataukah belum, yakni dari segi
ketepatan meramalnya (Predictive validity) dan daya ketepatan
bandingnya (Concurrent validity)
2) Validitas Butir Tes Yang dimaksud dengan validitas butir dari suatu tes
adalah ketepatan mengukur yang dimiliki oleh sebuah butir soal (yang
merupakan bagian yang tak terpisahkan dari tes sebagai suatu totalitas),
dalam mengukur apa yang seharusnya diukur lewat sebuah butir tes
tersebut.
2. Reliabilitas
Reabilitas merupakan penerjemahan dari kata reliability yang mempunyai asal kata
rely dan ability. Pengukuran yang memiliki reliabilitas tinggi disebut sebagai
pengukur yang reliabel. Konsep dari reliabilitas adalah sejauh mana hasil suatu tes
dapat dipercaya.Dengan demikian reliabilitas dapat pula diartikan dengan keajegan
atau stabilitas. Reliabilitas menunjuk pada satu pengertian bahwa suatu instrumen
cukup dapat dipercaya untuk digunakan sebagai alat pengumpul data karena
instrumen tersebut sudah baik. Instrumen yang baik tidak akan bersifat tendensius
mengarahkan responden untuk memilih jawaban-jawaban tetentu. Instrumen yang
sudah dapat dipercaya, yang reliabel akan menghasilkan data yang dapat dipercaya
juga. Apabila datanya memang benar sesuai dengan kenyataannya, maka berapa
kalipun diambil, tetap akan sama. Reliabilitas menunujuk pada keterandalan sesuatu.
Reliabel artinya dapat dipercaya, jadi dapat diandalkan.
Faktor yang Mempengaruhi Reliabilitas :
 Luas tidaknya sampling yang diambil Makin luas suatu
sampling, berarti tes semakin andal.
 Perbedaan bakat dan kemampuan murid yang di tes Makin
variatif kemampuan peserta tes, berarti makin tinggi keandalan

9
koefisien tes. Tes yang diberikan kepada beberapa tingkat kelas
yang berbeda, lebih tinggi keandalannya.
 Suasana dan kondisi testing Suasana ketika sedang berlangsung
testing, seperti tenang, gaduh, banyak gangguan, pengetes yang
marahmarah dapat mengganggu pengerjaan tes sehingga
dengan demikian mempengaruhi pula hasil dan keandalan tes.
Berbeda dengan tes hasil belajar bentuk uraian, maka pada bentuk tes obyektif penentuan
reliabilitas tes dapat menggunakan tiga macam pendekatan, ketiga macam pendekatan tersebut
adalah sebagai berikut:
1) Pendekatan Test-retest (Pendekatan Bentuk
Ulangan)
Tujuan reliabilitas ini adalah untuk mengetahui
koefisien stabilitas tes. Tes tersebut memiliki
keterandalan atau keajegan bilamana dipakai
untuk mengukur obyek yang sama dalam waktu
yang berbeda-beda hasilnya tetap sama. Ada
enam langkah yang dapat ditempuh pada uji
reliabilitas ini yaitu:
a. Menyusun sebuah tes yang akan
diukur reliabilitasnya.
b. Mengujikan tes yang tersusun
tersebut (tahap I)
c. Menghitung skor hasil tes tahap I
d. Mengujikan ulang tes yang
tersusun tersebut (tahap II)
e. Menghitung skor hasil tes tahap II
f. Menghitung reliabilitas tes
tersebut dengan jalan
mengorelasikan skor tes I dengan
skor tes II dengan rumus korelasi
rank-order (teknik korelasi tes
jenjang) dari Spearman.
2) Pendekatan Alternate Form (Pendekatan Bentuk
Paralel) Pendekatan Alternate Form adalah
pengujian reliabilitas yang dilakukan dengan cara
membuat dua perangkat tes yang paralel dan
mengujikan sekaligus. Dua perangkat tes parallel
adalah dua perangkat tes yang dikembangkan dari
spesifikasi yang sama: jumlah butir, pelaksanaan,
bentuk, waktu uji coba, peserta uji coba, dan kisi-
kisi. Adapun untuk mencari atau menghitung

10
reliabilitas tes dapat digunakan teknik korelasi
Product Moment dari Pearson atau teknik korelasi
Rank Order dari Spearman (khusus untuk N
kurang dari 30).Adapun langkah-langkah yang
dapat ditempuh, antara lain:
a. Menyusun dua buah tes yang
ekuivalen.
b. Menguji kedua tes tersebut (dalam
waktu yang bersamaan atau
beriringan).
c. Memberikan skor tes yang telah
diujikan, disusun dengan
memisahkan antara tes A dan tes B
d) Mencari koefisiensi stabilitas
kedua tes (A dan B) dengan jalan
mencari korelasinya melalui
rumus korelasi Product Moment.
3. Daya Pembeda
Analisis daya pembeda suatu soal adalah mengkaji butir-butir soal dengan tujuan
untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong
mampu dengan siswa yang tergolong kurang atau lemah prestasinya.71 Artinya,
apabila suatu soal diberikan kepada anak yang mampu, maka hasilnya menunjukkan
prestasi yang tinggi dan apabila diberikan kepada siswa yang lemah maka hasilnya
rendah. Daya pembeda suatu butir soal dapat diketahui dengan melihat besar kecilnya
angka indeks diskriminasi butir soal, yaitu sebuah angka atau bilangan yang
menunjukkan besar kecilnya daya pembeda yang dimiliki sebutir soal. Daya pembeda
dihitung berdasarkan atas pembagian testee kedalam dua kelompok, yaitu kelompok
atas atau kelompok yang tergolong pandai dan kelompok bawah atau kelompok testee
yang tergolong kurang pandai. Adapun cara menentukan dua kelompok tersebut bisa
bervariasi. Namun pada umumnya digunakan presentase sebesar 27% dari testee yang
termasuk dalam kelompok atas dan 27% diambil dari testee kelompok bawah.

4. Indeks Kesukaran
Analisis tingkat kesukaran artinya mengkaji soal-soal tes dari segi kesulitan sehingga
dapat diperoleh soal-soal yang termasuk mudah, sedang dan sukar.68perhitungan
tingkat kesukaran soal dapat dilihat apabila suatu soal memiliki tingkat kesukaran
seimbang (proporsional), maka dapat dikatakan bahwa soal tersebut baik. Suatu soal
hendaknya tidak terlalu sukar dan tidak terlalu mudah. Perbandingan antara soal
mudah, sedang dan sukar bisa dibuat 3-4-3. Artinya, 30% soal kategori mudah, 40%
soal kategori soal sedang, dan 30% lagi soal kategori soal sukar. Bisa juga
perbandingan 3-5-2 dan sebagainya.

11
5. Kualitas Option
Yang dimaksud pola jawaban soal di sini adalah distribusi testee dalam hal menentukan
pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan menghitung
banyaknya testee yang memilih pilhan jawaban a, b, c atau d atau yang tidak memilih pilihan
manapun (blangko). Dalam istilah evaluasi disebut omit, disingkat O. Dari pola jawaban soal
dapat ditentukan apakah pengecoh (distractor) berfungsi sebagai pengecoh dengan baik atau
tidak. Pengecoh yang tidak dipilih sama sekali oleh testee berarti bahwa pengecoh itu jelek,
terlalu mencolok menyesatkan. Sebaliknya sebuah distractor (pengecoh) dapat dikatakan
berfungsi dengan baik apanila distraktor tersebut mempunyai daya tarik yang besar bagi
pengikutpengikut tes yang kurang memahami konsep atau kurang menguasai bahan. Sesuatu
distraktor dapat diperlakukan dengan 3 cara : a. Diterima, karena sudah baik. b. Ditolak, karena
tidak baik. c. Ditulis kembali, karena kurang baik. Kekurangannya mungkin hanya teletak pada
rumusan kalimatnya sehingga hanya perlu ditulis kembali, dengan perubahan seperlunya.
Menulis soal adalah suatu pekerjaan yang sangat sulit, sehingga apabila masih dapat diperbaiki,
sebaiknya diperbaiki saja, tidak dibuang. Suatu distraktor dapat dikatakan berfungsi baik jika
paling sedikit dipilih oleh 5% pengikut tes. Pendidik perlu meningkatkan kualitas butir soal
melalui analisis terhadap komponen-komponen utama dari tiap-tiap butir soal yang meliputi (1)
validitas (2) reliabilitas (3) tingkat kesukaran, (4) daya pembeda, (5) sebaran kunci jawaban, dan
(6) efektifitas pengecoh soal. Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan
kualitas soal, yaitu apakah suatu soal (1) dapat diterima karena telah didukung oleh data statistic
yang memadai, (2) diperbaiki, karena terbukti terdapat beberapa kelemahan, atau bahkan (3)
tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali.
Seiring perkembangan teknologi banyak sekali program-program yang dapat membantu
dalam melakukan evaluasi, antara lain:
a) MENGGUNAKAN PROGRAM ANATES
Program Anates merupakan software untuk analisis butir soal dengan menggunakan bahasa
Indonesia yang dikembangkan oleh Drs. Karnoto, M.Pd. dan Yudi Wibisono, ST., nomor register
Hak Cipta di dirjen HAKI: C00200400291-338.
Keunggulan software ini sebagai program analisis butir soal daripada Program Iteman adalah
dapat digunakan untuk analisis butir soal bentuk uraian, di samping untuk analisis soal bentuk
pilihan ganda. Penggunaan bahasa Indonesia dalam program ini, juga merupa-kan salah satu sisi
kemudahan dalam penggunaannya daripada program lain yang menggunakan bahasa Inggris.
Hasil analisis tentang skor yang diperoleh setiap testee juga dapat ditransfer ke Ms.Excel untuk
dihitung nilainya, maka saat mendalami program ini agar sekaligus dapat mendalami aplikasi
Ms.Excel. Jika demikian maka pemanfaatan Anates akan menjadi optimal.
Berikut ini adalah langkah-langkah menggunakan program Anates:
1. Klik Start> All program > Anates, kemudian akan muncul dialog box sebagai berikut:
2. Pilih tombol Jalankan Anates Pilihan Ganda, untuk analisis butir soal pilihan ganda. Pilih
Jalankan Anates Uraian, untuk analisis butir soal Uraian.
3. Untuk yang pertama kita akan mencoba menganalisis butir soal pilihan ganda.
4. Pada kolom FILE, klik “Buat File Baru” untuk analisis baru, “Baca File yg Ada” untuk
membuka file tersimpan, “Keluar dari Anates” untuk keluar program.
5. Klik “Buat File Baru”
12
6. Pada Jumlah Subyek tuliskan jumlah peserta tes, jumlah soal dan jumlah option, kemudian klik
OK
7. masukkan kunci jawaban masing-masing nomor soal, tuliskan masing-masing nama peserta tes
dan jawaban peserta tes untuk masing-masing soal, untuk semua peserta
8. Entri data selesai. Kemudian pilih dan klik “Kembali Ke Menu Utama”
9. Pada kolom PENYEKORAN pilih “Olah Semua Otomatis”
10. Proses analisis selesai, pilih “ Cetak ke Printer” jika mau langsung di print, pilih “Cetak ke File”
jika mau disimpan dalam Notepad.
11. Klik “Kembali Ke Menu Sebelumnya”, pada kolom FILE pilih “Simpan”
12. Klik “ Keluar dari Anates” pada dialog box klik “Yes”
13. Selamat Bekerja.

INTERPRETASI HASIL
Program Anates ini tetap menuntut interpretasi data dari guru yang menggunakan.
Namun dalam program ini parameter-parameter yang dapat dimunculkan cukup lengkap antara
lain :
1. Tingkat Kesukaran
Merupakan prosentase yang memperlihatkan tingkat kesukaran soal yang dibuat. Soal hendaknya
tidak terlalu mudah (100% bisa dijawab peserta) dan juga tidak terlalu sukar (tidak satupun
peserta bias menjawab), dengan kata lain soal harus bersifat moderat.
2. Indeks Daya Beda
Daya pembeda menunjukkan sejauh mana tiap butir soal mampu membedakan siswa yang
menguasai bahan dan siswa yang tidak menguasai bahan. Butir soal yang daya pembedanya
rendah, tidak ada manfaatnya, malahan dapat merugikan siswa yang belajar sungguh-sungguh.
3. Kualitas Pengecoh
Tiap pengecoh/distraktor hendaknya bermanfaat, yakni ada sejumlah siswa yang memilihnya.
Pengecoh yang tidak dipilih sama sekali berarti tidak bermanfaat, sedang pengecoh yang dipilih
oleh hampir semua siswa berarti terlalu mirip dengan jawaban yang benar.
4. Reliabilitas
Reliabilitas tes adalah tingkat keajegan (konsistensi) suatu tes, yakni sejauh mana suatu tes dapat
dipercaya untuk menghasilkan skor yang ajeg/konsisten (tidak berubah-ubah). Tes yang reliabel
atau dapat dipercaya adalah tes yang menghasilkan skor secara ajeg, relatif tidak berubah
walaupun diteskan pada situasi dan waktu yang berbeda-beda. Sebaiknya, tes yang tidak reliabel
seperti karet untuk mengukur panjang, hasil pengukuran dengan karet dapat berubah-ubah (tidak
konsisten).
5. Homogenitas butir soal
Menunjukkan apakah tiap butir soal mengukur aspek atau kompetensi yang sama, atau sejauh
mana tiap butir soal menyumbang skor total tiap siswa. Butir soal yang homogen adalah yang
menunjang skor total. Sebaliknya butir soal yang tidak seiring dengan skor-total dikatakan tidak
homogen, dan lebih baik dibuang atau direvisi.

b) Menggunakan SPSS
SPSS merupakan sebuah program pengolah data yang sudah sangat dikenal di dalarn dunia
pendidikan. Penggunaannya sangat mudah untuk dipahami. Semua data diketik di dalam
format SPSS yang sudah disediakan. Setelah selesai, kemudian tinggal memilih statistik yang
akan digunakan pada menu ANALYZE . Misalnya uji validitas butir atau reliabilitas tes,
13
diklik pada menu ANALYZE kemudian pilih CORELATE, pilih BIVARIAT, untuk uji
reliabilitas pilih RELIABILITY. Di samping itu, program ini dapat digunakan untuk analisis
data kuantitatif secara umum

14
BAB III
PENUTUP
1. Kesimpulan
Instrumen merupakan alat yang digunakan untuk mengukur kegiatan evaluasi pembelajaran.
Salah satunya adalaah tes. Tes merupakan alat ukur untuk mendapatkan informasi hasil belajar
siswa yang memerlukan jawaban atau respon benar atau salah.
Analisis isi diartikan sebagai Teknik penyelidikan yang berusaha menguraikan secara objektif,
sistematik dan kuantitatif. Pendekatan analisis isi ada 3 yaitu: deskriptif, ekspanatif, dan
prediktif. Analisis konstruksi tes adalah telaah terhadap seperangkat tes hasil belajar, apakah
seperangkat tes hasil belajar tersebut layak sebagai tes yang baik dalam arti valid, reliable,
objektif, dan praktis. Selanjutnya untuk menguji validitas konstruksi digunakan:
1) Pengujian validitas konvergen
2) Pengujian validitas diskriminan
3) Pengujian stabilitas dan keajegan.
Analisis item tes adalah proses pengkajian butir-butir tes hasil belajar yang didasarkan pada
jawaban siswa terhadap tes tersebut, sehingga dapat diketahui kualitas dari suatu tes sebagai alat
pengukur hasil belajar siswa. Ada dua model analisis yang dapat dilakukan, yaitu analisis
kualitatif dan analisis kuantitatif. Analisis soal secara kuantitatif menekankan pada analisis
karakteristik internal tes melalui data yang diperoleh secara empiris.Karakteristik internal secara
kuantitatif dimaksudkan meliputi validitas, reliabilitas, daya pembeda, tingkat kesukaran serta
efektifitas fungsi pengecoh (distraktor).

2 .Saran
Penulis menyadari dalam penyusunan makalah diatas masih ada kesalahan serta jauh dari kata
sempurna. Adapun nantinya penulis akan segera melakukan perbaikan susunan makalah dengan
menggunakan pedoman dari beberapa sumber dan kritik yang membangun dari para pembaca.

15
DAFTAR PUSTAKA
Arikunto, Suharsimi.(2011). Dasar-dasar Evaluasi Pendidikan, Jakarta: Bumi Aksara.
Asrul, Ananda, R., & Rosnita. (2015). Evaluasi Pembelajaran. Bandung: Citapustaka Media.
Azwar, Saifudin.(2012). Reliabilitas dan Validitas, Yogyakarta: Pustaka Pelajar.
Dakhi, A. S. (2020). Peningkatan Hasil Belajar Siswa. JURNAL EDUCATION DEVELOPMENT.
Nurkancana, Wayan.( 1990). Evaluasi Hasil Belajar, Surabaya: Usaha Nasional.
Purwanto.(2011).Evalusai Hasil Belajar, Yogyakarta: Pustaka Pelajar.
Purwanto, M. Ngalim.(2010). Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, Bandung:
Remaja Rosdakarya.
Widoyoko, S. Eko Putro.(2014).Penilaian Hasil Pembelajaran di Sekolah, Yogyakarta: Pustaka
Pelajar.

16

Anda mungkin juga menyukai