Anda di halaman 1dari 16

Makalah Evaluasi Pengajaran TI

“Analisis Kualitas Soal Tes Uji Validitas”

Kelompok 7
Dina Rudiva Agusta (2100017)

Hikmahtul Heneva (21100019)

Ramadani Ermansah (21100036)

Dosen Pengampu : Dr.Evrialiani Rosba,S.Si.,M.Pd

PROGRAM STUDI PENDIDIKAN INFORMATIKA

UNIVERSITAS PGRI SUMATERA BARAT

2023
KATA PENGANTAR

Puji syukur kami panjatkan atas kehadirat Allah SWT, karena berkat rahmat-Nya kami

dapat menyelesaikan makalah yang berjudul “Analisis Kualitas Soal Tes Uji Validitas”.

Penulisan makalah ini diajukan untuk memenuhi tugas mata kuliah Evaluasi Pembelajaran TI.

Kami mengucapkan terima kasih kepada semua pihak yang telah membantu, sehingga makalah

ini dapat diselesaikan sesuai dengan waktu yang telah ditentukan. Makalah ini masih jauh dari

sempurna, oleh karena itu kami mengharapkan kritik dan saran yang bersifat membangun demi

kesempurnaan makalah ini. Semoga makalah ini memberikan informasi bagi teman – teman dan

bermanfaat untuk pengembangan ilmu pengetahuan bagi kita semua.

Padang, Mei 2023

Penulis

I
DAFTAR ISI

KATA PENGANTAR………………………………………………………………………….I

DAFTAR ISI…………………………………………………………………………………...II

BAB I PENDAHULUAN………………………………………………………………………1

Latar Belakang…………………………………………………………………………...1

Rumusan Masalah………………………………………………………………………..1

Tujuan Masalah…………………………………………………………………………..1

BAB II PEMBAHASAN………………………………………………………………………..2

A. ANALISIS KUALITAS TES DAN BUTIR SOAL…………………………………...2


B. VALIDITAS TES…………………………………………….………………………..5
C. UJI VALIDITAS………………………………………………………………………7

BAB III PENUTUP……………………………………………………………………………11

Kesimpulan……………………………………………………………………………..11

DAFTAR PUSTAKA………………………………………………………………………….12

II
BAB I
PENDAHULUAN

Latar Belakang
Proses belajar mengajar dilaksanakan tidak hanya untuk kesenangan atau bersifat
mekanis saja tetapi mempunyai misi atau tujuan bersama. Dalam usaha untuk mencapai misi dan
tujuan itu perlu diketahui apakah usaha yang dilakukan sudah sesuai dengan tujuan pendidikan?
Untuk mengetahui apakah tujuan pendidikan sudah tercapai, perlu diadakannya sebuah tes.
Tes merupakan salah satu cara untuk mengevaluasi proses pembelajaran yang dianggap
mampu memfasilitasi kebutuhan orang-orang di bidang pendidikan tentang perangkat atau alat
yang mampu memberi gambaran tentang proses pembelajaran yang dilaksanakan. Untuk
menghasilkan gambaran yang akurat, relevan dan sesuai dengan data yang terjadi dilapangan,
membutuhkan tes yang berkualitas, oleh karena itu dibutuhkan analisis kualitas tes guna
menciptakan kualitas tes yang benar-benar mampu melaksanakan tugasnya sebagai alat
evaluasi.Analisis kualitas tes digunakan untuk menjawab pertanyaan apakah tes sebagai alat ukur
benar-benar mampu mengukur apa yang sebenarnya hendak diukur dan apakah tes tersebut dapat
diandalkan dan berguna bagi dunia pendidikan.
Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan evaluasi sering
dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga hasil pengukuran yang
diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur. Instrumen ini memang
harus memiliki akurasi ketika digunakan. Alat ukur atau instrumen yang akan disusun itu tentu
saja harus memiliki validitas, agar data yang diperoleh dari alat ukur itu bisa reliabel, valid dan
disebut dengan validitas.

Rumusan Masalah
1. Bagaimana analisis kualitas tes dan butir soal ?
2. Bagamana validitas tes ?

Tujuan
1. Untuk mengetahui analisis kualitas tes dan butir soal.
2. Untuk mengetahui validitas tes.

1
BAB II
PEMBAHASAN

A. ANALISIS KUALITAS TES DAN BUTIR SOAL


1. Analisis Kualitas Tes
Analisis kualitas tes merupakan tahap yang harus ditempuh untuk mengenai
derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi
bagian tes.Analisis butir soal atau analisis item merupakan pengkajian pertanyaan-
pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas yang
memadai. Analisis soal Antara lain yang bertujuan mengadakan identifikasi soal-soal
yang baik, kurang baik, dan soal yang jelek. Hal ini dapat dilakukan dengan menghitung
beberapa aspek yaitu validitas, reliabilitas, tingkat kesukaran, daya pembeda dan pola
sebarang jawaban.
Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk
mengetahui derajat kualitas suatu tes ,baik tes secara keseluruhan maupun butir soal yang
menjadi bagian dari tes tersebut. Dalam penilaian harus belajar, tes diharapkan dapat
menggambarkan sampel perilaku dan menghasilkan nilai yang objektif serta akurat. Jika
tes yang digunakan guru kurang baik, maka hasil diperoleh pun tentunya kurang baik.Hal
ini dapat merugikan peserta didik itu sendiri.Artinya hasil yang diperoleh dari peserta
didik menjadi tidak objektif dan tidak adil.Oleh sebab itu, tes yang digunakan guru harus
memiliki kualitas yang lebih baik dilihat dari berbagai segi.Untuk mengetahui apakah
suatu tes yang digunakan termasuk baik atau kurang baik, maka perlu dilakukanan alisis
kualitastes.
Soal yang belum dianalisis baik secara kuantitatif maupun kualitatif memiliki
berbagai kelemahan jika harus digunakan untuk menilai hasil belajar.Kelemahan tersebut
diantaranya soal tidak sesuai dengan cakupan materi yang seharusnya dicapai sehingga
tidak bisa mengukur ketercapaian belajar siswa.Konstuk sisoal yang memiliki opsi
pengecoh yang heterogen membuat soal kurang berarti atau menjadi lemah, karena siswa
cenderung lebih mudah menebak jawaban yang benar.Hal ini berarti, soal tidak bisa
membedakan antara siswa yang berkemampuan tinggi dengan siswa yang berkemampuan
rendah.
Suatu tes dapat dilakukan baik apabila memenuhi lima persyaratan, yaitu:
validitas, reliabilitas, objektivitas, praktik abilitas dan ekonomis. Berdasa rpendapat
Arikonto di atas, kriteria minimal suatua latukur yang baik adalah alat ukur tersebut harus
valid dan reliabel.Selain valid dan reliabel, tes dikatakan baik jika daya pembeda, tingkat
kesulitan dan analisis pengecoh (soal pilihan ganda) juga baik.
Upaya untuk mengetahui apakah soal yang dibuat oleh guru sudah tergorong
layak dan baik, serta memberikan hasil yang maksimal dalam mengukur dan
meningkatkan tingkat pemahaman siswa, maka dapa tdilakukan analisis pada setiap butir
soal analisis kualitas soal dapat dilaksanakan dengan mengukur tingkat kesukaran soal

2
yang baik apabila soal-soal yang terdapat dalam ujian tengah semester tersebut sudah
proporsional. Daya beda soal digunakan untuk menganalisis
perbedaan kemampuan antara masing-masing siswa.Perhitungan besarnya tingkat
kesukaran dan daya beda dilaksanakan dengan melihat jumlah jawaban siswa yang betul
dan salah dari kelompok bawah dan kelompok atas.
2. Analisis Butir Soal
Analisis butir soal adalah pengkajian pertanyaan-pertanyaan tes agar diperoleh
perangkat pertanyaan yang memiliki kualitas yang memadai.Kegiatan menganalisis butir
soal merupakan suatu kegiatan yang harus dilakukan pendidik untuk meningkatkan mutu
soal yang telah ditulis. Kegiatan ini merupakan proses pengumpulan, peringkasan, dan
penggunaan informasi dari jawaban peserta didik untuk membuat keputusan tentang
setiap penilaian.
Tujuan penelaahan adalah untuk mengkaji dan menelaah setiap butir soal agar
diperoleh soal yang bermutu sebelum soal digunakan. Disamping itu, tujuan analisis butir
soal juga untuk membantu meningkatkan tes melalui revisi atau membuang soal yang
tidak efektif, serta dapat menentukan siswa mana yang sudah atau belum menguasai
materi yang diajarkan. Dan akan membantu guru mengetahui hal-hal yang berkaitan
dengan pengembangan, penyusunan, dan penggunaan tes yang sudah baik dan perlu
dipertahankan.
Adapun menurut Suharsimi Arikunto, analisis soal antara lain bertujuan untuk
mengadakan identifikasi soal-soal yang baik, kurang baik, dan soal yang jelek. Dengan
analisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk
mengadakan perbaikan.
Analisis butir soal ini dapat dilakukan secara kualitatif dan kuantitatif. Analisis
secara kualitatif artinya menguji tingkatan kebaikan suatu butir soal secara logis dan
rasional, yaitu mengenai isi dan bentuknya. Sedangkan, analisis kuantitatif berarti
menguji tingkat kebaikan suatu butir soal melalui teknik statistik. Analisis secara
kualitatif meliputi ranah konstruksi sesuai dengan kaidah umum dan bahasa.
Berdasarkan paparan diatas, dapat disimpulkan bahwa analisis butir soal
merupakan suatu kegiatan mengkaji dan mengidentifikasi setiap butir soal untuk
memperoleh informasi tentang kualitas butir soal. Hasil dari mengkaji dan
mengidentifikasi digunakan sebagai acuan dalam melakukan perbaikan butir soal.

Aturan penyusunan butir soal uraian yang sesuai dengan kaidah umum antara lain:
a. Menggunakan soal hanya untuk hasil-hasil yang tidak memuaskan jika dinilai
dengan bentuk obyektif.
b. Soal harus mampu mengukur perilaku hasil belajar sebagaimana dinyatakan
dalam tujuan pembelajaran.
c. Susunan kalimat harus baik dan benar sehingga apa yang harus dilakukan siswa
jelas.
d. Waktu ujian disesuaikan dengan waktu yang tersedia.
3
e. Butir soal merupakan rumusan masalah yang spesifik dan dan pasti.
f. Disertai petunjuk jawaban yang jelas mengenai jawaban dikehendaki.
g. Kunci jawaban dibuat serempak dengan penyusunan butir-butir soalnya.
h. Perbandingan antara proporsi butir-butir soal yang mudah, sedang, dan sukar
diusahakan berkisar antara 30%, 50%, dan 20%.
i. Seluruh bahan diolah menjadi suatu bahan yang terpadu dan komprehensif.
j. Soal disusun dari yang mudah dan yang sukar.

Adapun untuk soal berjenis pilihan ganda, konstruksi soal memiliki dua aspek
yaitu pokok soal dan pilihan jawaban. Pokok soal yang baik paling tidak perlu
mempertimbangkan aturan-aturan berikut:

a. Menghindari materi yang tidak relevan.


b. Pertanyaan dari setiap butir soal berisi masalah pokok.
c. Menghindari kata negatif ganda.
d. Menyebutkan sumber jika berisi pendapat yang kontroversial.
e. Tidak banyak menggunakan kalimat yang dinyatakan negatif. Jika soal yang
menggunakan pertanyaan negatif maka hendaknya dicetak lain/ miring.

4
B. VALIDITAS TES
Sebelum guru menggunakan suatu tes, hendaknya guru mengukur terlebih dahulu derajat
validitasnya berdasarkan kriteria tertentu. Dengan kata lain, untuk melihat apakah tes
tersebut valid, kita harus membandingkan skor peserta didik yang didapat dalam tes dengan
skor yang dianggap sebagai nilai baku. Validitas suatu tes erat kaitannya dengan tujuan
penggunaan tes tersebut. Namun, tidak ada validitas yang berlaku secara umum. Artinya, jika
suatu tes dapat memberikan informasi yang sesuai dan dapat digunakan untuk mencapai
tujuan tertentu, maka tes itu valid untuk tujuan tersebut.Gronlund (1985) mengemukan ada
tiga faktor yang memengaruhi validitas hasil tes, yaitu :
1. Faktor instrumen evaluasi
Mengembangkan instrumen evaluasi memang tidaklah mudah, apalagi jika
seorang evaluator tidak atau kurang memahami prosedur dan teknik evaluasi itu
sendiri.Jika instrumen evaluasi kurang baik, maka dapat berakibat hasil evaluasi menjadi
kurang baik. Untuk itu, dalam mengembangkun instrumen evaluasi, seorang evaluator
harus memperhatikan hal-hal yang memengaruhi validitas instrumen dan berkaitan
dengan prosedur penyusunan instrumen, seperti silabus, kisi-kisi soal, petunjuk
mengerjakan soal dan pengisian lembar jawaban, kunci jawaban, penggunaan kalimat
efektif, bentuk alternatif jawaban, tingkat kesukaran, daya pembeda, dan sebagainya.
2. Faktor administrasi evaluasi dan penskoran
Dalam administrasi evaluasi dan penskoran, banyak sekali terjadi penyimpangan
atau kekeliruan, seperti alokasi waktu untuk pengerjaan soal yang tidak proporsional,
memberikan bantuan kepada peserta didik dengan berbagai cara, peserta didik saling
menyontek ketika ujian, kesalahan penskoran, termasuk kondisi fisik dan psikis peserta
didik yang kurang menguntungkan.
3. Faktor jawaban dari peserta didik
Dalam praktiknya, faktor jawaban peserta didik justru lebih banyak berpengaruh
daripada dua faktor sebelumnya. Faktor ini meliputi kecenderungan peserta didik untuk
menjawab secara cepat, tetapi tidak tepat, keinginan melakukan coba-coba, dan
penggunaan gaya bahasa tertentu dalam menjawab soal bentuk uraian.
Selanjutnya,Kerlinger (1986) mengemukakan, “validitas instrumen tiduk cukup
ditentukan oleh derajat ketepatan instrumen untuk mengukur apa yang seharusnya diukur,
tetapi perlu juga dilihat dari tiga kriteria yang lain, yaitu appropriatness,
meaningfullness, dan usefulness”. Appropriatness menunjukkan kelayakan dari tes
sebagai suatu instrumen, yaitu seberapa jauh instrumen dapat menjangkau keragaman
aspek perilaku peserta didik.Meaningfillness menunjukkan kemampuan instrumen dalam
memberikan keseimbangan soal-soal pengukurannya berdasar tingkat kepentingan dari
setiap fenomena.Usefullness to inferences menunjukkan sensitif tidaknya instrumen
dalam menangkap fenomena perilaku dan tingkat ketelitian yang ditunjukkan dalam
membuat kesimpulan.
Dalam literatur modern tentang evaluasi, banyak dikemukakan tentang jenis-jenis
validitas, antara lain :
5
1. Validitas Permukaan (face validity)
Validitas ini menggunakun kriteria yang sangat sederhana, karena hanya melihat
dari sisi muka atau tampang dari instrumen itu sendiri. Artinya, jika suatu tes secara
sepintas telah dianggap baik untuk mengungkap fenomena yang akan diukur, maka tes
tersebut sudah dapat dikatakan memenuhi syarat validitas permukaan, sehingga tidak
perlu lagi adanya judgement yang mendalam.
2. Validitas Isi (content validity)
Validitas isi sering digunakan dalam penilaian hasil belajar. Tujuan utamanya
adalah untuk mengetahui sejauh mana peserta didik menguasai materi pelajaran yang
telah disampaikan, dan perubahan-perubahan psikologis apa yang timbul pada diri
peserta didik tersebut setelah mengalami proses pembelajaran tertentu. Jika dilihat dari
segi kegunaannya dalam penilaian hasil belajar, validitas isi ini sering disebut juga
validitas kurikuler dan validitas perumusan.
Validitas kurikuler berkenaan dengan pertanyaan apakah materi tes relevart
dengan kurikulum yang sudah ditentukan. Pertanyaan ini timbul karena sering terjadi
materi tes tidak mencakup keseluruhan aspek yang akan diukur, baik aspek kognitif,
afektif, maupun psikomotorik, tetapi hanya pengetahuan yang bersifat fakta-fakta
pelajaran tertentu. Diharapkan dengan validitas kurikuler ini timbul ketelitian yang jelas
dan totalitas dengan menjelajahi semua aspek yang tercakup dalam kisi-kisi dan Rencana
Pelaksanaan Pembelajaran (RPP) yang bersangkutan. Validitas kurikuler ini dapat
dilakukan dengan beberapa cara, antara lain mencocokkan materi tes dengan silabus dan
kisi-kisi, melakukan diskusi dengan sesama pendidik, atau mencermati kembali substansi
dari konsep yang akan diukur.
Validitas perumusan berkenaan dengan pertanyaan apakah aspek-aspek dalam
soal-soal itu betul-betul tercakup dalam perumusan tentang apa yang hendak diukur. Di
samping itu, validitas isi dapat juga disebut validitas rasional atau validitas logis.
Sebagaimana dikemukakan oleh R.L. Thorndike dan H.P. Hagen (1977) bahwa
“scientific analysis is essentially a rational and judgmental one, this is sometimes spoken
of as rational or logical validity”. Pernyataan ini memang ada benarnya, karena pengujian
validitas harus dilakukan secara rasional dan logis sehingga suatu tes hasil belajar dapat
memiliki validitas yang sempurna.
3. Validitas Empiris (empirical validity)
Validitas ini biasanya menggunakan teknik statistik, yaitu analisis korelasi.Hal ini
disebabkan validitas empiris mencari hubungan antara skor tes dengan suatu kriteria
tertentu yang merupakan suatu tolok ukur di luar tes yang bersangkutan. Namun, kriteria
itu harus relevan dengun apa yang akan diukur. Validitas empiris disebut juga validitas
yang dihubungkan dengan kriteria (criterion-related validity) atau validitas statistik
(statistical validity). Ada tiga macam validitas empiris, yaitu:
a. Validitas prediktif (predictive validity)
b. Validitas kongkuren (concurrent validity)
c. Validitas sejenis (congruent validity).
6
Validitas prediktif adalah jika kriteria standar yang digunakan adalah untuk
meramalkan prestasi belajar murid masa yang akan datang. Dengan kata lain, validitas
prediktif bermaksud melihat hingga mana suatu tes dapat memprakirakan perilaku peserta
didik pada masa yang akan datang, sedangkan validitas konkuren adalah jika kriteria
standarnya berlainan. Misalnya, skor tes dalam mata pelajaran Bahasa Indonesia
dikorelasikan dengun skor tes Bahasa lnggris.Sebaliknya, jika kriteria standarnya sejenis,
maka validitas tersebut disebut validitas sejenis. Misalnya, Bahasa Indonesia dengan
Bahasa Indonesia.

Dalam mengukur validitas suatu tes hendaknya yang menjadi kriteria sudah betul-
betul valid sehingga dapat diandalkan keampuhannya dan dapat dianggap sebagai tes
standar. Sebaliknya, bila kriterianya tidak valid, maka tes-tes lain yang akan divalidasi
menjadi kurang atau tidak meyakinkan. Suatu tes akan mempunyai koefisien validitas
yang tinggi jika tes itu betul-betul dapat mengukur apa yang hendak diukur dari peserta
didik tertentu.

C. UJI VALIDITAS
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukam fungsi ukurannya (Azwar 1986). Selain itu
validitas adalah suatu ukuran yang menunjukkan bahwa variabel yang diukur memang benar-
benar variabel yang hendak diteliti oleh peneliti (Cooper dan Schindler, dalam Zulganef,
2006).

Sedangkan menurut Sugiharto dan Sitinjak (2006), validitas berhubungan dengan suatu
peubah mengukur apa yang seharusnya diukur. Validitas dalam penelitian menyatakan
derajat ketepatan alat ukur penelitian terhadap isi sebenarnya yang diukur. Uji validitas
adalah uji yang digunakan untuk menunjukkan sejauh mana alat ukur yang digunakan dalam
suatu mengukur apa yang diukur. Ghozali (2009) menyatakan bahwa uji validitas digunakan
untuk mengukur sah, atau valid tidaknya suatu kuesioner. Suatu kuesioner dikatakan valid
jika pertanyaan pada kuesioner mampu untuk mengungkapkan sesuatu yang akan diukur oleh
kuesioner tersebut.

Suatu tes dapat dikatakan memiliki validitas yang tinggi jika tes tersebut menjalankan
fungsi ukurnya, atau memberikan hasil ukur yang tepat dan akurat sesuai dengan maksud
dikenakannya tes tersebut. Suatu tes menghasilkan data yang tidak relevan dengan tujuan
diadakannya pengukuran dikatakan sebagai tes yang memiliki validitas rendah.

Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur
yang valid dapat menjalankan fungsi ukurnya dengan tepat, juga memiliki kecermatan tinggi.
Arti kecermatan disini adalah dapat mendeteksi perbedaan-perbedaan kecil yang ada pada
atribut yang diukurnya.

7
Dalam pengujian validitas terhadap kuesioner, dibedakan menjadi 2, yaitu validitas faktor
dan validitas item. Validitas faktor diukur bila item yang disusun menggunakan lebih dari satu
faktor (antara faktor satu dengan yang lain ada kesamaan). Pengukuran validitas faktor ini
dengan cara mengkorelasikan antara skor faktor (penjumlahan item dalam satu faktor) dengan
skor total faktor (total keseluruhan faktor).

Validitas item ditunjukkan dengan adanya korelasi atau dukungan terhadap item total (skor
total), perhitungan dilakukan dengan cara mengkorelasikan antara skor item dengan skor total
item. Bila kita menggunakan lebih dari satu faktor berarti pengujian validitas item dengan cara
mengkorelasikan antara skor item dengan skor faktor, kemudian dilanjutkan mengkorelasikan
antara skor item dengan skor total faktor (penjumlahan dari beberapa faktor).

Dari hasil perhitungan korelasi akan didapat suatu koefisien korelasi yang digunakan untuk
mengukur tingkat validitas suatu item dan untuk menentukan apakah suatu item layak digunakan
atau tidak. Dalam penentuan layak atau tidaknya suatu item yang akan digunakan, biasanya
dilakukan uji signifikansi koefisien korelasi pada taraf signifikansi 0,05, artinya suatu item
dianggap valid jika berkorelasi signifikan terhadap skor total.

Untuk melakukan uji validitas ini menggunakan program SPSS. Teknik pengujian yang
sering digunakan para peneliti untuk uji validitas adalah menggunakan korelasi Bivariate
Pearson (Produk Momen Pearson). Analisis ini dengan cara mengkorelasikan masing-masing
skor item dengan skor total. Skor total adalah penjumlahan dari keseluruhan item. Item-item
pertanyaan yang berkorelasi signifikan dengan skor total menunjukkan item-item tersebut
mampu memberikan dukungan dalam mengungkap apa yang ingin diungkap à Valid. Jika r
hitung ≥ r tabel (uji 2 sisi dengan sig. 0,05) maka instrumen atau item-item pertanyaan
berkorelasi signifikan terhadap skor total (dinyatakan valid). Langkah-langkah dalam pengujian
validitas ini yaitu :

1. Buat skor total masing-masing variabel (Tabel perhitungan skor)

8
2. Klik Analyze -> Correlate -> Bivariate (Gambar/Output SPSS)

3. Masukan seluruh item variabel x ke Variabels

9
4. Cek list Pearson ; Two Tailed ; Flag
5. Klik Ok

Dari tabel diatas dapat dijelaskan bahwa nilai r hitung > r tabel berdasarkan uji signifikan 0.05,
artinya bahwa item-item tersebut diatas valid

Rumus Korelasi Product Moment :

Keterangan :

10
BAB III
PENUTUP

Kesimpulan
1. Analisis kualitas tes merupakan tahap yang harus ditempuh untuk mengenai derajat kualitas
suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian tes.
2. Analisis butir soal adalah pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat
pertanyaan yang memiliki kualitas yang memadai. Kegiatan menganalisis butir soal
merupakan suatu kegiatan yang harus dilakukan pendidik untuk meningkatkan mutu soal
yang telah ditulis.
3. Dalam mengukur validitas suatu tes hendaknya yang menjadi kriteria sudah betul-betul valid
sehingga dapat diandalkan keampuhannya dan dapat dianggap sebagai tes standar.
Sebaliknya, bila kriterianya tidak valid, maka tes-tes lain yang akan divalidasi menjadi
kurang atau tidak meyakinkan.
4. Reliabilitas tes merupakan derajat dari suatu tes dapat mengukur secara konsisten apa yang
seharusnya di ukur. Reliabilitas (keterandalan) evaluasi berhubungan dengan masalah
kepercayaan yaitu tingkat kepercayaan bahwa suatu evaluasi mampu memberikan hasil yang
tepat.

11
DAFTAR PUSTAKA

Amelia. Maria Agustina. Analisis Soal Tes Hasil Belajar High Order Thinking Skills (Hots)
Matematika ahan Untuk Kelas 5 Sekolah Dasar, Jurnal Penelitian (EdisiKhusus PGSD). Vol 20,
No. 2

Arifin. Zainal. 2009. EvaluasiPembelajaran. PT RemajaRosdakarya : Bandung

Arikunto. Suharsimi. 2018. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara

Darmayanti. Ni wayan Sri & I Komang Wisnu Budi Wijaya. 2020. Evaluasi Pembelajaran IPA.
Bali: NILACAKRA

Hamalik. Oemar. 1989. Teknik Pengukuran & Evaluasi Hasil Belajar. Bandung: Mandar Maju

Purwanti. Muslikah. 2014. Analisis Butir Soal UjianAkhir Mata Pelajaran Akuntansi
KeuanganMenggunakan Microsoft Office Excel 2010 . Jurnal Pendidikan Akuntansi Indonesia.
Vol. XII, No. 1

Rahayu. Tika Dwi dkk. 2014. Analisis Tingkat Kesukaran dan Daya Beda Pada Tengah
Semester Ganjil Bentuk Pilihan Ganda Mata Pelajaran Ekonomi Kelas X di SMA Negeri 5
Tahun Ajaran 2012-2013. Jurnal EdukasiUnej. Vol , No 1

Sary. Yessy Nur Endah. 2018. Buku Mata Ajar Evaluasi Pendidikan. Yogyakarta : Deepublish

Subino. 1987. Konstruksi dan Analisis Tes. Jakarta: Depdikbud

Sudjana. Nana. 2015. Penilaian Hasil Proses Belajar Mengajar. Bandung: Remaja Rosdakarya

Suparman dkk. 2012. Validitas, ’’Reliabilitas dan Kepraktisan Ujian Melalui Observasi dan
Bentuk Lisann Bagi Kelas Besar Pada Prodi PAI Fakultas Tarbiyah Dan Bahada IAIN Surakarta
‘’, Kodifikasia,. Vol. 6, No. 1

Suzana. Andrisni. 2017. Analisis Tingkat Kesukarandan Daya Beda Beda Butir-Butir Soal
Penilaian Akhir Tahun Matematika Kelas X di SMA Negeri 1 Purbalingan,. Jurnal Math Gram
Matematika. Vol 2 No 2

1Muslikah Purwanti, Analisis Butir Soal UjianAkhir Mata Pelajaran Akuntansi Keuangan
Menggunakan Microsoft Office Excel 2010 , Jurnal Pendidikan Akuntansi Indonesia ,Vol. XII,
No. 1, 2014, hal 83.

Arifin, Zainal, EvaluasiPembelajaran, (PT RemajaRosdakarya : Bandung, 2009), hal 246.

Andrisni Suzana, Analisis Tingkat Kesukarandan Daya Beda Beda Butir-Butir Soal Penilaian
Akhir Tahun Matematika Kelas X di SMA Negeri 1 Purbalingan, Jurnal Math Gram
Matematika, Vol 2 No 2, 2017 , hal. 2

12
Maria Agustina Amelia, Analisis Soal Tes Hasil Belajar High Order Thinking Skills (Hots)
Matematika ahan Untuk Kelas 5 Sekolah Dasar, Jurnal Penelitian (EdisiKhusus PGSD). Vol 20,
No. 2, Desember 123.

Tika Dwi Rahayu dkk, Analisis Tingkat Kesukaran dan Daya Beda Pada Tengah Semester Ganjil
Bentuk Pilihan Ganda Mata Pelajaran Ekonomi Kelas X di SMA Negeri 5 Tahun Ajaran 2012-
2013, Jurnal EdukasiUnej, Vol , No 1, 2014, h.40.

Nana Sudjana, Penilaian Hasil Proses Belajar Mengajar, (Bandung: Remaja Rosdakarya, 2015),
hal. 135

Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: Bumi Aksara, 2018), hal. 222

Subino, Konstruksi dan Analisis Tes, (Jakarta: Depdikbud, 1987), hal. 38-39

Oemar Hamalik, Teknik Pengukuran & Evaluasi Hasil Belajar, (Bandung: Mandar Maju, 1989),
hal. 163

Yessy Nur Endah Sary, Buku Mata Ajar Evaluasi Pendidikan, (Yogyakarta : Deepublish, 2018),
hal. 122.

Yessy Nur Endah Sary, Buku Mata Ajar Evaluasi Pendidikan,…, hal. 123.

Yessy Nur Endah Sary, Buku Mata Ajar Evaluasi Pendidikan,… , hal. 124.

Yessy Nur Endah Sary, Buku Mata Ajar Evaluasi Pendidikan,…, hal. 125.

Ni wayan Sri Darmayanti & I Komang Wisnu Budi Wijaya, Evaluasi Pembelajaran IPA, ( Bali:
NILACAKRA, 2020, hal. 127-128

13

Anda mungkin juga menyukai