Anda di halaman 1dari 11

KATA PENGANTAR

Alhamdulillah puji dan syukur kehadirat Allah SWT yang telah memberikan rahmat
dan karunia-Nya sehingga kami dapat menyelesaikan makalah yang berjudul “Makalah Uji
Validitas, Reabilitas, Daya Beda dan Taraf Kesulitan Soal” Tidak lupa shalawat dan salam
selalu tercurahkan kepada Nabi Muhammad SAW yang merupakan inspirator terbesar dalam
segala keteladanannya. Tidak lupa penulis sampaikan terima kasih kepada Dosen mata kuliah
Evaluasi Pembelajaran yang telah memberikan arahan dan bimbingan dalam pembuatan
makalah ini, orang tua yang selalu mendukung kelancaran tugas kami, serta pada anggota tim
yang selalu kompak dan konsisten dalam penyelesaian tugas ini.
Akhirnya penulis sampaikan terima kasih atas perhatiannya terhadap makalah ini, dan
penulis berharap semoga makalah ini bermanfaat bagi tim penulis khususnya dan pembaca
yang budiman pada umumnya. Tak ada gading yang tak retak, begitulah adanya makalah ini.
Dengan segala kerendahan hati, saran-saran dan kritik yang konstruktif sangat penulis
harapkan dari para pembaca guna peningkatan pembuatan makalah pada tugas yang lain dan
pada waktu mendatang.

Brebes, 02 Desember 2022

Tim Penulis

1
1. Bagaimana pengertian
validitas instrumen?
2. Bagaimana pengertian
reliabilitas instrumen?
3. Bagaimana Penegertian
Daya Beda Dan Kesukaran?
C. Tujuan Pembahasan
Masalah
1. Untuk mengetahui validitas
tes dan analisisnya
2. Untuk mengetahui
reliabelitas tes dan analisisnya
3. Untuk mengetahui daya
beda butir soal dan kesukaran
soal
DAFTAR ISI
KATA PENGANTAR
DAFTAR ISI
BAB I PENDAHULUANError: Reference source not found

A. Latar BelakangError: Reference source not found

B. Rumusan MasalahError: Reference source not found

C. Tujuan PembahasanError: Reference source not found

BAB II KAJIAN TEORIError: Reference source not found

2
A. ValiditasError: Reference source not found

B. ReabilitasError: Reference source not found

C. ReabilitasError: Reference source not found

D. ReabilitasError: Reference source not found

BAB IIIError: Reference source not found

PENUTUPError: Reference source not found

A. KesimpulanError: Reference source not found

DAFTAR PUSAKAError: Reference source not found

BAB I
PENDAHULUAN

Keberhasilan pendidikan sangat ditentukan oleh proses pembelajaran. Untuk mengukur


keberhasilan proses pembelajaran diperlukan evaluasi dan proses analisis dari evaluasi.
Manfaat dari analisis evaluasi untuk mengetahui kekuatan dan kelemahan pembelajaran dalam
rangka meningkatkan proses pembelajaran. Karena itu begitu pentingnya guru mengadakan
analisis butir soal Validitas, Reliabilitas, Tingkat Kesukaran dan Daya Beda.
Hasil dari proses penilaian perlu dilakukan analisis, untuk melihat validitas dan
efektivitas instrument, serta untuk mengetahui kelemahan dan kekuatan proses pembelajaran.

3
Ada tiga sasaran pokok ketika guru melakukan analisis terhadap hasil belajar, yaitu terhadap
guru, siswa dan prosedur pembelajaran. Fungsi analisis untuk guru terutama untuk
mendiagnosis keberhasilan pembelajaran dan sebagai bahan untuk merevisi dan
mengembangkan pembelajaran dan tes. Bagi siswa, analisis diharapkan berfungsi mengetahui
keberhasilan belajar, mendiagnosa mengoreksi kesalahan belajar, serta Memotivasi siswa
belajar lebih baik.
Pada makalah ini akan dibahas mengenai analisis soal berupa validitas, daya beda,
indeks kesukaran, fungsi distraktor, dan reliabilitas yang berguna sebagai pedoman bagi
pendidikan dalam melakukan analisis soal terutam untuk soal objektif.

BAB II
KAJIAN TEORI

1. VALIDITAS
Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang dilakukan
oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara empiris guna
mendukung kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan validitas adalah
kemampuan suatu alat ukur untuk mengukur sasaran ukurnya.
Suatu alat ukur disebut memiliki validitas apabila alat ukur tersebut isinya layak
mengukur objek yang seharusnya diukur dan sesuai dengan kreteria tertentu, artinya adanya
kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran. Ini sesuai
dengan Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B Anderson dan
disadur oleh Prof. Dr. Suharsimi Arikunto (2007, 65) bahwa A test is valid if it measures what
it purpose to measure bila diartikan sebuah tes dikatakan valid apabila tes tersebut mengukur
apa yang hendak diukur. Bilamana alat ukur tidak memiliki validitas yang dapat
dipertanggung jawabkan, maka data yang masuk juga sis dan kesimpulan yang ditarik juga
menjadi salah.

I. Validitas Tes Hasil Belajar


Menurut Suharsimi Arikunto 2007, validitas sebuah tes dapat diketahui dari hasil
pemikiran dan dari hasil pengalaman. Hal yang pertama akan diperoleh validitas logis dan hal
yang kedua akan diperoleh validitas empiris. Dua hal inilah yang menjadi dasar
pengelompokan validitas tes.
1. Validasi logis
Mengandung arti penalaran, sehingga validitas logis untuk suatu instrumen evaluasi
menunjuk pada kondisi bagi sebuah instrumen yang memenuhi persyaratan valid berdasarkan
hasil penalaran. Kondisi valid itu dipandang terpenuhi karena instrument itu telah dirancang
sebaik mungkin menurut ketentuan yang ada.
Dengan keadaan itu validitas logis dapat dicapai apabila instrument disusun mengikuti
ketentuan yang ada. Validitas logis yang dapat dicapai oleh sebuah instrumen terdiri dari dua
yaitu :
a) Validitas Isi
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instrument yang
disusun berdasarkan isi materi pelajaran yang dievaluasi. Sebuah tes dikatakan memiliki
validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi
pelajaran yang di berikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka
validitas ini sering disebut juga dengan validitas kurikuler.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci
materi kurikulum atau materi buku pelajaran.
b) Validitas Konstruk
Validitas konstruk sebuah instrumen menunjukkan suatu kondisi sebuah instrumen
yang disusun berdasarkan konstruk-konstruk aspek kejiwaan yang seharusnya dievaluasi.
Sebuah tes dikatakan memiliki validitas konstruk apabila butir-butir soal yang membangun tes
tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional
4
khusus. Dengan kata lain jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai
dengan aspek berfikir yang menjadi tujuan instruksional.

2. Validitas Empiris
Mengandung arti kata pengalaman. Sebuah instrument dikatakan memiliki validitas
empiris apabila sudah di uji dengan pengalaman. Sebagai contoh, seseorang dapat diakui jujur
oleh masyarakat lain apabila dalam pengalaman dia diakui memang jujur.
Pada Validitas empiris terdiri dari dua cara yang dilakukan untuk mengujinya sehingga dia
menjadi valid. Pengujian itu dilakuakn dengan membandingkan kondisi instrumen yang
bersangkutan dengan suatu ukuran. Kriteria yang digunakan adalah :
a) Validitas Konkuren
Disebut juga dengan validitas “yang ada sekarang ‘tetapi lebih dikenal dengan validitas
empiris. Sebuah instrument dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Jika ada istilah :sesuai” tentu ada dua hal yang dipasangkan, dimana dalam hal
ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang
telah lampau sehingga data pengalaman tersebut sekarang sudah ada.
Dalam membandingkan hasil sebuah tes maka diperlukan suatu alat pembanding. Maka hasil
tes merupakan sesuatu yang dibandingkan. Contoh : seorang guru ingin mengetahui apakah tes
sumatif yang disusun sudah valid atau belum. Untuk ini perlu sebuah kreteria masa lalu yang
datanya sekarang dimiliki. Misalnya nilai ulangan harian atau nilai semester yang lalu.
b) Validitas prediksi
Prediksi artinya meramal. Dengan meramal selalu mengenai hal yang akan datang jadi
sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi apabila mempunyai
kemampuan untuk meramalkan apa yang terjadi pada masa yang akan datang. Misalnya tes
masuk perguruan tinggi adalah sebuah tes yang diperkirakan dapat meramalkan keberhasilan
peserta tes dalam mengikuti kuliah di masa yang akan datang. Calon yang tersaring
berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti
kuliah. Jika nilai tesnya tinggi tentu menjamin keberhasilan kelak. Sebaliknya seorang calon
dikatakan tidak lulus tes karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak
mampu mengikuti perkuliahan yang akan datang. a. Sebagai alat pembanding validitas
prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran diperguruan
tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester I
dibandingkan dengan yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud
tidak memiliki validitas.

2. RELIABILITAS
Reliabilitas instrumen adalah keadaan instrumen yang menunjukkan hasil pengukuran
yang reliable (tidak berubah-ubah, konsisten). Instrumen yang reliable adalah instrumen yang
apabila digunakan untuk mengukur subyek atau objek yang sama pada waktu yang berbeda
dan pengukuran dilakukan oleh orang yang berbeda hasilnya tetap sama.
Beberapa faktor penting yang mempengaruhi reliabilitas suatu tes yaitu:
Kemampuan peserta tes atau subjek uji coba. Makin heterogen atau makin berbeda
kemampuan peserta tes makin tinggi reliabilitas tes.
Semakin besar jumlah peserta tes semakin besar reliabilitas, karena semakin banyak
peserta tes maka semakin beragam kemampuannya.
Panjang pendeknya tes. Jumlah item tes yang banyak dengan mengkaji beberapa tujuan
akan lebih reliable dibandingkan dengan jumlah item yang sedikit, karena akan lebih
representatif. Namun jumlah item tes yang terlalu banyak akan melelahkan dan mengganggu
konsentrasi sehingga hasil yang diperoleh tidak tepat lagi.
Evaluasi yang subjektif juga akan menurunkan reliabilitas.
Hal yang berhubungan dengan penyelenggaraan tes.
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung akan
mempengaruhi reliabilitas soal tes.

5
Reliabilitas instrumen dinyatakan dengan koefisien reliabilitas. Instrumen yang reliable
adalah instrumen yang memiliki koefisien reliabilitas minimal 0,70. Sebaiknya koefisien
reliabilitas instrumen 0,80 atau lebih. Koefisien reliabilitas instrumen dihitung dengan
menggunakan rumus tertentu.
a. Pengujian Reliabilitas Tes Bentuk Objektif
Pada tes belajar bentuk objektif, ada tiga macam metode yang dapat digunakan untuk
menentukan taraf reliabilitas.
Metode atau teknik ulangan (test-retest method) atau single test-double trial method.
Instrumen penelitian test-retest dilakukan dengan cara mencobakan instrumen dua kali
pada responden. Jadi dalam hal ini instrumennya sama, respondennya sama, dan waktunya
yang berbeda. Reliabilitas diukur dari koefisien korelasi antara percobaan pertama dengan
yang berikutnya. Bila koefisien korelasi positif dan signifikan maka instrumen tersebut
reliable. Pengujian cara ini sering juga disebutstability, yaitu seberapa stabil skor yang
diperoleh individu apabila dilakuakn pengujian dalam waktu yang berbeda. Rumus yang dapat
digunakan untuk menentukan reliabiltas test dengan metode test-retest antara lain
adalah Product Momen Correlation. Yaitu sebagai berikut:
Dimana:
X = skor test pertama
Y = skor test kedua
N = jumlah peserta tes
Cara lain yang dapat digunakan dengan teknik tes retes ini adalah tekinik korelasi rank- order
dari Spearmen menggunakn rumus:
Dimana:
ρ = koefisien korelasi
D = difference (beda antara rank skor hasil tes I dengan rank skor hasil tes II)
= RI – RII
N = banyaknya peserta tes.
Metode Belah Dua (split-half method) atau Single Test Single Trial Method
Dalam menggunakan metode ini pendidik atau evaluator hanya menggunnakan sebuah tes dan
dicobakan satu kali. Oleh sebab itu disebut juga singel-test-singel-trial method. Pada metode
ini tes yang diberikan dibagi/dibelah menjadi dua bagian. Jumlah item yang diberikan harus
genap sehingga dapat dibagi dua dan tiap kelompok memiliki jumlah item/butir soal yang
sama jumlahnya.
Untuk menentukan reliabilitas seluruh tes dapat digunakan rumus Spearman-Brown sebagai
berikut:
Rumus Spearman Brown:
Dimana:
korelasi antara skor-skor setiap belahan tes.
koefisien reliabilitas tes.
Cara lain yang juga dapat digunakan pada metode singel-test-singel-trial adalah formula
Rulon, Flanagan, Kuder-Richardson, Hoyt.
Metode Bentuk Paralel atau Metode Double Test Double Trial
Pada metode ini dipergunakan dua buah tes yang mempunyai kesamaan tujuan, tingkat
kesukaran, dan susunan, tetapi butir-butir soal berbeda. Pengujian reliabilitas dengan cara ini
cukup dilakukan sekali, tetapi instrumennya dua, pada responden yang sama, waktu yang
sama, instrumen berbeda. Reliabiltas instrumen dihitung dengan cara mengkorelasikan antara
data instrumen yang satu dengan data instrumen yang dijadikan equivalen. Bila koefisien
korelasi positif dan signifikan maka instrumen tersebut reliable.
Kelemahan dari metode ini adalah kesukaran dalam penyusunan item yang parallel dengan
item pada tes pertama, selain itu juga membutuhkan biaya yang lebih mahal dan memakan
waktu yang lebih lama.
Rumus yang dapat digunakan untuk menentukan reliabilitas dengan metode parallel ini
adalah Product Moment Correlation dan Rank Order Correlation.

6
3. TINGKAT KESUKARAN
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi usaha pemecahannya. Sebaliknya
soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai
semangat untuk mencoba lagi karena diluar jangkauannya.
Seorang akan menjadi hafal akan kebiasaan gurunya dalam pembuatan soal. Dengan
kebiasaaan ini maka siswa akan belajar giat untuk menghadapi ulangan dengan guru yang
terbiasa memberikan soal sukar, sedangkan siswa akan malas belajar bila akan ujian dengan
guru yang terbiasa dengan soal ulangan yang mudah-mudah.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut dengan indeks
kesukaran. Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran ini
menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,00 menunjukkan kalau
soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soalnya terlalu mudah.
Indeks kesukaran butir yang baik berkisar antara 0,3-0,7 paling baik pada 0,5.
Dalam istilah evaluasi, indeks kesukaran ini diberi simbol P singkatan ari proporsi.
Dengan demikian maka soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P = 0,20.
sebaliknya soal dengan P = 0,30 lebih sukar daripada soal dengan P = 0,80.
Rumusan mencari indeks kesukaran menurut Daryanto (2005,180) adalah :

Dimana :
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa peserta tes.

4. DAYA PEMBEDA
Daya pembeda soal yaitu kemampuan sesuatu soal untuk membedakan antara siswa
yang berkemampuan tinggi dengan siswa yang berkemampuan rendah. Angka yang
menunjukkan besarnya daya pembeda disebut indeks diskriminasi ( D), dan nilainya berkisar
antara 0,00 sampai 1,00. Pada daya pembeda ini berlaku tanda negatif yang digunakan jika
sesuatu soal “terbalik” menunjukkan kualitas testee yaitu anak pandai disebut bodoh dan anak
bodoh disebut pandai.
Dengan demikian ada tiga titik pada daya pembeda yaitu:
Bagi suatu soal yang dapat dijawab benar oleh siswa kemampuan tinggi dan siswa
kemampuan rendah, maka soal itu tidak baik karena tidak punya daya pembeda. Demikian
juga jika semua kelompok bawah menjawab salah dan siswa berkemampuan tinggi juga sama-
sama menjawab salah, maka soal itu tidak mempunyai daya beda sama sekali. Cara
menentukan daya pembeda ( nilai D )
Cara menentukan daya pembeda ( nilai D )yaitu perlu dibedakan antara kelompok kecil
( kurang dari 100 ) dan kelompok besar ( 100 orang ke atas ).

a. Untuk kelompok besar


Mengingat biaya dan waktu menganalisis, maka untuk kelompok besar biasanya hanya
diambil dua kutub saja yaitu 27% skor teratas sebagai kelompok atas (JA) dan 27 % skor
terbawahsebagai kelompok bawah (JB)
b. Untuk kelompok kecil
Seluruh kelompok tes di bagi dua sama besar, 50% kelompok atas dan 50% kelompok bawah
Seluruh pengikut tes dideretkan mulai dari skor teratas sampai kepada skor terendah, lalu di
bagi dua.
Rumus Mencari Daya Pembeda menurut Daryanto ( 2005, 186) yaitu :
Dimana :
D = Daya pembeda
J = jumlah peserta tes
7
JA = banyak peserta kelompok atas
JB = banyak peserta kelompok bawah
BA = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar
BB = banyak peserta kelompok bawah yang menjawab soal dengan benar
PA = proporsi peserta kelompok atas yang menjawab benar ( ingat P sebagai indeks
kesukaran )
PB = Proporsi peserta kelompok bawah yang menjawab benar

DAFTAR PUSTAKA
Azwar, Syaifuddin. 2012.
Metode Penelitian. Yogyakarta
: Pustaka belajar
Azwar, Syaifuddin. 2016.
Realibilitas dan validitas edisi
4. Yogyakarta : Pustaka belajar
Endra, Febri. 2017. Pedoman
Metodologi Penelitian
(Statiska Praktis). Jawa
Timur :
Zifatama
Jawara
Hamdi, Asep Saepul. 2014.
Metode Penelitian Kuantitatif
Aplikasi dalam Pendidikan.
Yogyakarta : Deepublish
8
Nisfianoor, Muhammad. 2009.
Pendekatan Statistik Modern
untuk Ilmu Sosial. Jakarta :
Salemba
Purwanto. 2018. Teknik
Penyusunan Instrumen Uji
Validitas dan Reliabilitas
untuk
Penelitian
Ekonomi Syariah. Magelang :
StaiaPress
Retnawati, Heri. 2016. Analisis
Kuantitatif Instrument
Penelitian. Yogyakarta :
Parama
publishing
Sarkadi, dan Komarudin. 2017.
Evaluasi Pembelajaran.
Yogyakarta : Rizqita
publishing
9
Siregar, syofian. 2013.
Metodokogi Penelitian
Kuantitatif. Jakarta : Kencana
Sitoyo, Sandu., Sodik, ali.
2015. Dasar metodologi
penelitian. Yogyakarat:
Literasi Media
Publishing.
Sugiyono. 2014. Statistika
untuk penelitian. Bandung :
Alfabeta.
Sary, Y. N. (2018). Buku Mata
Ajar Evaluasi Pendidikan.
Yogyakarta: deepublish.
Sudaryono. (2016). Metode
Penelitian Pendidikan. Jakarta:
PT Kharisma Putra Utama.
Sugiyono. (2012). Metode
penelitian kuantitatif, kualitatif
dan R&D. Bandung: Alfabeta.
10
Usman, M. (2021).
KUALITAS SOAL UJIAN
AKHIR SEKOLAH MATA
FISIKA SMA
NEGERI SE-KOTA
BAUBAU. Syntax Idea., 2175.

11

Anda mungkin juga menyukai