Puji syukur kami panjatkan atas kehadirat Tuhan Yang Maha Esa Atas berkat rahmatnya
kami,dapat menyelesaikan pembuatan makalah ini. Melalui makalah ini kami membahas
mengenai “”.
Keberhasilan kami dalam menyelesaikan makalah ini tidaklah terlepas dari peran serta
pihak-pihak terkait. Atas segala bantuan dan yang diberikan penyususn mengucapkan terima
kasih yang sebesar-besarnya. Kami menyadari bahwa ini masih jauh dari kesempurnaan. Oleh
karena, itu kami mengharapkan masukan dan kritik yang membangun dari dosen yang membaca
makalah ini. Kami berharap hasil dari makalah ini dapat bermanfaat bagi siapa pun yang
membutuhkannya. Semoga makalah ini dapat meningkatkan pemahaman kita di masa yang
akan datang. Amin.
Hasil belajar dari proses belajar tidak hanya dinialai oleh tes tetapi juga harus dinilai oleh
alat alat nontest atau bukan test. Teknik ini berguna untuk mengukur keberhasilan siswa
dalam proses belajar yang tidak dapat diukur dengan test. Penggunaan teknik ini dalam
evaluasi pembelajaran karena banyak aspek kemampuan siswa yang sulit diukur secara
kuantitatif dan mecakup objektoifitas yang sasarannya adalah perbuatan , ucapan, kegiatan,
pengalaman tingah laku dan lain lain. Penilaian tidak hanya menyangkut kognitif tetapi harus
mencakup ruang lingkup afektif dan pisikomotorik.
B. Rumusan Masalah
1. Apa itu analisis butir soal tes taraf kesukaran dan daya pembeda?
2. Bagaimana menilai tes yang dibuat sendiri?
C. Tujuan
Mengetahui analisis butir soal tes taraf kesukaran dan daya pembeda serta menilai tes
yang dibuat sendiri
BAB II
PEMBAHASAN
A. Validitas
Validitas adalah menilai apa yang seharusnya di nilai dan alat penilain yang
digunakan sesuai dengan apa yang seharusnya dinilai dengan menggunakan alat sesuai untuk
mengukur kompetensi.
Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai
sehingga betul-betul menilai apa yang yang seharusnya dinilai. Sebagai contoh menilai
kemampuan siswa dalam matematika. Misalnya diberikan soal dengan kalimat yang panjang
dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab
karena tidak memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara,
tetapi ditanyakan mengenai tata bahasa atau kesusastraan seperti puisi atau sajak. Penilaian
tersebut tidak tepat (valid). Validitas tidak berlaku universal sebab bergantung pada situasi
dan tujuan penilaian. Alat penilaian yang telah valid untuk suatu tujuan tertentu belum
otomatis akan valid untuk tujuan yang lain.
Contoh prestasi belajar dan motivasi belajar dapat dinilai oleh tes ataupun oleh
kuesioner. Caranya juga bisa berbeda, bisa dilaksanakan secara tertulis atau bisa secara lisan.
Ketentuan penting dalam evaluasi adalah bahwa hasilnya harus sesuai dengan
keadaan yang dievaluasi. Mengevaluasi dapat diumpamakan sebagai pekerjaan memotret.
Gambar potret atau foto dikatakan baik apabila sesuai dengan aslinya. Gambar pemotretan
hasil evaluasi tersebut di dalam kegiatan evaluasi dikenal dengan data evaluasi. Data evaluasi
yang baik sesuai dengan kenyataan disebut data valid. Agar dapat dieroleh data yang valid,
instrumen atau alat untuk mengevaluasinya harus valid. Jika pernyataan tersebut dibalik,
instrumen evaluasi dituntut untuk valid karena diinginkan dapat diperoleh data yang valid.
Dengan kata lain, instrumen evaluasi dipersyaratkan valid agar hasil yang diperoleh dari
kegiatan evaluasi valid.
a. Macam-Macam Validitas
Contoh:
Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan menunjukkan
kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan pengetahuan
orang tersebut dalam hal yang berkaitan dengan mobil. Tes yang mengukur pengetahuan
tentang mobil bukanlah tes yang sahih untuk mekanik.
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Hal yang pertama akan diperoleh validitas logis (logical validity) dan hal
yang kedua diperoleh validitas empiris (empirical validity). Dua hal inilah yang dijadikan
dasar pengelompokan validitas tes.
1) Validitas Logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika”
atau validitas logis sering juga disebut sebagai analisis kualitatif yaitu berupa
penalaran atau penelaahan. Dengan makna demikian maka validitas logis untuk
sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran.
Kondisi valid tersebut dipandang terpenuhi karena instrumen yang bersangkutan
sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana
pelaksanaan tugas lain misalnya membuat sebuah karangan, jika penulisan sudah
mengikuti aturan mengarang, tentu secara logis karangannya sudah baik. Berdasarkan
penjelasan tersebut maka instrumen yang sudah disusun berdasarkan teori
penyusunan instrumen, secara logis sudah valid. Dari penjelasan tersebut dapat
dipahami bahwa validitas logis dapat dicapai apabila instrumen disusun mengikuti
ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa validitas logis tidak
perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai
disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen,
yaitu validitas isi dan validitas konstrak (construct validity).
2) Validitas Empiris
Ada dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan
untuk menguji bahwa sebuah instrumen memang valid :
Menujukan kepada sejauh mana tes memiliki kesaman dengn tes yang
sudah ada atau yang sudah dilakukan . kesamaan yang di maksud meliputi
kemampuan yang di ukur, objek yang diukur , dan waktu yang sudahdiperlukan.
A. Pengertian Reliabilitas
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu pengukuran
dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran
yang relatif sama, selama aspek yang diukur dalam diri subyek memang belum berubah. Nur
(1987: 47) menyatakan bahwa reliabilitas ukuran menyangkut seberapa jauh skor deviasi
individu, atau skor-z, relatif konsisten apabila dilakukan pengulangan pengadministrasian
dengan tes yang sama atau tes yang ekivalen.
Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan salah-satu ciri atau
karakter utama instrumen pengukuran yang baik. Arifin (1991: 122) menyatakan bahwa
suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada
kelompok yang sama pada waktu atau kesempatan yang berbeda.
Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan masalah
kekeliruan pengukuran. Kekeliruan pengukuran sendiri menunjukkan sejauh mana
inkonsistensi hasil pengukuran terjadi apabila dilakukan pengukuran ulang terhadap
kelompok subyek yang sama. Sedangkan konsep reliabilitas dalam arti reliabilitas hasil ukur
berkaitan erat dengan kekeliruan dalam pengambilan sampel yang mengacu pada
inkonsistensi hasil ukur apabila pengukuran dilakukan ulang pada kelompok yang berbeda.
Sudjana (2004: 16) menyatakan bahwa reliabilitas alat penilaian adalah ketepatan atau
keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat penilaian
tersebut digunakan akan memberikan hasil yang relatif sama.
Djaali (2000: 81) menyatakan bahwa reliabilitas dibedakan atas dua macam, yaitu
reliabilitas konsistensi tanggapan, dan reliabilitaskonsistensi gabungan butir. Reliabilitas
konsistensi tanggapan responden mempersoalkan apakah tanggapan responden atau obyek
ukur terhadap tes atau instrumen tersebut sudah baik atau konsisten. Dalam hal ini apabila
suatu tes atau instrumen digunakan untuk melakukan pengukuran terhadap obyek ukur
kemudian dilakukan pengukuran kembali terhadap obyek ukur yang sama, apakah hasilnya
masih tetap sama dengan pengukuran sebelumnya. Jika hasil pengukuran kedua
menunjukkan ketidakkonsistenan maka jelas hasil pengukuran itu tidak mencerminkan
keadaan obyek ukur yang sesungguhnya.
Formula 𝐾𝑅20 dapat diterapkan pada instrumen yang yang mempunyai data skor
dikotomi dari tes yang seolah-olah dibagi-bagi menjadi belahan sebanyak butir yang
dimiliki. Hasil perhitungan dengan rumus 𝐾𝑅20 lebih teliti, tetapi perhitungan lebih
rumit.
𝑛 𝑠2 − ∑ 𝑝𝑞
Rumus: 𝑟11 = ( )( )
𝑛−1 𝑠2
Keterangan :
𝑟11 = koefisien reliabilitas
n = banyaknya butir soal
𝑠2 = varians skor total
p = proporsi subjek yang menjawab soal secara benar
q = proporsi subjek yang menjawab soal secara salah (q = 1 – p)
𝑛 𝑀𝑡 (𝑛 − 𝑀𝑡 )
𝑟11 = ( ) (1 − )
𝑛 − 1 (𝑛)(𝑆𝑡2 )
Keterangan:
𝑟11 = koefisien reliabilitas
n = banyaknya butir soal
1 = bilangan konstan
𝑀𝑡 = mean total (rata-rata hitung dari skor total)
𝑆𝑡2 = varian total
3) Formula Spearman-Brown
Formula Spearman-Brown hanya dapat diterapkan pada soal yang mempunyai jumlah
butir genap. Formula ini menggunakan teknik belah dua ( split half method), yaitu
soal dibelah menjadi 2 bagian (belahan ganjil dan belahan genap atau belahan kiri
dengan belahan kanan). Kedua belahan tersebut sejajar. Formulanya adalah sebagai
berikut:
2𝑟ℎℎ
𝑟11 =
1 + 𝑟ℎℎ
Keterangan:
𝑟11 = koefisien reliabilitas
𝑟ℎℎ = koefisien korelasi product moment antara skor belahan satu dengan skor
belahan yang lain
1&2 = bilangan konstan
4) Formula Rulon
Formula Rulon ini juga dapat diterapkan dengan belah dua ( split half method) seperti
halnya pada formula Spearman-Brown. Hanya saja cara pandannya terhadap
reliabilitas berbeda dengan Spearman-Brown. Menurut Rulon reliabilitas dapat
dipandang dari adanya selisih skor yang diperoleh oleh responden pada belahan
pertama dengan belahan kedua. Selisih tersebut yang menjadi sumber variasi error
sehingga bila dibandingkan dengan variasi skor akan dapat menjadi dasar untuk
melakukan estimasi reliabilitas tes. Formula Rulon adalah sebagai berikut.
𝑆𝑑2
𝑟11 =1− 2
𝑆𝑡
Keterangan:
𝑟11 = koefisien reliabilitas
𝑆𝑑2 = varians perbedaan skor belahan
1 = bilangan konstan
5) Formula Alpha
Formula-formula di atas (Spearman-Brown, KR, Rulon) hanya berlaku untuk soal
objektif yang mempunyai kemungkinan jawaban benar dan salah. Sedangkan untuk
soal yang mempunyai gradualitas skor jawaban misalnya pada soal uraian ataupun
pada angket (tes sikap) formula yang paling pas adalah dengan menggunakan
Formula Alpha. Hal ini dimungkinkan karena Formula Alpha mengakomodasi adanya
variasi skor dalam setiap butir soal. Rumus yang digunakan adalah sebagai berikut.
𝑛 ∑ 𝑆𝑖2
𝑟11 =( ) (1 − )
𝑛 − 1 ∑ 𝑆𝑡2
Keterangan:
𝑟11 = koefisien reliabilitas
𝑆𝑖2 = varians skor tiap-tiap butir soal
7) Formula Flanagan
Reliabilitas pada formula Flanagan tidak didasarkan pada ada tidaknya korelasi antara
belahan I dengan belahan II. Dasar dari formula Flanagan adalah jumlah kuadrat
deviasi (varians) pada tes belahan I, jumlah kuadrat (varians) deviasi pada tes belahan
II, dan jumlah kuadrat deviasi (varians) skor total. Formula yang digunakan adalah
sebagai berikut:
𝑆12 + 𝑆22
𝑟11 = 2 (1 − )
𝑆𝑡2
Keterangan:
𝑟11 = koefisien reliabilitas
𝑆12 = varians skor belahan 1
KESIMPULAN
Reliabilitas mempermasalahkan sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu hasil
pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran
terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama. Penentukan
koefisien reliabilitas instrumen untuk skor butir dikotomi digunakan rumus KR-20, sedang untuk
skor politomi digunakan rumus Alpha. Interpretasi terhadap koefisien reliabilitas merupakan
intrepretasi relatif, artinya tidak ada batasan mutlak yang menunjukkan berapa angka koefisien
minimal yang harus dicapai agar suatu pengukuran dapat disebut reliabel. Namun, memberikan
informasi tentang hubungan varians skor teramati dengan varians skor sejati kelompok individu
DAFTAR PUSTAKA
http://digilib.unimed.ac.id/705/1/Validitas%20dan%20reliabilitas%20suatu%20instrumen%20pe
nelitian.pdf
https://www.academia.edu/9020793/reliabilitas