Analisis Butir Soal

ASESMEN PENDIDIKAN
DISUSUN OLEH KELOMPOK
SEPTI YASNI DARTI (061313816210)
RESTI AGUSTINA (061313816210)

AMIROTUN AYU ASHAROHU (061313816210)
EKA KURNIASIH (06131381621091)
JURIKA NOVASARI (061313816210)
DOSEN PENGAMPUH : DRA.TOYBAH, M.Pd.,
VINA AMALIA SUGANDA, M.Pd
PENDIDIKAN GURU SEKOLAH DASAR

UNIVERSITAS SRIWIJAYA
2018
KATA PENGANTAR
Puji syukur kami panjatkan atas kehadirat Tuhan Yang Maha Esa Atas berkat rahmatnya
kami,dapat menyelesaikan pembuatan makalah ini. Melalui makalah ini kami membahas
mengenai “”.
Keberhasilan kami dalam menyelesaikan makalah ini tidaklah terlepas dari peran serta
pihak-pihak terkait. Atas segala bantuan dan yang diberikan penyususn mengucapkan terima
kasih yang sebesar-besarnya. Kami menyadari bahwa ini masih jauh dari kesempurnaan. Oleh
karena, itu kami mengharapkan masukan dan kritik yang membangun dari dosen yang membaca
makalah ini. Kami berharap hasil dari makalah ini dapat bermanfaat bagi siapa pun yang
membutuhkannya. Semoga makalah ini dapat meningkatkan pemahaman kita di masa yang
akan datang. Amin.
Palembang, Oktober 2018

BAB I
PENDAHULUAN
A. Latar Belakang
Asesmen merupakan bagian yang sangat penting dalam proses pembelajaran dan
tidak dapat lepas dari kegiatan pembelajaran itu sendiri. Sejatinya asesmen ditujukan untuk
meningkatkan kualitas belajar dan pengajaran.
Namun, asesmen seringkali dipandang sebagai produk akhir dari suatu proses pembelajaran
yang tujuan utamanya untuk memberikan penilaian bagi masing
masing peserta didik. Makna yang sebenarnya dari asesmen tidak hanya menyangkut
penyedian informasi tentang hasil belajar dalam bentuk nilai, akan
tetapi hal yang terpenting adalah adanya proses yang telah terjadi selama pembelajaran itu
berlangsung.
Hasil belajar dari proses belajar tidak hanya dinialai oleh tes tetapi juga harus dinilai oleh
alat alat nontest atau bukan test. Teknik ini berguna untuk mengukur keberhasilan siswa
dalam proses belajar yang tidak dapat diukur dengan test. Penggunaan teknik ini dalam
evaluasi pembelajaran karena banyak aspek kemampuan siswa yang sulit diukur secara
kuantitatif dan mecakup objektoifitas yang sasarannya adalah perbuatan , ucapan, kegiatan,
pengalaman tingah laku dan lain lain. Penilaian tidak hanya menyangkut kognitif tetapi harus
mencakup ruang lingkup afektif dan pisikomotorik.
B. Rumusan Masalah
1. Apa itu analisis butir soal tes taraf kesukaran dan daya pembeda?
2. Bagaimana menilai tes yang dibuat sendiri?
C. Tujuan
Mengetahui analisis butir soal tes taraf kesukaran dan daya pembeda serta menilai tes
yang dibuat sendiri
BAB II
PEMBAHASAN
Keberhasilan mengungkapkan hasil dan proses belajar siswa sebagaimana adanya

(objektivitas hasil penilaian) sangat bergantung pada kualitas alat penilaiannya di samping pada
cara pelaksanaannya. Suatu alat penilaian dikatakan mempunyai kualitas yang baik apabila alat
tersebut memiliki atau memenuhi dua hal, yakni ketepatan atau validitasnya dan ketetapan atau
keajegannya atau reliabilitasnya.
A. Validitas
Validitas adalah menilai apa yang seharusnya di nilai dan alat penilain yang
digunakan sesuai dengan apa yang seharusnya dinilai dengan menggunakan alat sesuai untuk
mengukur kompetensi.
Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai
sehingga betul-betul menilai apa yang yang seharusnya dinilai. Sebagai contoh menilai
kemampuan siswa dalam matematika. Misalnya diberikan soal dengan kalimat yang panjang
dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab
karena tidak memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara,
tetapi ditanyakan mengenai tata bahasa atau kesusastraan seperti puisi atau sajak. Penilaian
tersebut tidak tepat (valid). Validitas tidak berlaku universal sebab bergantung pada situasi
dan tujuan penilaian. Alat penilaian yang telah valid untuk suatu tujuan tertentu belum
otomatis akan valid untuk tujuan yang lain.
Contoh prestasi belajar dan motivasi belajar dapat dinilai oleh tes ataupun oleh
kuesioner. Caranya juga bisa berbeda, bisa dilaksanakan secara tertulis atau bisa secara lisan.
Ketentuan penting dalam evaluasi adalah bahwa hasilnya harus sesuai dengan
keadaan yang dievaluasi. Mengevaluasi dapat diumpamakan sebagai pekerjaan memotret.
Gambar potret atau foto dikatakan baik apabila sesuai dengan aslinya. Gambar pemotretan
hasil evaluasi tersebut di dalam kegiatan evaluasi dikenal dengan data evaluasi. Data evaluasi
yang baik sesuai dengan kenyataan disebut data valid. Agar dapat dieroleh data yang valid,
instrumen atau alat untuk mengevaluasinya harus valid. Jika pernyataan tersebut dibalik,
instrumen evaluasi dituntut untuk valid karena diinginkan dapat diperoleh data yang valid.
Dengan kata lain, instrumen evaluasi dipersyaratkan valid agar hasil yang diperoleh dari
kegiatan evaluasi valid.
a. Macam-Macam Validitas
Di dalam buku Encyclopedia of Educational Evaliation yang ditulis oleh Scarvia

B. Anderson dan kawan-kawan disebutkan: A test is valid if it measures what it purpose
to measure. Atau jika diartikan lebih kurang demikian: sebuah tes dikatakan valid apabila
tes tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia “valid” disebut
dengan istilah “sahih”. Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes
itu sendiri tetapi pada hasil pengetesan atau skornya.
Contoh:
Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan menunjukkan
kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan pengetahuan
orang tersebut dalam hal yang berkaitan dengan mobil. Tes yang mengukur pengetahuan
tentang mobil bukanlah tes yang sahih untuk mekanik.
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Hal yang pertama akan diperoleh validitas logis (logical validity) dan hal
yang kedua diperoleh validitas empiris (empirical validity). Dua hal inilah yang dijadikan
dasar pengelompokan validitas tes.
Secara garis besar ada dua macam validitas, yaitu :
1) Validitas Logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika”
atau validitas logis sering juga disebut sebagai analisis kualitatif yaitu berupa
penalaran atau penelaahan. Dengan makna demikian maka validitas logis untuk
sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran.
Kondisi valid tersebut dipandang terpenuhi karena instrumen yang bersangkutan
sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana
pelaksanaan tugas lain misalnya membuat sebuah karangan, jika penulisan sudah
mengikuti aturan mengarang, tentu secara logis karangannya sudah baik. Berdasarkan
penjelasan tersebut maka instrumen yang sudah disusun berdasarkan teori
penyusunan instrumen, secara logis sudah valid. Dari penjelasan tersebut dapat
dipahami bahwa validitas logis dapat dicapai apabila instrumen disusun mengikuti
ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa validitas logis tidak
perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai
disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen,
yaitu validitas isi dan validitas konstrak (construct validity).
a. Validitas isi ( content validity )
Validitas isi berhubungan dengan kesanggupan tes untuk mengukur isi

yang seharusnya di ukur. Dengan kata lain validitas isi menyatakan apakah tes
sudah mencakup sapel yang representatif dari domain prilaku yang diukur.
Misalnya tes hasil belajar matematika di SD harus mampu mengungkapkan isi
pelajaran Matematika di SD.
b. Validitas konstruk ( construct validity )
Menunjukan pada sejauh mana sesuatu instrumen mampu mengukur

pengertian-pengertian yang terkandung dalam materi yang akan diukur. Misalnya
instrumen minat harus mampu mengukur pengertian-pengertian yang terkandung
pada variabel minat.agar lebih jelas, biasanya variabel tersebut diuraikan dulu
menjadi indikator-indikator.
Untuk menganalisis soal ditinjau dari segi teknis, isi, dan editorial.
Analisis secara teknis dimaksudkan sebagai penelaahan soal berdasarkan prinsip-
prinsip pengukuran dan format penulisan soal. Analisis secara isi dimaksudkan
sebagai penelaahan khusus yang berkaitan dengan kelayakan pengetahuan yang
ditanyakan. Analisis secara editorial dimaksudkan sebagai penelaahan yang
khususnya berkaitan dengan keseluruhan format dan keajegan editorial dari soal
yang satu ke soal yang lainnya.
Analisis kualitatif lainnya dapat juga dikategorikan dari segi materi,

konstruksi, dan bahasa. Analisis materi dimaksudkan sebagai penelaahan yang
berkaitan dengan substansi keilmuan yang ditanyakan dalam soal serta tingkat
kemampuan yang sesuai dengan soal. Analisis konstruksi dimaksudkan sebagai
penelaahan yang umumnya berkaitan dengan teknik penulisan soal. Analisis
bahasa dimaksudkan sebagai penelaahan soal yang berkaitan dengan penggunaan
bahasa Indonesia yang baik dan benar menurut EYD. Melalui analisis kualitatif
dapat diketahui berfungsi tidaknya sebuah soal.
2) Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”.

Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari
pengalaman. Analisis soal secara kuantitatif menekankan pada analisis karakteristik
internal tes melalui data yang diperoleh secara empiris. Karakteristik internal secara
kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda
dan reliabilitas.
Khusus soal-soal pilihan ganda, dua tambahan parameter yaitu dilihat dari
peluang untuk menebak atau menjawab soal benar dan berfungsi tidaknya pilihan
jawaban, yaitu penyebaran semua alternative jawaban dari subyek-subyek yang dites.
Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal,
yaitu apakah suatu soal dapat diterima karena telah didukung oleh data statistik yang
memadai, diperbaiki karena terbukti terdapat beberapa kelemahan atau bahkan tidak
digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali.
Sebagai contoh sehari-hari, sesorang dapat diakui jujur oleh masyarakat

apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Contoh
lain, seseorang dapat dikatakan kreatif apabila dari pengalaman dibuktikan bahwa
orang tersebut sudah banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-
hal yang sudah ada. Dari penjelasan dan contoh-contoh tersebut diketahui bahwa
validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumen
berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan melalui
pengalaman.
Ada dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan
untuk menguji bahwa sebuah instrumen memang valid :
a. Validitas ramalan atau prediksi ( predictive validity )
Menunjukan pada sejauh mana tes dapat menentukan atau meramalkan

kriteria tertentu yang diinginkan . misalnya NEM di SLTP dapat digunakan untuk
meramalkan prestasi belajar di SD.
b. Validitas kesamaan ( concurrent validy )
Menujukan kepada sejauh mana tes memiliki kesaman dengn tes yang
sudah ada atau yang sudah dilakukan . kesamaan yang di maksud meliputi
kemampuan yang di ukur, objek yang diukur , dan waktu yang sudahdiperlukan.
A. Pengertian Reliabilitas
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu pengukuran
dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran
yang relatif sama, selama aspek yang diukur dalam diri subyek memang belum berubah. Nur
(1987: 47) menyatakan bahwa reliabilitas ukuran menyangkut seberapa jauh skor deviasi
individu, atau skor-z, relatif konsisten apabila dilakukan pengulangan pengadministrasian
dengan tes yang sama atau tes yang ekivalen.
Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan salah-satu ciri atau
karakter utama instrumen pengukuran yang baik. Arifin (1991: 122) menyatakan bahwa
suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada
kelompok yang sama pada waktu atau kesempatan yang berbeda.
Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan masalah
kekeliruan pengukuran. Kekeliruan pengukuran sendiri menunjukkan sejauh mana
inkonsistensi hasil pengukuran terjadi apabila dilakukan pengukuran ulang terhadap
kelompok subyek yang sama. Sedangkan konsep reliabilitas dalam arti reliabilitas hasil ukur
berkaitan erat dengan kekeliruan dalam pengambilan sampel yang mengacu pada
inkonsistensi hasil ukur apabila pengukuran dilakukan ulang pada kelompok yang berbeda.
Sudjana (2004: 16) menyatakan bahwa reliabilitas alat penilaian adalah ketepatan atau
keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat penilaian
tersebut digunakan akan memberikan hasil yang relatif sama.
Djaali (2000: 81) menyatakan bahwa reliabilitas dibedakan atas dua macam, yaitu
reliabilitas konsistensi tanggapan, dan reliabilitaskonsistensi gabungan butir. Reliabilitas
konsistensi tanggapan responden mempersoalkan apakah tanggapan responden atau obyek
ukur terhadap tes atau instrumen tersebut sudah baik atau konsisten. Dalam hal ini apabila
suatu tes atau instrumen digunakan untuk melakukan pengukuran terhadap obyek ukur
kemudian dilakukan pengukuran kembali terhadap obyek ukur yang sama, apakah hasilnya
masih tetap sama dengan pengukuran sebelumnya. Jika hasil pengukuran kedua
menunjukkan ketidakkonsistenan maka jelas hasil pengukuran itu tidak mencerminkan
keadaan obyek ukur yang sesungguhnya.
B. Metode Mencari Koefisien Reliabilitas

a. Metode Tes Ulang (Test Retest Method)
Metode ini diterapkan untuk menghindari adanya penyusunan dua seri tes.
Teknisnya adalah sebuah tes yang sama diberikan dua kali kepada responden yang sama
dengan jarak waktu tertentu. Jika hasil tes pertama mempunyai kesejajaran dengan hasil
tes yang kedua maka tes tersbut dikatakan reliable. Oleh karena pengujian ini dilakukan
terhadap sebuah tes yang diujicobakan dua kali maka sering disebut pula sebagai single-
test-double-trial-method.
Kelemahan metode ini adalah jika jeda waktu tes terlalu singkat sedangkan soal tes
banyak mengungkapkan aspek pengetahuan maka responden cenderung masih mengingat
materi yang diteskan, sehingga ada kemungkinan hasil tes yang kedua lebih baik daripada
hasil tes pertama. Sebaliknya jika jeda waktu tes pertama dengan kedua terlalu lama
dikhawatirkan banyak faktor serta situasi dan kondisi sudah banyak berubah dan
mempengaruhi hasil tes yang kedua.
b. Metode Tes Sejajar (Equivalent)

Metode ini mengharuskan adanya dua buah seri soal yang mempunyai kesamaan
tujuan, bobot soal, tingkat kesukaran, susunan soal, tetpai butir -butir soalnya berbeda.
Dengan kata lain, dua buah tes yang digunakan harus sejajar (paralel, equivalen).
Koefisien relibiabilitas diperoleh dengan me ngkorelasikan hasil tes pertama dengan hasil
tes kedua. Oleh karena metode ini menggunakan dua buah tes yang berbeda dan diteskan
pada siswa yang sama maka disebut juga doublé test – double – trial – method. Sudah
tentu metode ini akan menambah kerepotan. Inilah kelemahan metode ini.
Kelebihan dari metode ini adalah dapat memperbaiki kelemahan pada metode
pertama yaitu terhindarnya dari kondisi “siswa masih mengingat materi tes pertama”.
Aspek ingatan dan hafalan pada pengerjaan tes pertama tidak terbawa pada saat
mengerjakan tes yang kedua.
c. Metode Tes Tunggal (Single Test – Single Trial)

Metode tes tunggal dilihat dari kepraktisannya lebih praktis dari pada dua metode
sebelumnya. Metode ini hanya melakukan sekali tes kepada sekelompok subjek. Dengan
demikian tidak perlu menunggu waktu maupun harus mempunyai data dari tes sejenis
untuk dapat menentukan reliabilitasnya.
Koefisien reliabilitas dapat diperoleh dengan cara membelah instrumen menjadi
dua, tiga, empat, atau bahkan sebanyak butir yang dimiliki oleh instrumen tersebut.
Teknik perhitungannya tergantung pada banyaknya belahan, bentuk, serta sifat alat
ukurnya. Beberapa teknik yang sering digunakan untuk menentukan koefisien reliabilitas
dengan metode tes tunggal ini antara lain: Formula-formula Kuder Richardson (KR20
dan KR21), Formula Spearman-Brown, Formula Rulon, Formula Alpha, Formula C.
Hoyt, Formula Analisis Varians, Formula Kristof, Formula Flanagan, dan sebagainya.
1) Formula Kuder Richardson (𝐾𝑅20 )
Formula 𝐾𝑅20 dapat diterapkan pada instrumen yang yang mempunyai data skor
dikotomi dari tes yang seolah-olah dibagi-bagi menjadi belahan sebanyak butir yang
dimiliki. Hasil perhitungan dengan rumus 𝐾𝑅20 lebih teliti, tetapi perhitungan lebih
rumit.
𝑛 𝑠2 − ∑ 𝑝𝑞
Rumus: 𝑟11 = ( )( )
𝑛−1 𝑠2
Keterangan :
𝑟11 = koefisien reliabilitas
n = banyaknya butir soal
𝑠2 = varians skor total
p = proporsi subjek yang menjawab soal secara benar
q = proporsi subjek yang menjawab soal secara salah (q = 1 – p)
2) Formula Kuder Richardson (𝐾𝑅21 )

Formula KR21 lebih sederhana dalam perhitungannya. Kelemahannya adalah kurang
teliti dibandingkan dengan KR20. Rumusnya adalah sebagai berikut:
𝑛 𝑀𝑡 (𝑛 − 𝑀𝑡 )
𝑟11 = ( ) (1 − )
𝑛 − 1 (𝑛)(𝑆𝑡2 )
Keterangan:
n = banyaknya butir soal
1 = bilangan konstan
𝑀𝑡 = mean total (rata-rata hitung dari skor total)
𝑆𝑡2 = varian total
3) Formula Spearman-Brown
Formula Spearman-Brown hanya dapat diterapkan pada soal yang mempunyai jumlah
butir genap. Formula ini menggunakan teknik belah dua ( split half method), yaitu
soal dibelah menjadi 2 bagian (belahan ganjil dan belahan genap atau belahan kiri
dengan belahan kanan). Kedua belahan tersebut sejajar. Formulanya adalah sebagai
berikut:
2𝑟ℎℎ
𝑟11 =
1 + 𝑟ℎℎ
Keterangan:
𝑟ℎℎ = koefisien korelasi product moment antara skor belahan satu dengan skor
belahan yang lain
1&2 = bilangan konstan
4) Formula Rulon
Formula Rulon ini juga dapat diterapkan dengan belah dua ( split half method) seperti
halnya pada formula Spearman-Brown. Hanya saja cara pandannya terhadap
reliabilitas berbeda dengan Spearman-Brown. Menurut Rulon reliabilitas dapat
dipandang dari adanya selisih skor yang diperoleh oleh responden pada belahan
pertama dengan belahan kedua. Selisih tersebut yang menjadi sumber variasi error
sehingga bila dibandingkan dengan variasi skor akan dapat menjadi dasar untuk
melakukan estimasi reliabilitas tes. Formula Rulon adalah sebagai berikut.
𝑆𝑑2
𝑟11 =1− 2
𝑆𝑡
Keterangan:
𝑆𝑑2 = varians perbedaan skor belahan
𝑆𝑡2 = varians skor total
5) Formula Alpha
Formula-formula di atas (Spearman-Brown, KR, Rulon) hanya berlaku untuk soal
objektif yang mempunyai kemungkinan jawaban benar dan salah. Sedangkan untuk
soal yang mempunyai gradualitas skor jawaban misalnya pada soal uraian ataupun
pada angket (tes sikap) formula yang paling pas adalah dengan menggunakan
Formula Alpha. Hal ini dimungkinkan karena Formula Alpha mengakomodasi adanya
variasi skor dalam setiap butir soal. Rumus yang digunakan adalah sebagai berikut.
𝑛 ∑ 𝑆𝑖2
𝑟11 =( ) (1 − )
𝑛 − 1 ∑ 𝑆𝑡2
Keterangan:
𝑆𝑖2 = varians skor tiap-tiap butir soal

6) Formula C. Hoyt
Berbeda dengan formula-formula yang lain, C. Hoyt memandang bahwa sebuah tes
dapat dipandang sebagai sebuah interaksi faktorial di mana skor-skor tes dianggap
sebagai hasil eksperimen. Dalam hal ini, berlaku sebagai faktor I adalah subjek
(responden) sedangkan faktor II adalah butir soal. Dengan demikian masing-masing
sel terdiri atas satu subjek, untuk selanjutnya dapat dicari interaksi antara subjek
dengan butir soal.
Kelebihan formula ini adalah dapat diterapkan baik pada soal yang mempunyai skor
dikotomi 1 dan 0 maupun pada soal yang mempunyai variasi skor pada butirnya (tes
sikap maupun tes uraian). Rumus yang digunakan adalah sebagai berikut.
𝑀𝐾𝑒
𝑟11 = 1 −
𝑀𝐾𝑠
Keterangan:
𝑀𝐾𝑒 = mean kuadrat interaksi antara subjek dengan butir soal
𝑀𝐾𝑠 = mean kuadrat antarsubjek

7) Formula Flanagan
Reliabilitas pada formula Flanagan tidak didasarkan pada ada tidaknya korelasi antara
belahan I dengan belahan II. Dasar dari formula Flanagan adalah jumlah kuadrat
deviasi (varians) pada tes belahan I, jumlah kuadrat (varians) deviasi pada tes belahan
II, dan jumlah kuadrat deviasi (varians) skor total. Formula yang digunakan adalah
sebagai berikut:
𝑆12 + 𝑆22
𝑟11 = 2 (1 − )
𝑆𝑡2
Keterangan:
𝑆12 = varians skor belahan 1
𝑆22 = varians skor belahan 2

2&1 = bilangan konstan
C. Faktor-Faktor Yang Mempengaruhi Reliabilitas

1. Jumlah butir tes
Umumnya semakin besar jumlah butir soal tes samakin tinggi pula reliabilitasnya. Hal ini
terjadi karena semakin panjang tes (semakin banyak butir soal) sehingga semakin banyak
perilaku yang terukur dengan lebih tepat. Skorskor yang diperoleh tepat dan
kemungkinan sedikit mengalami penyimpangan (distorsi) oleh adanya faktor-faktor yang
sudah biasa dikenal dengan sebuah tes yang diberikan atau kurangnya pemahaman
terhadap apa yang diharapkan pada sebuah tes yang diberikan.
2. Penyebaran skor
Sebagai catatan awal, koefisien reliabilitas secara langsung dipengaruhi oleh penyebaran
skor dalam kelompok yang diukur. Hal-hal lain menjadi sama, semakin besar penyebaran
skor maka semakin besar pula indeks reliabilitas yang diperoleh. Karena semakin besar
indeks reliabilitas yang dihasilkan ketika individu-individu berada pada posisi yang
relatif sama dalam sebuah kelompok sebuah asesmen dengan asesmen yang lain, hal ini
secara alami mengikuti bahwa segala sesuatu yang mengurangi kemungkinan bergeser
nya posisi dalam kelompok juga turut andil dalam memperbesar koefisien reliabilitas.
Dalam kasus ini, semakin besar perbedaan skor individu mengurangi kemungkinan
pergeseran pososi. Dengan kata lain kesalahan dalam pengukuran kurang berpengaruh
terhadap posisi relatif individu ketika perbedaan-perbedaan di antara anggotaanggota
kelompok yang besar. Hal ini terjadi ketika skornya tersebar luas.
3. Objektivitas
Objektivitas sebuah alat ukur menyatakan derajad untuk pemberi skor kompeten yang
sama mendapatkan hasil yang sama. Sebagian besar tes bakat dan tes prestasi standar
mempunyai objektivitas yang tinggi. Butir-butir skor tes objektif seperti pilihan ganda
dan skor yang dihasilkan tidak dipengaruhi oleh keputusan dan pendapat pemberi skor.
Semakin tinggi tin gkat objektivitas tes semakin tinggi pula tingkat reliabilitasnya.
4. Metode estimasi reliabilitas
Saat menguji koefisien reliabilitas tes standar, memutuskan metode yang digunakan
untuk menentukan besarnya koefisien reliabilitas merupakan hal yang penting. Secara
umum, besarnya koefisien reliabilitas berkaitan erat dengan metode yang digunakan
untuk estimasi reliabilitas.
a. Metode tes ulang (Test Retest Method) : mungkin hasilnya lebih besar dibandingkan
dengan metode belah dua jika interval waktunya pendek. Koefisien reliabilitas yang
dihasilkan menjadi lebih kecil jika interval waktu tesnya ditingkatkan.
b. Tes sejajar (Equivalent Test) tanpa waktu interval: Koefisien reliabilitas cenderung
lebih rendah dibandingkan dengan metode belah dua atau tes ulang yang
menggunakan interval waktu singkat.
c. Tes Sejajar dengan interval waktu: koefisien menjadi lebih kecil seiring dengan
peningkatan interval waktu tes.
d. Metode belah dua (Split-half Method): Metode ini menyediakan sebuah indikasi
konsistensi internal tes.
KESIMPULAN
Reliabilitas mempermasalahkan sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu hasil
pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran
terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama. Penentukan
koefisien reliabilitas instrumen untuk skor butir dikotomi digunakan rumus KR-20, sedang untuk
skor politomi digunakan rumus Alpha. Interpretasi terhadap koefisien reliabilitas merupakan
intrepretasi relatif, artinya tidak ada batasan mutlak yang menunjukkan berapa angka koefisien
minimal yang harus dicapai agar suatu pengukuran dapat disebut reliabel. Namun, memberikan
informasi tentang hubungan varians skor teramati dengan varians skor sejati kelompok individu
DAFTAR PUSTAKA
http://digilib.unimed.ac.id/705/1/Validitas%20dan%20reliabilitas%20suatu%20instrumen%20pe
nelitian.pdf
https://www.academia.edu/9020793/reliabilitas

Analisis Butir Soal

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Analisis Butir Soal

Diunggah oleh

Hak Cipta:

Format Tersedia

ASESMEN PENDIDIKAN

DISUSUN OLEH KELOMPOK

SEPTI YASNI DARTI (061313816210)

RESTI AGUSTINA (061313816210)

EKA KURNIASIH (06131381621091)

JURIKA NOVASARI (061313816210)

DOSEN PENGAMPUH : DRA.TOYBAH, M.Pd.,

VINA AMALIA SUGANDA, M.Pd

PENDIDIKAN GURU SEKOLAH DASAR

Palembang, Oktober 2018

Keberhasilan mengungkapkan hasil dan proses belajar siswa sebagaimana adanya

Di dalam buku Encyclopedia of Educational Evaliation yang ditulis oleh Scarvia

Secara garis besar ada dua macam validitas, yaitu :

a. Validitas isi ( content validity )

Validitas isi berhubungan dengan kesanggupan tes untuk mengukur isi

b. Validitas konstruk ( construct validity )

Menunjukan pada sejauh mana sesuatu instrumen mampu mengukur

Analisis kualitatif lainnya dapat juga dikategorikan dari segi materi,

Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”.

Sebagai contoh sehari-hari, sesorang dapat diakui jujur oleh masyarakat

a. Validitas ramalan atau prediksi ( predictive validity )

Menunjukan pada sejauh mana tes dapat menentukan atau meramalkan

b. Validitas kesamaan ( concurrent validy )

B. Metode Mencari Koefisien Reliabilitas

b. Metode Tes Sejajar (Equivalent)

c. Metode Tes Tunggal (Single Test – Single Trial)

2) Formula Kuder Richardson (𝐾𝑅21 )

𝑆𝑡2 = varians skor total

𝑆𝑡2 = varians skor total

𝑀𝐾𝑠 = mean kuadrat antarsubjek

𝑆22 = varians skor belahan 2

𝑆𝑡2 = varians skor total

C. Faktor-Faktor Yang Mempengaruhi Reliabilitas

Anda mungkin juga menyukai