Anda di halaman 1dari 16

BAB I

PENDAHULUAN

A. Latar Belakang Masalah


B. Rumusan Masalah
1. Apa yang dimaksud analisis?
2. Apa yang dimaksud validitas?
3. Apa yang dimaksud reliabiliitas?
4. Apa saja jenis-jenis validitas (3) dan reliabilitas (2)?
5. Apa saja fakto yang mempengaruhi validitas?
6. Apa saja faktor yang mempengaruhi reliabilitas? (1)
7. Apa yang dimaksud analisis kualitas butir soal?
8. Apa yang dimaksud analisis pengecoh?
9. Apa yang dimaksud homogenitas?
10. Apa yang dimaksud efektivitas fungsi opsi?
C. Tujuan Masalah
A. Analisis Kualitas Tes
1. Pengertian Validitas
2. Pengertian Reliabilitas
3. Jenis-Jenis Validitas dan Reliabilitas

Menurut Basuki dan Hariyanto (2014:119) menyatakan bahwa validitas


dibagi menjadi 2 konsep.

1) Validitas menurut konsep konvensional

Menurut Basuki dan Hariyanto (2014:121-123) Menurut konsep


konvensional yang saat ini juga masih banyak dipakai oleh para ahli,
untuk meninjau suatu alat ukur itu valid atau tidak bergantung sifat
objek yang diukur. Konsep validitas konvensional dibagi menjadi 4.

a) Validitas muka (face validity). Validitas muka berkenaan dengan


apakah tes tersebut terlihat valid, terlihat baik bagi peserta tes.
Validitas muka terkait dengan transparansi atau relevansi tes dalam
pandangan peserta tes. Dengan kata lain, sebuah tes dikatakan
memiliki validitas muka jika “kelihatan” valid dalam pandangan
peserta tes, dan terlihat mengukur apa yang seharusnya diukur.
Validitas muka terkait kelayakan suatu tes berdasarkan penampilan
dan bukan berdasarkan kriteria objektif. Validitas ini adalah jenis
validitas yang paling rendah kebermaknaannya, bahkan ada
sementara ahli tidak menganggapnya valid.

b) Validitas kurikuler (curricular validity). Validitas ini disebut pula


validitas isi (content validity). Dalam hubungan ini valid atau
tidaknya alat ukur dilihat dari kesesuainnya dengan kurukulum
atau bahan ajar. Jika suatu tes sesuai dengan bahan yang
ditentukan, dikatakan bahwa tes itu memiliki validitas kurikuler. Di
sisni kisi-kisi tes berperan untuk memandu penyusun tes agar tes
yang disusunnya sesuai dengan kurikulum. Jangan sampai
penyusun tes bertanya tentang hal-hal yang berada di luar atau
tidak ada hubungannya sama sekali dengan bahan ajar yang telah
ditetapkan dan harus diujikan. Dalam kaitannya validitas kurikuler
ini, tes yang disusun harus pula mampu mengukur berbagai
kemampuan siswa. Misalnya kemampuan mengetahui dan
menghafal, kemampuan memahami, kemampuan mengaplikasikan,
kemampuan membuat analisis, kemampuan mengevaluasi serta
kemampuan menciptakan. Tes harus mampu mencakup
pengukuran terhadap seluruh aspek kemampuan berpikir seperti
yang dinyatakan oleh taksonomi bloom, terakhir seperti yang telah
direvisi oleh Krathwohl (2001). Bagi seorang guru, validitas
kurikuler ini yang paling penting.

c) Validitas terkait kriteria (criterion-related validity). Validitas jenis


ini melihat hubungan antara suatu skor tes dengan sesuatu luaran
yang telah ditetapkan. Terdiri dari dua macam sub tipe, yaitu:

a. Validitas logis (logical validity)


Disebut pula validitas prediktif (predictive validity). Valid atau
tidaknya suatu tes dilihat dengan membandingkan
kesesuaiannya dalam praktik. Sesuai datau tidak hal-hal yang
telah diramalkan (diprediksikan) oleh tes tersebut dengan
prestasi yang dicapai si testee sesudah pengukuran melalui tes
tersebut. Umumnya psikotes mengutamakan validitas logis ini,
demikian pula tes inteligensi. Hal ini memprediksikan apakah si
testee mampu mempertimbangkan dengan baik (to judge well),
mampu memahami dengan baik (to understand well), serta
mampu menalar dengan baik (to reason well).
b. Validitas bandingan atau validitas konkuren (concurrent
validity)
Validitas ini merupakan suatu proses teknik yang
memungkinkan kita untuk mengevaluasi kemampuan tes dalam
membedakan antara peserta tes yang menguasai (masters) dan
yang tidak menguasai (non-masters) kompetensi-kompetensi
yang dinilai.
d) Validitas konstruk (construct validity).
Validitas jenis ini mengacu kepada deraajat sejauh mana suatu tes
atau tindakan penilaian lain menilai suatu konstruk. Konstruk
merupakan konstruksi teoritis yang digunakan untuk menjelaskan
perilaku. Secara praktis dilaksanakan dengan mencoba mencari
hubungan antara skor tes dengan prediksi hasil tes berdasarkan
teori. Validitas jenis ini juga memiliki dua sub-tipe yang pada
praktiknya harus saling bekerjasama, yaitu validitas konvergen dan
validitas diskriminan.
1. Validitas konvergen (convergent validity) dalam hal ini anda
perlu menunjukan bahwa tindakan yang menurut teori
seharusnya berkaitan pada nyatanya memang benar-benar
berkaitan.

2. Validitas diskriminan (discriminant validity) dalam hal ini


anda perlu menunjukan bahwa tindakan yang menurut teori
seharusnya tidak berkaitan. Pada kenyataannya memang
benar-benar tidak berkaitan.

2) Validitas menurut konsep baru

Menurut Basuki dan Hariyanto (2014:123-124) dalam konsep baru


tentang validitas, hanya dibedakan tiga macam jenis validitas, yaitu:

a. Validitas terkait isi (content-related evidence validity atau content-


related validity) yang dilihat berdasarkan tubuh pengetahuan yang
dikaji (the body of knowledge surveyed). Validitas ini bertujuan
untuk menilai kemampuan tes mempresentasikan dengan baik ranah
yang hendak diukur. Caranya dilakukan dengan membandingkan tes
dengan kisi-kisi tes.
b. Validitas terkait kriteria (criterion-related evidence validity atau
criterion-related validity) yang dilihat berdasarkan hubungan antara
skor dalam suatu tes tertentu dengan kinerja atau kempuan dalam
tindakan yang lain atau dalam kehidupan nyata. Validitas jenis ini
bertujuan untuk menilai kempuan tes memprediksi kemampuan
peserta tes di masa mendatang caranya dengan membandingkan skor
tes dengan skor yang diperoleh dari tes lain di masa mendatang.
c. Validitas terkait konstruk (construct-related evidence validity atau
construct-related validity) yang dilihat berdasarkan penyelidikan
terhadap konstruk psikologis atau karakteristik suatu tes. Validitas
jenis ini bertujuan menilai kemampuan tes untuk menafsirkan suatu
ukuran bermakna dari sejumlah karakteristik. Caranya dengan
mengkaji teori-teori yang terkait konstruk yang diukur oleh tes yang
dikembangkan, kajian terhadap teori-teori tersebut merupakan dasar
pembuatan butir-butir tes.
Djaali, Mujiono. (2008: 50). Mengemukakan konsep validitas tes dapat
dibedakan atas tiga macam yaitu:
a. Validitas isi (contet validity)
b. Validitas konstruk (construct validity)
c. Validitas empiris atau validitas kriteria.

Validitas empiris dapat dibedakan lagi atas dua macam yaitu: (a) validitas
kongkuen (concurrent validity), dan (b) validitas prediktif (predictive
validity).

1) Validitas Isi
Validitas isi suatu tes mempermasalahkan seberapa jauh suatu tes
mengukur tingkat penguasaan terhadap isi suatu materi tertentu yang
seharusnya dikuasai sesuai dengan tujuan pengajaran.
Menurut Gregory. (2000) dalam Djaali, Mujiono. (2008: 50)
mengemukakan bahwa, validita isi menunjukkan sejauh mana
pertanyaan, tugas atau butir dalam suatu tes atau instrumen mampu
mewakili secara keseluruhan dan proporsional perilaku sampel yang
dikenai tes tersebut. Artinya tes mencerminkan keseluruhan konten atau
materi yang diujikan atau yang seharusnya dikuasai secara
proporsional.
Untuk mengetahui tes itu valid atau tidaak harus dilakukan melalui
penelaahan kisi-kisi tess untuk memastikan bahwa soal-soal tes itu
sudah mewakili atau mencerminkan keseluruhan konten atau materi
yang seharusnya dikuasai secara proposional. Oleh karena itu, validitas
isi atau tes tidak mempunyai besaran tertentu yang dihitung secara
statistika, tetapi dipahami bahwa tes itu sudah valid berdasarkan telaah
kisi-kisi tes.
Wiersma dan Jurs. (1990) dalam Djaali, Mujiono. (2008:50).
Menyatakan bahwa validitas isi sebenarnya mendasarkan pada analisis
logika, jadi tidak merupakan suatu koefisien validitas yang dihitung
secara statistika.
2) Validitas Konstruk
Djaali, Mujiono. (2008:51). Menyatakan bahwa, validitas konstruk
(contruct validity) adalah validitas yang mempermasalahkan seberapa
jauh item-item tes dengan konsep khusus atau definisi konseptual yang
telah ditetapkan. Untuk menentukan validitas konstruk suatu instrumen
validitas konstruk suatu instrumen harus dilakukan proses penelaah
toritis dari suatu konsep dari variabel yang hendak diukur, mulai dari
perumusan konstruk, penentuan dimensi dan indikator, sampai kepada
penjabaran dan penulisan butir-butiritem instrumen.
Djaali, Mujiono. (2008:51-52). Mengemukakan bahwa dimensi
dan indikator dijabarkan dri konstruk yang telah dirumuskandengan
memperhatikan hal-hal sebagai berikut:
a. Seberapa jauh indikator dijaarkan dari konstruk yangg telah
dirumuskan.
b. Indikator-indikator tersebut harus lengkap untuk mengukur konstruk
dari varabel yang hendak diukur.
c. Indikator-indikator tersebut harus lengkap untuk mengukur suatu
konstruk secara utuh.

Jumlah butir untuk mengukur setiap indikator sebagai penanda


konsep variabel yang hendak diukur. Menyimak proses telaah teoritis
seperti telah dikemukakan, maka proses validasi konstruk sebuah
instrumen harus dilakukan melalui penelaahan atau justifikasi pakar
atau melalui penelahaan atau justifikasi pakar atau melalui penilaian
sekelompok panel yang terdiri dari orang-orang yang menguasai
subtansi atau konten dari variabel yang hendak diukur.

3) Validitas Empiris atau Validitas Kriteria


Djaali, Mujiono. (2008: 52-54). Validitas empiris sam dengan
validitas kriteia, karena validitas berdasarkan kriteria baik itu kriteria
internal maupun kriteria eksternal. Kriteria internal merupakan tes atau
instrumen itu seniri yang menjadi kriteria, sedangkan kriteria eksternal
adalah hasil ukur instrumen atau tes lain diluar instrumen itu sendiri
yang menjadi kriteria.
Validitas yang ditentukan berdasarkan kriteria internal dan ekternal ,dan
validitas eksternal dapat dibedakan lagi atas dua macam yaitu: (a)
validitas kongkuren, dan validitas prediktif.
1) Validitas Internal
Validitas yang diukur dengan besaran yang menggunakan
instrumen sebagai suatu kesatuan (keseluruhan butir) sebagai kriteria
untuk menentukan validitas item atau butir dari instrumen itu. Validitas
internal mempersalahkan validitas butir atau item suatu instrumen
dengan menggunakan hasil ukur instrumen tersebut sebagai suatu
kesatuan dan sebagai kriteria , sehingga bisa juga disebut sebagai butir.
Validitas butir ini diperlihatkan oleh seberapa jauh hasil ukur butir
tersebut konsisten dengan hasil ukur instrumen secara keseluruhan. Jika
koefisien antara skor butir dengan skor total instrumen positif dan
signifikan, maka butir tersebut dapat dianggap valid berdasarkan ukuran
validitas internal.
Untuk menghitung koefisien korelasi antara skor butir dengan skor
total instrumen digunakan rumus statistika yang sesuai dengan jenis
skor butir dari instrumen tersebut. Jika skor kontinum, maka untuk
menghitung koefisien korelasi antara skor butir dengan skor total
instrumen digunaakan koefisien korelasi product moment (r) yang
menggunakan rumus:
RUMUS
Jika skor butir dikotomi (misalnya 0,1), maka untuk menghitung
koefisien korelasi antara skor butir dan skor total instrumen digunakan
koefisien korelasi biserial (rbis) yang menggunakan rumus:
RUMUS
Keterangan:
Rbis (l) = Koefisien korelasi biserial antara skor butir soal nomor l
dengan skor total.
Xi = Rata-rata skor total responden yang menjawab benar butir
soal nomor i.
St = Standar deviasi skor total semua responden.
pi = Proporsi jawaban yang benar untuk butir soal nomor i.
qi = Proporsi jawaban yang salah untuk butir sol nomor l.
Nilai koefisien korelasi yang didapat untuk masing-masing butir, baik
butir yang mempunyai skor kontinum maupun butir yang mempunyai
skor dikotomi dibandingkan dengan nilai koefisien korelasi yang ada di
tabel r (r t) pada alpha tertentu misalnya α = 0,005. Jika koefisien
korelasi skor butir dengan skor total lebih besar dari koefisien korelasi
dari tabel r t koefisien korelasi butir signifikan dan butir tersebut
dianggap valid secara empiris.
2) Validitas Eksternal
Jenis validitas empiris, yaitu validitas yang diukur berdasarkan
kriteria eksternal. Validitas eksternal diperlihatkan oleh suatu besaran
yang merupakan suatu hasil perhitungan statistika. Jika kita
menggunakan hasil ukur instrumen yang sudah baku sebagai kriteria
eksternal, maka besaran validitas eksternal dari instrumen yang kita
kembangkan didapat dengan jalan mengkorelasikan skor hasil ukur
instrumen yang dikembangkan dengan skor hasil ukur instrumen yang
kita kembangkan dengan skor hasil ukur instrumen baku dijadikan
kriteria. Makin tinggi koefisien korelasi yang didapat, maka validitas
instrumen yang dikembangkan juga makin baik. Kriteria yang
digunaakaan untuk menguji validitas eksternal adalah nilai tabel r (r-
tabel).
Jadi dapat dismpulkan bahwa validitas eksternal ini memiliki
kriteria yang berupa hasil ukur instrumen baku ataupun yang dianggap
baku dapat pula berupa hasil ukur lai yang sudah tersedia dan dipercaya
sebagai suatu konsep atau variebel yang hendak diukur.

Menurut Wahyudin. (2008: 45). Mengemukakan bahwa pengukuran


realibilitas disini memberikan kesempatan pada mereka yang sedang
mengkaji skor-skor pada tes yang mendapatkan pengetahuan dari skor
yang diproleh peserta tes, tentang batas-batas kepercayaan yang bisa
diharapkan untuk nilai sebenarnya yang peserta didik itu capai.

Menurut perhitungan product-moment dai person, ada tiga macam


reliabilitas, yaitu koefisien stabilitas, koefisien ekuivalen, dan koefisien
konsistensi internal.

a. Koefisien Stabilitas
Koefisien stabilitas (coefficient of stability) adalam jenis reliabilitas
yang menggunakan teknik test dan retest, yaitu memberikan tes
kepada sekelompok individu, kemudian diadakan pengulangan tes
pada kelompok yang sama dengan waktu yang berbeda. Cara
memperoleh kofisien stabilitas adalah dengan mengorelesasikan
hasil tes pertama dengan hasil tes yang kedua dari kelompok yang
sama
b. Bentuk yang Ekuivalen
Tes ekuivalen itu biasa diselenggarakan, dan tiap cara akan
memunculkan suatu nilai reliabiilitas, yang semuannya mungkin saja
tidak sama. Dengan menggunakan tes ysng sama yang
diselenggarakan pada dua waktu berbeda, dengan metode tes- retes-
tepat hanya apabila bisa diasumsiikan bahwa terdapat sedikit saja
atau tidak ada bawaan dari suatu pengetesan satu lainnya. Para
peserta tes mungkin saja, disadari atau tidak, mengingat jawaban-
jawaban mereka untuk soal-oal dalam tes, karena ingatan yang akan
memberikan nilai tinggi yang keliru pada reliabilitas yang di ukur,
dan mungkin saja peserta tes belajar tentang soal-soal tertentu
diantara dua penyelenggaraan tes. Jenis pengukuran ini barangkali
lebih sesuai dalam assesment skill-skill motor dari pada dalam lahan
matematika.
c. Reliabilitas SPLIT-HALF
Menstmulasi efek ini dengan membagi tes yang diberikan ke dalam
dua bagian dan memperlakukan ini sebagai tes-tes ekuivalen. Salah
satu metode yang lebih lazim untuk melakukan ini yaitu
mengkorelasikan skor-skor pada soal-soal bernomor genap dengan
yang bernomor ganjil. Metode ganjil genap ini pada Reliabilitas
suatu ujian merupakan konsistensi tes itu dalam mendapatkan hasil-
hasilnya.semua pengukuran tunduk pada tingkat-tingkat galat (error)
yang tertentu. Pada pengukuran tinggi badan terdapat standart yang
di sepakati yang bisa dijadikan acuan untuk semua pengukuran,
dalam mengukur kemampuan-kemampuan tidak terdapat
kesepakatan seperti itu, diantara perkara-perkara saat ini berarti
bahwa membicarakan klaim reliabilitas yang tunggal dari suatu tes
adalah hal yang tidak bermakna. Apa yang bisa diukur adalah
reliabilitasnya saat diterapkan pada jenis siswa tertentu yang telah
dilatih dalam matematika dalam suatu cara yang tertentu.
Jadi dapat di simpulkan suatu upaya mempermudah
penyelenggaraan dan tidak semestinnya diambil jika mungkin
diberlakukan metode yang lain. Lebihlah pantas kita lakukan upaya
sadar yang diperlukan untuk memilah tes ke dalam dua bagian yang
akan diseimbangkan sebisa mungkin sehubungan dengan kemampuan-
kemampuan yang diuji, tingkat kesukaran soal-soal, serta cakupan
silabus.

Djaali, Mujiono. (2008:55-56) . mengemukakan bahwa, konsep


reliabilitas dalam arti alat ukur berkaitan erat dengan masalah eror
pengukuran yang menunjukkan sejauh mana inkonsisten hasil
pengukuran terjadi apabila dilakukan pengukuran ulang terhadap
kelompok subyek yang sama. Salah satu syarat agar hasil ukur suatu tes
dapat dipercaya ialah tes tersebut harus mempunyai reliabilitas yang
memadai.
Menurut Basuki dan Hariyanto (2014:100) menuliskan bahwa, terdapat
jenis-jenis reliabilitas di bawah ini meliputi:
a. Reliabilitas antar-Pemeriksa (inter rater reliability)

Menurut Basuki dan Hariyanto (2014:100) menyatakan bahwa


reliabilitas jenis ini terlihat jika pemeriksa yang berbeda memeriksa
hasil tes yang hasilnya mirip atu sedikit berbeda variasinya. Dua cara
terkait penggunaan reliabilitas antar pemeriksa adalah a) menguji
kemiripan pemeriksa dalam mengategorisasikan butir soal; b)
menguji bagaimana kemiripan pemeriksa dalam memberikan skor
butir soal. Reliabilitas jenis ini juga disebut interobserver reliability
atau inter-coder reliability.

b. Reliabilitas tes-tes ulang (test-retest reliability)

Menurut Basuki dan Hariyanto (2014:100) menyatakan bahwa


reliabilitas jenis ini terlihat jika pemeriksa yang sam pada saat yang
berlainan memperoleh hasil tes yang mirip. Reliabilitas disebabkan
oleh bagaimana tanggapan seseorang terhadap tes, suasan hatinya,
adanya interupsi waktu pengambilan tes, dan sebagainya. Pada
umumnya, semakin lama penunaan pemberian tes yang ke dua,
semakin besar variasi hasil tes. Suatu tes yang baik dapat menangani
masalah seperti itu sehingga hanya menghasilkan sedikit perbedaan
pada hasilnya. Dengan kata lain, selang waktu pemberian tes tidak
berpengaruh kepada hasil tes.

c. Reliabilitas bentuk pararel (parallel from reliability)

Menurut Basuki dan Hariyanto (2014:101) menyatakan bahwa


reliabilitas bentuk pararel dapat dilihat tatkala pada saat yang sama,
pemeriksa-pemeriksa yang berbeda melaksanakan pengujian tes
yang berbeda, dengan hasil yang mirip. Jenis-jenis pertanyaan pada
tes berbeda tetapi memiliki konstruksi tes yang sama. Reliabilitas
jenis ini digunakan untuk menilai hasil dari dua buah tes yang
memiliki konstruksi sama. Penilaian bentuk pararel ini dapat
dilaksanakan dalam kombinasi dengan metode lain misalnya metode
belah dua, membagi dua sejumlah butir-butir soal yang
konstruksinya sama dan dilaksanakan pada kelompok siswa yang
sama.

d. Reabilitas konsistensi internal (internal consistency reliability)

Menurut Basuki dan Hariyanto (2014:102) menyatakan bahwa


reliabilitas jenis ini terlihat jika seorang pemeriksa memberikan tes
yang berbeda jenis pertanyaannya tetapi konstruksinya sama dengan
hasil yang mirip. Reliabilitas jenis ini digunakann untuk menilai
konsistensi seluruh butir soal dalam suatu tes.

Jadi dapat disimpulkan dari beberapa pendapat yang di kemukakan


bahwasannya jenis reliabilitas diatas ....

Menurut Djaali, Mujiono. (2008:56). Menyatakan bahwa, realibilitas


dapat dibedakan menjadi dua yakni:

a) Realibilitas Konsisten Tanggapan.


Realibilitas konsisten tanggapan, suatu tes atau instrumen
digunakan untuk melakukan pengukuran terhadap objek ukur
kemudian dilakukan pengukuran kembali terhadap objek yang
sama, apakah hasilnya masih sama tetap dengan hasil
sebelumnya. Untuk mengetahui apakah tanggapan terhadap tes
atau instrumen itu mantap, konsisten atau tidak plin-plan, dapat
dilakukan deng cara memberikan tes yang sama secara berulang
kali (dua kali) kepada objek ukur atau responden yang sama.
b) Realibilitas Konsisten Gabungan Item.
Reabilitas ini terkait dengan konsistensi antara item-item suatu
tes atau instrument, apabila terhadap bagian obyek ukur yang
sama, hasil pengukuran melalui item yang satu kontradiksi atau
tidak konsisten dengan hasil ukur melalui item yang lain maka
pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu
tidak dapat dipercaya. Untuk itu jika terjadi hal demikian maka
kita tidak bisa menyalahkan obyek ukur, melainkan alat ukur
(tes) yang dipersalahkan, dengan mengatakan bahwa tes tersebut
tidak reliable atau memiliki reliabilitas yang rendah.

Jadi dapat disimpulkan bahwa, Konsep reliabilitas mendasari


kesalah pengukuran yang mungkin terjadi pada suatu proses
pengukuran atau pada nilai tunggal tertentu, sehingga menimbulkan
perubahan yang tertentu, sehingga menimbulkan perubahan pada
susunan kelompoknya (error of measuretment). Misalnya, guru
mengetes peserta didik dengan instrument tertentu dan mendapat nilai
70. Kemudian pada kesempatan yang berbeda dengan instrumen yang
sama, guru melakukan tes kembali, ternyata peserta didik tersebut
mendapatkan nilai 75. Artinya, tes tersebut tidak reliabel, karena
terjadi kesalahan pengukuran. Tes yang reliabel adalah apabila
koefisien reliabilitasnya tinggi dan kesalahan baku pengukurannya
rendah.

4. Faktor yang Mempengaruhi Reliabilitas


banyak faktor yang mempengaruhi reliabilitas. Menurut Siyoto. (2015:
90) menyatakan bahwa beberapa faktor secara garis besar dapat
dibedakan menurut sumbernya, yaitu faktor internal dari tes, faktor
eksternal tes, dan faktor yang berasal dari siswa yang bersangkutan
a. Faktor yang berasal dari dalaam tes.
1) Arahan tes yang disusun dengan makna tidak jelas sehingga
dapat mengurangi validitas tes.
2) Kata-kata yang digunakan dalam struktur instrumen
evaluasi, tidak terlalu sulit.
3) Item tes dikonstruksikan dengan jelas.
4) Tingkat kesulitan item tes tidak tepat dengan materi
pembelajaran yang diterima siswa.
5) Waktu yang dialokasikan tidak tepat, hal ini termasuk
kemungkinan terlalu kurang atau terlalu longgar.
6) Jumlah item terlalu sedikit sehingga tidak mewakili sampel.
7) Jawaban masing-masing item evaluasi bisa diprediksi
siswa.
b. Faktor yang berasal dari adminitrasi dan skor tes
1) Waktu pengerjaan tidak cukup sehingga siswa dalam
memberikan jawaban dalam situasi tergesa-gesa.
2) Adannya kecurangan dalam tes sehingga tidak
membedakan antara siswa yang belajar dengan melakukan
kecurangan.
3) Pemberian petunjuk dari pengawas yang tidak dapat
dilakukan pada semua siswa.
4) Teknik pemberian skor yang tidak konsisten.
5) Siswa tidak dapat mengikuti arahan yang diberikan dalam
tes baku.
6) Adannya joki (orang lain bukan siswa) yang masuk dalam
menjawab item tes yang diberikan.
c. Faktor yang berasal dari jawaban siswa
Sukardi. (2009) dalam Yusuf, M. (2015: 90). Seringkali terjadi
bahwa interpretasi terhadap item-item tes evaluasi tidak valid,
karena dipengaruhi oleh jawaban siswa dari pada intrepetasi
item-item pada tes evaluasi.

Menurut Gronlund. (1985) dalam Arifin. (2014: 258). Mengemukakan


bahwa, ada empat faktor yang dapat mempengaruhi reliabilitas, yaitu
“panjang tes, sebaran skor, tingkat kesukaran, dan objektivitas”.

d. Panjang Tes (length of test). Panjang tes berarti banyaknya soal tes.
Ada kecenderungan, semakin panjang suatu tes akan lebih tinggi
tingkat reliabilitas suatu tes, karena semakin banyak soal, maka akan
semakin banyak sampel yang diukur dan proporsi jawaban yang benar
semakin banyak, sehingga faktor tebakan (guessing) akan semakin
rendah.
e. Sebaran Skor (spread of scores). Besarna sebaran skor akan membuat
tingkat reliabilitas menjadi lebih tinggi, karena koefisien reliabilitas
yang lebih besar diperoleh ketika peserta didik tetap pada posisi yang
relatif sama dalam satu kelompok pengujian ke pengujian berikutnya.
Dengan kata lain, peluang selisih dari perubahan posisi dalam
kelompok dapat memperbesar koefisien reliabilitas.
f. Tigkat Kesukaran (difficulty indeks). Dalam penilaian yang
menggunakan pendekatan peniaian acuan norma. Baik untuk soal yang
mudah maupun yang sukar, cenderung menghasilkan tingkat
reliabilitas yang rendah. Hal ini disebabkan antara hasil tes yang
mudah dengan hasil tes yang sukar keduannya dalam satu sebaran skor
yang terbatas. Untuk tes yang mudah skor akan berada di atas dan
akhir dari skala penilaian. Bagi kedua tes (mudah dan sukar) perbedaan
antara peserta didik kecil sekali dan cenderung tidak dapat dipercaya.
Tingkat kesukaran soal yang ideal untuk meningkatkan koefisien
reliabilitas adalah soal yang menghasilkan sebaran skor berbentuk
genta atau kurva normal.
g. Objektivitas (obyektivity), objektivitas disini menunjukkan skor tes
kemampuan yang sama antara peserta didik yang satu dengan peserta
didik yang lainnya. Peserta didik memperoleh hasil yang sama dalam
mengerjakan suatu tes. Jika peserta didik memiliki tingkat kemampuan
yang sama, maka akan memperoleh hasil tes yang sama dalam
mengerjakan tes yang sama. Objektivitas prosedur tes yang tinggi akan
memperoleh reliabilitas hasil tes yang tidak dipengaruhi oleh prosedur
persekoran.

Menurut Sukardi. (2009) dalam Siyoto ( 2015: 94). Menyatakan bahwa


koefisien reliabilitas dapat dipengaruhi oleh waktu penyelenggaraan tes-
retes. Interval penyelenggaraan yang terlalu dekat atau jauh, akan
mempengaruhi koefisien reliabilitas, faktor yang meliputi:
a. Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak
jumlah item materi pembelajaran diukur.
b. Penyebaran skor, koefisien realibilitas secara langsung dipengaruhi
oleh bentuk sebaran skor dalam kelompok siswa yang di ukur.
Semakin tinggi sebaran, samakin tinggi pula estimasi koefisien
reliabel.
c. Kesulitan tes, tes normatif yang terlalu mudah atau terlalu sulit
untuk siswa, cenderung menghasilkan skor reliabilitas rendah.
d. Objektifitas, derajat dimana siswa dengan kompetensi sama,
mencapai hasil yang sama.
B. Analisis Kualitas Butir Soal

C. Analisis Pengecoh

Anda mungkin juga menyukai