PENDAHULUAN
A. Latar Belakang
Salah satu aspek positif kemajuan dari dunia penelitian yang ada di
Indonesia, adalah muncul banyaknya para peneliti-peneliti muda yang kini
lebih kritis lagi dalam meneliti objek-objek yang ada. Agar kajian kita bisa
bersifat riel maka kita sebagai seorang peneliti harus menguji terlebih dahulu
hasil penelitian kita yang disebut dengan uji reabilitas.
Kebanyakan dari kita mengira bahwa jika kita mempunyai
kesimpulan dari hasil penelitian kita terhadap kejadian-kejadian yang
terbatas, maka kesimpulan itu berlaku dengan sempurna untuk seluruh
kejadian yang sejenis. Perkiraan semacam itu belum tentu benar, untuk
menghindari hal-hal yang semacam itu maka kita harus melakukan
reliabilitas, yang berguna untuk menunjukkaan kevalidan data dari hasil
sebuah penelitian yang kita lakukan.
Reliabilitas mampu menunjukkan tingkat kepercayaan terhadap skor
atau tingkat kecocokan skor dengan skor sesungguhnya. Reliabilitas ini bisa
dicapai melalui tingkat kecocokan di antara skor pada lebih dari sekali
pengukuran. Jika makin cocok dengan skor sesungguhnya maka makin tinggi
tingkat reliabilitasnya. Kalaupun ada ketidakcocokan itu merupakan
kekeliruan yang acak. Jadi kemungkinan munculnya kesalahan masih tetap
ada, namun kemungkinan itu sangatlah kecit sekali dan tidak akan banyak
berpengaruh terhadap hasil akhir dari sebuah pengujian.
B. Rumusan Masalah
1. Apa pengertian reliabilitas ?
2. Apa saja jenis-jenis dari reliabilitas ?
3. Apa saja faktor-faktor yang mempengaruhi reliabilitas?
C. Tujuan
1. Agar mahasiswa mengetahui pengertian reliabilitas.
2. Agar mahasiswa dapat mengetahui jenis-jenis dari reliabilitas.
3. Agar mahasiswa dapat mengetahui faktor-faktor yang mempengaruhi
reliabilitas.
Page 1
BAB 2
PEMBAHASAN
A. Pengertian Reliabilitas
Menurut Sugiono (2005) Pengertian Reliabilitas adalah serangkaian
pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran
yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reliabilitas tes
adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat
dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun
diteskan pada situasi yang berbeda-beda. Menurut Sukadji (2000) reliabilitas suatu
tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur.
Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien
tinggi berarti reliabilitas tinggi. Menurut Nursalam (2003) Reliabilitas adalah
kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi
diukur atau diamati berkali – kali dalam waktu yang berlainan. Alat dan cara
mengukur atau mengamati sama – sama memegang peranan penting dalam waktu
yang bersamaan.
Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka
dapat diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk
mengukur atau mengamati sesuatu yang menjadi objek ukur. Suatu tes dapat
dikatakan mempunyai reliabilitas yang tinggi jka tes tersebut dapat memberikan hsil
yang tetap sama (konsisten, ajeg). Hasil pengukuran itu harus tetap sama (relative
sama) jika pengukurannya diberikan pada subjek yang sama meskipun dilakukan
oleh orang yang berbeda, waktu yang berbeda, dan tempat yang berbeda pula. Alat
ukur yang reliabilitasnya tinggi disebut alat ukur yang reliable.
Berkaitan dengan penilaian, suatu alat penilaian disebut reliabel jika hasil
penilaian tersebut relative tetap jika digunakan untuk subjek yang sama. Yang sering
ditangkap kurang tepat adalah adanya pendapat bahwa “ajeg” atau “tetap” diartikan
sebagai “sama”. Dalam pembicaraan penilaian ini tidak demikian. Ajeg atau tetap
tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan Si A
mula – mula berada lebih rendah dibanding dengan si B, maka jika diadakan
pengukuran ulang, si A juga berada lebih rendah dari B. itulah yang dikatakan ajeg
atau tetap, yaitu sama dalam kedudukan siswa di antara anggota kelompok yang lain.
Page 2
Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukkan
tingginya reliabilitas instrumen.
Sehubungan dengan reliabilitas ini, Scarvia . Anderson dan kawan-kawan
menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini sangat
penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena
menyongkong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid.
Sebalinya, sebuah tes yang valid biasanya reliabel.
Page 3
Pada pengukuran sesungguhnya
Hasil bidikan siapakah yang tidak valid dan tidak reliabel? Hasil bidikan
siapakah yang tidak valid tetapi reliabel? Dan hasil bidikan siapakah yang valid dan
reliabel? Dengan menggunakan pengertian validitas dan reliabilitas yang telah
dijelaskan di depan, maka anda akan dapat menjawab ketiga pertanyaan tersebut.
Hasil bidikan Reno adalah hasil bidikan yang tidak valid dan tidak reliabel.
Page 4
Mengapa? Hal ini disebabkan karena dari 10 anak panah yang dilepaskan Reni selalu
mengenai sasaran yang berbeda.
Bagaimana hasil bidikan Fano? Kalau anda perhatikan hasil bidikan Fano
ternyata dari 10 anak panah yang dilepaskan tidak satu pun anak panah yang tepat
mengenai sasaran. Walaupun ke 10 anak panah yang dilepaskan tidak tepat pada
sasaran yang di tentukan, tetpai hasil bidikan Fano selalu mengenai sasaran yang
relative sama. Kalau kita menggunakan konsep validitas dan reliabilitas yang telah
dijelaskan didepan maka dapat dikatakan bahwa hasil bidikan Fano adalah tidak
valid tetapi reliabel. Hasil bidikan Aldi lah yang dikatakan valid dan reliabel.
Mengapa ? Hal ini disebabkan karena ke 10 hasil bidikan Aldi tepat dan tetap
mengenai sasaran yang ditentukan.
Page 5
Tes ekuivalen adalah tes yang terdiri dari dua perangkat dimana soal – soal
pada perangkat pertama ekuivalen dengan soal – soal pada perangkat kedua.
Pengertian ekuivalen disini adalah soal – soal yang memuat konsep yang sama,
tetapi soal tersebut tidak persis sama. Selain memuat konsep yang sama, tingkat
kesukarannya pun harus sama. Misalkan untuk soal pemfaktoran suku tiga
bentuk 𝑥 2 − 5𝑥 + 6 ekuivalen dengan bentuk 𝑥 2 − 6𝑥 + 8 , tetapi tidak
ekuivalen dengan bentuk 5𝑥 2 + 7𝑥 − 4 sebab meskipun konsep suku tiga dan
pemfaktoranya sama tetapi tingkat kesukarannya berbeda. Untuk menentukan
reliabilitasnya dihitung dengan cara mengkorelasikan hasil tes untuk soal
perangkat pertama dengan hasil tes dari perangkat kedua.
Tes parallel atau tes ekuivalen bisa juga adalah dua buah tes yang
mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir
soalnya berbeda. Dalam istilah bahasa inggris disebut alternate-forms method
(parallel forms). Dengan metode bentuk parallel ini, dua buah tes yang paralel,
misalnya Matematika Seri A yang akan dicari reliailitasnya dan Seri B di teskan
pada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien
korelasi dari kedua hasil tes inilah yang menunjukan koefisien reliabilitas tes
Seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat
digunakan sebagai alat pengetes yang terandalkan. Dalam menggunakan metode
paralel ini pengetes harus menyiapkan dua buah tes, dan masing-masing
dicobakan pada kelompok siswa yang sama.
Page 6
2. Reliabilitas Terwakili
Mengacu pada keterandalan masing-masing grup. Menguji apakah
penyampaian indikator sama jawabannya saat diterapkan ke kelompok yang
berbeda-beda.
3. Reliabilitas Seimbang (equivqlence reliability)
Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran
yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama
tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional,
peralatan pengumpulan data, dan / atau pengamat-pengamat.
Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama
bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-
tengah.
Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan
yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-
pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau
pengubahan sering digunakan untuk teknik belah tengah ini). Hasil masing-
masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing
bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing
bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah
reliabilitas belah tengah.
Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik
pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan
pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor
yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang
tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila
tekanan darahnya yang diukur.
Page 7
2. Homogenitas Soal Tes
Soal yang memiliki homogenitas tinggi cenderung mengarah pada tingginya
tingkat realibilitas. Dua buah tes yang sama jumlah butir-butirnya akan tetapi
berbeda isinya, misalnya yang satu mengukur tentang pengetahuan kebahasaan
dan yang satunya tentang kemampuan fisika akan menghasilkan tingkat
reliabilitas yang berbeda. Tes fisikan cenderung menghasilkan tingkat reliabilitas
yang lebih tinggi daripada tes kebahasaan karena dari segi isi kemampuan
menyelesaikan soal fisika lebih homogen daripada pengetahuan kebahasaan.
3. Waktu Yang diperlukan untuk menyelesaikan Tes
Semakin terbatasnya waktu dalam pengerjaan tes maka akan mendorong tes
untuk memiliki reliabilitas yang tinggi.
4. Keseragaman Kondisi Pada Saat Tes Diberikan
Kondisi pelaksanaan tes yang semakin seraga akan memunculkan reliabilitas
yang makin tinggi
5. Kecocokan Tingkat Kesukaran Terhadap Peserta Tes
Bahwa soal-soal dengan tingkat kesukaran sedang cenderung lebih reliabel
dibandingkan dengan soal-soal yang sangat sukar atau sangat mudah
6. Heterogenitas Kelompok
Semakin heterogen suatu kelompok dalam pengerjaan suatu tes maka tes
tersebut cenderung untuk menunjukkan tingkat reliabilitas yang tinggi
7. Motivasi Individu
Motivasi masing-masing individu dalam mengerjakan suatu instrumen akan
mampu mempengaruhi realibilitas. Perbedaan motiviasi antar individu dalam
kelompok akan menimbulkan kesalahan acak pada pengukurannya karena
individu yang tidak memiliki motivasi tidak akan mengerjakan instrumen tersebut
dengan sungguh-sungguh sehingga jawaban yang diberikan tidak akan
mencerminkan kenyataan yang sebenarnya.
8. Variabilitas Skor
Instrumen yang menghasilkan rentangan skor yang lebh luas atau lebih
tinggi variabilitasnya, akan memiliki tingkat reliabilitas yang lebih tinggi daripada
menghasilkan rentangan skor yang lebih sempit , seperti bentuk pilihan ganda
cenderung menghasilkan tingkat reliabilitas yang lebih tinggi daripada bentuk
benar – salah
Page 8
Faktor – Faktor Yang Mempengaruhi Reliabilitas Instrumen
Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh
waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau
terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga
mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::
1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item
materi pembelajaran diukur.
2) Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk
sebaran skor dalam kelompok siswa yang di ukur. Semakin tinggi sebaran,
semakin tinggi estimasi koefisien reliable.
3) Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa,
cenderung menghasilkan skor reliabilitas rendah.
4) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan
kompetensi sama, mencapai hasil yang sama.
Page 9
2. Membelah atas item – item (butir – butir) awal dan item – item (butir –
butir) akhir yaitu separoh junlah pada nomor-nomor awal dan separo pada
nomor – nomor akhir yang selanjutnya disebut belahan awal-akhir.
Seperti halnya koefisien validitas yang telah dibahas pada bab terdahulu,
untuk koefisien reliabilitas yang menyatakan tingkat keterandalan tes,
dinyatakan dengan r11 . Tolak ukur menginterprestasikan tingkat reliabilitas tes
dapat digunakan tolak ukur yang dibuat oleh Guilford (1956) sebagai berikut :
0,80 < r11 ≤ 1,00 reliabilitas sangat tinggi
0,60 < r11 ≤ 0,80 reliabilitas tinggi
0,40 < r11 ≤ 0,60 reliabilitas sedang
0,20 < r11 ≤ 0,40 reliabilitas rendah
r11 ≤ 0,20 reliabilitas sangat rendah
Untuk menentukan koefisien reliabilitas suatu tes dengan teknik belah dua,
ada tiga macam teknik perhitungan, yaitu formula Spearman – Brown, Formula
Flanagan, dan formula Rulon.
bisa digunakan rumus product moment dengan angka kasar dari karl Pearson,
yaitu :
𝑁 ∑ 𝑋𝑌−(∑ 𝑋).(∑ 𝑌)
r ½½ =
√{𝑁 ∑ 𝑋 2 −(∑ 𝑋)2 }−{𝑁 ∑ 𝑌 2 −(∑ 𝑌)2 }
N = banyaknya subyek
X = Kelompok data belahan pertama
Y = Kelompok data belahan kedua
Page 10
Untuk menghitung koefisien reliabilitas suatu tes keseluruhan, Spearman –
Brown mengemukakan rumus :
Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil – genap adalah
sebagai berikut
Page 11
Subyek Skor Skor X.Y
Item Ganjil Item Genap
(X) (Y)
A 16 17 272
B 16 16 256
C 10 11 110
D 17 17 289
E 16 18 288
F 18 17 306
G 15 17 255
H 10 11 110
I 16 12 192
J 17 18 306
K 19 17 323
L 11 10 110
M 17 17 289
N 15 17 255
O 16 14 224
𝑁 ∑ 𝑋𝑌 − (∑ 𝑋). (∑ 𝑌)
r =
√{𝑁 ∑ 𝑋 2 − (∑ 𝑋)2 } − {𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 }
15 𝑥 3585 − 229 𝑥 229
=
√(15 𝑥 3603 − 52441)(15 𝑥 3609 − 52441)
1334
=
√1604 ∶ 1694
1334
= = 0,809
1648,386
Page 12
Jika dihitung dengan teknik belah dua metode awal – akhir, akan diperoleh dua
kelompok data seperti tabel di bawah ini :
Subyek Skor Skor X.Y
Bagian Awal Bagian Akhir
(X) (Y)
A 18 15 270
B 17 15 255
C 10 11 110
D 17 17 289
E 16 18 288
F 16 19 304
G 16 16 256
H 8 13 104
I 16 12 192
J 17 18 306
K 19 17 323
L 11 10 110
M 17 17 289
N 16 16 256
O 15 15 225
𝑁 ∑ 𝑋𝑌 − (∑ 𝑋). (∑ 𝑌)
r =
√{𝑁 ∑ 𝑋 2 − (∑ 𝑋)2 } − {𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 }
15 𝑥 3577 − 229 𝑥 229
=
√(15 𝑥 3631 − 52441)(15 𝑥 3597 − 52441)
1214
=
√2024 ∶ 1514
1214
= = 0,6935
1750,48
Setelah dihitung dengan rumus korelasi product moment dengan angka
kasar diperoleh bahwa rxy = 0,6935. Harga tersebut baru menunjukkan reliabilitas
separo tes. Sehingga r ½ ½ = 0,6935. Untuk mencari reliabilitas seluruh tes
digunakan rumus formulasi Spearman – Brown sebagai berikut :
2 r1⁄1 2 𝑥 0,6935 1,387
2 ⁄2
r11 = = = = 0,819
1 + r1⁄ 1 1 + 0,6935 1,6935
2 ⁄2
Dari kedua contoh perhitungan diatas ternyata hasilnya ada perbedaan, tetapi jika
dirujuk pada tolak ukur reliabilitas, keduanya menunjukkan tingkat reliabilitas
yang sama, yaitu tergolong tinggi. Jadi reliabilitas tes soal tersebut adalah tinggi
atau baik.
Page 13
Formula Flanagan
Menghitung reliabilitas tes dengan menggunakan rumus formula Flanagan
tidak didasarkan atas nilai korelasi antara kedua belahan tes, melainkan
didasarkan atas varians masing – masing belahan dan varians totalnya. Untuk
menghitung koefisien reliabilitas tes, Flanagan mengemukakan formula :
S12 + S22
r11 = 2 (1 − )
St2
Keterangan :
r11 = koefisien reliabilitas seluruh tes
S12 = varians belahan pertama
S22 = varians belahan kedua
St2 = varians skor total
Page 14
∑ X = 229 ∑ Y = 229 ∑ X𝑡 = 458
∑ X 2 = 3603 ∑ Y 2 = 3609 ∑ X𝑡2 = 14382
S𝑥2 = 7,1287 S𝑌2 = 7,5287 S𝑡2 = 26,5153
Setelah diperoleh nilai – nilai varians dari data belahan 1, belahan 2, dan varians
total kemudian dimasukkan ke dalam rumus.
S12 + S22
r11 = 2 (1 − )
St2
7,1287 + 7,5287
r11 = 2 (1 − )
26,5153
146,574
r11 = 2 (1 − ) = 0,9
26,5153
Jika dirujuk pada tolak ukur reliabilitas tergolong tinggi.
Formula Rulon
Formula Rulon didasarkan atas konsep perbedaan antara skor subyek pada
belahan pertama dan kedua, yang dapat dipandang sebagai kekeliruan (error) dari
proses penilaian. Dengan demikian varians yang diperhitungkan adalah varians
perbedaan skor antara kedua belahan itu, yaitu varians kekeliruan. Rumus Rulon
sebagai berikut :
Sd2
r11 = 1 −
St2
Keterangan :
Sd2 = Varians selisih skor subyek pada kedua belahan
St2 = Varians skor total
Untuk penggunaan rumus tersebut, kita menggunakan kembali data hasil tes
di atas dengan metode awal – akhir. Data yang harus dipersiapkan disusun dalam
bentuk tabel seperti dibawah ini.
Page 15
J 17 18 -1 35
K 19 17 2 36
L 11 10 1 21
M 17 17 0 34
N 16 16 0 32
O 15 15 0 30
S𝑑 = 2,22 St = 5,15
S𝑑2 = 4,93 S𝑡2 = 26,51
Rumus KR-20
n St2 − ∑ pi q i
r11 = [ ][ ]
n−1 st2
Keterangan :
n = banyaknya butir soal
pi = proporsi banyak subyek yang menjawab benar pada butir soal ke - i
q i = proporsi banyak subyek yang menjawab salah pada butir soal ke - i
Page 16
St2 = vaarians skor total
r11 = koefisien reliabilitas
Sebagai contoh kita gunakan hasil tes matematika yang terdiri dari 15 butir
soal yang diikuti 10 subyek siswa seperti yang digunakan sebelumnya. Tabel di
bawah ini adalah tabel persiapan untuk menghitung koefisien reliabilitas dengan
KR-20.
Keterangan : Untuk menyingkat tulisan 0,6 ditulis .6, 0,24 ditulis .24 dan
seterusnya.
Selanjutnya hasil perhitungan diatas dimasuk kan ke dalam rum,us KR-20
sebagai berikut:
n St2 − ∑ pi q i
r11 =[ ][ ]
n−1 st2
15 6,05 − 2,61
r11 = [ ][ ]
15 − 1 6,05
r11 = 1,07 x 0,56 = 0,5992
Page 17
Rumus KR-21
n Xt (n − Xt )
r11 = ( ) (1 − )
n−1 n St2
Keterangan :
n = banyaknya butir soal
Xt = rata – rata skor total
St2 = varians skor total
r11 = koefisien reliabilitas
Keuntungan yang dapat diperoleh dari penggunaan rumus KR-21 adalah
kemudahan dalam membuat tabel persiapan karena data nilai yang dibutuhkan
hanyalah rata – rata dan varians skor total. Dengan menggunakan kalkulator akan
diperoleh :
X𝑡 = 9,5 dan S𝑡2 = 6,05
Page 18
Rumus Alpha
n ∑ Si2
r11 =( ) (1 − 2 )
n−1 St
Keterangan :
n = banyaknya butir soal
∑ Si2 = jumlah varians skor setiap butir soal
St2 = varians skor total
r11 =koefisien reliabilitas
= 25,76
St2 = 29,24
Dimasukkan ke dalam rumus alpha
n ∑ Si2
r11 = ( ) (1 − 2 )
n−1 St
10 25,76
r11 = ( ) (1 − )
10 − 1 29,24
r11 = (1,11)(0,12) = 0,13
Koefisien reliabilitas tersebut menyatakan bahwa soal yang dibuat reliabilitasnya
sangat rendah.
Page 19
G. ANCAMAN TERHADAP RELIABILITAS
Semua jenis instrumen tes atau nontes tidak terlepas kesalahan. Hal ini
berlaku untuk instrumen tes dalam ilmu-ilmu eksakta dan dalam ilmu-ilmu psikologi
dan pendidikan. Misalnya, dalam mengukur panjang dengan suatu penggaris,
mungkin ada kesalahan sistematis berhubungan dengan di mana titik nol dicetak
pada penggaris dan kesalahan acak berhubungan dengan kemampuan mata dalam
membaca tanda-tanda dan memperhitungkan tanda-tanda tersebut. Juga
memungkinkan bahwa panjang obyek dapat berubah dari waktu ke waktu dan pada
lingkungan yang berbeda (misalnya perubahan temperatur). Salah satu tujuan
penilaian adalah untuk mengurangi kesalahan tersebut hingga ke tingkatan yang
sesuai dengan tujuan tes. Tes yang beresiko tinggi (high-stakes tes), seperti ujian
untuk mendapatkan SIM, harus mempunyai kesalahan yang sangat kecil. Tes di
kelas dapat mentolerir kesalahan yang lebih tinggi secara wajar kesalahan tersebut
mudah dikoreksi sepanjang proses pengujian. Reliabilitas hanya mengacu pada
derajat tingkat kesalahan yang tidak sistematis, yang disebut kesalahan acak.
Ada tiga sumber kesalahan utama, yaitu: faktor dalam tes itu sendiri, faktor
siswa yang dites, dan faktor penskoran. Umumnya tes berisi suatu koleksi butir yang
mengukur keterampilan tertentu. Adakalanya guru secara khas menggeneralisasikan
masing-masing butir tes ke semua materi yang diukur oleh tes itu. Sebagai contoh,
jika seorang siswa dapat memecahkan beberapa permasalahan seperti 7x8, maka
mungkin akan disamaratakan kemampuannya dalam mengalikan angka tunggal
bilangan bulat. Juga mungkin akan menyamaratakan suatu kumpulan materi kepada
suatu domein yang lebih luas. Jika siswa dapat menyelesaikan penjumlahan,
pengurangan, perkalian, dan pembagian, maka mungkin akan disimpulkan bahwa
siswa tersebut mampu menyelesaikan operasi pecahan.
Kesalahan dapat pula disebabkan oleh pemilihan butir untuk mengukur
domein dan keterampilan tertentu. Materi yang tercakup dalam tes berbeda menurut
format masing-masing tes, kesalahan pensampelan, pembatasan butir tes, dan karena
menyamaratakan ke data yang tidak diamati, yakni, kemampuan siswa terhadap
keseluruhan butir yang mungkin terdapat dalam tes. Ketika keterampilan dan domain
yang diukur menjadi lebih rumit, mungkin akan terjadi lebih banyak kesalahan yang
disebabkan oleh pensampelan materi. Sumber lain kesalahan tes adalah
Page 20
ketidakefektifan pengecoh dalam tes pilihan ganda, seperti jawaban benar yang lebih
banyak, dan tingkat kesukaran butir tes.
Sebagai manusia, para siswa tidaklah selalu konsisten dan juga tidak terlepas
dari kesalahan dalam menyelesaikan tes. Apakah tes itu dimaksudkan untuk
mengukur kemampuan khusus atau kemampuan siswa secara optimal, perubahan
dalam berbagai hal seperti sikap siswa, kesehatan, dan rasa kantuk dapat
mempengaruhi kualitas usaha dan konsistensi siswa dalam menyelesaikan tes.
Sebagai contoh, peserta tes mungkin membuat kesalahan karena teledor, salah
menafsirkan petunjuk tes, melupakan instruksi tes, melupakan beberapa butir tes,
atau salah baca butir tes.
Kesalahan penskoran merupakan sumber sepertiga dari kesalahan potensial.
Pada bentuk tes objektif, penskoran bersifat mekanik, dan kesalahan penskoran harus
diperkecil. Pada tes uraian, sumber kesalahan meliputi ketidakjelasan rubrik
penskoran, ketidakjelasan apa yang diharapkan dari siswa, dan beberapa kesalahan
yang bersumber dari penilai. Para penilai tidaklah selalu konsisten, kadang-kadang
merubah ukuran-ukuran mereka selagi menskor, dan terkadang terpengaruh oleh hal-
hal yang tidak berhubungan dengan skor tes seperti efek halo, latar belakang siswa,
perbedaan persepsi, kebaikan hati atau kepelikan, dan kesalahan dalam penskalaan.
Page 21
BAB 3
PENUTUP
Sumber : https://www.scribd.com/doc/252564322/Makalah-Reliabilitas
https://mihwanuddin.wordpress.com/2011/01/13/makalah-reliabilitas/
Page 22