Makalah Analisis Realibilitas Tes

ANALISIS RELIABILITAS TES
MAKALAH
diajukan untuk memenuhi salah satu tugas mata kuliah Evaluasi Pembelajaran
dosen pengampu: Rahmat Rizal., S.Pd., M.Pd.
disusun oleh:
Kelompok 5
1 Ani Mahisarani (14210617889)
2 Azmi Endah Permatasari (1421061)
3 Pipin Aripin (1421061)
Kelas : 6D-Matematika PGSD
PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR

SEKOLAH TINGGI KEGURUAN DAN ILMU PENDIDIKAN
(STKIP) SEBELAS APRIL SUMEDANG
2017
KATA PENGANTAR
Puji syukur kami panjatkan kehadirat Allah SWT karena berkat rahmat dan
hidayah-Nya, kami dapat menyelesaikan Makalah dalam tugas mata kuliah Evaluasi
Pembelajaran yang berjudul Analisis Reliabilitas Tes dengan baik.
Kami menyadari dalam pembuatan makalah ini masih jauh dari kata sempurna
dan kami masih belajar dalam seluruh tataran pembuatan makalah ini. Maka dari itu
kami sangat mengharapkan masukan ataupun saran beserta kritik dan aspek terkait
untuk kemajuan dan semakin berkembangnya daya kualitas dari makalah yang akan
kami buat untuk selanjutnya.
Semoga makalah yang kami buat ini bermanfaat bagi pembaca. Atas segala
saran dan bantuan, kami sampaikan terima kasih.
Sumedang, 07 April 2017
Penulis
1
DAFTAR ISI
Halaman
KATA PENGANTAR.......................................................................................... i
DAFTAR ISI........................................................................................................ ii
BAB I PENDAHULUAN
1.1 Latar Belakang................................................................................................. 1
1.2 Rumusan Masalah........................................................................................... 3
1.3 Tujuan Penulisan............................................................................................. 4
1.4 Metode Penulisan............................................................................................ 4
1.5 Sistematika Penulisan...................................................................................... 5
BAB II PEMBAHASAN
2.1 Pengertian Analisis Reliabilitas Tes............................................................... 6
2.2 Tipe-Tipe Reliabilitas..................................................................................... 9
2.3 Faktor yang Mempengaruhi Reliabilitas Instrumen....................................... 10
2.4 Objek Evaluasi kurikulum.............................................................................. 12
2.5 Prinsip, Jenis, dan Desain Evaluasi Kurikulum............................................. 14
2.6 Pendekatan Pengembangan Kriteria Evaluasi................................................ 17
2.7 Model-Model Evaluasi Kurikulum................................................................ 20
2.8 Peranan Evaluasi Kurikulum.......................................................................... 26
BAB III PENUTUP
3.1 Keimpulan...................................................................................................... 30
3.2 Saran............................................................................................................... 31
DAFTAR PUSTAKA........................................................................................... 33
2
BAB I
PENDAHULUAN
1.1 Latar Belakang
Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan

evaluasi sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga
hasil pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu yang sedang
diukur. Instrumen ini memang harus memiliki akurasi ketika digunakan. Konsisten
dan stabil dalam arti tidak mengalami perubahan dari waktu pengukuran satu ke
pengukuran yang lain.
Data yang kurang memiliki validitas dan reliabilitas, akan menghasilkan kesimpulan
yang bias, kurang sesuai dengan yang seharusnya, dan bahkan bisa saja bertentangan
dengan kelaziman. Untuk membuat alat ukur instrumen itu, diperlukan kajian teori,
pendapat para ahli serta pengalaman-pengalaman yang kadangkala diperlukan bila
definisi operasional variabelnya tidak kita temukan dalam teori. Alat ukur atau
instrumen yang akan disusun itu tentu saja harus memiliki validitas dan reliabilitas,
agar data yang diperoleh dari alat ukur itu bisa reliabel, valid dan disebut dengan
validitas dan reliabilitas alat ukur atau validitas dan reliabilitas instrumen
Perkembangan konsep penilaian pendidikan yang ada pada saat ini

menunjukkan arah yang lebih luas. Penilaian program pendidikan atau penilaian
kurikulum menyangkut penilaian terhadap tujuan pendidikan, isi program, strategi
pelaksanaan program dan sarana pendidikan. Penilaian proses belajar-mengajar
menyangkut penilaian terhadap kegiatan guru, kegiatan siswa, pola interaksi guru-
siswa dan keterlaksanaan program belajar-mengajar. Sedangkan penilaian hasil hasil
belajar menyangkut hasil belajar jangka pendek dan hasil belajar jangka panjang.
1
Dengan demikian, inti penilaian adalah proses memberikan atau menentukan
nilai kepada objek tertentu berdasarkan suatu kriteria tertentu. Proses pemberian nilai
tersebut berlangsung, baik dalam bentuk validitas maupun reliabilitas. Hal ini
mengisyaratkan bahwa objek yang dinilainya adalah hasil belajar siswa.
Keberhasilan mengungkapkan hasil dan proses belajar siswa sebagaimana
adanya (objektivitas hasil penilaian) sangat tergantung pada kualitas alat penilaiannya
di samping pada cara pelaksanaannya.
Berdasarkan beberapa data di atas serta dikaitkan dengan permasalahan yang
kami akan jelajahi, maka penulisan ini akan difokuskan pada pembahasan tentang
Validitas dan Reliabilitas Tes Hasil Belajar Siswa agar dapat lebih memahami apa
itu sebenarnya validitas dan reliabilitas serta lebih memahami bagaimana mengetahui
suatu alat penilaian dikatakan mempunyai kualitas yang baik.
1.2 Rumusan Masalah

Berdasarkan latar belakang di atas, kami akan merumuskan masalah
masalah yang akan dibahas dalam bab pembahasan, yaitu :
1.3 Tujuan Penulisan

Sejalan dengan rumusan masalah di atas, makalah ini disusun dengan
tujuan untuk:
1.4 Metode Penulisan

Metode atau cara yang digunakan dalam penulisan makalah yang
berjudul Analisis Reliabilitas Tes yaitu menggunakan studi kepustakaan dan mencari
sumber dari Internet yang kemudian di pelajari sesuai dengan tema yang diperlukan.
Juga sumber-sumber lain yang dapat dijadikan referensi makalah yang kami buat ini.
Kami memahami data dan menuliskan kembali pokok-pokok materi dari literatur
tersebut.
2
1.5 Sistematika Penulisan
Makalah ini terdiri dari tiga bab. Bab I membahas tentang latar belakang,
rumusan masalah, tujuan, metode penulisan dan sistematika penulisan. Bab II
membahas tentang. Serta Bab III membahas tentang simpulan dan saran.
3
BAB II
PEMBAHASAN
2.1 Pengertian Analisis Reliabilitas Tes
Bogdan dan Biklen (dalam Adi Rosyadi, 2012) mengemukakan bahwa

analisis adalah proses yang dilakukan secara sistematis untuk mencari, menemukan
dan menyusun transkrip wawancara, catatan-catatan lapangan dan bahan-bahan
lainnya yang elah dikumpulkan peneliti dengan teknik-teknik pengumpulan data
lainnya. Kegunaan adanya Analisis untuk menyusun data dalam cara yang bermakna
sehingga dapat dipahami, untuk memperoleh jawaban atas pertanyaan penelitian
berupa temua penelitian.
Kata reliabillitas dalam bahasa Indonesia di ambil dari reliability dalam

bahasa inggris, berasal dari kata, reliable yang artinya dapat di percaya. reliabilitas
merupakan kata benda, sedangkan reliable merupakan kata sifat atau keadaan.
Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai

asal kata rely dan ability. Pengukuran yang memiliki reliabilitas tinggi disebut
sebagai pengukuran yang reliabel (reliable). Walaupun reliabilitas mempunyai
berbagai arti seperti kepercayaan, keterandalan, keajegan, kestabilan dan konsistensi,
namun ide pokok yang terkandung dalam konsep reliabilitas adalah sejauh mana hasil
pengukuran dapat dipercaya. Adapun pengertian Reliabilitas menurut para ahli:
Menurut Sugiono (dalam Nur Chaerah, 2013:17)

Pengertian Reliabilitas adalah serangkaian pengukuran atau serangkaian
alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan
dengan alat ukur itu dilakukan secara berulang. Reabilitas tes adalah
tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat
dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah
walaupun diteskan pada situasi yang berbeda-beda.
1
Menurut Sukadji (dalam Nur Chaerah, 2013:17) reliabilitas suatu tes adalah
seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur.
Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien
tinggi berarti reliabilitas tinggi. Menurut Nursalam (dalam Nur Chaerah, 2013:17)
Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau
kenyataan hidup tadi diukur atau diamati berkali kali dalam waktu yang berlainan.
Alat dan cara mengukur atau mengamati sama sama memegang peranan penting
dalam waktu yang bersamaan. Sedangkan menurut Sukardi (dalam Nur Chaerah,
2013:17) relaibelitas adalah karakter lain dari evaluasi. Reliabelitas juga dapat
diartikan sama dengan konsistensi atau keajegan. Suatu instrument evaluasi dikatakan
mempunyai nilai reliabelitas tinggi, apabila tes yang dibuat mempunyai hasil
konsisten dalam mengukur yang hendak diukur.
Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabila pembaca
telah memahami konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid
menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan. Dalam
hal reliabilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait dengan
ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan,
artinya bahwa data tersebut benar, maka konsep reliabilitas terkait dengan pemotretan
berkali-kali. Instrumen yang baik adalah instrumen yang dapat dengan ajeg
memberikan data yang sesuai dengan kenyataan.
Sehubungan dengan reliabilitas ini, Scarvia B. Anderson (dalam Suharsimi
Arikunto, 2013:101) menyatakan bahwa persyaratan bagi tes, yaitu validitas dan
reliabilitas ini penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu,
karena menyokong terbentuknya validitas. Sebuah tes mungkin reliable tetapi tidak
valid. Sebaliknya, sebuah tes yang valid biasanya reliable. A reliable measure in one
that provides consistent and stable indication of the characteristic being investigated.
Untuk dapat memperoleh gambaran yang ajeg memang sulit karena unsur
kejiwaan manusia itu sendiri tidak ajeg. Misalnya kemampuan, kecakapan, sikap dan
sebagainya berubah-ubah dari waktu ke waktu.
2
Beberapa hal yang sedikit banyak mempengaruhi hasil tes banyak sekali.
Namun secara garis besar dapat dikelompokkan menjadi 3 hal:
1. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-
butir soalnya
Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan dengan
tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya validitas
menunjukkan tinggi rendahnya reliabilitas tes. Dengan demikian maka semakin
panjang tes, maka reliabilitasnya semakin tinggi. Dalam menghitung besarnya
reliabilitas berhubung dengan penambahan banyaknya butir soal dalam tes ini ada
sebuah rumus yang diberikan oleh Spearman dan Brown sehingga terkenal dengan
rumus Spearman Brown.
Rumusnya adalah:
nr
rnn
1+ ( n1 ) r
Keterangan :
rnn = Besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru
n = Berapa kali butir-butir soal itu ditambah
r = Besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah
Contoh:
Suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabilitas 0,70. Kemudian
butir-butir soal itu ditambah menjadi 60 butir soal. Maka koefisien reliabilitas baru
adalah:
nr
rnn
1+ ( n1 ) r
1,5 0,70

1+ ( 1,51 ) 0,70
1,05

1,35
0,79
3
Dengan demikian maka penambahan sebanyak 20 butir soal dari 40 butir,
memperbesar koefisien reliabilitas sebesar 0,09. Akan tetapi penambahan butir-butir
soal tes adakalanya tidak berarti bahkan adakalanya merugikan. Hal ini disebabkan
karena:
1) Sampai pada suatu batas tertentu, penambahan banyaknya butir soal sudah tidak
menambah tinggi reliabilitas tes.
2) Penambahan tingginya reliabilitas tes tidak sebanding nilainya dengan waktu, biaya
dan tenaga yang dikeluarkan untuk itu. Misalnya seorang guru sudah cukup membuat
100 soal bentuk objektif dan 10 soal bentuk esai sudah cukup mempunyai validitas isi
dan tingkah laku. Guru tersebut ingin menambah butir-butir soal sehingga menjadi
200 dan 20 dengan menambahkan soal-soal yang parallel. Tentu saja hal ini hanya
akan menambah waktu, biaya dan tenaga saja tanpa ada keuntungan apa-apa. Kualitas
butir-butir soal ditentukan oleh:
a) Jelas tidaknya rumusan soal.
b) Baik-tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah
jawab.
c) Petunjuknya jelas sehingga mudah dan cepat dikerjakan.
2. Hal yang berhubungan dengan tercoba (testee)

Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa
akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya
reliabilitas tes. Tes yang dicobakan kepada bukan kelompok terpilih, akan
menunjukkan reliabilitas yang lebih besar daripada yang dicobakan pada kelompok
tertentu yang diambil secara dipilih.
3. Hal yang berhubungan dengan penyelenggaraan tes

Sudah disebutkan bahwa faktor penyelenggaraan tes yang bersifat
administrative sangat menentukan hasil tes.
Contoh:
4
1) Petunjuk yang diberikan sebelum tes dimulai akan memberikan ketenangan kepada
para tes-tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak
terdapat pertanyaan. Ketenangan ini tentu saja akan berpengaruh terhadap hasil tes.
2) Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa terhadap
tes. Bagi siswa-siswa tertentu adanya pengawasan yang terlalu ketat menyebabkan
rasa jengkel dan tidak dapat dengan leluasa mengerjakan tes.
3) Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana disekelilingnya
ramai dan sebagainya) akan mempengaruhi hasil tes.
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak
langsung akan mempengaruhi reliabilitas soal tes.
2.2 Cara-Cara Mencari Besarnya Reliabilitas

Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada
subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran
hasil. Seperti halnya beberapa teknik juga menggunakan rumus korelasi product
moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.
Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di
luar tes (consistency eternal) dan pada tes itu sendiri (consistency internal).
1. Metode bentuk paralel (equivalent)
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butir soalnya berbeda.
Dalam istilah bahasa Inggris disebut alternative-form method (parallel forms).
Dengan metode bentuk parallel ini, dua buah tes yang paralel misalnya tes
Matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan kepada
sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien korelasi
dari kedua hasil tes inilah yang menunjukkan koefisien reliabilitasnya tes seri A. jika
koefisiennya tinggi maka tes tersebut sudah reliable dan dapat digunakan sebagai alat
pengetes yang terandalkan.
5
Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan
dua buah tes dan masing-masing dicobakan pada kelompok siswa yang sma. Oleh
karena itu, ada orang menyebutkan sebagai double test-double-trial method.
Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes
sehingga tidak ada faktor masih ingat soalnya yang dlam evaluasi disebut
adanya practice-effect dan carry-over effect, artinya ada faktor yang dibawa oleh
pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat
karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk
mencobakan dua kali tes.
2. Metode tes ulang (test-retest method)

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri
tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri
tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali,
maka metode ini dapat disebut dengan single-test-double-trial method. Kemudian
hasil dari kedua kali tes tersebut dihitung korelasinya.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan
pemahaman, cara ini kurang mengena karena tercoba akan masih ingat akan butir-
butir soalnya. Ooleh karena itu, tenggang waktu antara pemberian tes pertama dengan
kedua menjadi permasalahan tersendiri. Jika tenggang waktu terlalu sempit, siswa
masih banyak ingat materi. Sebaliknya kalau tenggang waktu terlalu lama, maka
faktor-faktor atau kondisi tes sudah akan berbeda dan siswa sendiri barangkali sudah
mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula terhadap
reliabilitas.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil
tes pertama. Hal ini tidak mengapa karena pengetes harus sadar akan adanya practice
effect dan carry over effect. Yang penting adalah adanya kesejahteraan hasil atau
ketetapan hasil yang diyunjukkan oleh koefisien korelasi yang tinggi.
6
Contoh:
Tes Pertama Tes Kedua

Siswa Skor Ranking Skor Ranking
A 15 3 20 3
B 20 1 25 1
C 9 5 15 5
D 18 2 23 2
E 12 4 18 4
Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh

semua siswa.
Metode ini juga disebut self-correlation method (korelasi diri sendiri)
karena mengkorelasikan hasil dari tes yang sama.
3. Metode belah dua atau split-half method

Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes
dua kali percobaan diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam
menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan
satu kali. Oleh karena itu, disebut juga single-test-single-trial method.
Berbeda dengan metode pertama dan kedua yang setelah diketemukan
koefisien korelasi langsung ditafsirkan itulah koefisiensi reliabilita, maka dengan
ketiga metode ini tidak dapat demikian. Pada waktu membelah dua dan
mengkorelasikan dua belahan, baru diketahui reliabilitas separo tes. Untuk
mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-Brown sebagai
berikut:
Contoh:
2r
R11
(1+r )
r = Korelasi antara skor-skor setiap belahan tes.
7
R11 = Koefisien reliabilitas yang sudah disesuaikan.
Contoh:
Korelasi antar belahan tes = 0,60
2 0,60 1,20
Maka reliabilitas tes = =0,75
1+0,60 1,60
Banyak pemakai metode ini salah membela hasil tes pada waktu,
menganalisis. Yang mereka lakukan adalah mengelompokkan hasil separo subjek
peserta tes dan separo yang lain kemudian hasil kedua kelompok ini dikorelasikan.
Yang benar adalah membelah item atau butir soal. Tidak akan keliru kiranya bagi
pemakai metode ini harus ingat bahwa banyaknya butir soal harus genap agar dapat
dibelah.Ada dua cara membelah butir soal ini, yaitu:
1) Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut
belahan ganjil-genap, dan
2) Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada
nomor-nomor awal dan separo pada nomor-nomor akhir yang selanjutnya disebut
belahan awal-akhir.
Contoh perhitungan reliabilitas dengan metode belah dua

Langkah pertama yang harus dilakukan adalah mengadakan analisis butir soal yang
lebih terkenal dengan nama analisis item. Item yang dapat dijawab dengan benar di
beri skor dan bagi yang salah diberi skor 0. Skor-skor untuk seluruh subjek dan
seluruh item ini diterangkan dalam table analisis sebagai berikut:
Tabel Analisis Item Tes Matematika

Skor 1,3,5 2,4,6 1,2,3 6,7,8
Nomor Item
No Total 7,9 8,10 4,5 9,10
Nama
. 1 Ganji
1 2 3 4 5 6 7 8 9 Genap Awal Akhir
0 l
8
1 Hartati 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5
2 Yoyok 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3
3 Oktaf 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3
4 Wendi 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2
5 Diana 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1
6 Paul 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1
Susan
7 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2
a
8 Helen 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5
Kertas yang digunting bergigi dapat digunakan sebagai alat bantu dalam
menentukan jumlah skor pada item ganjil dan jumlah skor pada item genap. Bagian
berlekuk dapat dipaskan pada item-item genap ataupun item-item ganjil. Jika sudah
diketahui jumlah skor pada item ganjil, otomatis diketahui jumlah skor pada item
genap karena skor totalnya sudah diketahui terlebih dahulu.
Penyajian contoh membelah diatas berarti bahwa perhitungan reliabilitas
dilakukan dengan membelah dua cara. Pembelahannya hanya memilih salah satu saja,
untuk selanjutnya dihitung dengan korelasi product moment.
1) pembelahan ganjil-genap
Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil-genap sebagai
berikut :
Item ganjil Item genap
No Nama (1,3,5,7,9) (2,4,6,8,10)
(X) (Y)
1 Hartati 5 3
2 Yoyok 3 2
3 Oktaf 0 4
4 Wendi 3 2
5 Diana 3 3
6 Paul 4 0
7 Susana 4 3
9
Kelanjutan dari tabel ini adalah menghitung dengan rumus korelasi product
moment.
Dengan menggunakan kalkulator diketahui bahwa :
X = 25 X2 = 93
Y = 22 Y2 = 76
XY = 63
Setelah dihitung dengan rumus korelasi product moment dengan angka
kasar diketahui bahwa rxy = -0,3786. Harga tersebut baru menunjukkan reliabilitas
separo tes. Oleh karena itu, rxy untuk belahan ini disebut dengan istilah r1/21/2 atau
rgg singkatan dari rganjil-genap. Untuk mencari reliabilitas seluruh tes digunakan
rumus Spearman-Brown yang rumusnya telah dikemukakan di depan. Jika koefisien
reliabilitas separo tes ini dimasukan ke dalam rumus hitungannya demikian:
2r
R11
( 1+r )
20,3786

1+ (0,3786 )
0,7572
=0,5493
1,3786
2) pembelahan awal-akhir
Dengan data yang tertera pada table analisis item tes Matematika diketahui
jumlah skor belahan awal-akhir sebagai berikut :
Item ganjil Item genap

No Nama (1,2,3,4,5) (6,7,8,9,10)
(X) (Y)
1 Hartati 3 5
2 Yoyok 2 3
3 Oktaf 1 3
4 Wendi 3 2
5 Diana 5 1
10
6 Paul 3 1
7 Susana 5 2
Seperti halnya pada waktu menghitung dengan belahan ganjil genap maka
kelanjutannya adalah menghitung dengan rumus korelasi product moment. Dengan
menggunakan kalkulator diketahui:
X = 25 X2 = 93
Y = 22 Y2 = 76
XY = 63
Setelah dimasukkan ke dalam rumus korelasi product moment dengan

angka kasar diperoleh r1/2 1/2 = -0,3831. Dengan rumus Spearman-Brown diperoleh
r11 = -0,5538. Selain menggunakan rumus korelasi product moment, dua orang ahli
mengajukan rumus lain. Seorang bernama Flanagan menemukan rumus yang
perhitungannya menggunakan belah dua ganjil-genap, dan seorang lagi bernama
Rulon yang rumusnya diterapkan pada data belahan awal-akhir.
3) Penggunaan rumus Flanagan

Rumusnya :
R11 = 2 (1- S21 + S22

S2t
Dimana :
R11 : reliabilitas tes
S21 : varians belahan pertama yang dalam hal ini varians skor item ganjil
S22 : varians belahan kedua, yaitu varians skor item genap
S2t : varians total yaitu varians skor total
11
Secara sederhana dapat dipahami bahwa varians adalah standar deviasi kuadrat.
Dengan demikian bagi peminat yang menghitung dengan kalkulator statistic varians
ini diperoleh dengan mengkuadratkan standar deviasi. Untuk mereka yang tidak
menggunakan kalkulator statistic maka varians dapat dicari dengan rumus sebagai
berikut :
S2 = X2 (X)2
N
N
Standar Deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB).
Namun huruf S (B besar) juga dapat dikatakan sudah menyebut standar deviasi.
Dalam kalkulator tertera dengan symbol a.
Bagi yang berminat mencari S dulu untuk mencari varians, dapat menggunakan
rumus S, yaitu:
S= X2
N
Dimana :
S: Standar Deviasi
X: simpangan X dan X yang dicari dari X- X
S2 : Varians, selalu dituliskan dalam bentuk kuadrat, karena standar deviasi
kuadrat.
N: banyaknya subjek pengikut tes.
Berdasarkan data table belahan ganjil-genap perhitungannya sebagai berikut :
12
S21 = 93- 252 S22 = 76-222
8 8
8 8
= 93-78,125 = 76-
60,5
8 8
= 1,859 = 1,937
b. Penggunaan Rumus Rulon

Rumusnya :
R11 = 1- S2d
S2t
Dimana :
S2d : varians beda (varians different)
D: different, adalah perbedaan antara skor belahan pertama (awal) dengan skor
belahan kedua (akhir)
Untuk memperjelas keterangan, maka table belahan awal-akhir sebagai berikut ;
No Nama Awal Akhir D

1 Hartati 3 5 -2
2 Yoyok 2 3 -1
3 Oktaf 1 3 -2
4 Wendi 3 2 1
5 Diana 5 1 4
6 Paul 3 1 2
7 Susana 5 2 3
13
Dengan kalkulator atau hitungan biasa diketahui bahwa :
d = 3
d2= 43
Dari perhitungan dengan rumus Flanagan maupun Rulon ternyata hasilnya sama,
keduanya lebih besar dari 1,00. Secara teoretik koefisien ini salah tetapi karena
pembulatan dalam perhitungan, seperti dijelaskan didepan, hasil seperti ini dapat saja
terjadi.
Analisis Reliabilitas tes uraian

Reliabilitas mengacu pada suatu pengertian bahwa suatu instrument cukup
dapat dipercaya untuk dapat digunakan sebagai alat pengumpul data karena instrumen
tersebut sudah baik (Arikunto, 1999:154). Pengukuran reliabilitas instrumen
penelitian misalnya berupa soal matematika bentuk uraian untuk mengukur hasil
belajar matematika dengan menggunakan rumus Alpha yaitu sebagai berikut.
Kriteria pengujian reliabilitas soal tes yaitu setelah didapatkan harga

r11 kemudian harga r11
tersebut dikonsultasikan dengan harga r product moment pada tabel, jika
r11 > rtabelmaka
item tes yang diujicobakan reliabel (Arikunto, 2006: 109).
contoh perhitungan reliabilitas soal tes bentuk uraian dengan menggunakan rumus
alpha:
14
tabel hasil belajar 40 siswa dengan skor 0-10 per butir dengan banyak soal ada 7 butir
soal
Hasil perhitungan reliabilitas soal tersebut dengan menggunakan m excel
15
16
2.2 Tipe-tipe Reliabelitas
Menurut Sukardi (dalam Nur Chaerah, 2013) Ada beberapa tipe reliabelitas
yang digunakan dalam kegiatan evaluasi dan masing-masing reliebelitas mempunyai
konsistensi yang berbeda-beda. Beberap tipe reliebelitas di antaranya: tes-retes,
ekivalen, dan belah dua yang ditentukan melalui korelasi.
Berbagai tipe tersebut akan diuraikan sebagai berikut:
1. Relibalelitas Dengan Tes-Retes
Reliabelitas tes-retes tidak lain adalah derajat yang menunjukkan
konsistensi hasil sebuah tes dari waktu ke waktu. Tes-Retes menunjukkan variasi skor
yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilaksanakan dua kali
atau lebih, sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik dalam
mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu tertentu adalah
sama hasilnya, ketika siswa itu dites lagi dengan tes yang sama. Dengan melakukan
tes-retes tersebut. Seorang guru akan mengetahui seberapa jauh konsistensi suatu tes
mengukur apa yang ingin diukur.
Sedangkan Arikunto Metode tes ulang (tes-retes) dilakukan untuk
menghindari dua penyusunan dua seri tes. Dalam menggunakan teknik atau metode
ini pengetes hanya memiliki satu seri tes tapi dicobakan dua kali. Oleh karena tesnya
satu dan dicobakan dua kali, maka metode ini dapat disebut juga dengan single-test-
double-trial-method.
Reliebelitas tes retes dapat dilakukan dengan cara seperti berikut:
1. Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.
2. Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan
kembali tes yang sama dengan kelompok yang sama tersebut.
3. Korelasikan kedua hasil tes tersebut.
Jika hasil koefisien menunjukkan tinggi, berarti reliabilias tes adalah bagus.
Sebaliknya, jika korelasi rendah, berarti tes tersebut mempunyai konsistensi rendah.
2) Reliabelitas Dengan Bentuk Ekivalensi
17
Sesuai dengan namanya yaitu ekivalen, maka tes evaluasi yang hendak
diukur reliabelitasnya dibuat identik dengan tes acuan. Setiap tampilannya, kecuali
substansi item yang ada, dapat berbeda. Kedua tes tersebut sebaliknya mempunyai
karate yang sama. Karakteristik yang dimaksud misalnya mengukur variabel yang
sama, mempunyai jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan
mempunyai petunjuk, cara penskoran, dan interpretasi yang sama (Sukardi 2008
dalam Nur Chaerah, 2013:18).
Pernyataan serupa juga disampaikan oleh Arikunto (dalam Nur Chaerah,
2013:18) tes paralel atau equivalent adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran dan susunan, tetapi butir-butirnya berbeda. Dalam istilah
bahasa Inggris disebut Alternate-forms method (parallel forms).
Tes reliabelitas secara ekivalen dapat dilaksanakan dengan mengikuti langkah-
langkah sebagai berikut:
1. Tentukan sasaran yang hendak dites
2. Lakukan tes yang dimaksud kepada subjek sasaran tersebut.
3. Administrasinya hasilnya secara baik.
4. Dalam waktu yang tidak terlalu lama, lakukan pengetesan yang kedua kalinya
pada kelompok tersebut
5. Korelasikan kedua hasil skor tersebut (Sukardi, 2008 dalam Nur Chaerah, 2013).
Perlu diketahui juga bahwa tes ekivalensi mempunyai kelemahan yaitu
bahwa membuat dua buah tes yang secara esensial ekivalen adalah sulit. Akibatnya
akan selalu terjadi kesalahan pengukuran (Sukardi dalam Nur Chaerah, 2013).
Pernyataan lain juga disampaikan oleh Arikunto (dalam Nur Chaerah, 2013)
kelemahan dari metode ini adalah pengetes pekerjaannya berat karena harus
menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan
dua kali tes.
3) Reliebilitas Dengan Bentuk Belah Dua
18
Menurut Sukardi (dalam Nur Chaerah, 2013) Reliabilitas belah dua ini
termasuk reliabilitas yang mengukur konsistensi internal. Yang dimaksud konsistensi
internal adalah salah satu tipe reliabilitas yang didasarkan pada keajegan dalam setiap
item tes evaluasi. Relibilitas belah dua ini pelaksanaanya hanya satu kali.
Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan
dengan urutan sebagai berikut:
1. Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.
2. Bagi tes yang ada menjadi dua atas dasar dua item, yang paling umum dengan
membagi item dengan nomor ganjil dengan item dengan nomor genap pada
kelompok tersebut.
3. Hitung skor subjek pada kedua belah kelompok penerima item genap dan item
ganjil.
4. Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan
dengan teknik pengukuran (Sukardi, dalam Nur Chaerah, 201).
2.3 Faktor-Faktor Yang Mempengaruhi Reliabilitas Instrumen

Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh
waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau
terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga
mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::
1. Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item
materi pembelajaran diukur.
2. Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk
sebaran skor dalam kelompok siswa yang di ukur. Semakin tinggi sebaran,
semakin tinggi estimasi koefisien reliable.
3. Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa,
cenderung menghasilkan skor reliabilitas rendah.
4. Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan
kompetensi sama, mencapai hasil yang sama.
19
Reliabilitas telah didefinisikan dengan cara yang berbeda oleh pengarang
yang berbeda. Cara yang terbaik untuk membahas reliabilitas adalah sejauhmana hasil
pengukuran dari suatu instrumen mewakili karakteristik yang diukur. Sebagai contoh,
reliabilitas didefinisikan seberapa besar konsistensi skor tes yang dicapai peserta tes
pada pengujian ulang. Definisi ini akan memuaskan jika skor tes dapat
menggambarkan kemampuan peserta tes; jika tidak maka skor tes tidak sistematis,
tidak dapat diulangi atau tidak terikat. Reliabilitas juga diartikan sebagai indikator
ketidakhadiran kesalahan acak. Jika kesalahan acak dapat diperkecil maka skor tes
akan lebih konsisten dari suatu pengujian ke pengujian berikutnya.
Definisi teoretis dari reliabilitas adalah proporsi keragaman skor tes yang
disebabkan oleh keragaman sistematis dalam populasi peserta tes. Jika terdapat
keragaman sistematis yang lebih besar dalam suatu populasi dibanding dengan
populasi lainnya, seperti dalam semua siswa sekolah negeri dibandingkan hanya
dengan kelas tertentu, tes akan mempunyai reliabilitas lebih besar untuk populasi
yang lebih bervariasi. Reliabilitas adalah karakteristik bersama antara tes dan
kelompok peserta tes. Reliabilitas tes bervariasi dari suatu kelompok dengan
kelompok lainnya.
Para profesional pengukuran menganggap reliabilitas sebagai persyaratan
utama suatu instrumen penilaian. Dalam teori tes diakui bahwa skor tes akan valid
(benar) jika skor tes tersebut reliabel (Mehrens & Lehmann, 1991). Asumsi ini
didasarkan pada suatu model matematika teori tes dimana skor perolehan terdiri atas
skor tulen dan skor galat (obtained score = true score + error score). Semakin sedikit
kesalahan dalam suatu tes (yaitu semakin reliabel) semakin valid skor tes. Karenanya,
suatu penilaian yang tidak reliabel secara otomatis tidak valid.
Penekanan utama dalam mengumpulkan data untuk menentukan reliabilitas
tes adalah pada konsistensi dihubungkan dengan reliabilitas skor atau reliabilitas
penilai. Reliabilitas skor berarti bahwa jika suatu tes telah diadministrasikan pada
penempuh ujian untuk kedua kalinya, maka penempuh ujian akan tetap memperoleh
skor yang sama dengan pengadministrasian yang pertama. Salah satu cara para
20
spesialis pengukuran dalam menentukan reliabilitas skor tes adalah melalui tes
standar. Jika penempuh ujian diuji kembali, mereka harus melengkapi tugas yang
sama persis dalam kondisi yang juga persis sama. Hal ini akan membantu dalam
pencapaian hasil tes yang konsisten.
2.4 Analisis Reliabilitas Menggunakan Komputer

Proses perhitungan untuk menganalisis reliabilitas instrumen dapat
dilakukan secara manual dan komputer. Secara manual biasanya hanya dengan
menggunakan kalkulator dan hanya efektif dilakukan untuk data yang jumlahnya
sedikit. Analisis reliabilitas dengan menggunakan komputer dilakukan dengan
menggunakan program SPSS (Statistical Package for Social Sciences) for Windows
yang saat itu buku ini disusun telah dikembangakan sampai pada versi 16,0. Untuk
analisis reliabilitas menggunakan SPSS dilakukan dengan urutan langkah: membuka
program, memasukkan data (entry data), mengolah data, dan menganalisis output.
21

Makalah Analisis Realibilitas Tes

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makalah Analisis Realibilitas Tes

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS RELIABILITAS TES

PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR

Sumedang, 07 April 2017

1.1 Latar Belakang

Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan

Perkembangan konsep penilaian pendidikan yang ada pada saat ini

1.2 Rumusan Masalah

1.3 Tujuan Penulisan

1.4 Metode Penulisan

2.1 Pengertian Analisis Reliabilitas Tes

Bogdan dan Biklen (dalam Adi Rosyadi, 2012) mengemukakan bahwa

Kata reliabillitas dalam bahasa Indonesia di ambil dari reliability dalam

Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai

Menurut Sugiono (dalam Nur Chaerah, 2013:17)

2. Hal yang berhubungan dengan tercoba (testee)

3. Hal yang berhubungan dengan penyelenggaraan tes

2.2 Cara-Cara Mencari Besarnya Reliabilitas

2. Metode tes ulang (test-retest method)

Tes Pertama Tes Kedua

Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh

3. Metode belah dua atau split-half method

Contoh perhitungan reliabilitas dengan metode belah dua

Tabel Analisis Item Tes Matematika

Item ganjil Item genap

Setelah dimasukkan ke dalam rumus korelasi product moment dengan

3) Penggunaan rumus Flanagan

R11 = 2 (1- S21 + S22

Berdasarkan data table belahan ganjil-genap perhitungannya sebagai berikut :

b. Penggunaan Rumus Rulon

Untuk memperjelas keterangan, maka table belahan awal-akhir sebagai berikut ;

No Nama Awal Akhir D

Analisis Reliabilitas tes uraian

Kriteria pengujian reliabilitas soal tes yaitu setelah didapatkan harga

Hasil perhitungan reliabilitas soal tersebut dengan menggunakan m excel

2) Reliabelitas Dengan Bentuk Ekivalensi

3) Reliebilitas Dengan Bentuk Belah Dua

2.3 Faktor-Faktor Yang Mempengaruhi Reliabilitas Instrumen

2.4 Analisis Reliabilitas Menggunakan Komputer

Anda mungkin juga menyukai