Anda di halaman 1dari 27

Menghitung Validitas dan Reliabilitas

MAKALAH
Disusun Guna Memenuhi Tugas Mata Kuliah Evaluasi Pembelajaran
Dosen Pengampu : Dr. Jaka Agus Pramana, M.Pd.

Disusun Oleh:

Neneng Kurnianingrum (115-14-072)


Desita Eka Kurniasari (115-14-076)
Yulia Dwi Rahmawati (115-14-078)
Nelis Ika Lestari F (115-14-086)
Yamti Damayanti (115-14-087)

JURUSAN PENDIDIKAN GURU MADRASAH IBTIDAIYAH


FAKULTAS TARBIYAH DAN ILMU KEGURUAN
INSTITUT AGAMA ISLAM NEGERI SALATIGA
2016
BAB I
PENDAHULUAN

A. LATAR BELAKANG
Penilaian adalah upaya atau tindakan untuk mengetahui sejauh mana
tujuan yang telah ditetapkan itu tercapai atau tidak. Dengan kata lain,
penilaian berfungsi sebagai alat untuk mengetahui keberhasilan proses dan
hasil belajar siswa.
Salah satu prinsip dasar yang harus senantiasa diperhatikan dan dipegangi
dalam rangka evaluasi hasil belajar adalah prinsip kebulatan, dengan prinsip
evaluator dalam melaksanakan evaluasi hasil belajar dituntut untuk
mengevaluasi secara valid dan reliabel, sehingga sangat penting bagi pendidik
untuk dapat mengetahui tingkat validitas dan reliabilitas suatu tes untuk agar
dilakukan perbaikan selanjutnya.

B. RUMUSAN MASALAH
1. Bagaimana cara menghitung validitas suatu tes?
2. Bagaimana cara menghitung reliabilitas suatu tes?

C. TUJUAN
1. Mengetahui cara menghitung validitas suatu tes.
2. Mengetahui cara menghitung reliabilitas suatu tes.

2
BAB II
PEMBAHASAN
1. Menghitung Validitas
Menurut Azwar (1986) Validitas berasal dari kata validity yang
mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya.
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas
yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau
memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran
tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan
data yang tidak relevan dengan tujuan pengukuran.
Terkandung di sini pengertian bahwa ketepatan validitas pada suatu alat
ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan
pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan
untuk mengukur variabel A dan kemudian memberikan hasil pengukuran
mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas
tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi
menghasilkan data mengenai variabel A atau bahkan B, dikatakan sebagai
alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan
tinggi validitasnya untuk mengukur variabel A atau B (Azwar 1986).
a. Macam-macam Validitas
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Hal yang pertama akan diperoleh validitas logis (logical
validity) dan hal yang kedua diperoleh validitas empiris (empirical
validity). Dua hal inilah yang dijadikan dasar pengelompokan validitas tes.
Ada 4 macam validitas yang berasal dari dasar pembagian jenis di atas
yaitu:1

1
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: Bumi Aksara, 1997), hlm.
64

3
1) Validitas logis
a) Validitas isi (content validity)
Sebuah tes dikatakan memiliki validitas isi apabila mengukur
tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran
yang diberikan. Oleh karena materi yang diajarkan tertera dalam
kurikulum maka validitas isi ini sering juga disebut validitas
kurikuler. Validitas ini dapat diusahakan tercapainya sejak saat
penyusunan dengan cara memerinci materi kurikulum atau materi
buku pelajaran.
Salah satu cara untuk memperoleh valiitas isi adalah dengan
melihat soal-soal yang membentuk tes itu. Jika Keseluruhan soal
nampak mengukur apa yang seharusnya tes itu digunakan, tidak
diragukan lagi bahwa validitas isi sudah terpenuhi.2
b) Validitas konstruksi (contstruct validity)
Sebuah tes dikatakan memiliki validitas konstruksi apabila
butir-butir soal yang membangun tes tersebut mengukur setiap
aspek berpikir seperti yang disebutkan dalam Tujuan Instruksional
Khusus. Dengan kata lain jika butir-butir soal mengukur aspek
berpikir tersebut sudah sesuai dengan aspek berpikir yang menjadi
tujuan instruksional.
Validitas konstruk mengandung arti bahwa suatu alat ukur
dikatakan valid apabila telah cocok dengan kostruksi teoritik
dimana tes itu dibuat. Dengan kata lain sebuah tes dikatakan
memiliki validitas konstruksi apabila soal-soalnya mengukur setiap
aspek berpikir seperti yang diuraikan dalam standar kompetensi,
kompetensi dasar, maupun indikator yang terdapat dalam
kurikulum.3
2) Validitas empiris
a) Validitas ada sekarang (concurrent validity)
2
Sumarna Surapranata, Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes
Implementasi Kurikulum 2004, (Bandung: PT Remaja Rosdakarya, 2004), hlm 52.
3
Ibid, hlm 53-54.

4
Validitas ini lebih umum dikenal dengan validitas empiris.
Sebuah tes dikatakan memiliki validitas empiris jika hasilnya
sesuai dengan pengalaman. Dalam hal ini hasil tes dipasangkan
dengan hasil pengalaman. Dalam membandingkan hasil sebuah tes
maka diperlukan suatu kriterium atau alat banding. Maka hasil tes
merupakan sesuatu yang dibandingkan. Validitas concurent atau
validity ada sekarang menunjuk pada hubungan antara tes skor
dengan yang dicapai dengan keadaan sekarang. Validitas ini
dikenal sebagai validitas empiris.4
b) Validitas prediksi (predictive validity)
Sebuah tes dikatakan memiliki validitas prediksi atau
validitas ramalan apabila mempunyai kemampuan untuk
meramalkan apa yang akan terjadi pada masa yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang
diperoleh setelah peserta tes mengikuti pelajaran di Perguruan
Tinggi.
b. Cara Mengetahui Validitas Alat Ukur
Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan
kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan
kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah
teknik korelasi product moment yang dikemukakan oleh Pearson.
Rumus korelasi product moment ada dua macam, yaitu:
1) Korelasi Product Moment dengan Simpangan
Rumus:

rxy =
( 2 )( 2 )

Keterangan:

4
Sumarna Surapranata, Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes
Implementasi Kurikulum 2004, (Bandung: PT Remaja Rosdakarya, 2004), hlm 55.

5
rxy = koefisien korelasi antara variabel X dan variabel Y,

dua variabel yang dikorelasikan (x = X - X


dan y = Y - Y ).
xy = jumlah perkalian x dengan y
x = kuadrat dari x
y = kuadrat dari y
Contoh perhitungan:
Misalnya, akan menghitung validitas tes prestasi belajar IPA. Sebagai
kriterium diambil rata-rata nilai ulangan harian yang tercatat dalam
daftar nilai. Nilai tes yang akan dicari validitasnya diberi kode X dan
rata-rata nilai harian diberi kode Y. Kemudian dibuat tabel persiapan
sebagai berikut:

Tabel Persiapan untuk Mencari Validitas


Tes Prestasi IPA

No Nama X Y x Y x2 y2 Xy
1 Risa 7 6,8 +0,4 +0,3 0,16 0,09 +0,12
2 Tika 6,5 6,2 -0,1 -0,3 0,01 0,09 +0,03
3 Sari 7,5 7,2 +0,9 +0,7 0,81 0,49 +0,63
4 Reno 5,5 6 -1,1 -0,5 1,21 0,25 +0,55
5 Rendi 6 6,5 -0,6 0 0,36 0 0
6 Lea 7 6,5 +0,4 0 0,16 0 0
7 Miko 7 6,3 +0,4 -0,2 0,16 0,04 -0,08
8 Sandra 6 6,2 -0,6 -0,3 0,36 0,09 +0,18
9 Lita 6,5 6,3 -0,1 -0,2 0,01 0,04 +0,02
10 Erma 7 7,2 +0,4 +0,7 0,16 0,49 +0,28
Jumlah 66 65,2 3,4 1,58 1,73

6
66
X = = = 6,6
10
Y 65,2
Y = = = 6,52 dibulatkan 6,5
N 10
x = X - X
y = Y - Y

Dimasukkan ke rumus:

rxy =
( 2 )( 2 )
1,73 1,73 1,73
= = = = 0,746333 = 0,746
3,4 1,58 5,372 2,318

2) Korelasi Product Moment dengan Angka Kasar


Rumus:

r () ()
XY =
{( 2 ()2 }{ 2 ()}

Keterangan:
r = koefisien korelasi antara variabel X dan variabel Y, dua
XY

variabel yang dikorelasikan.


Contoh penghitungan:
Dengan menggunakan data hasil tes prestasi IPA di atas kini
dihitung dengan rumus korelasi product moment dengan angka
kasar yang tabel persiapannya sebagai berikut:

7
Tabel Persiapan untuk Mencari Validitas
Tes Prestasi IPA
No Nama X Y X2 Y2 XY
1 Risa 7 6,8 49 4,24 47,6
2 Tika 6,5 6,2 42,25 38,44 40,3
3 Sari 7,5 7,2 56,25 51,84 54
4 Reno 5,5 6 30,25 36 33
5 Rendi 6 6,5 36 42,25 39
6 Lea 7 6,5 49 42,25 45,5
7 Miko 7 6,3 49 39,69 44,1
8 Sandra 6 6,2 36 38,44 37,2
9 Lita 6,5 6,3 42,25 39,69 40,95
10 Erma 7 7,2 49 51,84 50,4
Jumlah 66 65,2 439 426,68 432,05

Dimasukkan ke rumus:
() ()
rxy=
{( 2 ()2 }{ 2 ()}

10 432,05(66 65,2)
=
{10 439(66)} {10 426,68(65,2)}
4320,54303,2
=
(43904356)(4266,84251,04)
17,3 17,3 17,3
= = = = 0,7476 = 0,748
34 15,76 535,84 23,14

Jika diperbandingkan dengan validitas soal yang dihitung dengan


rumus simpangan ternyata terdapat perbedaan sebesar 0.002. hal ini wajar
karena dalam mengerjakan perkalian atau penjumlahan jika diperoleh 2

8
atau angka dibelakang koma dilakukan pembulatan ke atas. Perbedaan ini
sangat kecil sehingga dapat diabaikan.
1. Validitas soal dengan produk moment
Contoh soal matematika Kls VII SMP
1. Nilai tempat 1000 dari angka 5 terdapat pada bilangan . . . .
(A) 6.500.300
(B) 650.300
(C) 65.300
(D) 6.500
2. Lambang bilangan Romawi untuk 41 adalah . . . .
(A) XXXXI
(B) XXXI
(C) LXI
(D) XLI5
c. Validitas Butir Soal atau Validitas Item
Pengertian umum untuk validitas item adalah demikian: sebuah item
dikatakan valid apabila mempunyai dukungan yang besar terhadap skor
total. Skor pada item menyebabkan skor total menjadi tinggi atau rendah.
Dengan kata lain sebuah item memiliki validitas yang tinggi jika skor pada
item mempunyai kesejajaran dengan skor total. Kesejajaran ini dapat
diartikan dengan korelasi sehingga untuk mengetahui validitas item
digunakan rumus korelasi.
Untuk soal-soal bentuk obyektif skor untuk item biasa diberikan
dengan 1 (bagi item yang dijawab benar) dan 0 (item yang dijawab salah),
sedangkan skor total selanjutnya merupakan jumlah dari skor untuk semua
item yang membangun soal tersebut.
Contoh Penghitungan:

5
Sumarna Surapranata, Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes
Implementasi Kurikulum 2004, (Bandung: PT Remaja Rosdakarya, 2004), hlm 66.

9
Tabel Analisis Item utuk Penghitungan
Validitas Item

Butir Soal/ Item Skor


No Nama 1 2 3 4 5 6 7 8 9 10 Total
1. Elsa 1 1 0 1 1 0 1 1 1 0 7
2. Ika 0 1 0 0 0 1 1 0 1 1 5
3. Ninda 1 0 1 1 1 1 0 1 1 1 8
4. Dira 1 1 0 0 0 0 0 1 1 0 4
5. Toni 1 0 0 1 1 0 1 1 1 0 6
6. Romi 1 1 0 0 1 1 0 0 0 1 5
7. Karin 0 1 1 1 1 1 1 0 0 1 7
8. Lucky 1 1 1 1 0 1 1 0 1 1 8

Misalnya akan dihitung validitas item nomor 7, maka skor item


tersebut disebut variabel X dan skor total disebut variabel Y. Selanjutnya
perhitungan dilakukan dengan menggunakan rumus korelasi product
moment, baik dengan rumus simpangan maupun rumus angka besar.
Contoh perhitungan mencari validitas item:
Untuk menghitung validitas item nomor 7, dibuat terlebih dahulu tabel
persiapannya sebagai berikut:

10
Tabel Persiapan untuk Menghitung
Validitas Item Nomor 7
No. Nama X Y XY X2 Y2
1. Elsa 1 7 7 1 49
2. Ika 1 5 5 1 25
3. Ninda 0 8 0 0 64
4. Dira 0 4 0 0 16
5. Toni 1 6 6 1 36
6. Romi 0 5 0 0 25
7. Karin 1 7 7 1 49
8. Lucky 1 8 8 1 64
Jumlah 5 50 33 5 328

() ()
rxy=
{( 2 ()2 }{ 2 ()}
8 335 50
= (855 2 )(8328502 )

264250
= (40 25)(26242500)

= 1514 124 = 14
1860
14
= 43,12
= 0,3246 = 0,325

d. Tes Terstandar dan Validitas Faktor


1) Tes Terstandar sebagai Kriterium dalam Menentukan Validitas
Tes terstandar adalah tes yang telah dicobakan berkali-kali
sehingga dapat dijamin kebaikannya. Di negara-negara berkembang
biasa tersedia tes semacam ini, dan dikenal dengan nama standardized
test. Sebuah tes terstandar biasanya memiliki identitas antara lain:
sudah dicobakan berapa kali dan dimana, berapa koefisien validitas,
reliabilitas, taraf kesukaran, daya pembeda dan lain-lain keterangan
yang dianggap perlu.

11
Cara menentukan validitas soal yang menggunakan tes terstandar
sebagai kriterium dilakukan dengan mengalikan koefisien validitas
yang diperoleh dengan koefisien validitas tes terstandar tersebut.
2) Validitas Faktor
Selain validitas soal secara keseluruhan dan validitas butir atau
item, masih ada lagi yang perlu diketahui validitasnya, yaitu faktor-
faktor atau bagian keseluruhan materi. Setiap keseluruhan materi
pelajaran terdiri dari pokok-pokok bahasan atau mungkin sekelompok
pokok bahasan yang merupakan satu kesatuan.
Apabila guru ingin mengetahui validitas faktor, maka ada tiga
faktor dalam soal ini. Pengertian validitas faktor adalah butir-butir soal
dalam faktor dikatakan valid apabila mempunyai dukungan yang besar
terhadap soal-soal secara keseluruhan. Sebagai tanda bahwa butir-butir
faktor tersebut mempunyai dukungan yang besar terhadap seluruh soal,
yakni apabila jumlah skor untuk butir-butir faktor tersebut
menunjukkan adanya kesejajaran dengan skor total.

12
2. Menghitung Reliabilitas
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam
bahasa Inggris, berasal dari kata asal reliable yang artinya dapat dipercaya.
Sebuah tes dikatakan dapat dipercaya jika memberikan hasil yang tetap
apabila diteskan berkali-kali. Sebuah tes dikatan reliabel apabila hasil-hasil tes
tersebut menunjukkan ketetapan. Dengan kata lain, jika siswa diberikan tes
yang sama pada waktu yang berlainan, maka setiap siswa akan tetap berada
dalam urutan (ranking) yang sama dalam kelompoknya.
Pengukuran merupakan proses untuk memperoleh skor perorangan
sehingga attribute yang diukur benar-benar menggambarkan kemampuan
mereka. Reliabilitas atau keajegan suatu skor adalah hal yang sangat penting
dalam menentukan apakah tes telah menyajikan pengukuran yang baik. Hal
yang paling penting dalam keajegan atau reliabilitas sekor adalah adanya
pengambilan keputusan tentang peserta tes.6
Beberapa hal yang dapat mempengaruhi hasil tes, dikelompokkan menjadi
3 hal, antara lain:
a. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan
kualitas butir-butir soalnya.
Tes yang terdiri dari banyak butir, tentu saja lebih valid
dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal.
Tinggi rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes.
Dengan demikian maka semakin panjang tes, maka reliabilitasnya semakin
tinggi. Dalam menghitung besarnya reliabilitas berhubung dengan
penambahan banyaknya butir soal dalam tes ini ada sebuah rumus yang
diberikan oleh Spearman dan Brown sehingga terkenal dengan rumus
Spearman Brown.
Rumusnya adalah:

rnn = 1+(1)

6
Sumarna Surapranata, Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes
Implementasi Kurikulum 2004, (Bandung: PT Remaja Rosdakarya, 2004), hlm 86.

13
Keterangan:

rnn = besarnya koefisien reliabilitas sesudah tes tersebut ditambah

butir soal baru.


n = berapa kali butir-butir soal itu ditambah.
r = besarnya koefisien reliabilitas sebelum butir-butir soalnya
ditambah.
Kualitas butir-butir soal ditentukan oleh:
1) Jelas tidaknya rumusan soal.
2) Baik tidaknya pengarahan soal kepada jawaban sehingga tidak
menimbulkan salah jawab.
3) Petunjuknya jelas sehingga mudah dan cepat dikerjakan.
b. Hal yang Berhubungan dengan Tercoba (testee)
Suatu tes yang dicobakan kepada kelompok yang terdiri dari
banyak siswa akan mencerminkan keragaman hasil yang menggambarkn
besar kecilnya reliabilitas tes. Tes yang dicobakan kepada bukan
kelompok terpilih, akan menunjukkan reliabilitas yang lebih besar
daripada yang dicobakan pada kelompok tertentu yang diambil secara
dipilih.
c. Hal yang Berhubungan dengan Penyelenggaraan Tes
Faktor penyelenggaraan tes yang bersifat administratif, sangat
menentukan hasil tes. Contoh:
1) Petunjuk yang diberikan sebelum tes dimulai, akan memberikan
ketenangan kepada para tes-tes dalam mengerjakan tes, dan dalam
penyelenggaraan tidak akan banyak terdapat pertanyaan. Ketenangan
ini tentu saja akan berpengaruh terhadap hasil tes.
2) Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh
siswa terhadap tes. Bagi siswa-siswa tertentu adanya pengawasan yang
terlalu ketat menyebabkan rasa jengkel dan tidak dapat dengan leluasa
mengerjakan tes.

14
3) Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana di
sekelilingnya ramai dan sebagainya) akan mempengaruhi hasil tes.
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara
tidak langsung akan mempengaruhi reliabilitas soal tes. Ada beberapa
cara untuk menghitung reliabilitas yaitu:
a. Metode Bentuk Paralel (equivalent)
Tes parallel adalah dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran dan susunan, tetapi butir-butir soalnya berbeda. Dalam
menggunakan metode test parallel ini pengetes harus menyiapkan dua buah
test, dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh
karena itu ada orang yang menyebutkan sebagai doubletest-double-trial
method.7
b. Metode Test Ulang
Metode test ulang dilakukan orang untuk menghindari penyusunan dua
seri test. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki
satu seri test tetapi dicobakan dua kali oleh karena testnya hanya satu dan
dicobakan dua kali, maka metode ini dapat disebut dengan single test double
trial method. Kemudian hasil dari keduakali test tersebut di hitung
korelasinya.8
Untuk tes yang banyak mengungkap pengetahuan (ingatan) cara ini kurang
mengena karena peserta tes akan masih ingat akan butir-butir soalnya. Oleh
karena itu tenggang waktu antara pemberian tes pertama dan kedua menjadi
permaslahan tersendiri. Jika terlalu, siswa masih banyak mengingat materi.
Sebaliknya jika terlalu lama, maka faktor-faktor atau kondisi tes sudah akan
berbeda, dan siswa sendiri mungkin sudah memperlajari materi
selanjutnya.Tentu saja faktor ini mempengaruhi terhadap reliabilitas tes. Yang
jelas, hasil tes kedua cenderung akan lebih baik dari pada hasil tes pertama.

7
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: Bumi Aksara, 1997), hlm.
87
8
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: Bumi Aksara, 1997), hlm.
88

15
Hal ini mengapa karena peneliti harus sadar akan adanya practice effect dan
carry over effect (masih ingat soalnya).
Contoh:
Siswa Tes Pertama Tes Kedua
Skor Ranking Skor Ranking
Neneng 25 1 27 1
Nelis 19 3 21 3
Desita 17 4 20 4
Yulia 23 2 25 2
Yamti 15 5 19 5

Walaupun nampaknya skornya naik, akan tetapi kenaikannya dialami oleh


semua siswa.
c. Metode Belah Dua atau Split-half method
Kelemahan penggunaan metode dua test dua kali percobaan dan satu test
dua kali percobaan diatasi dengan metode ketiga ini yaitu metode belah dua.
Dalam menggunakan metode ini pengetes hanya menggunakan sebuah test
dan dicobakan satu kali. Oleh karena itu disebut juga single-test-single-trial
method.9
Estimasi reliabilitas belah dua dilakukan dengan membagi item-item
testyang sudah dikenakan pada subjek, menjadi dua bagian sedemikian rupa
sehingga masing-masing belahan relative parallel satu sama lain.10 Ada dua
cara membelah butir soal ini, yaitu : Membelah atas item-item genap dan
ganjil yang selanjutnya disebut belahan ganjil genap. Membelah atas item-
item awal dan akhir yaitu separo jumlah pada nomor awal dan separo pada
nomor akhir yang selanjutnya disebut belahan awal akhir. Untuk mengtahui
reliabilitas seluruh tes harus digunakan rumus Spearman-Brown.

9
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: Bumi Aksara, 1997), hlm.
89.
10
Saifuddin Azwar, Test Prestasi, (Yogyakarta: Liberty, 1987), hlm. 153.

16
Cara menghitung:
Sebagai contoh, diperoleh hasil uji coba tes objektif yang ingin dianalisis
reliabilitasnya sebagai berikut:
Butir Soal
No Nama Skor
1 2 3 4 5 6 7 8 9 10 11 12
1 Neneng 1 1 1 1 0 1 1 1 1 1 1 1 11
2 Nelis 1 1 1 1 1 0 1 1 1 1 1 0 10
3 Desita 1 1 1 1 1 0 1 1 1 1 0 1 10
4 Yulia 1 1 1 1 0 1 1 1 1 0 1 0 9
5 Yamti 1 1 1 0 1 1 0 0 1 1 1 1 9
6 Erni 1 1 0 1 1 0 1 1 0 0 1 1 8
7 Hana 0 1 1 1 0 0 1 1 0 0 0 1 6
8 Mariza 1 0 0 1 0 1 1 1 0 1 0 0 6
9 Arina 1 0 0 0 1 0 1 1 1 0 0 0 5
10 Felita 1 0 0 0 1 0 0 0 0 1 0 0 3
Jmlh 9 7 6 7 6 4 8 8 6 6 5 5 77
Diberikan 2 contoh cara menghitung, yaitu:
1) Pembelahan Ganjil Genap
Dihitung dengan langkah-langkah sebagai berikut:
a) Dikelompokkan jumlah jawaban benar tiap skor yang diperoleh siswa
dengan berdasarkan soal ganjil dan genap. Perhatikan tabel berikut:

17
Keterangan:
X1 = Jumlah jawaban benar nomor ganjil.
X2 = Jumlah jawaban benar nomor genap.
Sebagai contoh siswa 1 jumlah jawaban benar dari soal dengan nomor ganjil =5
(nomor 1, 3, 7, 9, 11), ganjil=6 (nomor 2, 4, 6, 8, 10, 12).
b) Skor yang diperoleh selanjutnya dimasukkan pada rumus Formula Spearman-
Brown, berikut hitungannya:

18
0,42 merupakan koefisien reliabilitas setengah dari bagian tes tersebut.
c) Untuk menghitung koefisien reliabitas semuanya dihitung dengan rumus:

Nilai 0,59 merupakan nilai koefisien reliabilitas, nilai inilah yang


kemudian dikonsultasikan pada kriteria reliabilitas instrumen:

Jadi nilai koefisien reliabilitas 0,59 termasuk pada reliabilitas sedang, artinya
instrumen yang digunakan masih perlu diperbaiki. Pada teknik genap gasal nomor
pertanyaan dikelompokkan menjadi dua kelompok, yaitu kelompok genap dan
kelompok gasal. Selanjutnya kelompok genap dikorelasikan dengan kelompok
gasal dengan menggunakan korelasi Pearson. Selanjutnya r yang diperoleh
dimasukkan ke dalam rumus korelasi genap gasal (r gg).
r gg = 2(r) / (1+r)
r gg = korelasi genap gasal
r = korelasi Pearson

2) Pembelahan Awal-Akhir
Dihitung dengan langkah-langkah sebagai berikut:
a) Dikelompokkan jumlah jawaban benar tiap skor yang diperoleh siswa
dengan berdasarkan jumlah jawaban benar pada nomor awal (no 1-6)
dan separo pada nomor akhir (no 7-12).

19
No No Awal No Akhir
X12 X22 X1 . X2
Subjek X1 X2
1 5 6 25 36 30
2 5 5 25 25 25
3 5 5 25 25 25
4 5 4 25 16 20
5 5 4 25 16 20
6 4 4 16 16 16
7 3 3 9 9 9
8 3 3 9 9 9
9 2 3 4 9 6
10 2 1 4 1 2
Jmlh 39 38 167 162 161

Keterangan:
X1 = Jumlah jawaban benar nomor awal
X2 = Jumlah jawaban benar nomor akhir
Sebagai contoh siswa 1 jumlah jawaban benar dari soal dengan nomor
awal =5 (nomor 1,2,3,4,6), ganjil=6 (nomor 7,8,9,10,11,12).
b) Skor yang diperoleh selanjutnya dimasukkan pada rumus Formula
Spearman-Brown, berikut hitungannya:

= 10 (162) (39) (38)


((10)(167) (39)2 )((10)(162) (38)2 )

20
= 138
(149) (176)

= 138

26. 224

= 138

161, 94

= 0, 85

0,85 merupakan koefisien reliabilitas setengah dari bagian tes tersebut.


c) Untuk menghitung koefisien reliabitas semuanya dihitung dengan rumus:

= 2 (0, 85)
1 + (0, 85)
= 1, 7 = 0, 92

1, 85

Nilai 0,92 merupakan nilai koefisien reliabilitas, nilai inilah yang


kemudian dikonsultasikan pada kriteria reliabilitas instrumen:

Jadi nilai koefisien reliabilitas 0,92 termasuk pada reliabilitas tinggi.

21
d. Penggunaan Rumus Rulon
Dalam sebuah penelitian yang terdiri dari 10 orang sampel didapatkan hasil
belajar seperti berikut :

Langkah-langkah menghitung:
a) Dari data tersebut kita cari nilai Np, p, q, dan pq serta kuadrat dari jumlah
total. Sehingga akan terlihat seperti dibawah ini :

p 0,6 1 0,6 0,6 1 0,7 0,3 0 0,8 0,8 0,6 0,7 0,5 0,6 0,7
q 0,4 0 0,4 0,4 0 0,3 0,7 1 0,2 0,2 0,4 0,3 0,5 0,4 0,3
Pq 0,24 0 0,24 0,24 0 0,21 0,21 0 0,16 0,16 0,24 0,21 0,25 0,24 0,21 2,61

22
b) Langkah selanjutnya adalah mengitung Standar deviasi.

c) Langkah terakhir adalah memasukkan nilai tersebut kedalam rumus KR-20 sekaligus
mendapatkan nilai reliabilitas tes.

= 15 X 6,25 2,61

14 6,25

= 1,1 X 0, 58

= 0, 638

Dari perhitungan diatas didapat nilai reliabilitas tes tersebut adalah 0,6836.
Apabila kita lihat didalam kriteria reliabilitas maka terletak diantara 0,600 - 0,800
yang berarti memiliki kriteria tinggi.
e. Metode Alpha Cronbach
Untuk soal yang berbentuk uraian atau angket, sobat dapat menggunakan
rumus alpha cronbach. Hal ini dikarenakan dalam bentuk soal uraian dan
angket termasuk kedalam penilaian subjektif. Suatu butir soal uraian
menghendaki gradualisasi penilaian. Barangkali butir soal nomer 1 penilaian

23
terendah 0 tertinggi 8, tetapi butir soal nomer 2 nilai tertingginya hanya 5 dan
seterusnya.
Contoh data :

Langkah menghitung:
a) Mencari Nilai Jumlah Varians Butir (b2) dengan mencari dulu varian setiap
butir, kemudian di jumlahkan.

24
b) Mencari Nilai Varians Total

c) Masukkan ke rumus Alpha

25
PENUTUP

A. KESIMPULAN
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas
yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau
memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran
tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan
data yang tidak relevan dengan tujuan pengukuran.
Sebuah tes dikatakan dapat dipercaya jika memberikan hasil yang tetap
apabila diteskan berkali-kali. Sebuah tes dikatan reliabel apabila hasil-hasil tes
tersebut menunjukkan ketetapan. Dengan kata lain, jika siswa diberikan tes
yang sama pada waktu yang berlainan, maka setiap siswa akan tetap berada
dalam urutan (ranking) yang sama dalam kelompoknya. Ada beberapa cara
untuk menghitung reliabilitas suatu tes.

B. SARAN
Demikian makalah ini kami sampaikan, kami sadar makalah ini jauh dari
kata sempurna. Namun kami sudah berusaha semaksimal mungkin supaya
makalah ini dapat terselesaikan dengan baik dan benar. Maka dari itu kritik
dan saran yang membangun sangat kami harapkan. Semoga makalah ini
bermanfaat bagi kita dan menambah pengetahuan. Amin

26
DAFTAR PUSTAKA

Arikunto, Suharsimi. 1997. Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi


Aksara.
Azwar, Saifuddin. 1987. Test Prestasi. Yogyakarta: Liberty.
Surapranata, Sumarna. 2004. Analisis, Validitas, Reliabilitas, dan Interpretasi
Hasil Tes Implementasi Kurikulum 2004. Bandung : PT Remaja Rosdakarya.

27

Anda mungkin juga menyukai