Anda di halaman 1dari 14

Faktor-Faktor yang Mempengaruhi Reliabilitas Tes 341

Faktor-Faktor yang Mempengaruhi Reliabilitas Tes

Adhi Setiyawan
Fakultas Ilmu Tarbiyah dan Keguruan
UIN Sunan Kalijaga Yogyakarta
Email: adhi.setiyawan@mail.uin-suka.ac.id

Abstrak
Sebuah tes mengandung skor-skor untuk mengukur kemampuan siswa. Pengukuran
merupakan kegiatan untuk menghasilkan skor-skor yang mampu mengukur kemampuan
siswa dan menggambarkan karakteristik masing-masing siswa. Reliabilitas dalam tes sangat
penting menentukan kualitas tes. Penelitian ini bertujuan menjelaskan faktor-faktor yang
mempengaruhi pada reliabilitas tes. Metode yang digunakan dalam penelitian ini adalah
studi pustaka. Hasil dari penelitian ini menunjukkan faktor-faktor yang mempengaruhi
reliabilitas tes adalah jumlah butir tes (panjang tes), variabilitas kelompok, objektivitas
penskoran, metode untuk mengestimasi reliabilitas, level kelompok dan tingkat kesulitan
tes, dan homogenitas tes.
Kata Kunci: Faktor, Reliabilitas Tes

Abstract
In achievement test, obtained scores are expected to be able to measure the actual
ability of the students. Measurement is a process to obtain a score so that measured
attributes of students really describe the characteristics of the person. Reliabillity of the test
is very important in determining the quality of a good test. This research aims to describe the
factors that affect reliability of the test. The method used in this research is library research.
Results of research shows the factors that affect the reliability of a test are the number of
test items (length test), variability of the group, scoring objectivity, method or operations used
for estimating reliability, group level and difficulty level of the test, and homogeneity tests.
Keywords: Factors, Test Reliability

A. Pendahuluan
Penilaian hasil belajar dilakukan untuk mengukur tingkat pencapaian
kompetensi peserta didik, bahan penyusunan laporan kemajuan hasil
belajar, dan memperbaiki proses pembelajaran oleh guru. Penilaian
342 Jurnal An Nûr, Vol. VI No. 2 Desember 2014

dilakukan secara konsisten, sistematik, dan terprogram dengan


menggunakan tes dan nontes dalam bentuk tertulis atau lisan, pengamatan
kinerja, pengukuran sikap, penilaian hasil karya berupa tugas, proyek dan/
atau produk, portofolio, dan penilaian diri. Penilaian hasil pembelajaran
menggunakan Standar Penilaian Pendidikan dan Panduan Penilaian
Kelompok Mata Pelajaran.1
Dalam pelaksanaannya di kelas ternyata tes hasil belajar sering
memperoleh pengukuran yang tidak ajeg atau tidak konsisten. Ketika guru
melakukan pengukuran lebih dari satu kali, pasti ditemukan perbedaan.
Misalnya pada kasus seseorang yang mengambil tes intelegensi memperoleh
skor 100 pada tes pertama dan memperoleh skor 115 pada tes kedua. Begitu
juga pada tes hasil belajar, seorang siswa mungkin memperoleh skor 5,5 pada
ujian akhir sekolah sehingga ia dinyatakan harus menempuh ujian ulang.
Pada ujian ulang ternyata ia memperoleh skor 6,5 dan dinyatakan lulus.
Berdasarkan beberapa kasus tersebut, terlihat bahwa hasil pengukuran
dalam ilmu sosial (pendidikan) menunjukkan sesuatu yang tidak ajeg.
Metode untuk mempelajari, mengidentifikasi, dan mengestimasi keajegan
skor tes merupakan fokus dari pengkajian reliabilitas.
Dalam tes hasil belajar, skor yang diperoleh diharapkan mampu
mengukur kemampuan yang sebenarnya. Pengukuran adalah proses
memperoleh skor sehingga atribut seseorang yang diukur benar-benar
menggambarkan ciri dari orang tersebut. Reliabillitas tes merupakan
hal yang sangat penting untuk menentukan kualitas tes. Apabila siswa
memperoleh skor yang tidak ajeg pada beberapa kali ujian, padahal tes
yang diberikan sama, maka keputusan akhir mengenai lulus atau tidaknya
juga akan berbeda. Maka dari itu, dalam menyusun tes hasil belajar perlu
dilihat seberapa besar nilai koefisien reliabilitas dari tes yang akan dipakai.
Apabila hasil skor tes pertama sama dengan hasil skor tes kedua, maka
tes dikatakan memiliki reliabilitas yang tinggi atau terdapat korelasi yang
tinggi antara hasil tes pertama dengan hasil tes kedua. Apabila antara

1
Peraturan Menteri Pendidikan Nasional Republik Indonesia Nomor 41 Tahun 2007
Tentang Standar Proses Bab IV Penilaian Hasil Pembelajaran, Hal 18
Faktor-Faktor yang Mempengaruhi Reliabilitas Tes 343

hasil tes pertama dan kedua tidak terdapat hubungan atau hubungannya
rendah, maka tes itu dikatakan tidak reliabel. Berangkat dari permasalahan
tesebut, melalui penelitian ini penulis ingin menelaah tentang faktor apa
sajakah yang dapat mempengaruhi reliabilitas. Berdasarkan latar belakang
masalah tersebut, maka pokok permasalahan penelitian ini adalah faktor
apa saja yang mempengaruhi reliabilitas suatu tes.

B. Pengertian Tes
Tes adalah sehimpunan pertanyaan yang harus dijawab, atau
pertanyaan-pertanyaan yang harus dipilih, ditanggapi, atau tugas-
tugas yang harus dilakukan oleh orang yang dites (testee) dengan tujuan
untuk mengukur suatu aspek (perilaku/atribut) tertentu dari orang yang
dites tersebut.2 Melalui tes, guru dapat memperoleh informasi tentang
berhasil tidaknya peserta didik dalam menguasai tujuan-tujuan (standar
kompetensi, kompetensi dasar, dan indikator) yang telah ditetapkan dalam
kurikulum. Guru dapat dengan mudah mendeteksi peserta didik yang
sudah menguasai dan yang belum menguasai melalui tes. Begitu pula guru
dapat mendeteksi berhasil tidaknya pembelajaran yang telah dilakukan
melalui tes. Hasil tes dapat digunakan untuk memberikan laporan kepada
pihak tertentu tentang perkembangan kemampuan belajar peserta didik
maupun tentang keberhasilan guru mengajar.
Tes merupakan salah satu cara untuk menaksir besarnya tingkat
kemampuan manusia secara tidak langsung, yaitu melalui respons seseorang
terhadap sejumlah stimulus atau pertanyaan.3 Tes biasanya digunakan
untuk mengukur aspek-aspek perilaku manusia, seperti aspek pengetahuan
(kognitif), sikap (afektif), maupun keterampilan (psikomotor). Hal yang
hendak diukur adalah tingkat penguasaan peserta didik terhadap bahan
pelajaran yang telah diajarkan.

2
Sumarna Surapranata. Panduan Penulisan Tes Tertulis, (Bandung: Remaja Rosdakarya,
2005), hal 19.
3
Djemari Mardapi. Teknik Penyusunan Instrumen Tes dan Nontes. (Mitra Cendekia:
Yogyakarta, 2008), hal 67
344 Jurnal An Nûr, Vol. VI No. 2 Desember 2014

Tujuan tes adalah untuk mengetahui tingkat kemampuan peserta


didik, mengukur pertumbuhan dan perkembangan peserta didik,
mendiagnosis kesulitan belajar peserta didik, mengetahui hasil pengajaran,
mengetahui hasil belajar, dan mendorong pendidik mengajar lebih baik
dan peserta didik belajar lebih baik.4 Tujuan-tujuan tes ini menjadi dasar
pengembangan tes. Tes yang ditujukan untuk suatu tujuan tertentu harus
mengarah pada tujuan tersebut.
Sesuai dengan tujuan-tujuan tadi, terdapat beberapa fungsi utama
dari tes, yaitu5, 1) Fungsi penempatan adalah penggunaan hasil tes untuk
mengklasifikasikan individu ke dalam bidang atau jurusan yang sesuai
dengan kemampuan yang telah diperlihatkan pada hasil belajar yang telah
lalu. 2) Fungsi formatif adalah penggunaan tes guna melihat sejauh mana
kemajuan belajar yang telah dicapai oleh siswa dalam program pembelajaran.
Dalam hal ini tes merupakan umpan balik (feed back) kemajuan belajar dan
karena itu biasanya tes diselenggarakan di tengah program pembelajaran
yang sedang berjalan. 3) Fungsi diagnostik dilakukan oleh tes apabila
hasil tes yang bersangkutan digunakan untuk mendiagnosis kesukaran-
kesukaran yang bersangkutan dalam belajar, medeteksi kelemahan-
kelemahan siswa yang dapat diperbaiki segera, dan semacamnya. 4) Fungsi
sumatif adalah penggunaan tes untuk memperoleh informasi mengenai
penguasaan pelajaran yang telah drencanakan sebelumnya dalam suatu
program pelajaran. Tes sumatif merupakan pengukuran akhir dalam suatu
program pelajaran dan hasilnya dipakai untuk menentukanapakah siswa
dapat dinyatakan lulus dalam program pendidikan tersebut, atau apakah
siswa dinyatakan dapat melanjutkan ke jenjang program yang lebih tinggi.
Setidak-tidaknya ada empat ciri yang harus dimiliki oleh tes hasil
belajar yang baik, yaitu (1) valid (2) reliabel (3) obyektif (4) praktis.6 Jika tes
memiliki keempat karakteristik tersebut, maka dapat dipastikan tes hasil
belajar itu adalah tes hasil belajar yang baik.

4
Ibid., hal 68.
5
Saifuddin Azwar. Tes Prestasi: Fungsi dan Pengembangan Pengukuran Prestasi Belajar.
Pustaka Pelajar: Yogyakarta, 2011), hal 11
6
Anas Sudijono, Pengantar Evaluasi Pendidikan (Jakarta: Rajawali Press, 2006), hal 93.
Faktor-Faktor yang Mempengaruhi Reliabilitas Tes 345

Ciri pertama adalah valid atau memiliki validitas. Sebuah tes


dikatakan telah memiliki validitas apabila tes tersebut dengan secara tepat,
secara benar, secara sahih atau secara absah telah dapat mengungkap atau
mengukur apa yang seharusnya diungkap atau diukur melalui tes itu.
Ciri kedua adalah reliabel atau memiliki reliabilitas. Suatu tes dikatakan
telah memiliki reliabilitas apabila skor-skor yang diperoleh para peserta
penempuh tes untuk pekerjaan tesnya adalah stabil, kapan saja, dimana
saja, dan oleh siapa saja tes itu diuji, diperiksa, dan dinilai. Tingkat
reliabilitas ini dapat dilihat melalui seberapa besar koefisien reliabilitas
yang diperoleh tes itu. Ciri ketiga adalah obyektif. Suatu tes dikatakan
bersifat obyektif jika tes tersebut disusun dan dilaksanakan menurut apa
adanya. Mulai dari penyusunannya, (seperti isi atau materi tesnya), sampai
pada proses pemberian skor dan penentuan nilainya. Ciri keempat adalah
praktis. Suatu tes bersifat praktis jika tes hasil belajar itu dapat dilaksanakan
dengan mudah, karena tes itu: (a) sederhana, dalam arti tidak memerlukan
peralatan yang banyak atau sulit pengadaannya; (b) lengkap, dalam arti tes
tersebut telah dilengkapi dengan petunjuk pengerjaannya, kunci jawaban,
dan pedoman penyekorannya.

C. Faktor-Faktor yang Mempengaruhi Reliabilitas Tes Hasil Belajar


Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang
dapat dipercaya (tahan uji). Sebuah tes dikatakan mempunyai reliabilitas
yang tinggi jika tes tersebut memberikan data hasil yang ajeg (tetap)
walaupun diberikan pada waktu yang berbeda kepada responden yang
sama. Reliabilitas merupakan salah satu kriteria yang harus dipenuhi
oleh instrumen pengukuran sebelum digunakan untuk mengumpulkan
data. Reliabilitas mengacu pada ketetapan atau kekonsistenan alat ukur,
meskipun digunakan berulang kali pada subjek yang sama. Hal ini
bukanlah berarti bahwa untuk mendapatkan alat ukur yang reliabel harus
selalu melalui pengulangan penggunaan alat ukur tersebut pada subjek
yang sama,
346 Jurnal An Nûr, Vol. VI No. 2 Desember 2014

Tujuan utama mengestimasi reliabilitas adalah untuk menentukan


seberapa besar variabilitas yang terjadi akibat adanya kesalahan pengukuran
dan seberapa besar variabilitas skor tes sebenarnya. Banyak prosedur yang
dapat ditempuh untuk mengetahui indek koefisien reliabilitas suatu
instrumen pengukuran. Ada banyak faktor yang mempengaruhi reliabilitas
suatu instrumen.
Menurut teori klasik, reliabilitas dihubungkan dengan pengertian
adanya ketepatan suatu tes dalam pengukuran. Reliabilitas adalah kestabilan
skor yang diperoleh orang yang sama ketika diuji ulang dengan tes yang
sama pada situasi yang berbeda atau dari satu pengukuran ke pengukuran
lainnya. jadi reliabilitas dapat dinyatakan sebagai tingkat keajegan atau
kemantapan hasil dari hasil dua pengukuran terhadap hal yang sama. Hasil
pengukuran itu diharapkan akan sama apabila pengukuran itu diulangi.7
Tinggi rendahnya koefisien reliabiitas dipengaruhi oleh beberapa
faktor. Beberapa pakar menyebutkan faktor-faktor yang mempengaruhi
reliabilitas tes secara berbeda. Menurut Robert M Thorndike dalam
bukunya berjudul Measurement and Evaluation in Psychology and
Education Seventh Edition, faktor yang mempengaruhi reliabilitas adalah:
..” Variability of the group on the trait the test measures; Level of the group on
the trait the test measures; Length of the test, Operations used for estimating the
reliability.” 8 1) Variabilitas kelompok yang diberikan tes (Variability of the
group on the trait the test measures); 2) Level kelompok yang diberikan tes
(Level of the group on the trait the test measures); Panjang tes (Length of the
test); Teknik atau rumus yang digunakan untuk menghitung reliabilitas
(Operations used for estimating the reliability).
Sedangkan menurut Gilbert Sax, beberapa kondisi yang mempengaruhi
koefisien reliabilitas, 9 yaitu: …” Objectivity in scoring: Scorer Reliability; The

7 Sumarna Surapranata, (Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes.


Bandung: Remaja Rosdakarya, 2006), hal 89.
8
Robert M Thorndike, Measurement and Evaluation in Psychology and Education Seventh
Edition (New Jersey: Prentice Hall, Inc., 2005), hal 125-130.
9
Gilbert Sax, Principles of Educational and Psychological Measurement and Evaluation (2nd
ed) (San Fransisco: Phoenix Publishing Services, Inc., 1980), hal 267-272.
Faktor-Faktor yang Mempengaruhi Reliabilitas Tes 347

variability of the group tested; The number of items on the testThe difficulty
level of the test). Objektifitas penskoran: Reliabilitas pemberi skor (Objectivity
in scoring: Scorer Reliability); Variabilitas kelompok yang dites (The variability
of the group tested); Jumlah item pada tes (The number of items on the
test); dan Tingkat kesulitan tes (The difficulty level of the test).
Menurut Ebel10, koefisien reliabilitas akan bertambah besar untuk
skor: …from a longer test than from a shorter test, from a test composed of more
homogeneous items than from a more heterogeneous test, from a test composed of
more discriminating item than from a test composed of less discriminating items,
from a test whose items are of middle difficulty than from a test composed mainly of
quite difficult or quite easy items, from a group having a wide range of ability than
from a group more homogeneous in ability, from a speeded test than from one all
examinees can complete in the time available.
a. dari tes yang lebih panjang daripada tes yang lebih pendek (from a
longer test than from a shorter test)
b. dari tes yang tersusun dari item yang lebih homogen daripada tes yang
lebih heterogen (from a test composed of more homogeneous items
than from a more heterogeneous test)
c. dari tes yang memiliki daya pembeda lebih tinggi daripada yang
mempunyai daya pembeda lebih rendah (from a test composed of more
discriminating item than from a test composed of less discriminating
items)
d. dari tes yang tingkat kesulitannya sedang daripada tes yang terlalu sulit
atau terlalu mudah (from a test whose items are of middle difficulty
than from a test composed mainly of quite difficult or quite easy items)
e. dari kelompok yang mempunyai jarak kemampuan yang lebar daripada
yang berkemampuan homogen (from a group having a wide range of
ability than from a group more homogeneous in ability)

10
Robert L. Ebel, Essentials of Educational Measurement (3rd ed), (New Jersey: Prentice
Hall, Inc., 1979), hal 288.
348 Jurnal An Nûr, Vol. VI No. 2 Desember 2014

f. tes yang membutuhkan waktu terbatas daripada waktu yang lebih


longgar (from a speeded test than from one all examinees can complete
in the time available)
Menurut Crocker dan Algina (1986), dikutip dari Sumarna,
menyebutkan bahwa faktor yang mempengaruhi reliabilitas tes antara lain
panjang suatu tes, kecepatan, homogenitas belahan, dan tingkat kesukaran
soal. Menurut Alen dan Yen (1979) dan Crocker dan Algina (1986) tingkat
kesukaran itu memegang peranan yang paling dominan. Hasil penelitian
Aiken et. al, dikutip dari Sumarna, menunjukkan bahwa pengaruh tingkat
kesukaran memegang peranan yang paling besar pada koefisien reliabilitas.
Hal ini disebabkan karena menyangkut variasi jumlah soal yang dapat
dijawab benar. Semakin sukar soal-soal dalam perangkat tes akan semakin
besar pula variasi skor yang diperoleh belahan.11 Dengan demikian maka
akan semakin besar pula reliabilitas tes tersebut. Sebaliknya, semakin
rendah tingkat kesukaran suatu soal semakin kecil pula reliabilitasnya.
Untuk itu harus dihindari banyaknya terkaan yang dilakukan peserta tes dan
diusahakan menyesuaikan pengetahuan peserta tes dengan materi tes yang
akan diujikan kepada mereka. Penambahan panjang tes akan menaikkan
koefisien reliabilitas sepanjang soal yang digunakan untuk menambah tes
itu memiliki kualitas yang sama baik dengan soal-soal lainnya.
Tes yang terdiri atas soal-soal yang banyak akan lebih reliabel
dibandingkan dengan tes yang terdiri atas soal yang sedikit. Sebagai contoh
kita ambil dalam tes bahasa arab yang terdiri atas 40 soal dengan indeks
reliabilitas 0,70. kemudian soal ditambah 20 butir sehingga berjumlah 60.
Tes dengan 40 soal ini akan memiliki reliabilitas yang berbeda dengan tes
yang terdiri atas 60 soal. Cara menentukan reliabilitas dengan jumlah soal
yang berbeda dapat menggunakan persamaan Spearman-Brown sebagai
berikut:

11
Sumarna Surapranata, (Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes.
Bandung: Remaja Rosdakarya, 2006), hal 92.
rn = indeks reliabilitas setelah ditambahkan soal
n = perkalian penambahan awal
r = indeks reliabilitas awal

Penambahan 20 soal pada 40 soal, maka panjang tes sekarang menjadi


60 soal. Panjang tes sekarang adalah 1.5 tes awal. Dengan menggunakan
rumus di atas maka:

Penambahan 20 butir soal pada tes awal yang memiliki indeks


reliabilitas 0.60 mengakibatkan kenaikan indeks reliabilitas sebesar 0,78.
Maksud dari perubahan panjang tes adalah perubahan pada jumlah
item tes. Perubahan panjang tes bukan hanya mengubah mean atau rata-
rata dan varians skor tes, tetapi juga mempengaruhi pula reliabilitasnya,
seperti pada contoh sebelumnya. Maksud perubahan terhadap reliabilitas
hanya dapat diprediksikan apabila item-item yang ditambahkan pada atau
dihilangkan dari tes merupakan item atau kumpulan item yang setara
dengan lainnya. Para ahli psikometri sepakat bahwa tidak selamanya
penambahan panjang tes akan mengakibatkan penambahan indeks
reliabilitas. Ada batas-batas kejenuhan yang mengakibatkan indeks
reliabilitas tidak berubah.
Berdasarkan paparan di atas, dapat kita identifikasi hal apa saja yang
mempengaruhi reliabilitas tes hasil belajar, yaitu:
1. Jumlah butir tes (panjang tes)
Umumnya semakin besar jumlah butir soal tes samakin tinggi pula
reliabilitasnya. Hal ini terjadi karena semakin panjang tes (semakin banyak
butir soal) sehingga semakin banyak perilaku yang terukur dengan lebih
tepat. Kenaikan reliabilitas sebagai fungsi dari panjang tes dijelaskan oleh
formula Spearman-Brown, yaitu:

rn = indeks reliabilitas setelah ditambahkan soal


n = perkalian penambahan awal
r = indeks reliabilitas awal
Apabila tes memiliki banyak butir, maka reliabilitasnya dapat
meningkat, asal penambahan butir tersebut mengacu pada pendiskripsian
yang jelas terhadap variabel yang diukur. Jadi, dalam menyiapkan suatu tes
perlu dipertimbangkan jumlah butirnya. Walaupun ditemukan semakin
banyak butir berarti semakin tinggi reliabilitas, bukanlah berarti bahwa
perlu disiapkan butir tes sebanyak-banyaknya, tetapi tetap berada pada
batas dimensi dan indikator dari variabel yang diukur.

2. Variabilitas kelompok atau heregonitas kelompok


Faktor lain yang berpengaruh terhadap reliabilitas instrument adalah
heterogenitas kelompok. Heterogenitas kelompok diperlihatkan oleh besar
kecilnya varians distribusi skor subjek pada variabel yang diungkap oleh tes
yang bersangkutan. Bila tes yang bersangkutan mengungkap kemampuan
bahasa arab maka heterogenitas kelompok diperlihatkan oleh besarnya
variasi skor kemampuan berbahasa arab di antara siswa yang dites. Hal ini
juga sesuai dengan rumus reliabilitas, yaitu:
Koefisien reliabilitas menunjukkan sejauhmana sebuah tes secara
konsisten menempatkan siswa di tengah-tengah kelompoknya. Koefisien
reliabilitas secara langsung dipengaruhi oleh penyebaran skor dalam
kelompok yang diukur. Semakin besar penyebaran skor (artinya semakin
kelompok bervariasi) maka semakin besar pula indeks reliabilitas yang
diperoleh. Akan semakin sulit untuk mengukur perbedaan kemampuan
siswa dalam kelompok yang homogen daripada dalam kelompok yang
heterogen.
Variabilitas kelompok ini berimplikasi pada penyebaran skor.
Koefisien reliabilitas secara langsung dipengaruhi oleh penyebaran skor
dalam kelompok yang diukur. Hal-hal lain menjadi sama, semakin besar
penyebaran skor maka semakin besar pula indeks reliabilitas yang diperoleh.

3. Objektivitas penskoran
Reliabilitas pemberi skor merujuk kepada keberadaan observer
yang berbeda atau kesepakatan pemberi nilai yang mereka berikan pada
instrument yang sama. Semakin tinggi kesepakatan, maka reliabilitas
pemberi skor akan semakin tinggi juga. Begitu juga sebaliknya. Sebagian
besar tes bakat dan tes prestasi standar mempunyai objektivitas yang tinggi.
Butir-butir skor tes objektif seperti pilihan ganda dan skor yang dihasilkan
tidak dipengaruhi oleh keputusan dan pendapat pemberi skor. Semakin
tinggi tingkat objektivitas tes semakin tinggi pula tingkat reliabilitasnya.

4. Metode estimasi reliabilitas


Saat menguji koefisien reliabilitas tes standar, memutuskan metode
yang digunakan untuk menentukan besarnya koefisien reliabilitas
352 Jurnal An Nûr, Vol. VI No. 2 Desember 2014

merupakan hal yang penting. Secara umum, besarnya koefisien reliabilitas


berkaitan erat dengan metode yang digunakan untuk estimasi reliabilitas.
Berikut ini beberapa tes untuk menentukan koefisien reliabilitas:
a. Metode tes ulang (Test Retest Method): mungkin hasilnya lebih besar
dibandingkan dengan metode belah dua jika interval waktunya
pendek. Koefisien reliabilitas yang dihasilkan menjadi lebih kecil jika
interval waktu tesnya ditingkatkan.
b. Tes sejajar (Equivalent Test) tanpa waktu interval: Koefisien reliabilitas
cenderung lebih rendah dibandingkan dengan metode belah dua atau
tes ulang yang menggunakan interval waktu singkat.
c. Tes Sejajar dengan interval waktu: koefisien menjadi lebih kecil seiring
dengan peningkatan interval waktu tes.
d. Metode belah dua (Split-half Method): Metode ini menyediakan sebuah
indikasi konsistensi internal tes.
Guru dapat menggunakan salah satu teknik analisis untuk estimasi
reliabiltas, yang perlu ditekankan adalah penggunaan teknik tertentu
memerlukan data pada kategori interval atau nominal.

5. Level kelompok dan tingkat kesulitan tes


Selain variabilitas dalam kelompok, level kelompok juga mungkin
dapat berpengaruh dalam koefisien reliabilitas. Presisi pengukuran dari
sebuah tes bisa berhubungan dengan level kemampuan dari orang yang
diukur; bagaimanapun juga, tidak ada aturan yang dapat memformulasikan
keadaan hubungan ini. Sifat hubungan ini bergantung pada bagaimana
cara tes itu disusun. Untuk mereka yang merasa bahwa tes terlalu sulit,
sepertinya mereka akan sering menebak, akurasinya akan menjadi rendah.
Pada keadaan lain, jika tes terlalu mudah untuk kelompok itu, seperti
mereka pasti bisa menjawab kebanyakan item dengan benar, tes tersebut
bisa menjadi tidak efektif dalam membedakan dalam anggota kelompok.
Hal ini ekuivalen dengan tingkat kesulitan tes. Tes yang sangat mudah atau
sangat sulit tidak dapat mengukur perbedaan individu.
6. Homogenitas tes
Homogenitas tes juga berpengaruh pada reliabilitas. Seratus item tes
sejarah kelas X akan menjadi lebih reliabel daripada 100 item tes yang
mengukur tes sejarah pada tingkat SMA. Begitu juga pada mata pelajaran
lainnya, seperti matematika atau bahasa arab, yang lebih membutuhkan
pengorganisasian yang lebih padat, dengan ketergantungan yang erat pada
bukti-bukti, aturan-aturan, kemampuan, dan hasil, daripada seperti pada
mata pelajaran sejarah. Ini adalah aspek lain dari homogenitas tes yang
membuat reliabilitas tes yang tinggi menjadi lebih mudah dicapai pada tes
matematika dan bahasa asing dibandingkan pada tes hasil belajar materi
pendidikan lainnya.

D. Simpulan
Penyusunan tes hasil belajar merupakan hal yang urgen dalam
proses pembelajaran. Maka dari itu, tes yang disusun harus mempunyai
kualitas yang baik, diantaranya adalah tes bersifat reliabel atau memiliki
reliabilitas. Agar tes bersifat reliabel kita perlu tahu faktor apa sajakah
yang mempengaruhi reliabilitas tes. Berdasarkan uraian sebelumnya, dapat
disimpulkan bahwa faktor-faktor yang mempengaruhi reliabilitas suatu tes
adalah jumlah butir tes (panjang tes), variabilitas kelompok, objektivitas
penskoran, metode untuk mengestimasi reliabilitas, level kelompok dan
tingkat kesulitan tes, dan homogenitas tes. Jika guru memperhatikan hal-
hal tersebut diharapkan tes hasil belajar memiliki kualitas yang baik.

Daftar Pustaka
Allen, Mary J. and Yen, Wendy M. Introduction to measurement theory.
Monterey, California: Cole Publishing Company. 1979.
Azwar, Saifuddin. Dasar-Dasar Psikometri. Yogyakarta: Pustaka Pelajar. 2011.
354 Jurnal An Nûr, Vol. VI No. 2 Desember 2014

Azwar, Saifuddin. Tes Prestasi: Fungsi dan Pengembangan Pengukuran Prestasi


Belajar. Pustaka Pelajar : Yogyakarta. 2011.
Ebel. Robert L. Essentials of Educational Measurement (3rd ed). New Jersey:
Prentice Hall, Inc. 1979.
Mardalis. Metode Penelitian Suatu Pendekatan Proposal. Jakarta: Bumi Aksara.
1990.
Mardapi, Djemari. Teknik penyusunan instrumen tes dan nontes. Mitra
Cendekia : Yogyakarta. 2008.
Peraturan Menteri Pendidikan Nasional Republik Indonesia Nomor 41
Tahun 2007 Tentang Standar Proses.
Sax, Gilbert. Principles of Educational and Psychological Measurement and
Evaluation (2nd ed). San Fransisco: Phoenix Publishing Services, Inc.
1980.
Sudijono, Anas. Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press.
2006.
Surapranata, Sumarna. Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil
Tes. Bandung: Remaja Rosdakarya. 2006.
Surapranata, Sumarna. Panduan Penulisan Tes Tertulis. Bandung: Remaja
Rosdakarya. 2005.
Thorndike, Robert M. Measurement and Evaluation in Psychology and
Education Seventh Edition. New Jersey: Prentice Hall, Inc. 2005.

Anda mungkin juga menyukai