Anda di halaman 1dari 28

RELIABILITAS

I. Definisi
Reliabilitas
Reliabilitas
 Artinya pengukuran yang dapat diandalkan akan mengukur
secara konsisten.
Reliabilitas menjelaskan sejauh mana pengukuran dapat
diandalkan untuk memberikan informasi yang konsisten dan tidak
ambigu. Pengukuran dapat diandalkan jika mereka mencerminkan
aspek "benar" dan bukan kebetulan.

• Dalam penelitian, reliabilitas adalah sejauh mana pengukuran


dari suatu tes tetap konsisten setelah dilakukan berulang-ulang
terhadap subjek dan dalam kondisi yang sama.
II. Obtained,
True, and
Error Score
Obtained, True, and Error Score

 Obtained atau raw score adalah jumlah poin yang diterima


seseorang pada suatu tes. Tes yang disusun dengan kurang
baik atau mungkin siswa yang kurang sungguh-sungguh dalam
mengerjakan tes juga bisa mempengaruhi nilai dari tes ini.
Obtained, True, and Error Score

 True Score, kadang-kadang juga disebut score Universal,


adalah nilai hipotetis yang paling mewakili pengetahuan atau
kemampuan yang sebenarnya dari siswa.
Hubungan Obtained, True, and Error Score
Error score atau skor kesalahan adalah perbedaan antara true score dan obtined score
(skor yang diperoleh).
Skor yang diperoleh sama dengan skor sebenarnya ditambah kesalahan pengukuran.
Hubungan ini dapat dilambangkan dengan:

Skor yang diperoleh = Skor benar + skor kesalahan.

Perbedaan antara skor yang diperoleh dan nilai sebenarnya disebut kesalahan
pengukuran atau skor kesalahan. Semakin besar perbedaannya antara skor yang
diperoleh dan true score yang sesuai, semakin besar jumlah kesalahan.
III. Metode Untuk
Meningkatkan
Dan Mengurangi
Kesalahan
Reliabilitas
Metode yang Digunakan Untuk
Meningkatkan Reliabilitas
a. Kembangkan item yang mengukur sifat atau kemampuan yang sama pada setiap tes yang
dibangun.
b. Pastikan bahwa pencetak skor memiliki instruksi yang jelas dan tidak ambigu.
c. Tingkatkan jumlah item pada tes karena varians benar meningkat lebih cepat daripada varians
kesalahan ketika tes meningkat panjangnya. Rumus Spearman-Brown digunakan untuk
memperkirakan keandalan dari serangkaian pengukuran ketika jumlah item meningkat atau
menurun.
d. Jaga agar tingkat kesulitan tetap moderat untuk semua item yang diuji.
Metode yang Digunakan Untuk
Mengurangi Kesalahan Reliabilitas

 Menurut (APA 1974):

1. korelasi antara skor pada tes yang sama diambil dua kali(stabilitas)
2. korelasi antara skor pada dua atau lebih bentuk dari tes yang sama diambil
secara bersamaan, (kesetaraan)
3. korelasi antara skor pada dua atau lebih bentuk tes yang sama diambil pada
waktu yang berbeda, dan (stabilitas dan kesetaraan)
4. korelasi antara item pada tes tunggal. (konsistensi internal (homogenitas)
Komponen Kesalahan/Kekurangan
dari Setiap Jenis Reliabilitas
 Stabilitas. Selama periode waktu yang singkat, memori tanggapan sebelumnya mungkin akan
digunakan ke situasi pengujian ulang dan akan menjaga tanggapan konstan. Dengan demikian,
koefisien kestabilan waktu yang singkat sangat tinggi.
 Persamaan derajatnya. Karena siswa tidak mengikuti tes yang sama dua kali, efek dari memori
dapat diabaikan. Namun, perbedaan dalam konten item antara fom berkontribusi kesalahan.
 Stabilitas dan kesetaraan. Reliabilitas terendah kemungkinan berasal dari kestabilan stabilitas
dan kesetaraan karena semua faktor kesalahan.
 Konsistensi internal atau homogenitas. Koefisien ini cenderung relatif tinggi karena individu
tidak banyak berubah ketika merespons item yang berbeda dalam suatu tes dan karena hanya
ada satu bentuk tes. Metode split-hall dan Kuder-Richardson inilah yang menjadi sumber
kesalahan dari dalam item itu sendiri. item yang tidak mengukur sifat atau kemampuan yang
sama seperti orang lain cenderung menurunkan konsistensi internal umum untuk stabilitas dan
pengukuran kesetaraan akan ada.
IV. Prosedur
yang
Digunakan
Mengestimasi
Reliabilitas
Prosedur Untuk Mengestimasi
Reliabilitas
1. Stabilitas
Stabilitas diukur dengan mengkorelasikan skor tes yang diperoleh dari individu yang sama selama
periode waktu tertentu.

2. Equivalence (Kesetaraan)
Kesetaraan ditentukan dengan membangun dua atau lebih bentuk pemeriksaan dan memberikannya
kepada orang yang sama pada waktu yang hampir bersamaan.

3. Stabilitas dan Kesetaraan


Koefisien stabilitas dan kesetaraan sangat cocok untuk pengukuran perolehan atau peningkatan.
Karena Koefisien ini termasuk kesalahan pengukuran yang terjadi karena individu berubah (stabilitas)
dan karena bentuk paralelnya tidak sepenuhnya sama.

4. Konsistensi Internal atau Homogenitas


Konsistensi internal dapat Diperkirakan dengan menentukan sejauh mana pengukuran pada bentuk
tunggal saling terkait. Ukuran konsistensi ini harus dilakukan untuk tes daya dan bukan untuk tes
kecepatan.
V. Metode
Untuk
Mengukur
Internal
Consistency
atau
Homogenitas
Metode Untuk Mengukur Internal
consistency atau Homogenitas
a. Metode split-half
• Metode split-half adalah suatu uji konsitensi alat ukur yang dilakukan dengan mengukur
setengah item dari instrumen kemudian menilai apakah salah satu dari setengah ukuran
tersebut menghasilkan hasil yang sama dengan setengahnya.

• Metode ini bertujuan untuk menilai skor dengan cara membaginya menjadi dua bagian
menggunakan item bernomor ganjil dan genap dari hasil jawaban atas soal yang diberikan.
Kemudian setiap kelompok diskor secara terpisah. Skor antara kedua bagian yang dikorelasikan
untuk melihat konsestensi antar bagian.

• 3 batasan dalam metode split-half:


1. Sumber kesalahan utama adalah item itu sendiri
2. Skor maksimum pada setiap setengah dari tes
3. Menyangkut penggunaan keandalan split-half
Metode Untuk Mengukur Internal
consistency atau Homogenitas
 b. Kuder Richardson
 Tes yang tidak dibagi menjadi beberapa bagian untuk penilaian terpisah, karena tes ini
mengasumsikan bahwa item diberi skor secara dikotomis, 0 atau 1.
 Keuntungan dari metode Kuder-Richardson adalah bahwa ia menghindari masalah yang
memutuskan tes mana yang harus dibagi.

 Formula Kuder-Richard-son 20 adalah

Dimana n = nomor untuk item pada tes


SD² = varian skor (standar deviasi kuadrat)
p = tingkat kesulitan pada setiap item (proporsi pada kelompok responden yang benar)
q = proporsi responden yang tidak benar pada setiap item, atau 1-p
Metode Untuk Mengukur Internal
consistency atau Homogenitas
b. Kuder Richardson

Langkah-langkahnya dalam Perhitungan estimasi keandalan KR20 sebagai berikut:


1. Temukan nilai-p, atau tingkat kesulitan, untuk setiap item. Ini adalah jumlah siswa yang merespons
dengan benar untuk setiap item dibagi dengan jumlah total siswa yang mengikuti tes.
2. Kalikan nilai p yang ditemukan pada langkah 1 dengan q, proporsi kelas yang hilang item. Jika p
adalah proporsi yang merespons dengan benar, q adalah 1 - p, atau proporsi siswa yang merespons
dengan tidak benar.
3. Hitung varians (kuadrat dari deviasi standar).
4. Tambahkan semua nilai pg untuk mendapatkan Epq. Kurangi Epq dari varians.
5. Bagi nilai yang ditemukan pada langkah 4 dengan varians dan kalikan hasil bagi ini dengan n / (n -
1), di mana n adalah jumlah item pada pemeriksaan. Jangan bingung n (jumlah item) dengan N
(jumlah dari siswa).
Metode Untuk Mengukur Internal
consistency atau Homogenitas
 b. Kuder Richardson

 Formula 21 Kuder-Richardson adalah metode pintas yang akan menghasilkan hubungan koofesien
billty identik dengan KR, tetapi hanya ketika semua item sama-sama sulit (jika asumsi ini
dilanggar ,KR21 akan selalu meremehkan KR20).
Rumus KR21 adalah:

Dimana : n = jumlah tem pada tes


M = skor rata-rata pada tes
= varians
Metode Untuk Mengukur Internal
consistency atau Homogenitas
c. Koefisien Alpha

Koefisien alpha dapat digunakan ketika siswa menerima dari nol hingga sejumlah poin untuk setiap
jawaban (ingat bahwa KR20, terbatas ke skor 0 atau 1.0 untuk setiap respons). KR20 dan koefisien
alpha menghasilkan hasil yang identik jika item diberi skor 0 dan 1.
 Metode ini digunakan untuk mengukur rata-rata konsistensi diantara item-item pertanyaan.
Keuntungan dari uji ini adalah dapat dihitung dengan hanya melakukan pengukuran satu waktu
atau satu kali dan tepat.
Metode Untuk Mengukur Internal
consistency atau Homogenitas
 c. Koefisien Alpha

Rumus untuk koefisien alpha adalah

Dimana : n = jumlah item pada tes


varian skor pada tes (sd kuadrat)
= jumlah varian pada setiap item
VI. Criterion
Referenced
Test dan
Mastery Test
Criterion Referenced Test dan
Mastery Test
Menurut James Popham soal tipe Referenced Test dan Mastery Test sulit diukur karena:

• Test yang direferensikan kriteria harus konsisten secara internal


• Tidak jelas bagaimana menilai konsisten secara internal
• Prosedur metode correlation dan Kuder-Richardson yang tidak tepat karena mereka bergantung
pada skor varlabilitas.
Pendekatan Referenced Test dan
Mastery Test
 The Livingston Approach

"Livingston (1972a: 17) menyarankan penggunaan rumus berikut untuk memperkirakan reliabilitas
kriteria ukuran yang direferensikan :

Dimana:
r ert : reliabilitas yang dirujuk berdasarkan kriteria
r : norma-reliabilitas yang direferensikan seperti yang diperkirakan oleh KR 20, split-halves,dll.

Seperti yang ditunjukkan Livingston, jika skor tes rata-rata dan skor tingkat kriteria sama, Koefisien
akan persis sama dengan reliabilitas yang ditemukan oleh metode referensi-norma konvensional.
Tetapi di mana ada perbedaan antara rata-rata dan skor kriteria, koefisien Livingston akan lebih besar
dari perkiraan reliabilitas konvensional.
Pendekatan Referenced Test dan
Mastery Test
  Kuder Richardson 20
 Kuder Richardson 20
 Formula Kuder-Richard-son 20 adalah

Dimana n = nomor untuk item pada tes


SD² = varian skor (standar deviasi kuadrat)
p = tingkat kesulitan pada setiap item (proporsi pada kelompok responden yang benar)
q = proporsi responden yang tidak benar pada setiap item, atau 1-p
VII. Kondisi
yang
Mempengaruhi
Koefisien
Reabilitas
Kondisi yang Mempengaruhi
Koefisien Reabilitas
1. Objektifitas dalam penilaian dilakukan dengan cara menjaga konsistensi dalam penilaia hal ini
dapat mengurangi korelasi antara skor sebenarnya dan skor yang diperoleh oleh siswa.
2. Variabilitas kelompok yang diuji dapat dilihat dari varian skor yang sebenarnya dalam
kelompok yang diuji.
3. Jumlah item dalam pengujian dapat mempegaruhi reabilitas yaitu semakin banyak item
semakin tinggi keandalannya dikarenakan peningkatan jumlah item disertai dengan
peningkatan variabilitas potensial siswa dalam kelompok.
4. Tingkat kesulitan tes, tes yang terlalu mudah atau suli tidak mampu menyelesaiakan perbedaan
individu karena semua peserta cendnerung merespon secara seragam.
5. Efek kesalahan sistematis dan acak, kesalahan ini dapat terjadi karena kondisi kebetulan baik
saat mengambilan tes atau dalam item tes.krena kesalahan ini informasi tentang skor yang
diperoleh peserta tidak dapat diketahui.
VIII. Sumber
Kesalahan 4
Tipe
Reliabilitas
Sumber Kesalahan 4 Tipe
Reliabilitas

1. Stabilitas dipengaruhi oleh interval waktu yang berbeda. Ketika interval waktu singkat koefisien
stabilitas dipengaruhi oleh memori yang meningkatkan varian sebenanrnya. Jika interval waktu
panjang koefisien stabilitas dipengaruhi oleh perubahan actual yang terjadi paa siswa. Selain itu
karakteristik tes, kondisi administrasi penguji dan pemebrian skor yang berbeda-beda dalam
jangka waktu panjang.
2. Equivalent/Kesetaraan disebabkan oleh bentuk tes yang diujikan kepada peserta didik dapat
digantikan dengan bentuk tes lain atau tidak.
3. Stabilitas dan kesetaraan disebabkan oleh waktu yang relative lama dapat memisahkan
administrasi dari dua bentuk tes. Perubahan bisa terjadi pada individu, item mungkin tidak
setara, dan peluang terjadi perbedaan dalam mengelola dan mencetak.
4. Konsistensi internal dan homogenitas disebabkan oleh siswa, waktu, dan bentuk tes hubungan
ketiganya sebgaai berikut ukuran konsistensi internal cenderung lebih tinggi daripada koefisien
stabilitas jangka panjang karena kemungkinan kecil siswa berubah; konsistensi internal
cenderung lebih tinggi daripada kesetaraan karena hanya ada satu bentuk tes.

Anda mungkin juga menyukai