Anda di halaman 1dari 2

Reliabilitas

Reliabilitas adalah salah satu metodeologi indikator dalam arti penelitian yang dilakukan guna
memberikan pengukuran kevalidan atas variabel riset yang telah ditentukan. Akan tetapi, jikalau suatu
metode tidak dapat diandalkan (tidak reliable), mungkin metode tersebut tidak valid.

Oleh karena itulah reliabilitas dimaknai sebagai ketepatan hasil yang diperoleh dari suatu
pengukuran. Sedangkan untuk validitas dapat didefinisikan sebagai suatu ukuran yang menunjukkan
tingkat kevalidan atau keshalihan suatu instrumen.

Jenis Uji Reliabilitas


Berikut ini bermacam-macam contoh reliabilitas berdasarkan jenisnya, antara lain:

1. Reliabilitas tes ulang


Uji reliabilitas tes ulang adalah ukuran reliabilitas yang diperoleh dengan memberikan tes yang sama
dua kali selama periode waktu tertentu kepada sekelompok individu. Skor dari Waktu 1 dan Waktu 2
kemudian dapat dikorelasikan untuk mengevaluasi stabilitasnya dari waktu ke waktu.

Contoh uji reliabilitas tes-ulang


Sebuah tes yang dirancang untuk menilai pembelajaran siswa dalam psikologi dapat diberikan
kepada sekelompok siswa sebanyak dua kali, dengan arti tes yang kedua mungkin dilakukan
seminggu setelah yang pertama. Koefisien korelasi yang diperoleh akan menunjukkan stabilitas skor.

2. Reliabilitas bentuk parallel


Uji reliabilitas bentuk parallel adalah ukuran reliabilitas yang diperoleh dengan mengelola berbagai
versi alat penilaian (kedua versi harus berisi item yang menyelidiki konstruksi, keterampilan, basis
pengetahuan, dan lain-lain yang sama) ke kelompok individu yang sama. Skor dari dua versi
kemudian dapat dikorelasikan untuk mengevaluasi konsistensi hasil di seluruh versi alternatif.

Contoh uji reliabilitas bentuk parallel


Jika kita ingin mengevaluasi relibilitas penilaian berpikir kritis, kita dapat membuat serangkaian besar
item yang semuanya berkaitan dengan pemikiran kritis dan kemudian secara acak membagi
pertanyaan menjadi dua set, yang akan mewakili bentuk paralel.

3. Reliabilitas antar penilai


Uji reliabilitas antar-penilai adalah ukuran reliabilitas untuk menilai sejauh mana penilai berbeda
setuju dalam keputusan penilaian mereka.

Reliabilitas antar penilai berguna karena pengamat manusia tidak akan serta merta menafsirkan
jawaban dengan cara yang sama; penilai mungkin tidak setuju tentang seberapa baik tanggapan atau
materi tertentu menunjukkan pengetahuan tentang konstruksi atau keterampilan yang dinilai.

Contoh uji reliabilitas antar-penilai


Reliabilitas antar penilai dapat digunakan saat juri yang berbeda mengevaluasi sejauh mana
portofolio seni memenuhi standar tertentu. Jenis reliabilitas yang satu ini sangat berguna saat
penilaian bisa dianggap relatif subjektif.

Jadi, penggunaan jenis reliabilitas ini mungkin akan lebih mungkin terjadi saat mengevaluasi karya
seni dibandingkan dengan masalah matematika.

4. Reliabilitas konsistensi internal


Uji reliabilitas konsistensi internal adalah ukuran reliabilitas yang digunakan untuk mengevaluasi
sejauh mana item tes berbeda yang menyelidiki konstruk yang sama menghasilkan hasil yang
serupa. Subtipe konsistensi internal diantaranya yaitu:
1. Korelasi antar-item rata-rata adalah subtipe dari reliabilitas konsistensi internal. Ini diperoleh
dengan mengambil semua item pada tes yang menyelidiki konstruk yang sama (misalnya,
pemahaman bacaan), menentukan koefisien korelasi untuk setiap pasangan item, dan
terakhir mengambil rata-rata dari semua koefisien korelasi ini. Langkah terakhir ini
menghasilkan korelasi antar item rata-rata.
2. Split-half  correlation adalah subtipe lain dari keandalan konsistensi internal. Proses untuk
mendapatkan reliabilitas yang satu ini dimulai dengan “membelah dua” semua item tes yang
dimaksudkan untuk menyelidiki bidang pengetahuan yang sama (misalnya, Perang Dunia II)
untuk membentuk dua “set” item.

Dari penjelasan yang dimukakan dapatlah dikatakan bahwa uji reliabilitas merupakan bentuk
kesamaan hasil pengukuran atau pengamatan apabila fakta atau kenyataan hidup tadi diukur atau
diamati berulang kali pada waktu yang berlainan.

Dimana seluruh tes diberikan kepada sekelompok individu, skor total untuk setiap “set” dihitung, dan
akhirnya reliabilitas split-half diperoleh. Yang sebelumnya dilaukan dengan menentukan korelasi
antara dua skor “set” total. Yaitu berupa

1. Validitas permukaan: Apakah konten tes tampaknya sesuai dengan tujuannya?


2. Validitas konstruk: Apakah tes mengukur konsep yang ingin diukur?
3. Validitas konten: Apakah tes sepenuhnya mewakili apa yang ingin diukur?
4. Validitas kriteria: Apakah hasilnya sesuai dengan tes yang berbeda untuk hal yang sama?

Anda mungkin juga menyukai