Anda di halaman 1dari 20

VALIDITAS, RELIABILITAS, DAYA PEMBEDA, DAN TINGKAT KESUKARAN INSTRUMEN

Suatu kegiatan penelitian selalu membutuhkan data yang tepat agar hasilnya sesuai dengan yang
harapkan. Data yang diperoleh tersebut juga akan berpengaruh dalam menentukan kualitas kegiatan
penelitian yang dilakukan bermutu atau tidak. Menurut Arikunto (2006:168). Hal tersebut dikarenakan
data adalah sebuah gambaran variabel yang diteliti, dan berfungsi sebagai alat pembuktian hipotesis.
Data yang sesuai tersebut hanya akan kita peroleh dari instrumen yang tepat dan memenuhi
persyaratan. Persyaratan suatu instrumen yang baik adalah harus memiliki validitas (kesahihan) dan
reliabilitas (keterpercayaan) harus tinggi.
Penggunaan instrumen selain untuk memperoleh data dari suatu penelitian, dapat juga berfungsi
sebagai alat evaluasi. Alat evaluasi berupa tes biasanya digunakan sebagai instrumen untuk
mengumpulkan data yang berupa hasil belajar siswa. Oleh karena itu, Persyaratan lainnya yang kita
perlukan dalam menggunakan instrumen berupa tes sebagai alat evaluasi adalah daya pembeda dan
tingkat kesukaran instrumen.

2.1 Validitas Instrumen

Validitas adalah suatu ukuran yang menunjukkan tingkat kevalidan suatu instrumen (Arikunto,
2006:168). Suatu instrumen yang valid berarti instrumen penelitian tersebut dapat mengukur apa yang
seharusnya diukur (Sugiyono, 2012:121). Tinggi rendahnya validitas instrumen menunjukkan sejauh
mana data yang didapat dan digunakan sesuai dengan variabel yang dimaksud. Instrumen memiliki
validitas tinggi jika derajat ketepatan mengukurnya benar (Russefendi, 1998:132).

Sukmadinata (2011: 228) menyatakan bahwa ada beberapa karakteristik darivaliditas, yaitu:

a. Instrumen dikatakan valid apabila dapat mengukur apa yang akan diukur, misalnya suatu tes
benar-benar menggukur sikap siswa terhadap matematika bukan pengetahuan matematika siswa.

b. Validitas menunjukkan derajat atau tingkatan, validitasnya tinggi, sedang, dan rendah.

c. Validitas instrumen juga memiliki spesifikasi tidak berlaku umum. Misalnya suatu tes matematika
menunjukkan validitas yang tinggi dalam mengukur keterampilan menghitung siswa tapi rendah dalam
mengukur kemampuan berfikir kreatif siswa.

Instrumen penelitian yang valid adalah hasil dari usaha peneliti dengan kehati-hatian dan mengikuti
langkah-langkah penyusunan instrumen yaitu memecah variabel menjadi sub-variabel dan indikator
setelah itu baru mulai memasukkannya dalam butir-butir pertanyaan.

Oleh karena itu untuk menentukan validitas suatu alat evaluasi hendaklah dilihat dari berbagai aspek,
diantaranya validitas isi, validitas muka, validitas konstruksi, validitas ramal, dan validitas banding.
Erman (2003: 103) menyatakan bahwa semua macam validitas di atas dapat dikelompokkan ke dalam
dua jenis berdasarkan pelaksanaannya, yaitu validitas logik (teoritik) dan validitas empirik (kriterium).
Macam-macam validitas itu dapat digambarkan secara diagram sebagai berikut:
Penjelasan mengenai macam-macam validitas tersebut adalah sebagai berikut:

A. Validitas Teoritik

Validitas teoritik atau validitas logika adalah validitas isntrumen yang dilakukan berdasarkan
pertimbangan teoritik atau logika (Erman, 2003: 104). Validitas teoritik akan menunjukkan kondisi bagi
sebuah instrumen yang memenuhi persyaratan valid berdasarkan teori dan aturan yang ada. Dalam hal
ini diperlukan pertimbangan atau pengkajian oleh para ahli atau orang yang dianggap ahli dalam hal
tersebut, minimal oleh orang yang berpengalaman dibidang tersebut. Hal yang perlu dikaji atau
dipertimbangkan adalah “apakah konsep-konsep atau materi yang terdapat dalam instrument tersebut
sudah benar?; apakah aspek psikologi yang terdapat dalam instrumen tersebut tidak mengganggu emosi
tester sehingga jawaban menjadi bias?”. Jika pertanyaan-pertanyaan tersebut terjawab dengan baiki
dan terpenuhi, maka validitas teoritik alat evaluasi tersebut bisa dikatakan baik.

Penjelasan lebih rinci mengenai macam-macam validitas teoritik adalah sebagai berikut:

1. Validitas Isi (Content Validity)

Suatu instrumen yang digunakan di dalam kelas penelitian umumnya dipakai untuk menaksir
pengetahuan dan kecakapan siswa dalam bidang studi tertentu. Cara yang ideal untuk mengerjakan hal
itu ialah dengan melalui ujian yang memasukkan semua pertanyaan yang mungkin dapat ditanyakan
tentang bidang studi tersebut. Namun, prosedur yang seperti ini jelas tidak mungkin dapat dilaksanakan.
Alternatif yang umum digunakan adalah dengan menyiapkan suatu sampel dari keseluruhan isi bidang
studi tersebut. Kemudian sampel ini dipakai sebagai dasar bagi penarikan kesimpulan mengenai
pengetahuan siswa tentang seluruh universum isi bidang studi tersebut. Karena penarikan kesimpulan
itu akan dilakukan hanya berdasarkan suatu sampel saja, maka sampel itu harus benar-benar mewakili
universum isi secara keseluruhan. Artinya sampel tersebut harus menjadi sampel yang valid. Hal ini
adalah pondasi dalam membahas validitas isi.

Validitas isi adalah derajat dimana sebuah tes mengukur cakupan substansi yang akan diukur
(Sukardi,2003:123). Validitas ini berkenaan dengan kesahihan instrumen, dengan materi yang akan
ditanyakan, baik menurut per butir soal maupun menurut soalnya secara menyeluruh (Ruseffendi,
1998:133). Validitas isi juga mempunyai peranan penting dalam pencapaian atau achievement
test. Validitas isi pada umumnya ditentukan melalui pertimbangan para ahli. Tidak ada formula
matematis khusus untuk menghitung atau tidak ada cara untuk menunjukkan secara pasti. Tetapi untuk
memberikan gambaran bagaimana suatu tes divalidasi dengan menggunakan validitas isi, pertimbangn
para ahli tersebut dilakukan sebagai berikut. Para ahli diminta untuk mengamati secara cermat semua
item dalam tes yang hendak dibuat. Kemudian mereka diminta untuk memberikan pertimbangan
tentang bagaimana tes tersebut menggambarkan cakupan isi yang hendak diukur. Pertimbangan para
ahli itu biasanya juga menyangkut apakah semua aspek yang hendak diukur telah mencakup semua item
pertanyaan dalam tes. Validitas isi yang mendasar adalah merupakan suatu pendapat,baik pendapat
sendiri maupun pendapat orang lain. Tiap-tiap item atau soal yang akan diuji perlu dipelajari secara
seksama dan kemudian dipertimbangkan tentang representatif tidaknya isi yang akan diuji (Nazir,
2005:146).
Universum isi bidang studi tentu saja bersifat teoritis. Tetapi kita dapat membuat suatu kerangka atau
kisi-kisi topik, kecakapan, dan kemampuan yang merupakan wilayah dari isi yang sedang diukur, disertai
tentang pentingnya tiap-tiap wilayah tersebut. Butir-butir instrumen ditulis berdasarkan kerangka ini
sebagai pedoman. Dari setiap kategori dalam kerangka itu dapat ditarik secara acak butir- butir tes
dalam jumlah yang sesuai dengan bobot kategori tersebut secara keseluruhan. Sampel butir instrumen
semacam itu akan mencerminkan universum isi sehingga akan memiliki validitas isi.

Validitas isi tidak dapat dinyatakan dalam bentuk angka. Validasi isi pada dasarnya terpaksa didasarkan
pada pertimbangan yang harus dilakukan secara terpisah untuk setiap situasi dan memerlukan
penelaahan yang cermat dan kritis terhadap butir-butir isntrumen, karena butir instrumen tersebut erat
kaitannya dengan wilayah isi yang ditentukan. Peneliti harus memastikan apakah butir-butir di dalam tes
itu mencerminkan pelajaran dan tujhuan-tujuan seperti dinyatakan di dalam buku pedoman kurikulum,
silabus, dan buku pelajaran. Untuk itu penyusunan instrumen seharusnya diperiksa terlebih dahulu oleh
sejumlah ahli atau guru-guru lain mengenai isi instrument tersebut secara sistematis serta mengevaluasi
relevansinya dengan universum yang sudah ditenrtukan. Jika semua penilai itu sepakat bahwa butir
instrument tersebut sudah mencerminkan wilayah isi dengan memadai, maka tes tersebut dapat
dikatakan telah meiliki validitas isi. Namun perlu juga dilihat bahwa tes tersebut bebas dari pengaruh
factor-faktor yang tidak ada hubungannya dengan tujuan pengukuran, karena akan merendahkan
validitasnya. Selain itu juga perlu ditegaskan bahwa suatu tes hasil belajar yang memiliki validitas isi
tinggi bagi penyusun tes, mungkin tidak memiliki validitas isi bagi pemakai lain yang merumuskan
universum isi secara berlainan. Pada akhirnya hanya pemakai instrument sendirilah yang harus
memutuskan validitas isi suatu tes yang akan dipakainya.

Erman (2003: 105) menyatakan bahwa hal-hal yang harus diperhatikan agar suatu isntrumen memiliki
validitas isi yang baik adalah:

a. Bahan instrumen merupakan sampel representatif untuk mengukur seberapa jauh tujuan
(indikator pembelajaran dan kompetensi dasar) dapat tercapai, baik ditinjau dari materi yang diajarkan
maupun dari segi tingkat proses belajar

b. Titik berat bahan yang diujikan harus berimbang dengan titik berat bahan dalam kurikulum, sesuai
dengan alokasi waktu yang disediakan untuk menyajikannya dalam kegiatan belajhar-mengajar

c. Untuk mengerjakan evaluasi tersebut tidak diperlukan pengetahuan lain yang tidak relevan atau
bahan yang belum diajarkan.

2. Validitas Muka (Face Validity)

Validitas muka suatu instrumen disebut pula sebagai validitas bentuk instrumen (pertanyaan,
pernyataan, suruhan) atau validitas tampilan, yaitu kebasahan susunan kalimat atau kata-kata dalam
soal sehingga jelas pengertiannya atau tidak menimbulkan tafsiran lain (Erman, 2003: 106). Apabila
suatu instrumen tidak dapat atau sulit dipahami maksudnya sehingga testi tidak bisa menjawabnya
dengan baik, kemudian jika soal tes kurang bersih, tulisan terlalu berdesakan, tanda baca atau notasi
lain mengenai bahan uji yang kurang jelas atau salah, ini berarti akan mengurangi validitas mukanya
hingga memasuki kategori tidak baik. Jadi validitas muka suatu instrument hanya menyangkut
keabsahan penyajian instrument tersebut berkenaan dengan tampilan luarnya saja, belum menyangkut
materi bahan uji instrument itu sendiri.

Pada umumnya alat evaluasi yang mempunyai validitas isi yang baik, validitas mukanya juga baik,
tetapi tidak sebaliknya. Oleh karena itu, validitas muka ini dapat ditentukan berdasarkan pendapat para
ahli yang kompeten bersamaan dengan validitas isi.

3. Validitas konstruk (construct validity)

Validitas konstruk adalah derajat dari suatu instrumen dalam mengukur konstruk yang diduga, yaitu
perilaku yang tidak bisa diamati yang kita duga ada(Ruseffendi,1998:133). Erman (2003: 106)
menyatakan bahwa istilah konstruksi dalam hal ini lebih berkenaan dengan aspek psikologis. Pada
umumnya instrumen yang berkenaan dengan aspek sikap, kepribadian, motivasi, minat, dan bakat perlu
dilihat validitas konstruksinya. Faktor-faktor psikologis tersebut sulit diukur secara langsung, tetapi
dapat diukur secara tidak langsung. Didalam penelitian biasanya instrumen yang digunakan biasanya
berupa evaluasi non tes.

Alat evaluasi yang berkenaan dengan aspek-aspek di atas penyusunannya (kalimat yang
dikemukakan) jangan menyinggung emosi responden atau orang lain yang ada kaitannya dengan
evaluasi tersebut. Selain hasil evaluasi akan bias, kemungkinan hal-hal yang tidak diinginkan akan
muncul.

Berikut ini disajikan beberapa butir contoh instrumen yang sebaiknya tidak disajikan karena
validitas konstruksinya kurang baik, sehingga dapat menyinggung emosi dan mental (psikologi)
responden atau orang lain:

1. Salah satu faktor penyebab saya tidak berhasil dalam belajar matematika karena tulisan gurunya
jelek sehingga tidak dapat dipahami.

a. Benar Sekali

b. Ada benarnya

c. Tidak benar

d. Tidak benar sama sekali

2. Sebagai hasil belajar matematika, bidang afektif yang dirasakan tumbuh dan berkembang dalam
diri saya adalah:

a. Memiliki sikap tegas dalam menentukan sikap, sehingga seringkali kurang toleransi dalam
menghadapi permasalahan sesuai dengan sifat matematika itru sendiri dan guru pengajarnya

b. Kurang biasa berbicara panjang lebar (misalnya untuk berpidato) karena dibiasakan oleh guru
untuik menyatakan pendapat dengan singkat, bahkan jika perlu memakai notasi.
c. Merasa memiliki kemampuan ber4fikir yang lebih baik daripada orang lain, karena dalam
mempelajari matematika dituntut dan dilatih untuk itu

d. Cepat putus asa, diliputi rasa pesimis, ser4ingkali timbul perasaan takut tanpa sebab dikarenakan
gurunya pemarah dan tidak manusiawi dalam member hukuman

Berdasarkan contoh-contoh di atas tampak bahwa butir evaluasi yang disajikan memojokkan orang lain
secara pribadi, sehingga dapat menimbulkan akibat yang tidak diharapkan, sehingga validitas
konstruksinya tidak baik.

Validitas konstruksi psikologik hanya berlaku untuk unsur psikologik yang akan dievaluasi, tidak berlaku
untuk hal yang lainnya, kecuali unsure-unsur itu mempunyai korelasi yang tinggi. Oleh karena itu,
peneliti yang khususnya berasal dari dunia pendidikan matematika, hasil dari validitas konstruk ini
dicukupkan sebagai sekedar pengetahuan saja. Untuk pengkajian lebih dalam biasanya dilakukan oleh
para ahli psikologi.

Contoh Validitas Teoritik Instrumen (validitas isi, validitas muka, validitas konstruksi) dari sebuah tesis
(Setyawan, 2013: 40-41) yang berjudul “Penerapan Model Pembelajaran Connecting-Organizing-
Reflecting-Extending (CORE) untuk Meningkatkan Kemampuan Pemahaman dan Koneksi Matematis
Siswa Sekolah Menengah Atas (Penelitian Kuasi Eksperimen terhadap Siswa SMA di Duri)” adalah
sebagai berikut:

“Validitas teoritik untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi instrumen yang
memenuhi persyaratan valid berdasarkan teori dan aturan yang ada. Pertimbangan terhadap soal tes
kemampuan pemahaman dan koneksi matematis berkenaan dengan validitas isi dan validitas muka
diberikan oleh ahli.

Validitas isi dilakukan dengan membandingkan antara isi instrumen dengan materi pelajaran yang telah
diajarkan. Apakah soal pada instrumen penelitian sesuai atau tidak dengan indikator. Validitas muka
dilakukan dengan melihat tampilan dari soal itu yaitu keabsahan susunan kalimat atau kata-kata dalam
soal sehingga jelas pengertiannya atau tidak salah tafsir. Jadi suatu instrumen dikatakan memiliki
validitas muka yang baik apabila instrumen tersebut mudah dipahami maksudnya sehingga testi tidak
mengalami kesulitan ketika menjawab soal.

Sebelum tes tersebut digunakan, terlebih dahulu dilakukan validitas muka dan validitas isi
instrumen oleh para ahli yang kompeten. Uji coba validitas isi dan muka untuk soal tes kemampuan
pemahaman dan koneksi matematis dilakukan oleh tiga orang penimbang. Untuk mengukur validitas isi,
pertimbangan didasarkan pada kesesuaian soal dengan materi ajar matematika SMA kelas IX, dan sesuai
dengan tingkat kesulitan siswa kelas tersebut.Untuk mengukur validitas muka, pertimbangan didasarkan
pada kejelasan soal tes dari segi bahasa dan redaksi. Setelah instrumen dinyatakan sudah memenuhi
validitas isi dan validitas muka, kemudian secara terbatas diujicobakan kepada lima orang siswa diluar
sampel penelitian yang telah menerima materi yang telah diteskan. Tujuan dari uji coba terbatas ini
adalah untuk mengetahui tingkat keterbacaan bahasa sekaligus memperoleh gambaran apakah butir-
butir soal tersebut dapat dipahami denagn baik oleh siswa. Hasil uji coba terbatas, ternyata diperoleh
bgambaran bahwa semua soal tes dipahami dengan baik. Kisi-kisi soal, perangkat soal, dan kunci tes
kemampuan pemahaman dan koneksi matematis tersebut selengkapnya ada pada lampiran A (Silabus,
RPP, LKS, Kisi-kisi Tes Kemampuan Koneksi Matematis, Kisi-kisi Tes Kemampuasn Pemahaman
Matematis, Kisi-kisi Skala Sikap, Kisi-kisi Kemampuan Awal Matematis, Lembar Observasi).”

B. Validitas Empirik (Validitas Kriterium)

Sukmadinata (2011: 228) menyatakan Validitas empirik berkenaan dengan tingkat ketepatan instrumen
mengukur segi yang akan diukur dibandingkan dengan hasil pengukuran dari instrumen lain yang
menjadi kriteria. Instrumen yang menjadi kriteria adalah instrumen yang sudah standar. Erman (2003:
109) menjelaskan bahwa validitas ini diperoleh melalui observasi atau pengalaman yang bersifat
empirik, kriteria itu digunakan untuk menentukan tinggui-rendahnya koefisien validitas yang dibuat
melalui perhitungan korelasi, yaitu dengan mengkorelasikan antara skor item instrument dengan rumus
Pearson Product Moment memakai angka kasar (raw score

Selanjutnya dihitung dengan Uji-t dengan rumus :

Distrubusi (Tabel t) untuk dan derajad kebebasan (dk= n-2). Kaidah keputusan:

Jika t hitung > t tabel berarti valid sebaliknya

Jika t hitung < t tabel berarti tidak valid

(Riduwan, 2010: 98)

Jika instrumen itu valid, maka kriteria yang digunakan untuk menentukan validitas item instrumen
adalah:

TABEL KRITERIA VALIDITAS ITEM INSTRUMEN

Besarnya r Interpretasi

0,80 < r < 1,00 Sangat tinggi

0,60 < r < 0,79 Tinggi

0,40 < r < 0,59 Cukup Tinggi


0,20 < r < 0,39 Rendah

0,00 < r < 0,19 Sangat rendah

Ada dua macam validitas yang termasuk validitas kriterium (Erman, 2003: 109) yaitu:

1. Validitas Banding (Concurrent Validity)

Furchan (2011: 301) menyatakan bahwa validitas banding berkenaan dengan korelasi antara skor tes
dengan suatu ukuran kriteria yang dapat diperoleh pada waktu yang sama atau pada waktu yang sangat
berdekatan. Erman (2003: 109) menjelaskan bahwa validitas ini kriteriumnya terdapat pada waktu yang
bersamaan dengan alat evaluasi yang terdapat pada waktu yang bersamaan dengan instrumen evaluasi
yang diselidiki validitasnya, atau hampir bersamaan. Biasanya dilakukan terhadap subjek yang sama.
Misalnya instrument yang diselidiki validitasnya adalah instrumen berupa tes matematika buatan
peneliti dengan menggunakan kriterium nilai rata-rata harian yang telah ada, dengan asumsi bahwa
hasil evaluasi yang digunakan untuk kriterium itu telah mencerminkan kemampuan siswa
sebenarnya.Sukardi (2003:124) menyebutkan bahwa validitas banding adalah derajat dimana skor dalam
suatu tes dihubungkan dengan skor lain yang telah dibuat.Validitas ini ditentukan dengan membangun
analisis hubungan atau pembedaan . Metode hubungan pada umumnya dilakukan dengan cara
melibatkan antara skor-skor pada tes dengan skor tes yang telah baku atau kriteria tes yang sudah ada.
Cara-cara membuat tes dengan validitas ini dapat dilakukan dengan beberapa langkah seperti berikut:

a. Administrasikan tes yang baru dilakukan terhadap guru atau anggota kelompok.

b. Catat tes baku yang ada termasuk yang dilakukan terhadap grup atau anggota kelompok.

c. Hubungkan atau korelasikan dua tes skor tersebut.

Hasil yang dicapai/ koefisien validitas yang muncul menunjukkan derajat hubungan tes yang baru. Jika
koefisien tinggi, berarti tes yang baru tersebut mempunyai validitas konkuremn yang baik. Sebaliknya,
tes yang baru dikatakan mempunyai validitas dompleng jelek jika koefisien yang dihasilkan rendah.

2. Validitas Ramal (Predictive Validity)

Pengertiannya adalah derajat yang menunjukkan suatu tes dapat memprediksi tentang bagaimana
seseorang akan melakukan prospek tugas atau pekerjaan yang direncanakan (Sukardi,2003:123).
Validitas ramal berkenaan dengan tingkat ketepatan suatu instrumen dalam meramalkan keberhasilan
seseorang di masa yang akan datang (Ruseffendi,1998:133). Tes kemampuan aljabar misalnya dapat
dikatakan memiliki nilai validitas prediksi jika instrumen tersebut dapat menduga atau memperkirakan
seseorang yang memiliki kemampuan aljabar dengan anak yang tidak memiliki kemampuan ajabar.
Instrumen validitas prediksi mungkin berbeda tergantung dari kurikulum yang digunakan, buku
pegangan yang digunakan, intensitas mengajar, dan letak geografis atau daerah sekolah. Yang perlu
diperhatikan saat akan melakukan tes uji validitas predikasi adalah perlunya memperhatikan proses dan
cara membandingkan instrument yang dilakukan dengan tes yang telah dibakukan.

Validitas prediksi umumnya ditentukan dengan membangun hubungan antara skor tes dengan beberapa
ukuran keberhasilan dalam situasi tertentu yang digunkana untuk memprediksi keberhasilan yang
selanjutnya disebut sebagaipredictor. Sedangkan tingkah laku yang hendak diukur disebut
sebagai criterion.Sebagai contoh misalnya jika kita hendak memprediksi mata kuliah matematika.
Kelengkapan kehdiran kuliah satu semester , menyelasikan tugas-tugas yang diberikan dan mengikuti
mid semester dari kuliah tersebut dapat digunakan sebagai indicator criterion. Sedangkan mahasiswa
yang tidak hadir dan tidak mengumpulkan tugas ,skor penuh yang dioeroleh menunjukkan bahwa nilai-
nilai tersebut tidak merefleksikan prediksi keberhasilan. Ketika criteria telah ditentukan maka langkah
selanjutnya adalah menentukan validitas prediksi suatu tes dengan cara seperti berikut:

a. Buat item tes sesuai dengan tujuan yang hendak dicapai.

b. Tentukan grup yang dijadikan sebjek dalam pilot study.

c. Identifikasi criterion prediksi yang hendak dicapai .

d. Tunggu sampai tingkah laku yang diprediksi atau variabel criterion.

muncul dan terpenuhi dalam grup yang telah ditentukan.

e. Capai ukuran-ukuran criterion tersebut.

f. Korelasikan dua set skor yang dihasilkan.

Hasil angka beberapa koefisien validitas adalah menunjukkan validitas prediksi terhadap tes yang baru
dibuat. Jika koefisien tinggi, berarti tes mempunyai prediksi bagus. Sebagaimana, jika koefisien rendah
berarti tes yangbaru dibuat mempunyai tes prediksi rendah.

Contoh Validitas Empirik Instrumen dari tesis yang sama (Setyawan, 2013: 42-43):

“Setelah instrumen dinyatakan memenuhi validitas isi dan validitas muka, kemudian soal tes
kemampuan pemahaman dan koneksi matematis tersebut diujicobakan secara empiris kepada 70 orang
siswa kelas XII SMA Negeri 2 Mandau. Tujuan uji coba empiris ini adalah untuk mengetahui tingkat
reliabilitas dan validitas butir soal tes. Perhitungan validitas butir soal digunakan korelasi product
moment.”

2.2 Reliabilitas Instrumen

Syarat lainnya yang penting untuk seorang peneliti adalah reliabilitas. Reliabilitas sama dengan
kekonsistenan atau keajekan (Sukardi, 2003:127). Reliabilitas berkaitan dengan ketetapan hasil/
data dari suatu instrumen jika dilakukan beberapa kali. Reliabilitas berasal kata reliabel yang berarti
dapat dipercaya atau dapat diandalkan. Sehinga instrument yang reliabel mengarah kepada suatu
instrumen yang dapat dipercaya untuk digunakan sebagai alat pengumpulan data, sehingga akan
menghasilkan data yang juga dapat dipercaya.

Reliabilitas suatu instrumen merupakan ukuran yang menyatakan tingkat kekonsistenan instrumen
tersebut, artinya instrumen itu memiliki keandalan untuk digunakan sebagai alat ukur dalam jangka
waktu yang relatif lama. Jika suatu tes dikatakan tidak reliable artinya bahwa dapart dikatakan tes itu
sia-sia, karena jika dilakukan pengetasan kembali hasilnya akan berbeda. Reliabilitas suatu tes pada
umunya diekspresikan secara numeric dalam bentuk koefisien. Koefisien tinggi menunjukkan reliabilitas
tinggi. Sebaliknya jika koefisien suatu tes rendah maka reliabilitas tes rendah. Jika suatu mempunyai
reliabilitas sempurna, berarti bahwa tes tersebut mempunyai koefisien +1 atau -1. Namun, dalam
kenyataann yang terjadi adalah suatu tes tidak ada yang mencaapai peringkat sempurna karena skor
kemungkinan besar selalu bervariasi, yang disebabkan oleh terjadinya kesalahan pengukuran dari
bermacam-macam sumber. Reliabilitas tinggi menunjukkan kesalahan varian yang minim. Jika sebuah
tes mempunyai reliabilitas tinggi maka pengaruh kesalahan pengukuran telah terkurangi. Ada beberapa
tipe realibilitas yang sering digunakan dalam kegiatan penelitian dan masing-masing reliabilitas
mempunyai konsistensi yang berbeda, termasuk: tes-retes, ekuivalen, dan belah dua yang ditentukan
melalui korelasi. Sedangkan reliabilitas ekuivalensi diperhitungkan melalui bagaimana masing-masing
item pertanyaanberkorelasi dengan item-item pernyataan berkorelasi dengan item-item keseluruhan
dalam tes.

A. Macam Reliabilitas Instrumen

a. Reliabilitas Tes-Retes

Reliabilitas tes-retes tidak lain adalah derajat yang menunjukkan konsisten hasil sebuah tes dari waktu
ke waktu. Tes-retes menunjukkan variasi skor yang diperoleh dari penyelenggarakan satu tes yang
dilakukan dua kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan melakukan tes-retes
tersebut kita mengetahui sejauh mana konsistren suatu tes mengukur dnegan apa yang harus diukur.
Realibilitas tes-retes juga mempunyai beberapa permasalahan. Diantara permasalahan tersebut, yaitu
faktor waktu tenggang yang dimabil ketika melakukan tes pertama dengan tes keduaa. Jika waktu
interval terlalu pendek maka mahasiswa memiliki kesempatanm mengingat jawaban dalam tes sehingga
tes kedua dapat dipastikan lebih baik. Jika interval wuaktu terlalu panjang, kemampuan para pelaku
yang mengikuti tes mungkin bertambah, karena dua kemungkinan yaitu factor kedewasaan dan faktor
intervensi dari factor belajar subjek.

b. Reliabilitas Bentuk Ekuivalensi

Dalam hal ini tes yang hendak dilaksanakan reabilitasnya dibuat identik. Setiap tampilannya
kecuali substansi item yang ada dapat berbeda. Kedua tes tersebut sebaiknya mempunyai karakteristik
yang sama. Dari semua kondisi yang direncanakan secara ekuivalen, idealnya jika grup sama mengambil
dua tes tersebut maka rerata askor maupun variabilitas skor yang dicapai dari kedua tes tersebut
harusnya sama (Sukardi, 2003:129). Reabilitas ekuivalen, pada umunya juga menggambarkan bentuk
konsiten alternative, yang dapat menunjukkan variasi skor yang terjadi dari bentuk tes satu dengan
bentuk lainnya. Beberapa langkah yang dapat dilakukan dalam melaksanakan tes reliabilitas secara
ekuivalen ialah :

1. Tentukan subjek sasaran yang hendak dites

2. Lakukan tes yang dimaksud kepada subjek sasaran tersebut.

3. Administrasikan hasilnya secara baik

4. Dalam waktu yang tidak terlalu lama, lakukan pengetesan untuk kedua kalinya pada grup
tersebut.

5. Korelasikan kedua hasil skor tes tersebut.

Jika hasil koefesien ekuivalen tinggi, berarti tes yang dilakukan memiliki reliabilitas yang tinggi. .
sebaliknya jika koefisien rendah maka reliabilitas ekuivalen tes rendah. Tes reabilitas ekuivalen
mempunyai kelemahan, yaitu membuat dua tes yang secara esensial ekuivalen adalah sulit. Akibatnya
akan selalu muncul terjadinya kesalahan pengukuran.

c. Reabilitas Belah Dua

Reabilitas belah dua ini termasuk reabilitas yang mengukur konsistensi internal. Yang dimaksud
dengan konsistensi internal ialah salah satu tipe reabilitas yang didasarkan pada keajekan dalam tes .
reabilitas belah dua ini dalam pelaksanaannya hanya memerlukan waktu satu kali. Cara melakkan
reabilitas belah dua pada garis besarnya dapat dilakukan dengan urutan sebagai berikut:

1. Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.

2. Bagi tes yanga ada menjadi dasar jumlah item-item yang paling umum dengan membagi ganjil
menjadi genap pada kelompok tersebut.

3. Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.

4. Korelasikan kedua skor tersebut menggunakan formula korelasi yang relevan dengan teknik
pengukuran.

Jika koefisien korelasi tinggi maka tes mempunyai tingkat reliabilitas baik. Demikian sebaliknya
jika hasil korelasi rendah maka tingkat reliabilitasnya juga rendah. Hasil dari analisis belah dua tersebut
baru separo, sehingga diperlukan adanya formula koreksi untuk meningkatkan ketepatan perhitungan
tingkat konsistensi.

B. Metode Pengujian Reliabilitas

a. Metode Belah Dua


Metode belah dua adalah metode yang menggunakan sebuah tes dan dicobakan satu kali atau single-
tes-double-trial-method . Pada waktu membelah dua dan mengkorelasikan dua belahan baru diketahui
reliabilitas setengahnya saja. Jika untuk mengetahui reliabilitas tes menyeluruh harus menggunakan
rumus Sperman-Brown (Riduwan, 2010:102).

b. Metode Kuder Richardson-20 (KR-20)

Metode KR-20 ini berguna untuk mengetahui reliabilitas tes untuk item pertanyaan atau pernyataan
yang menggunakan jawaban benar (Ya) atau salah (Tidak). Bila benar bernilai = 1 dan jika salah bernilai
=0

Daya pembeda soal dapat ditentukan dengan rumus:

atau

Keterangan:

DP = Daya Pembeda

JBA = Jumlah siswa berkemampuan tinggi yang menjawab soal tersebut dengan benar

JBB = Jumlah siswa yang berkemampuan rendah yang menjawab soal itu dengan benar

JSA = Jumlah siswa berkemampuan tinggi

JSB = Jumlah siswa berkemampuan rendah

Tabel Klasifikasi Interpretasi Daya Pembeda

Daya Pembeda Kriteria

Sangat Jelek

Jelek

Cukup

Baik

Sangat Baik

(Erman, 2003:160-161)
2.4 Tingkat Kesukaran Instrumen

Soal yang dianggap baik berdasarkan PAN (Patokan Acuan Normal) adalah soal yang tingkat
kesukarannya sedang, sebab bila tingkat kesukaran soal itu sedang maka dapat memberikan informasi
mengenai perbedaan individual yang paling besar (Ruseffendi, 1998:160-161).

Tingkat kesukaran instrumen adalah besaran yang digunakan untuk menyatakan apakah suatu soal
termasuk ke dalam kategori mudah, sedang, atau sukar. Tingkat kesukaran instrumen dapat diperoleh
dengan mencari indeks kesukaran yang menggunakan rumus:

atau

Keterangan:

IK = Indeks Kesukaran

Tabel Klasifikasi Indeks Kesukaran Instrumen

Indeks Kesukaran Kriteria

Terlalu Sukar

Sukar

Sedang

Mudah

Terlalu Mudah

(Erman, 2003:171)

Pengertian Uji Validitas


Uji Validitas adalah Uji ketepatan atau ketelitian suatu alat ukur dalam mengukur apa yang sedang
ingin diukur. Dalam pengertian yang mudah dipahami, uji validitas adalah uji yang bertujuan untuk
menilai apakah seperangkat alat ukur sudah tepat mengukur apa yang seharusnya diukur.

Saya ambil contoh mudahnya saja, jika anda ingin mengukur berat badan, maka harus menggunakan
timbangan. Sedangkan jika anda ingin mengukur tinggi badan, maka harus menggunakan meteran. Nah,
itulah yang dimaksud dengan validitas. Jadi validitas dapat diartikan sebagai tingkat kesahihan alat ukur
ukur dalam mengukur apa yang seharusnya diukur.

Dalam pengujian alat ukur pengumpulan data penelitian, validitas itu ada dua macam, yaitu validitas
faktor dan validitas item. Validitas faktor diukur apabila item yang disusun menggunakan lebih dari
sebuah faktor (antara faktor yang satu dengan faktor yang lain ada kesamaannya).

Cara Uji Validitas


Proses mengukur validitas faktor tersebut adalah dengan cara menghubungkan atau mengkorelasikan
antara skor faktor (penjumlahan dari semua item dalam satu faktor) dengan skor total faktor (total
keseluruhan dari faktor).

Sedangkan pengukuran validitas item adalah dengan cara mengkorelasikan antara skor item dengan
skor total dari semua item yang ada.

Dengan uraian diatas, para pembaca pasti sudah memahami, bahwa sebenarnya uji validitas item adalah
uji yang menilai apakah seperangkat soal yang terdiri dari beberapa item dapat mendukung seperangkat
item soal sebagai satu kesatuan yang tunggal.

Pada artikel lainnya kita telah membahas banyak perihal uji validitas, salah satunya adalah Tutorial Uji
Validitas Instrumen dengan SPSS. Disini kami akan coba menerangkan apa, bagaimana dan rumus
perhitungan uji validitas. Uji Validitas dilakukan untuk menilai apakah soal sudah valid atau tidak untuk
sebuah penelitian yang sesungguhnya.

Pada saat anda membaca paragraph awal artikel ini, anda jangan pergi kemana-mana dulu, sebab yang
anda cari pasti ada disini. Namun dalam bahasan ini, kami lebih fokus kepada pengertian dan penjelasan
tentang apa sebenarnya uji validitas dan manfaatnya. Berikut kami sampai dulu singkat saja perihal
perbedaan antara uji validitas dan reliabilitas:

Uji Validitas dan Reliabilitas


Sebagian pembaca mungkin bertanya-tanya selama ini, apa sih perbedaan antara uji validitas dan
reliabilitas? keduanya adalah dua hal yang benar-benar berbeda, namun saling melengkapi satu sama
lain. Keduanya perlu dilakukan dengan tujuan agar alat ukur yang kita gunakan dapat menghasilkan data
yang benar-benar dapat digunakan untuk menjawab permasalahan penelitian.

Alat ukur yang seperti itu, haruslah memenuhi kriteria, yaitu valid dan reliabel. Valid berarti sahih atau
tepat apa yang diukur sedangkan reliabel adalah handal, yaitu digunakan kapan saja dan dimana saja
maka hasilnya tetaplah sama.
Pada prakteknya, sebuah item soal dalam sebuah alat ukur haruslah valid terlebih dahulu, baru
kemudian diuji kehandalannnya. Jadi dapat dimaknai, bahwa: soal yang valid belum tentu reliabel.
Sedangkan soal yang reliabel, maka pastilah sudah valid. Demikian kiranya perbedaan uji validitas dan
reliabilitas.

Bagi anda yang ingin mencari referensi uji validitas butir, silahkan baca artikel kami yang berjudul:
Tutorial Uji Validitas Instrumen dengan SPSS. Dalam artikel tersebut dijelaskan langkah demi langkah
atau step by step tutorial melakukan analisis atau uji validitas butir, baik menggunakan pearson product
moment ataupun corrected item to total correlation.

Manfaat Uji Validitas Instrumen


Kegunaan uji validitas adalah untuk daya ketepatan mengukur:

 Segi tes sebagai suatu totalitas


 Segi item tes
Jenis Validitas Instrumen
Validitas Tes terbagi jadi 2:

 Logika
 Empirik.
Logika
Macam-Macam Logika:

 Isi : untuk menguji apa tes ini representatif atau tidak (untuk sampel, populasi untuk penelitian)
 Konstruksi : diteliti dari segi susunan dan rekaan aspek: kognitif, afektif, dan psikomotor.
Empirik
(Didasarkan pada keadaan di lapangan)

Macam-macam Empirik:

 Ramalan: suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah dapat dengan
secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa
mendatang. Contoh : penerimaan mahasiswa baru.
 Bandingan: tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu
menunjukkan adanya hubungan searah antara tes yang pertama dan kedua (validitas
sekarang/pengalaman).
Rumus Uji Validitas
Ada beberapa teknik atau rumus uji validitas yang dapat anda gunakan. Dibawah ini akan kami jelaskan
beberapa diantaranya.

Teknik pertama dan populer yang digunakan adalah teknik Korelasi Product Moment yang dikemukakan
oleh Pearson.
Rumus korelasi Product Moment ada 2 :

 Korelasi Product moment dengan Simpangan,


 Korelasi Product moment dengan angka kasar

Rumus Pearson dengan Simpangan

Rumus Pearson dengan Angka Kasar

Persiapan Untuk Mencari Validitas Tes dengan Simpangan:

Dimasukkan ke rumus:

Persiapan Untuk Mencari Validitas Tes dengan angka kasar:


Bila dilihat pada kedua hitungan diatas terdapat perbedaan 0,003 lebih besar pada simpangan ini wajar
karena adanya pembulatan.

Koefisien Korelasi Dalam Uji Validitas


Koefisien Korelasi adalah sebagai berikut:

 Antara 0,800 sampai dengan 1,00 = sangat tinggi


 Antara 0,600 sampai dengan 0,800 = tinggi
 Antara 0,400 sampai dengan 0,600 = cukup
 Antara 0,200 sampai dengan 0,400 = rendah
 Antara 0,00 sampai dengan 0,200 = sangat rendah
Korelasi positif menunjukkan adanya hubungan sejajar antara 2 hal:

Misal:

IPA :2357432

Matematika : 4 5 6 8 5 4 3

Kondisi nilai Matematika sejajar dengan IPA karena naik dan turunnya nilai Matematika mengikuti naik
dan turunnya nilai IPA.

Korelasi Negatif menunjukkan adanya hubungan kebalikan antara dua hal:

Bahasa Indonesia dengan Matematika


Bahasa Indonesia : 5 6 8 4 3 2

Matematika :875123

Koefisien korelasi terdapat antara -1,00 sampai +1,00. karena dalam perhitungan sering dilakukan
pembulatan angka yang didapatkan 1,00

Penafsiran Harga Koefisien Korelasi Pearson Product Moment


Ada 2 cara yaitu :

 Dengan melihat harga r dan diinterprestasikan misalnya korelasi Tinggi, Cukup dan sebagainya.
 Dengan mengkonsultasikan ke tabel harga kritik r product moment sehingga dapat diketahui
signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil dari harga kritik dalam tabel, maka
korelasi tersebut tidak signifikan. Begitu juga arti sebaliknya.
Tabel analisis item Untuk Perhitungan Uji Validitas Item atau validitas butir.

Untuk menghitung validitas item nomor 6, dibuat terlebih dahulu tabel persiapannya sebagai berikut:
Dimasukkan ke Korelasi Product Moment dengan rumus angka kasar:

Contoh Hitung Uji Validitas Pearson Produk Momen

Koefisien validitas item nomor 6 adalah 0,421.Validitas items tersebut kurang meyakinkan, validitas
tidak tinggi.

Koefisien Korelasi Biserial


Apabila item memili skor 1 dan 0 saja, bisa menggunakan Koefisien Korelasi Biserial.

Responden No.3 memiliki skor total hanya 4, sedangkan No.2 dan No. 4 memiliki nilai yang sama yaitu 5.

Rumus:

Keterangan :

γpbi = koefisien korelasi biserial


Mp = rerata skor dari subyek yang menjawab betul bagi item yang dicari validitasnya

Mt = rerata skor total

St = standar deviasi dari skor total

p = proporsi siswa yang menjawab benar

Perhitungan Mp dari tiap butir soal 1 sd 10:


Menghitung korelasi rpbi

Demikian sudah dijelaskan secara singkat tentang tutorial uji validitas. Selanjutnya silahkan baca artikel
kami yang berjudul Tutorial Uji Validitas Instrumen dengan SPSS, Semoga bermanfaat

Anda mungkin juga menyukai