Anda di halaman 1dari 34

MAKALAH

ASSESMEN DAN EVALUASI PEMBELAJARAN

“ANALISI VALIDITAS ISI, VALIDITAS EMPIRIS DAN RELIAIBILITAS”

DISUSUN OLEH:

IDA AYU SATYAHARI INDRAYONI (1713071036)

GUSTI AYU KETUT KARUNIA DEWI (1713071043)

S1 PENDIDIKAN IPA

JURUSAN FISIKA DAN PENGAJARAN IPA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS PENDIDIKAN GANESHA

SINGARAJA

2019
KATA PENGANTAR

Puji syukur kami panjatkan ke hadirat Tuhan Yang Maha Esa, karena berkat rahmat Nya
kami dapat menyelesaikan makalah yang berjudul “Analisis Validitas Isi, Validitas Empiris dan
Realibilitas”. Makalah ini disusun guna memenuhi tugas matakuliah Asesmen dan Evaluasi
Pembelajaran Jurusan Fisika dan Pengajaran IPA di Fakultas Matematika dan Ilmu Pengetahuan
Alam. Kami menyadari bahwa dalam proses penyelesaian makalah ini tidak terlepas dari peran
serta dari berbagai pihak, khususnya penulis dan berbagai sumber referensi yang telah mendukung
dalam penyusunan makalah ini.

Maka itu dalam kesempatan ini, kami ingin menyampaikan terimakasih kepada semua
pihak yang telah membantu dan berkontribusi dalam menyelesaikan penulisan makalah ini. Dalam
penulisan makalah ini, kami menyadari bahwa masih terdapat banyak kekurangan dan jauh dari
kesempurnaan sehingga kritik dan saran yang membangun sangat kami harapkan. Kami berharap
Semoga tulisan ini dapat bermanfaat bagi para pembaca.

Singaraja , 25 Oktober 2019

Penulis
DAFTAR ISI

KATA PENGANTAR ....................................................................................................... ii

DAFTAR ISI...................................................................................................................... iii

BAB I PENDAHULUAN .................................................................................................. 1

1.1 LATAR BELAKANG .................................................................................................. 1


1.2 RUMUSAN MASALAH .............................................................................................. 1
1.3 TUJUAN ....................................................................................................................... 2
1.4 MANFAAT ................................................................................................................... 2

BAB II PEMBAHASAN ................................................................................................... 3

2.1 PENGERTIAN VALIDITAS DAN REABILITAS ..................................................... 3


2.2 CARA MENGHITUNG VALIDITAS ......................................................................... 7
2.3 CARA MENCARI BESARNYA VALIDITAS ........................................................... 9

BAB II PENUTUP ............................................................................................................ 18

3.1 KESIMPULAN ............................................................................................................. 18


3.2 SARAN ......................................................................................................................... 19

DAFTAR PUSTAKA
BAB I

PENDAHULUAN

1.1 LATAR BELAKANG


Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan evaluasi sering
dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga hasil pengukuran yang
diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur. Instrumen ini memang
harus memiliki akurasi ketika digunakan. Konsisten dan stabil dalam arti tidak mengalami
perubahan dari waktu pengukuran satu ke pengukuran yang lain.
Data yang kurang memiliki validitas , akan menghasilkan kesimpulan yang bisa, kurang
sesuai dengan yang seharusnya, dan bahkan bisa saja bertentangan dengan kelaziman. Untuk
membuat alat ukur instrumen itu, diperlukan kajian teori, pendapat para ahli serta
pengalaman-pengalaman yang kadangkala diperlukan bila definisi operasional variabelnya
tidak kita temukan dalam teori. Alat ukur atau instrumen yang akan disusun itu tentu saja
harus memiliki validitas , agar data yang diperoleh dari alat ukur itu bisa reliabel, valid dan
disebut dengan validitas.
Validitas adalah kualitas yang menunjukkan hubungan antara suatu pengukuran
(diagnosis) dengan arti atau tujuan kriteria belajar atau tingkah laku. Keandalan adalah kualitas
yang menunjukkan kemantapan (consistency) ekuivalensi atau stabilitas suatu pengukuran
yang dilakukan. Objektivitas adalah kualitas yang menunjukkan identitas atau kesamaan dari
skor-skor atau diagnosis-diagnosis yang diperoleh dari data yang sama dari penskor-penskor
kompeten yang sama. Kepraktisan adalah suatu kualitas yang menunjukkan kemungkinan
dapat dijalankannya suatu kegunaan umum dari suatu teknik penilaian. Dalam pembicaraan ini
akan dibahas lebih lanjut dan lebih rinci mengenai validitas itu sendiri

1.2 RUMUSAN MASALAH


Berdasarkan latar belakang di atas, dapat dirumuskan beberapa rumusan masalah, yaitu:
1. Bagaimana pengertian validitas?
2. Bagaimana pengertian reabilitas?
3. Bagaimanakah analisis validitas isi?
4. Bagaimanakah analisis validitas empiris?
5. Bagaimakaha analisis reabilitas?
1.3 TUJUAN
Berdasarkan rumusan masalah yang telah dirumuskan tersebut, tujuan dari pembuatan
makalah ini, yaitu:
1. Agar mahasiswa mampu membedakan antara validitas dengan reabilitas
2. Agar mahasiswa mampu mengetahui analisis validitas isi
3. Agar mahasiswa mampu mengetahui validitas empiris
4. Agar mahasiswa mempu mengetahui analisis reabilitas

1.4 MANFAAT

Manfaat yang bisa diperoleh dari penulisan makalah ini, yaitu sebagai berikut:

1. Bagi Penulis
Penulisan makalah ini memberikan manfaat bagi penulis untuk dapat memahami
lebih banyak tentang validitas dan reabilitas serta analisis validitas isi, validitas empirsis
dan analisis reabilitas yang penulis miliki tersebut, sehingga penulis dapat menyampaikan
informasi yang lebih jelas mengenai materi tersebut kepada pembaca dan masyarakat
umum yang terkadang masih memiliki pengetahuan yang minim.
2. Bagi Pembaca
Penulisan makalah ini memberikan manfaat bagi pembaca yang membaca makalah ini untuk
dapat menambah wawasan mengenai tentang validitas dan reabilitas dalam pembelajaran, serta
analisis validitas isi, validitas empirsis dan analisis reabilitas. Selain itu, makalah ini juga dapat
digunakan sebagai referensi oleh pembaca dalam pembuatan makalah yang sejenis.
BAB II

PEMBAHASAN

2.1 PENGERTIAN VALIDITAS DAN REABILITAS

2.1.1 Pengertian Validitas

Validitas berasal dari kata ’’validity’’ yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur
dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi
ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran tersebut.
Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes
yang memiliki validitas rendah (Azwar, 1997).
Validitas adalah ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi, jadi
jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa istrumen
tersebut valid, karena dapat memberikan gambaran tetang data secara benar sesuai dengan
kenyataan atau keadaan sesungguhnya jadi jika data yang dihasilkan oleh instrument benar atau
valid, sesuai kenyataan, maka instrument yang digunakan tersebut juga valid.
Prinsip validitas adalah pengukuran atau pengamatan yang berarti prinsip keandalan
instrumen dalam mengumpulkan data. Instrumen harus dapat mengukur apa yang seharusnya
diukur. Jadi validitas lebih menekankan pada alat pengukuran atau pengamatan.
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila
instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan
maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan
menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung
pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat.
Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil
pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi.
Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai
variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk
mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A’ atau B (Azwar: 1997).
2.1.2 Macam-macam Validitas

Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.

a. Validitas Logis
istilah ’’validitas logis’’ mengandung kata ’’logis’’ berasal dari kata ’’logika’’ yang berarti
penalaran. Dengan makna demikian maka validitas logis untuk sebuah instrumen evaluasi
menunjuk pada kondisi bagi sebuah instrument yang memenuhi persyaratan valid berdasarkan
hasil penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrument yang bersangkutan
sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan
tugas lain misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan mengarang,
tentu secara logis karangannya sudah baik. Dari penjelasan tersebut kita dapat memahami bahwa
validitas logis dapat dicapai apabila instrument disusun mengikuti ketentuan yang ada. Dengan
demikian dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi langsung
diperoleh sesudah instrument tersebut selesai disusun. Ada dua macam validitas logis yang dapat
dicapai oleh sebuah instrument, yaitu: validitas isi dan validitas konstrak.

b. Validitas Empiris
istilah validitas empiris memuat kata empiris yang artinya pengalaman. Sebuah instrumen dapat
dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-
hari, seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa
orang tersebut memang jujur. Contoh lain, seseorang dikatakan kreatif apabila dari pengalaman
dibuktikan bahwa orang tersebut sudah banyak menghasilkan ide-ide baru yang diakui bebeda dari
hal-hal yang sudah ada. Dari penjelasan contoh-contoh tersebut diketahui bahwa validitas empiris
dapat diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas
logis, tetapi harus dibuktikan melalui pengalaman. Ada dua macam validitas empiris, yakni
validitas ada sekarang dan validitas prediksi.
Dari uraiaan diatas ada dua jenis validitas, yakni validitas logis yang ada dua macam, dan validitas
empiris yang juga ada dua macam, maka secara keseluruhan kita mengenal adanya empat validitas,
yaitu:

1) Validitas Isi (Content Validity)


Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang
sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera
dalam kurikulum maka validitas isi ini sering juga disebut validitas kurikuler. Validitas isi dapat
diusahakan tercapainya sejak saat penyusunan dengan cara memerinci materi kurikulum atau
materi buku pelajaran.
Misalnya: tes bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut,
pengukuran motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan konsep
motivasi, dan demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan validitas
isi terutama berkaitan dengan proses analisis logis, dengan dasar ini dia berpendapat bahwa
validitas isi berbeda dengan validitas rupa yang kurang menggunakan analisis logis yang
sistematis, lebih lanjut dia menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya
juga mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
2) Validitas konstruksi (Construct Validity)
Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang
berkaitan dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang
diukurnya. Sebuah tes dikatakan memeiliki validitas konstruksi apabila butir-butir soal yang
membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam tujuan
instruksional khusus. Dengan kata lain jika butir-butir soal mengukur aspek berpikir tersebut sudah
sesuai dengan aspek berpikir yang menjadi tujuan instrusional.
Contoh: siswa dapat membandingkan antara efek biologis dan efek psikologis, maka butir
soal pada tes merupakan perintah agar siswa membedakan antara dua efek tersebut.
Konstruksi dalam pengertian ini bukanlah susunan seperti yang sering dijumpai dalam teknik,
tetapi merupakan rekaan psikologis yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa. Seperti
halnya validitas isi, validitas konstruksi dapat diketahui dengan cara memerinci dan memasangkan
setiap butir soal dengan setiap aspek dan tujuan instrusional khusus. Pengajarannya berdasarkan
logika, bukan pengalamannya.

3) Validitas bandingan/ ’’ada sekarang’’ (Concurrent Validity)


Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki
validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah ’’sesuai’’ tentu ada dua
hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman
selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada
(ada sekarang).
Contoh: seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau
belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki. Misal
nilai ulangan harian atau nilai sumatif yang lalu.

4) Validitas ramalan/ prediksi (Predictive validity)


Memprediksi artinya meramal, dengan meramal selalu menganai hal yang akan datang
yang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila
mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang.
Misalanya tes masuk keperguruan tinggi adalah sebuah tes yang diperkirakan mampu meramalkan
keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon yang tersaring
berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti kuliah.
Jika nilai tesnya tinggi tentu menjamin keberhsilannya kelak. Sebaliknya seorang calon dikatakan
tidak lulus tes karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu
mengikuti perkuliahan yang akan datang.

2.1.3 Pengertian Reabilitas

Menurut arti kata reliabel berarti dapat dipercaya. Berdasarkan arti kata tersebut, maka
instrumen yang reliabel adalah instrumen yang hasil pengukurannya dapat dipecaya. Salah satu
keriteria instrumen yang dapat dipercaya jika instrumen tersebut digunakan secara berulang-ulang,
hasil pengukurannya tetap. Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat
dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang
tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau
seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti.
Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabilaa sudah memahami konsep
validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan diperolehnya data
yang valid, sesuai dengan kenyataan. Dalam hal reliabilitas ini tuntutannya tidak jauh berbeda.
Jika validitas terkait dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data
dari kenyataan, artinya bahwa data tersebut benar, maka konsep reliabilitas terkait dengan
pemotretan berkali-kali. Instrumen yang baik adalah yang dapat dengan ajeg memberikan data
data yang sesuai dengan kenyataan. Yang sering dikatakan kurang tepat adalah adanya pendapat
bahwa “ajeg” atau “tetap” diartikan sebagai “sama”. Dalam evaluasi ini tidak demikian. Ajeg atau
tetap tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan A mula-mula
berada lebih rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang, A juga berada
lebih rendah dari B. itulah yang dikatan ajeg atau tetap, yaitu sama dalam kedudukan siswa di
antara anggota kelompok yang lain. Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan
itulah menunjukkan tingginya reliabilitas instrumen.
Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-kawan menyatakan bahwa
persyaratan bagi tes, yaitu vasiliditas dan reliabilitas ini penting. Dalam hal ini vasiliditas lebih
penting, dan reabilitas ini perlu, karena menyongkong terbentuknya vasiliditas. Sebuah tes
mungkin reliabel tetapi tidak valid. Sebaliknya, sebuah tes yang valid biasanya reliabel.
Beberapa hal yang mempengaruhi hasil tes banyak sekali. Namun secara garis besar dapat
dikelompokkan menjadi 3 hal, yaitu:

a. Hal yang berhubungan dengan tes itu sediri, yaitu panjang tes dan kualitas butir-butir
soalnya.

Tes yang terdiri dari banyaknya butir, tentu saja lebih vali dibantingkan dengan tes yang hanya
terdiri dari beberapa butir soal. Tinggi rendahnya validitas menunjukkan tinggi rendahnya
reliabilitas tes. Dengan demikian maka semakin panjang tes. Maka reliabilitas berhubung dengan
penambahan banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh Spearman
dan Brown sehingga terkenal dengan rumus Spearman-Brown. Rumusnya adalah:

nr
rnn =
1 + (n − 1)r

Dimana:
rnn = besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru
n = berapa kali butir-butir soal itu ditambah
r = besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah.
b. Hal yang berhubungan dengan tercoba (testee)

Suatu tes yang dicobakan dengan kepada kelompok yang terdiri dari banyak siswa akan
mencerminkan keragaman hasil yang menggambarkan besar-kecilnya reliabilitas tes. Tes yang
dicobakan bukan kelompok terpilih, akan menunjukkan reliabilitas yang lebih besar daripada yang
dicobakan pada kelompok tertentu yang diambil secara dipilih.

c. Hal yang berhubungan dengan penyelenggaraan tes

Faktor penyelenggaraan tes yang bersifat administratif, sangat menentukan hasil tes.
Contohnya yaitu:
1) Petunjuk yang diberikan sebelum tes mulai, akan memberikan ketenangan kepada para tes-
tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak terdapat
pertanyaan. Ketenangan ini tentu saja akan berpengaruh terhadap hasil tes.
2) Pengawas yang tertib akan mempengaruhi hasil diberikan oleh siswa terhadap tes. Bagi
siswa tertentu adanya pengawas yang terlalu ketat menyebabkan rasa jengkel dan tidak
dapat dengan leluasa mengerjakan tes.
3) Suasana lingkungan dan tempat tes ( duduk tidak teratur, suasana sekelilingnya ramai, dan
sebagainya) akan mempengaruhi hasil tes.
Adanya hal-hal yang mempengaruhi tes ini, secara tidak langsung akan mempengaruhi reliabilitas
soal tes.

2.2 CARA MENGHITUNG VALIDITAS

 Validitas Isi (Content Validity)

Menurut Suharsini Arikunto (2013 : 82 ) sebuah tes dikatakan memiliki validitas isi apabila
mengkur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh
karena itu materi yang diajarkan tertera dalam kurikulum maka validitas isi sering disebut juga
validitas kurikuler.

Validitas isi dilakukan untuk memastikan apakah isi kuesioner sudah sesuai dan relevan dengan
tujuan study. Validitas isi menunjukkan isi yang mencerminkan rangkaian lengkap terkait dengan
atribut yang diteliti dan biasanya dilakukan oleh tujuh orang ahli atau lebih (DeVon et al
2007).Perkiraan validitas isi dari tes diperoleh dengan menyeluruh dan sistematis dalam
memeriksa item tes untuk menentukan sejauh mana mereka mencerminkan dan tidak
mencerminkan domain konten (Kowsalya, Venkat Lakshmi, dan Suresh, 2012)

Validitas isi terdiri dari dua bagian, yaitu validitas tampang dan validitas logis.

 Validitas tampang/muka (face validity) merupakan validitas isi yang paling dasar dan sangat
minimum. Validitas isi menunjukkan bahwa aitem-aitem yang dimaksudkan untuk mengukur
sebuah konsep, memberikan kesan mampu mengungkap konsep yang hendak di ukur (Sekaran,
2006). Tidak berbeda dengan penjelasan sebelumnya, Groth-Marnat, (2009) menjelaskan bahwa
validitas isi (content validity) dengan validitas muka (face validity) memiliki perbedaan dan tidak
sinonim. Validitas isi menyangkut judgement yang dibuat oleh para ahli, sedangkan validitas
muka/tampang menyangkut judgement dari pengguna test. Sejalan dengan itu, Gregory (1992)
menjelaskan bahwa validitas tampang hanya sekedar tahap penerimaan orang pada umumnya
terhadap fungsi pengukuran tes, serta tidak berhubungan dengan statistic validitas seperti
koefisien atau indeks,
 Analisis lanjutan setelah validitas tampang adalah melalui validitas logis yaitu prosedur
penilaian kelayakan isi item melalui penilaian yang bersifat kualitatif oleh panel ahli. Prosedur
ini selanjutnya menghasilkan validitas logis atau merupakan tinggi rendahnya kesepakatan di
antara para ahli yang menilai kelayakan suatu skala pengukuran (Azwar, 2012).

Gambar Jenis Uji Validitas

Sekali lagi diulangi bahwa sebuah tes dikatakan memiliki validitas jika hasilnya sesuai
dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium.
Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik kolerasi product moment
yang dikemukakan oleh Pearson.

Rumus kolerasi product moment ada dua macam, yaitu :

a. Korelasi product moment dengan simpangan, dan


b. Korelasi product moment dengan angka dasar.

Rumus korelasi product moment dengan simpangan :


Contoh perhitungan:Misalnya akan menghitung validitas tes prestasi belajar matematika. Sebagai
kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi kode X dan rata-rata
nilai harian diberi kode Y. Kemudian dibuat tabel persiapan seperti berikut.
Jika diperbandingkan dengan validitas soal yang dihitung dengan rumus simpangan,
ternyata terdapat perbedaan sebesar 0,003, lebih besar yang dihitung dengan rumus simpangan.
Hal ini wajar karena dalam mengerjakan perkalian dan penjumlahan jika diperoleh 3 atau angka
di belakang koma dilakukan pembulatan ke atas. Perbedaan ini sangat kecil sehingga dapat
diabaikan.

2.3 CARA-CARA MENCARI BESARNYA REABILITAS

Reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk
mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik
juga menggunakan rumus kolerasi produk moment untuk mengetahui validitas, kesejajaran hasil
dalam reliabilitas tes.
Kriteria yang digunakan untuk mengetahui ketetapan ada yang beradda di luar tes (consistency
external) dan pada tes itu sendiri (consistency internal).

a. Metode bentuk paralel (equivalent)

Tes paralel atau akuicalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat
kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa inggris disebut
alternate-forms method (parallel forms).
Dengan metode bentuk paralel ini, dua buah tes yang paralel, misalnya tes Matematika Seri A
yang akan dicari reliabilitas dan Seri B diteskan kepada sekolompok siswa yang sama, hasilnya
dikorelasi. Koefisien korelasi dari kedua hasil tes inilah menunjukkan koefisien reliabilitas tes Seri
A. Jika koefisiennya tinggi maka tes tersebut sudah reliabel dan dapat digunakan sebagai alat
pengetes yang terandalkan.
Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan dua buah tes, dan
masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang yang
menyebutkan sebagai double test-double-trial method. Penggunaan metode ini baik karena siswa
dihadapkan kepada dua macam tes sehingga tidak ada faktor “masih ingat soalnya” yang dalam
evaluasi disebut dengan adanya practise-effect dan carry-over effect, artinya ada faktor yang
dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun
dua seri tes. Selain itu harus tersedia waktu yang harus untuk mencobakan dua kali tes.

b. Metode tes ulang (tes-retest method)

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam
menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua
kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut denan
single-test-double-trial method. Kemudian hari dari kedua kali tes tersebut dihitung korelasinya.
Untuk tes yang banyak mengungkapkan pengetahuan (ingatan) dan pemahaman, cara ini
kurang, karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena itu, tenggang waktu
antara pemberian tes pertama dengan kedua menjadi permasalahan tersendiri. Sebaliknya kalau
tenggang waktu terlalu sempit, siswa banyak mengingat materi. Sebaliknya kalau tenggang waktu
terlalu lama, maka faktor-faktor sudah mempelajari sesuatu. Tentu saja faktor-faktor ini akan ini
berpengaruh pula terhadap reliabilitas.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes pertama. Hal ini
tidak mengapa karena pengetes harus sadar akan adanya practice effect dan carry over effect. Yang
penting ditunjukkan oleh koefisien korelasi yang tinggi.

Contoh:
Siswa Tes Pertama Tes Kedua
Skor Ranking Skor Ranking

A 15 3 20 3

B 20 1 25 1

C 9 5 15 5

D 18 2 23 2

E 12 4 18 4

Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh semua siswa. Metode ini
juga disebut korelasi diri sendiri karena mengkorelasikan hasil dari tes yang sama.

c. Metode belah dua atau split-half method

Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes dua kali percobaan
diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes
hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga single-test-
single-trial method.
Berbeda dengan metode pertama dan kedua yang setelah di kemukakan koefisien korelasi
langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat
demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui reliabilitas
separo tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-Brown
sebagai berikut:

2 r11
22
rII =
1 + r11
22

Dimana:
r11 = korelasi antara skor-skor setiap belahan tes.
22
rII = koefisien reliabilitas yang sudah disesuaikan.

Contoh:

Korelasi antara belahan tes = 0,60


2 x 0,60 1,20
Maka reliabilitas tes = = = 0,75
1+0,60 1,60
Banyak pemakaian metode ini salah membelah hasil tes pada waktu, menganalisis. Yang
mereka lakukan adalah mengelompokkan hasil separo subjek peserta tes dan separo yang lain
kemudian hasil kedua kelompok ini dikorelasikan. Yang benar adalah membelah item atau butir
soal. Tidak akan keliru kiranya bagi pemakaian metode ini harus ingat bahwa banyaknya butir soal
harus genap supaya dapat dibelah.

Ada dua cara membelah butir soal ini yaitu:


1) Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut belahan ganjil-
genap.
2) Membelah atas item-item awal item-item akhir yaitu jumlah pada nomor-nomor awal dan
separo pada nomor-nomor akhir yang selanjutnya disebut belahan awal-akhir.

Contoh perhitungan reliabilitas dengan metode belah dua


Langkah pertama yang harus dilakukan adalah mengadakan analisis butir soal yang lebih
terkenal dengan nama analisis item. Item yang dapat dijawab dengan benar diberi skor dan bagi
yang salah diberi skor 0. Skor-skor untuk seluruh subjek dan seluruh item ini diterakan dalam tabel
analisis sebagai berikut:

Nomor item 1, 3, 2, 4, 1,2,3 6, 7,


5, 7, 6. 8, , 4,5 8, 9,
No 9 10, 10
Siswa
.
1 2 3 4 5 6 7 8 9 10 Skor Ganj Gen Awal Akhi
total il ap r

1 Hartati 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5

2 Yoyok 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3

3 Oktaf 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3

4 Wendi 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2

5 Diana 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1

6 Paul 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1

7 Susan 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2
a

8 Helen 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5
1. Pembelahan ganjil-genap

Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil-genap adalah sebagai berikut:

No. Nama Item ganjil Item genap

(1, 3, 5, 7, 9) (2, 4, 6, 8, 10)

(X) (Y)

1 Hartati 5 3

2 Yoyok 3 2

3 Oktaf 0 4

4 Wendi 3 2

5 Diana 3 3

6 Paul 4 0

7 Susana 4 3

8 Helen 3 5

Kelanjutnya dari tabel ini adalah menhitung dengan rumus kolerasi product moment. Dengan
menggunakan kalkulator dikethui bahwa:
∑ 𝑋 = 25 ∑ 𝑋2 = 93 ∑ 𝑋𝑌 = 63
2
∑ 𝑋 = 22 ∑ 𝑌 = 76

Setelah dihitung dengan rumus kolerasi product moment dengan angka kasar diketahui bahwa
rxy = -0,3786. Harga tersebut baru menunjukkan reliabilitas separo tes. Oleh karena itu, rxy untuk
belahan ini disebut dengan istilah r1/2 ½ atau rgg singkatan dari rganjil-genap. Untuk mencari reliabilitas
seluruh tes digunakan rumus Spearman-Brown yang rumusnya telah dikemukakan di depan. Jika
koefisien reliabilitas separo tes ini dimasukkan ke dalam rumus hitungannya yaitu:

2 r11
22
RI I = 1+r11
22
2 𝑋−0,3786
= 1+(−0,3786)
−0,7572
= 1,3786
= -0,5493
2. Pembelahan awal-akhir

Dengan data yang tertera pada Tabel analisis item tes Matematika diketahui jumlah skor
belahan awal-akhir sebagai berikut.

No. Nama Item ganjil Item genap

(1, 3, 5, 7, 9) (2, 4, 6, 8, 10)

(X) (Y)

1 Hartati 5 3

2 Yoyok 3 2

3 Oktaf 0 4

4 Wendi 3 2

5 Diana 3 3

6 Paul 4 0

7 Susana 4 3

8 Helen 3 5

Seperti hanya pada waktu menghitung dengan belahan ganjil-genap maka kelanjutannya adalah
menghitung dengan rumus korelasi product moment. Dengan menggunakan kalkulator diketahui:

∑ 𝑋 = 25 ∑ 𝑋2 = 91 ∑ 𝑋𝑌 = 63
∑ 𝑋 = 22 ∑ 𝑌2 = 78

Setelah dimasukkan ke dalam rumus korelasi product moment dengan kasar diperoleh r1/2 ½ = -
0,3831. Dengan rumus Spearman-Brown diperoleh rI I = -0,5538.
Selain menggunakan rumus korelasi product moment, dua orang ahli mengajukan rumus lain.
Seorang bernama Flanagan menemukan rumus yang perhitungannya menggunakan belah dua
ganjil-genap, dan seorang lagi bernama Rulon yang rumusnya diterapkan pada data belahan awal-
akhir.
3. Penggunaan rumus Flanagan

Rumus :
𝑆12 + 𝑆22
RI I = 2(1- )
𝑆𝑡2
Dimana:
RI I = reliabilitas
𝑆12 = varians belahan pertama (1) yang dalam hal ini varians skor item ganjil
𝑆22 = varians belahan kedua (2) yaitu varians skor item genap
𝑆𝑡2 = varians total yaitu varians skor total.

Secara sederhana dapat dipahami bahwa varians adalah standar deviasi kuadrat. Dengan
demikian bagi peminat yang menghitung dengan kalkulator statistik varians ini diperoleh dengan
mengkuadratkan standar deviasi. Untuk mereka yang tidak menggunakan kalkulator statistik maka
varians dapat dicari dengn rumus sebagai berikut :

(∑ 𝑋)2
∑ 𝑋2 –
2 𝑁
S = 𝑁

Standar Deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB). Namun
huruf S (B besar) juga dapat dikatakan sudah menyebut standar deviasi. Bagi yang berminat
mencari S dulu untuk mencari varians, dapat menggunakan rumus S, yaitu:
√∑ 𝑋 2
S= 𝑁

S = standar deviasi
X = Simpangan X dari 𝑥̅ , yang dicari dari x-𝑥̅ ,
𝑆 2 = varians, selalu dituliskan dalam bentuk kuadrat, karena standar deviasi kuadrat
N = Banyak subjek pengikut tes

Berdasarkan data tabel belahan ganjil-genap perhitungannya adalah sebagai berikut:


Dimasukkan ke dalam rumus diperoleh demikian:

1,859+1,937
RI I = 2(1- )
2,359
= -2(1-1,609)
= - 1,218

4. Penggunaan Rumus Rulon

Rumus :
𝑆2
RI I = 1- 𝑆𝑑2
𝑡
Dimana :
𝑆𝑑2 = varians beda
d = difference yaitu perbedaan antara skor belahan pertama (awal) dengan skor
belahan kedua (akhir)

untuk memperjelas keterangan maka tabel belahan awal-akhir, yaitu:


No. Nama Awal Akhir d
1 Hartati 3 5 -2

2 Yoyok 2 3 -1

3 Oktaf 1 3 -2

4 Wendi 3 2 1

5 Diana 5 1 4

6 Paul 3 1 2

7 Susana 5 2 3

8 Helen 3 5 -2

∑𝑑 = 3
∑ 𝑑 2 = 43

Dari hitungan terdahulu diketahui:


Varians total = 2,75

𝟒𝟏,𝟖𝟕𝟓
= = 5, 234
𝟖

Dimasukkan ke dalam rumus Rulon


5,234
RI I = 1- 2,36
= 1-2,218
= - 1,218

Dari perhitungan dengan rumus Flahan maupun Rulon ternyata hasil sama, keduanya lebih
besar dari 1,00. Secara teoretik koefisien ini salah tetapi karena pembulatan-pembulatan dalam
perhitungan.
Salah satu syarat untuk danat menggunakan metode belah dua adalah bahwa banyaknya item
harus genap agar dapat dibelah. Syarat yang kedua item-item yang membentuk soal tes harus
homogen atau paling tidak setelah dibelah terdapat keseimbangan antara belahan pertama dengan
belahan kedua.
Untuk mengatasi kesulitan memenuhi persyaratan ini maka reliabilitas dapat divari dengan
rumus yang diketemukan oleh Kuder dan Richardson. Kedua orang ahli ini menemukan banyak
rumus yang diberi nomor. Rumus yang digunakan untuk mencari reliabilitas dan banyak
digunakan orang ada dua rumus yaitu rumus K-R.20 dan rumus K-R.21.

5. Penggunaan rumus K-R.20

Rumus :

Dimana :
rI I = reliabilitas tes secara keseluruhan
p = proporsi subjek yang menjawab item dengan benar
q = proporsi subjek yang menjawab item dengan salah (q=1-p)
∑ 𝑝𝑞 = jumlah hasil perkalian antara p dan q
n = banyaknya item
S = standar deviasi dari tes (standar deviasi adalah akar varians).

Dalam buku-buku lain n (n kecil) ini sering diganti dengan huruf k (k kecil), yang juga
melambangkan banyaknya item. Demikian juga haru S sebagai lambang standar deviasi, dituliskan
SB sebagai singkatan dari kata Simpangan Baku. Maka rumus K-R.20 menjadi:

Penggunaan huruf k ini juga berlaku bagi rumus-rumus lain yang melibatkan banyaknya item
tes, misalnya K-R.21 dan rumus Al-pha. Untuk memberikan contoh perhitungan mencari
reliabilitas yang menggunakan rumus K-R.20 ini akan dibuatkan tabel analisis item yang lain.
TABEL PERHITUNGAN MENCARI REALIBILITAS
TES DENGAN RUMUS K-R.20

Nomor Item Skor


No. Nama
1 2 3 4 5 6 7 Total

1 Wardoyo 1 0 1 1 1 1 0 5

2 Benny 0 1 1 0 1 1 1 5

3 Hanafi 0 0 0 0 1 0 1 2

4 Rahmad 0 1 1 1 1 1 1 6

5 Tanti 1 0 0 0 1 0 0 2

6 Nadia 0 1 1 1 1 0 0 4

7 Tini 0 0 0 1 1 1 0 3

8 Budi 0 1 0 1 1 0 0 3

9 Daron 0 1 0 1 1 0 0 3

10 Yakob 0 0 0 1 1 0 0 2

Np 2 5 4 7 10 4 3 35

P 0,2 0,5 0,4 0,7 1 0,4 0,3

Q 0,8 0,5 0,6 0,3 0 0,6 0,7

pq 0,16 0,25 0,24 0,21 0 0,24 0,21 1,31

(𝑝𝑞)

Dimasukkan ke dalam rumus K-R.20

𝑛 𝑆 2 − ∑ 𝑝𝑞
RI I = (𝑛−1)( )
𝑆2
7 2
1,36 – 1,31
=6 x 1,362
S = 1,56
1,85−1,31
= 1,17 x 1,85
0,54
= 1,17 x 1,85
= 1,17 x 0,29 = 0,3415, dibulatkan 0,342

6. Penggunaan rumus K-R.21

Jika dibandingkan reliabilitas yang dihitung dengan K-R.20 dan K-R.21 lebih besar yang
ertama. Memang menggunakan rumus K-R.20 cenderung memberikan hasil yang lebih tinggi,
tetapi pekerjaannya lebih rumit.

7. Penggunaan rumus Hoyt

𝑉𝑠 𝑉𝑟−𝑉𝑠
rI I = 1- atau rI I =
𝑉𝑟 𝑉𝑟

dimana :
rI I = reliabilitas seluruh soal
Vr = Varians responden
Vs = Varians sisa

Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah sebagai berikut:
Langkah 1. Mencari jumlah kuadrat responden dengan rumus :
2
∑ 𝑋𝑡 2 (∑ 𝑋𝑡)
Jk(r) = -
𝑘 𝑘𝑥𝑁
Dimana :
Jk(r) = jumlah kuadrat responden
𝑥𝑡) = skor total tiap responden
k = banyaknya item
N = banyaknya responden atau subjek

Langkah 2. Mencari jumlah kuadrat item dengan rumus:


2
∑ 𝐵2 (∑ 𝑋𝑡)
Jk(i) = -
𝑁 𝑘𝑥𝑁

Dimana :
Jk(i) = jumlah kuadrat item
∑ 𝐵 2 = jumlah kuadrat jawab benar seluruhnya
(∑ 𝑋𝑡 )2 = kuadrat dari jumalh skor total

Langkah 3. Mencari jumlah kuadrat total dengan rumus:


(∑ 𝐵)(∑ 𝑆)
Jk(t) = (∑ 𝐵)+ (∑ 𝑆)

Dimana :
Jk(t) = jumlah kuadrat total
(∑ 𝐵) = jumlah jawab benar seluruh item
(∑ 𝑆) = jumlah jawab salah seluruh item

Langkah 4. Mencari jumlah kuadrat sisa, dengan rumus:


Jk(s) = Jk(t) - Jk(r) - J(i)

Langkah 5. Mencari varians responden dan varians sisa dengan tabel F

Dalam mencari varians ini diperlukan d.b (derajat kebebasan) dari masing-masing sumber
varians kemudian d.b ini digunakan sebagai penyebut terhadap setiap jumlah kuadrat untuk
memperoleh variansi.
d.b = banyaknya N setiap sumber variansi dikurangi 1
jumlah kuadrat
jadi Variansi =
d.b

Langkah 6. Memasukkan ke dalam rumus rI I =

Contoh perhitungan:
Dengan menggunakan tabel analisis item yang digunakan untuk mencari reliabilitas tes dengan
rumus K-R.20 dapat dicarikan reliabilitas dengan rumus Hoyt.

TABEL ANALISIS ITEM UNTUK


MENCARI RELIABILITAS DENGAN RUMUS HOYT.
Kuadrat
Skor total
No. Nama skor total
1 2 3 4 5 6 7 (x)
(x2)

1 Wardoyo 1 0 1 1 1 1 0 5 25

2 Benny 0 1 1 0 1 1 1 5 25

3 Hanafi 0 0 0 0 1 0 1 2 4

4 Rahmad 0 1 1 1 1 1 1 6 36

5 Tanti 1 0 0 0 1 0 0 2 4

6 Nadia 0 1 1 1 1 0 0 4 16

7 Tini 0 0 0 1 1 1 0 3 9

8 Budi 0 1 0 1 1 0 0 3 9

9 Daron 0 1 0 1 1 0 0 3 9

10 Yakob 0 0 0 1 1 0 0 2 4

Jumlah jawab 2 5 4 7 10 4 3 35 141


benar
Kuadrat 4 25 16 49 100 16 9 ∑ 𝑋𝑡 ∑ 𝑋𝑡 2
jumlah benar

Jumlah 219
kuadrat
jumlah jawab
benar

Jumlah jawab 8 5 6 3 0 6 7 35
salah

Berdasarkan tabel ini dapat dicari reliabilitas soal dengan rumus Hoyt melalui langkah-langkah
sebagai berikut:
2
∑ 𝑋𝑡 2 (∑ 𝑋𝑡)
Jk(r) = -
𝑘 𝑘𝑥𝑁
141 352
= −
7 7 𝑥 10
= 20,143 – 17,5
= 2,643
Langkah 5. Mencari varians responden dan varians sisa dengan tabel F

Untuk mencari d.b sisa, harus dicari d.b total terlebih dahulu baru dikurangi d.b responden dan d.b
item.
d.b total = k xN -1 +7 x 10 – 1 = 70 -1 = 69
d.b responden = N – 1 = 10 – 1 = 9
d.b item =k–1=7–1=6
d.b sisa = d.b total – d.b responden – d.b item
= 69-9-6 = 54

Langkah 6. Memasukkan ke dalam rumus


𝑉𝑠
RI I = 1- 𝑉𝑟
0,1936
= 1- = 1-0,658 + 0,342
0,294

1.3 Mencari Reliabilitas Tes Bentuk Uraian

Menilai soal bentuk uraian tidak dapat dilakukan dengan dinilai hanya benar dan saah. Sesuatu
butir soal uraian menghendaki gradualisasi penilaian. Bisa saja butir soal nomor 1 penilaian
terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi hanya 5, dan butir soal nomor 3
sampai 10, dan sebagainya.
Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan analisis butir soal
seperti halnya soal bentuk objektif. Skor untuk masing- masing butir soal dicantumkan pada kolom
item menurut apa adanya. Rumusan yang digunakan adalah rumus Alpha sebagai berikut:

Dimana :
rI I = reliabilitas yang dicari
2
∑ 𝜎1 = jumlah varians skor tiap-tiap item
𝜎1 2 = varians total
BAB III

PENUTUP

1.1 KESIMPULAN

Validitas berasal dari kata ’’validity’’ yang mempunyai arti sejauh mana ketepatan dan kecermatan
suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat
dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau
memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran tersebut. Tes yang
menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang
memiliki validitas rendah (Azwar, 1997).
Validitas adalah ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi, jadi
jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa istrumen
tersebut valid, karena dapat memberikan gambaran tetang data secara benar sesuai dengan
kenyataan atau keadaan sesungguhnya jadi jika data yang dihasilkan oleh instrument benar atau
valid, sesuai kenyataan, maka instrument yang digunakan tersebut juga valid.
Menurut arti kata reliabel berarti dapat dipercaya. Berdasarkan arti kata tersebut, maka instrumen
yang reliabel adalah instrumen yang hasil pengukurannya dapat dipecaya. Reliabilitas adalah
ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk mengetahui ketetapan ini
pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus
kolerasi produk moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.
Kriteria yang digunakan untuk mengetahui ketetapan ada yang beradda di luar tes (consistency
external) dan pada tes itu sendiri (consistency internal).

1.2 SARAN
Dalam penilaian validitas dan reabilitas hal utama yang harus diperhatikan yaitu
kejujuran dalam menilai pembelajaran. Karena dalam penilaian validitas dan reabilitas
akan mementukan kualitas sekolah dan memperlihatkan keberhasilan sekolah dalam
memenuhi standar siswa.
DAFTAR PUSTAKA

Arikunto, Suharsimi. 2005. Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta: Bumi

Aksara.

Drs. Asrul, M.Si, dkk. 2015. Evaluasi Pembelajaran. Medan: Perdana Mulya Sarana.

https://www.statistikian.com/2012/08/uji-validitas.html/amp

Anda mungkin juga menyukai