Anda di halaman 1dari 30

Uji validitas dan reliabilitas

Disusun oleh
Syamsidar s 181050801014
Indah lutfiah 181050801016
Muhammad ilham 181050801025
Jumura 181050801026

PROGRAM PASCASARJANA
UNIVERSITAS NEGERI MAKASSAR
PENDIDIKAN FISIKA
2018
KATA PENGANTAR

Assalamualaikum warahmatullahi wabarakatuh


Puji syukur saya panjatkan kehadirat Allah SWT karena atas berkat dan
rahmat-Nya sehingga kami dapat menyelesaikan tugas makaah yang diberikan oleh
Bapak selaku dosen mata kuliah Statistik.
Makalah ini dibuat dalam rangka menyelesaikan tugas yang diberikan oleh
dosen yang bersangkutan dan juga semoga makalah ini bermanfaat bagi kelompok
kami dan juga bagi para pembacanya.
Saya menyadari bahwa penyusunan makalah ini tidak luput dari
kesempurnaan sehingga saya mengharap kritik dan saran demi terbangunnya
makalah kami di kemudian kelak.
Waalaikumsalam warahmatullahi wabarakatuh

Makassar, September 2018

Penyusun
DAFTAR ISI
KATA PENGANTAR ........................................................................................................... i
DAFTAR ISI ...................................................................................................................... ii

BAB I PENDAHULUAN............................................................................................................... 1

Latar Belakang ....................................................................................................................... 1


Rumusan Masalah ................................................................................................................. 1
Tujuan ................................................................................................................................... 2
BAB II PEMBAHASAN ....................................................................................................... 2
Pengertian Validitas .............................................................................................................. 2
Macam-macam Validitas....................................................................................................... 3
Cara Mengetahui Validitas Alat Ukur .................................................................................... 7
Koefisien Korelasi Dalam Uji Validitas................................................................................... 8
Validitas Butir Soal atau Validitas Item ................................................................................. 9
Tes Terstandar Sebagai Kriterium Dalam Menentukan Validitas ....................................... 10
Validitas Faktor ................................................................................................................... 11
Kegunaan Validitas .............................................................................................................. 11
Arti Reliabilitas Bagi Sebuah Tes ......................................................................................... 12
Cara-cara Mencari Besarnya Reliabilitas............................................................................. 13
Mencari Reliabilitas Tes Bentuk Uraian .............................................................................. 17
Contoh Analisis Validasi Dan Reliabilitas ............................................................................ 18
BAB III PENUTUP ........................................................................................................... 24
Kesimpulan .......................................................................................................................... 24
Saran ................................................................................................................................... 25
Daftar Pustaka .............................................................................................................. 26
BAB I
PENDAHULUAN
A. Latar belakang
Persoalan alat ukur yang digunakan evaluator ketika melakukan
kegiatan evaluasi sering dihadapkan pada persoalan akurasi, konsisten dan
stabilitas sehingga hasil pengukuran yang diperoleh bisa mengukur dengan
akurat sesuatu yang sedang diukur. Instrumen ini memang harus memiliki
akurasi ketika digunakan. Konsisten dan stabil dalam arti tidak mengalami
perubahan dari waktu pengukuran satu ke pengukuran yang lain.
Data yang kurang memiliki validitas , akan menghasilkan kesimpulan
yang bisa, kurang sesuai dengan yang seharusnya, dan bahkan bisa saja
bertentangan dengan kelaziman. Untuk membuat alat ukur instrumen itu,
diperlukan kajian teori, pendapat para ahli serta pengalaman-pengalaman
yang kadangkala diperlukan bila definisi operasional variabelnya tidak kita
temukan dalam teori. Alat ukur atau instrumen yang akan disusun itu tentu saja
harus memiliki validitas , agar data yang diperoleh dari alat ukur itu bisa
reliabel, valid dan disebut dengan validitas.

B. Rumusan masalah
1. Apa pengertian dari validitas dan reliabilitas?
2. Apa saja pembagian validitas dan reliabilitas ?
3. Bagaimana ketetapan atau validitas dalam soal?

C. Tujuan
1. Mengetahui apa yang dimaksud dengan validitas dan reliabilitas.
2. Setelah mempelajari makalah ini mahasiswa menyimpulkan analisis
validitas.
3. Setelah mempelajari makalah ini peserta didik dapat menentukan
mana validitas yang benar.
BAB II
PEMBAHASAN
A. Validitas
1. Pengertian validitas
Validitas adalah satu ukuran yang menunjukkan tingkat kevalidan atau
kesahihan suatu instrmen. Suatu instrumen yang valid itu mempunyai validitas
yang tinggi dan sebaliknya bila tingkat validitasnya rendah maka instrumen
tersebut kurang valid. Sebuah instrumen dikatakan valid apabla mampu
mengukur apa yang hendak diukur/ diinginkan. Sebuah instrumen dikatan valid
apabila bisa mengungkap data dari variabel yang diteliti. Validitas instrumen
terbagi dalam validitas internal,(validitas konstruk /constract validity dan
validitas isi / contect validity) dan validitas eksternal / empiris.
Azwar (1987: 173) menyatakan bahwa validitas berasal dari kata validity
yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen
pengukur (tes) dalam melakukan fungsi ukurnya.
Suryabrata (2000: 41) menyatakan bahwa validitas tes pada dasarnya
menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat
kecermatan ukurnya sesuatu tes.
Sudjana (2004: 12) menyatakan bahwa validitas berkenaan dengan
ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-betul
menilai apa yang seharusnya dinilai.
Sudjana (2004: 149) menyatakan bahwa analisis validitas bertujuan
mengkaji kesahihan alat ukur atau soal dalam menilai apa yang seharusnya
diukur atau mengkaji ketepatan soal tes sebagai alat ukur.
Djaali (2000: 70) menyatakan bahwa konsep validitas tes dapat
dibedakan atas tiga macam yaitu validitas isi, validitas konstruk, dan validitas
empiris. Selanjutnya dinyatakan bahwa validitas empiris terbagi dua, yaitu
validitas internal dan validitas eksternal. Dalam tulisan ini yang dibahas hanya
validitas internal.
Validitas adalah ketepatan atau kecermatan suatu instrument dalam
pengukuran. Dalam pengujian instrument pengumpulan data, validitas
dibedakan menjadi validitas factor dan validitas item. Validitas factor diukur bila
item yang disusun menggunakan lebih dari satu faktor (antara factor satu
dengan yang lain ada kesamaan. Pengukuran validitas faktor ini dengan cara
mengkorelasikan antara skor faktor (penjumlahan item dalam satu faktor)
dengan skor total faktor (total keseluruhan faktor), sedangkan pengukuran
validitas item dengan cara mengkorelasikan antara skor item dengan skor total
item.
Validitas item ditunjukkan dengan adanya korelasi atau dukungan
terhadap item total (skor total). Bila kita menggunakan lebih dari satu faktor,
berarti pengujian validitas item dengan cara mengkorelasikan antara skor item
dengan skor factor, kemudian dilanjutkan mengkorelasikan antara item dengan
skor total factor (penjumlahan dari beberapa faktor). Dari hasil perhitungan
korelasi akan di dapat suatu koefisien korelasi yang digunakan untuk
mengukur tingkat validitas suatu item dan menentukan apakah suatu item
layak digunakan atau tidak. Dalam menentukan layak atau tidaknya suatu item
yang digunakan, biasanya digunakan uji signifikansi valid jika berkorelasi
signifikan terhadap skor total.

2. Macam-macam Validitas
a. Validitas logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika”
atau validitas logis sering juga disebut sebagai analisis kualitatif yaitu berupa
penalaran atau penelaahan. Dengan makna demikian maka validitas logis
untuk sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil
penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen yang
bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan
yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah
karangan, jika penulisan sudah mengikuti aturan mengarang, tentu secara
logis karangannya sudah baik. Berdasarkan penjelasan tersebut maka
instrumen yang sudah disusun berdasarkan teori penyusunan instrumen,
secara logis sudah valid. Dari penjelasan tersebut dapat dipahami bahwa
validitas logis dapat dicapai apabila instrumen disusun mengikuti ketentuan
yang ada. Dengan demikian, dapat disimpulkan bahwa validitas logis tidak
perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut
selesai disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrumen, yaitu validitas isi dan validitas konstrak (construct validity). Validitas
isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instrumen yang
disusun berdasarkan isi materi pelajaran yang dievaluasi. Selanjutnya validitas
konstrak sebuah instrumen menunjuk suatu kondisi sebuah instrumen yang
disusun berdasarkan konstrak aspek-aspek kejiwaan yang seharusnya
dievaluasi.
b. Validitas empiris
Dari uraian adanya dua jenis validitas yakni validitas logis ada dua
macam dan validitas empiris ada juga dua macam, maka secara keseluruhan
kita mengenal ada 4 validitas, yaitu:
1) Validitas isi (content validity)
Sebuah tes dikatakan memilki validitas isi apabila mengukur tujuan
khusus tertentu yang sejajar dengan materi atau isis pelajaran yang
diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum
maka validitas isi ini sering juga disebut validitas kurikuler.
Validitas isi berkenaan dengan kesanggupan alat penilaian data
mengukur isi yang seharusnya. Artinya, tes tersebut mampu
mengungkapkan isi suatu konsep atau variabel yang hendak diukur.
Misalnya tes hasil belajar bidang studi IPS harus bisa mengungkapkan
isi bidang studi tersebut. Hal ini bisa dilakukan dengan cara menyusun
tes yang bersumber dari kurikulum bidang studi yang hendak diukur.
Disamping kurikulum dapat juga diperkaya dengan melihat atau
mengkaji buku sumber.
Tes hasil belajar tidak mungkin dapat mengungkapkan semua
materi yang ada dalam bidang studi tertentu sekalipun hanya untuk satu
semester. Oleh sebab itu, harus diambil sebagian dari materi dalam
bentuk sampel tes. Sampel harus dapat mencerminkan materi yang
terkandung dalam sseluruh materi bidang studi. Cara yang ditempuh
dalam menetapkan sampel tes adalah memilih konsep-konsep materi
yang esensial. Misalnya menetapkan sejumlah konsep dari setiap pokok
bahasan yang ada. Dari setiap konsep dikembangkan beberapa
pertanyaan tes. Disinilah pentingnya peranan kisi-kisi sebagai alat untuk
memenuhi validitas isi. Dalam hal tertentu untuk tes yang telah disusun
sesuai dengan kurikulum (materi dan tujuannya) agar memenuhi
validitas isi, dapat pula dimintakan bantuan ahli bidang studi untuk
menelaah apakah konsep materi yang diajukan telah memadai atau
tidak sebagai sampel tes. Dengan demikian validitas isi tidak
memerlukan uji coba dan analisis statistic atau dinyatakan dalam bentuk
angka-angka.

2) Validitas konstruksi (construct validity)


Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir
soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti
yang disebutkan dalam tujuan instruksional khusus. Dengan kata lain jika
butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan
aspek berfikir yang menjadi tujuan instruksional.
Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK). “Siswa
dapat membandingkan antara efek biologis dan efek psikologis”, maka
butir soal pada tes merupakan perintah agar siswa membedakan anatar
dua efek tersebut.
“Konstruksi” dalam pengertian ini bukanlah “susunan” seperti yang
sering dijumpai dalam teknik, tetapi merupakan rekaan psikologis yaitu
suatu rekaan yang dibuat oleh para ahli ilmu jiwa yang dengan suatu cara
tertentu “memerinci” isi jiwa atas beberapa aspek seperti ingatan
(pengetahuan), pemahaman, aplikasi dan seterusnya. Dalam hal ini,
mereka menganggap seolah-olah jiwa dapat dibagi-bagi. Tetapi
sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan
sementara untuk mempermudah mempelajari.
Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan
cara memerinci dan memasangkan setiap butir soal dengan setiap aspek
dalam TIK. Pengerjaannya dilakukan berdasarkan logika bukan
pengalaman.

3) Validitas “ada sekarang” (concurrent validity)


Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes
dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang dipasangkan.
Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman.
Pengalaman selalu mengenai hal yang telah lampau sehingga data
pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent).
Dalam membandingkan hasil sebuah tes maka diperlukan suatu
kriterium atau alat banding. Maka hasil tes merupakan sesuatu yang
dibandingkan. Untuk jelasnya di bawah ini dikemukakan sebuah contoh.
Misalnya seorang guru ingin mengetahui apakah tes sumatif yang
disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium
masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan harian
atau nilai ulangan sumatif yang lalu.
4) Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dengan meramal selalu mengenai hal
yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan
memiliki validitas prediksi atau validitas ramalan apabila mempunyai
kemampuan untuk meramalkan apa yang akan terjadi pada masa yang
akan datang.
Misalnya tes masuk Perguruan Tinggi adalah sebuah tes yang
diperkirakan mampu meramalkan keberhasilan peserta tes dalam
mengikuti kuliah di masa yang akan datang. Calon yang tersaring
berdasarkan hasil tes diharapkan mencerminkan tinggi-rendahnya
kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin
keberhasilannya kelak. Sebaliknya seorang calon dikatakan tidak lulus tes
karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu
menikuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang
diperoleh setelah peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika
ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian
semester 1 dibandingkan dengan yang dahulu nilai tesnya lebih rendah
maka tes masuk yang dimaksud tidak memiliki validitas prediksi.

3. Cara Mengetahui Validitas Alat Ukur


Sekali lagi diulangi bahwa sebuah tes dikatakan memiliki validitas jika
hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil
tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui
kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh
Pearson.
Rumus korelasi product moment ada dua macam, yaitu:
a) Korelasi product moment dengan simpangan
∑𝑥𝑦
𝑟𝑥𝑦 =
√(∑𝑥 2 )(∑𝑦 2 )
Keterangan:
rxy = koefisien korelasi anatara variabel X dan Y
Σxy = jumlah perkalian x dengan y
x2 = kuadrat dari x
y2 = kuadrat dari y

b). Korelasi product moment dengan angka kasar

n∑XY− ∑X ∑Y
rxy =
√(n∑X2 −(∑X)2 ) (n∑Y2 −(∑Y)2 )

Keterangan:
rxy = koefisien korelasi anatara variabel X dan Y
n = jumlah responden
ΣX = jumlah skor butir soal
ΣY = jumlah skor total soal
ΣX2 = jumlah skor kuadrat butir soal
ΣY2 = jumlah skor total kuadrat butir soal

nilai r hitung dicocokkan dengan r tabel product moment pada taraf


signifikan 5%. Jika r hitung lebih besar dari r tabel 5%. Maka butir soal tersebut
valid.

4. Koefisien Korelasi Dalam Uji Validitas


Koefisien korelasi selalu terdapat antara -1,00 sampai +1,00, namun
karena dalam menghitung sering dilakukan pembulatan angka-angka, sangat
mungkin diperoleh koefisien lebih dari 1,00. Koefisien negatif menunjukkan
hubungan kebalikan sedangkan koefisien positif menunjukkan adanya
kesejajaran untuk mengadakan interpretasi mengenai besarnya koefisien
korelasi sebagai berikut:
 Antara 0,800 sampai dengan 1,00 = sangat tinggi
 Antara 0,600 sampai dengan 0,800 = tinggi
 Antara 0,400 sampai dengan 0,600 = cukup
 Antara 0,200 sampai dengan 0,400 = rendah
 Antara 0,00 sampai dengan 0,200 = sangat rendah

Penafsiran Harga Koefisien Korelasi Pearson Product Moment ada 2


cara yaitu:
a. Dengan melihat harga r dan diinterprestasikan misalnya korelasi
Tinggi, Cukup dan sebagainya.
b. Dengan mengkonsultasikan ke tabel harga kritik r product
moment sehingga dapat diketahui signifikan tidaknya korelasi
tersebut. Jika harga r lebih kecil dari harga kritik dalam tabel, maka
korelasi tersebut tidak signifikan. Begitu juga arti sebaliknya.

5. Validitas Butir Soal atau Validitas Item


Apa yang sudah dibicarakan di atas adalah validitas soal secara
keseluruhan tes. Di samping mencari validitas soal perlu juga dicari validitas
item. Jika seorang peneliti atau seorang guru mengetahui bahwa validitas soal
tes misalnya terlalu rendah atau rendah saja, maka selanjutnya ingin
mengetahui buti-butir tes manakah yang menyebabkan soal secara
keseluruhan tersebut jelek karena memiliki validitas rendah. Untuk keperluan
inilah dicari validitas butir soal.
Pengertian umum untuk validitas item adalah demikian sebuah item
dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total.
Skor pada item menyebabkan skor total menjadi tinggi atau rendah. Dengan
kata lain dapat dikemukakan di sini bahwa sebuah item memiliki validitas yang
tinggi jika skor pada item mempunyai kesejajaran dengan skor total.
Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui
validitas item digunakan rumus korelasi seperti sudah diterangkan di atas.
a. Koefisien Korelasi Biserial
Apabila item memili skor 1 dan 0 saja, bisa menggunakan Koefisien
Korelasi Biserial. Responden No.3 memiliki skor total hanya 4, sedangkan
No.2 dan No. 4 memiliki nilai yang sama yaitu 5.
Rumus:

𝑀𝑝 − 𝑀𝑡 𝑝
𝛾𝑝𝑏𝑖 = √
𝑆𝑡 𝑞

Keterangan:
𝛾𝑝𝑏𝑖 = koefisien korelasi biserial
𝑀𝑝 = rerata skor dari subyek yang menjawab betul bagi item yang dicari
validitasnya
𝑀𝑡 = rerata skor total
𝑆𝑡 = standar deviasi dari skor total
p = proporsi siswa yang menjawab benar

6. Tes Terstandar Sebagai Kriterium Dalam Menentukan Validitas


Tes terstandar adalah tes yang telah dicobakan berkali-kali sehingga
dapat dijamin kebaikannya. Di Negara-negara berkembang biasa tersedia
tes semacam ini, dan dikenal dengan nama standardized test. Sebuah tes
terstandar biasanya memiliki identitas antara lain: sudah dicobakan berapa
kali dan di mana, berapa koefisien validitas, reliabilitas, taraf kesukaran,
daya pembeda dan lain-lain keterangan yang dianggap perlu.
Cara menentukan validitas soal yang menggunakan tes terstandar
sebagai kriterium dilakukan dengan mengalikan koefisien validitas yang
diperoleh dengan koefisien validitas tes terstandar tersebut.
7. Validitas Faktor

Selain validitas soal secara keseluruhan dan validitas butir atau item,
masih ada lagi yang perlu diketahui validitasnya, yaitu faktor-faktor atau bagian
keseluruhan materi. Setiap keseluruhan materi pelajaran terdiri dari pokok-
pokok bahasan atau mungkin sekelompok pokok bahasan yang merupakan
satu kesatuan.
Contoh:
Guru akan mengevaluasi penguasaan siswa untuk tiga pokok bahasan,
yaitu: Bunyi, Cahaya dan Listrik. Untuk keperluan ini guru tersebut membuat
30 butir soal, untuk Bunyi 8 butir, untuk Cahaya 12 butir dan untuk Listrik 10
butir.
Apabila guru ingin mengetahui validitas faktor, maka ada tiga faktor
dalam soal ini. Seperti halnya pengertian validitas butir, pengertian validitas
faktor adalah butir-butir soal dalam faktor dikatakan valid apabila mempunyai
dukungan yang besar terhadap soa-soal secara keseluruhan. Sebagai tanda
bahwa butir-butir faktor tersebut mempunyai dukungan yang besar terhadap
seluruh soal, yakni apabila jumlah skor untuk butir-butir faktor tersebut
menunjukkan adanya kesejajaran dengan skor total.

8. Kegunaan Validitas
1. Untuk menghindari pertanyaan yang kurang jelas.
2. Untuk meniadakan kata-kata yang terlalu asing atau kata-kata
yang menimbulkan kecurigaan.
3. Untuk memperbaiki pertanyaan-pertanyaan yang kurang jelas.
4. Untuk menambah item yang diperlukan atau meniadakan item yang
dianggap tidak relevan.
5. Untuk mengetahui validitas kuesioner tersebut.
B. Reliabilitas
1. Arti Reliabilitas Bagi Sebuah Tes
Reliabilitas berhubungan dengan kepercayaan yang juga sangat
erat hubungannya dengan ketetapan hasil tes. Konsep ini tidak akan sulit
dimengerti apabila telah memahami konsep validitas. Jika validitas terkait
dengan ketepatan objek, maka konsep reliabilitas terkait dengan data-
data yang telah berkali-kali diambil. Instrumen yang baik adalah
instrumen yang dapat dengan ajeg (tetap) memberikan data yang sesuai
dengan kenyataan. Dalam pembicaraan evaluasi ini, “ajeg” atau “tetap”
tidak harus selalu “sama”. Tetapi mengikuti perubahan secara ajeg.

Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dkk,


menyatakan bahwa validitas dan reliabilitas ini penting untuk persyaratan
bagi tes. Sebuah tes mungkin reliabel, tetapi tidak valid. Namun
sebaliknya, sebuah tes yang valid biasanya reliabel. Dalam hal ini
validitas lebih penting dan reliabilitas ini perlu karna menyokong
terbentuknya validitas. Beberapa hal yang mempengaruhi hasil tes
secara garis besar dapat dikelompokkan menjadi 3 yaitu:

a. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes
dan kualitas butir-butir soalnya.
Tes yang terdiri dari banyak butir tentu saja lebih valid
dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal.
Maka semakin panjang tes, reliabilitasnya semakin tinggi. Berikut
rumus Spearman-Brown yang digunakan untuk menghitung besarnya
reliabilitas berhubungan dengan penambahan banyaknya butir soal
dalam tes: F. Salah satu syarrat agar hasil ukuran suatu tes dpat
dipercaya ialah tes tersebut harus mempunyai reliabilitas yang
memadahi dalam buku:
𝑛𝑟
𝑟𝑛𝑛 =
1 + (𝑛 − 1)𝑟
dimana:
𝑟𝑛𝑛 = besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir
soal baru.
n = berapa kali butir-butir soal tersebut ditambah.
r = besarnya koefisien reliabilitas sebelum butir-butir soal ditambah

Kualitas butir-butir soal ditentukan oleh:


a. Jelas tidaknya rumusan soal.
b. Baik tidaknya pengarahan soal kepada jawaban sehingga tidak
menimbulkan salah jawab.
c. Petunjuknya jelas sehingga mudah dan cepat dikerjakan.

b. Hal yang berhubungan dengan tercoba (testee)


Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak
siswa akan mencerminkan keragaman hasil yang menggambarkan besar
kecilnya reliabilitas tes.

c. Hal yang berhubungan dengan penyelenggaraan tes


Faktor penyelenggaraan tes yang bersifat administratif sangat
menentukan hasil tes. Misalnya petunjuk yang diberikan sebelum tes
dimulai, sehingga tidak menimbulkan banyak pertanyaan dari yang dicoba.

2. Cara-Cara Mencari Besarnya Reliabilitas


Ada dua hal yang digunakan untuk mengetahui ketetapan, yaitu yang
berada di luar tes (consistency external) dan pada tes itu sendiri (consistency
internal).
a. Metode bentuk paralel (equivalent)
Metode bentuk paralel (equivalent) yaitu dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran, susunan, tetapi butir-butir soalnya
berbeda. Dua tes terbut dicobakan kepada kelompok siswa yang sama,
setelah itu baru hasil dari kedua tes tersebut dikorelasikan. Adapun
kelemahan dari metode ini yaitu pekerjaan pengetes menjadi berat karena
harus menyusun dua seri tes dan juga harus tersedianya waktu yang lama
untuk mencobakan dua kali tes tersebut.

b. Metode tes ulang (test-retest method)


Metode ini dilakukan untuk menghindari penyusunan dua seri tes.
Pengetes hanya memiliki satu seri tes tetapi dicobakan dua kali. Cara ini
kurang mengena jika tes digunakan untuk mengungkap pengetahuan
(ingatan) dan pemahaman, karena tercoba akan masih ingat butir-butir
soalnya. Tenggang waktu tentu saja menjadi faktor yang berpengaruh
terhadap reliabilitas. Metode ini juga disebut korelasi diri sendiri karena
mengkorelasikan hasil dari tes yang sama.

c. Metode belah dua atau split-half method


Metode ini mengatasi kelemahan-kelemahan penggunaan metode
bentuk paralel dan metode tes ulang. Dalam metode ini, pengetes hanya
menggunakan sebuah tes dan dicobakan satu kali. Untuk mengetahui
reliabilitas seluruh tes, digunakan rumus Spearman-Brown berikut:

2𝑟1⁄ 1
2 ⁄2
𝑟11 =
(1 + 𝑟1⁄ 1 )
2 ⁄2
di mana:
𝑟1 1 = korelasi antara skor-skor setiap belahan tes.
22
𝑟11 = koefisien rliabilitas yang sudah disesuaikan.
Banyaknya butir soal dalam tes yang menggunakan metode ini
harus genap. Ada dua cara membelah butir soal ini:
1. Membelas atas item-item genap dan item-item ganjil yang selanjutnya
disebut belahan ganjil-genap.
2. Membelah atas item-item awal dan item-item akhir yaitu setengah
jumlah pada nomor-nomor awal dan setengah pada nomor-nomor
akhir yang selanjutnya disebut belahan awal-akhir.
Berikut beberapa rumus selain rumus ganjil-genap dan awal-akhir
yang dapat digunakan untuk mencari reliabilitas dalam suatu tes:
𝑆12 + 𝑆22
𝑟11 = 2(1 −
𝑆𝑡2
di mana:
𝑟11 = reliabilitas tes
𝑆12 = varians belahan pertama (1) yang dalam hal ini varians skor
item ganjil.
𝑆22 = varians belahan kedua (2) yaitu varians skor item genap.
𝑆𝑡2 = varians total yaitu varians skor total.

b. Rumus Rulon:
𝑆𝑑 2
𝑟11 = 1− 2
𝑆𝑡
di mana:
sd = varians beda (varians difference)
d = difference yaitu perbedaan antara skor belahan pertama
(awal) dengan skor belahan kedua (akhir).
c. Rumus K-R.20:
𝑛 𝑆 2 − Σ𝑝𝑞
𝑟11 = ( )( )
𝑛−1 𝑆2

di mana:
𝑟11 = reliabilitas tes secara keseluruhan.
p = proporsi subjek yang menjawab item dengan benar.
Q = proporsi subjek yang menjawab item dengan salah
(q = 1-p)
∑pq = jumlah hasil perkalian antara p dan q.
n = banyaknya item.
𝑆 2 = standar devisi dari tes (standar devisi adalah akar varians).

d. Rumus K-R. 21:


𝑛 𝑀 − (𝑛 − 𝑀)
𝑟11 = ( ) (1 − )
𝑛−1 𝑛𝑆𝑡2

di mana:
M = Mean atau rata-rata skor nilai.

e. Rumus Hoyt:
𝑉𝑠 𝑉𝑟 − 𝑉𝑠
𝑟11 = 1 − 𝑎𝑡𝑎𝑢 𝑟11 =
𝑉𝑟 𝑉𝑟
Keterangan:
𝑟11 = Reliabilitas seluruh soal.
𝑉𝑟 = Varians responden.
𝑉𝑠 = Varians sisa.
3. Mencari Reliabilitas Tes Bentuk Uraian
Penjelasan yang sudah diuraikan diatas merupakan cara mencari
reliabilitas tes bentuk objektif, yaitu yang terdiri dari butir-butir soal
yang dinilai hanya “benar” atau “salah”. Untuk keperluan mencari
reliabilitas soal keseluruhan perlu juga dilakukan analisis butir soal
seperti halnya soal bentuk objektif. Adapun skor untuk masing-masing
butir soal dicantumkan pada kolom item menurut apa adanya.
Rumus yang diggunakan adalah rumus Alpha sebagai berikut:
𝑘 ∑𝜎𝑖2
𝑟11 = (𝑘−1) (1 − )
𝜎𝑡2

di mana:
𝑟11 = reliabilitas yang dicari.
∑ = jumlah varians skor tiap-tiap item.
σ = varians total.

C. CONTOH ANALISIS VALIDITAS DAN RELIABILITAS


1. Analisis Validitas Soal Pilihan Ganda
TABEL ANALISIS ITEM UNTUK PERHITUNGAN
VALIDITAS PADA SOAL PILIHAN GANDA
TABEL PERHITUNGAN UNTUK MENGHITUNG VALIDITAS
ITEM NOMOR 9
Responden X Y
1 1 16
2 1 11
3 0 8
4 1 10
5 1 13
6 1 9
7 1 15
8 1 17
9 1 14
10 0 9
11 1 14
12 1 9
13 1 12
14 0 11
15 1 14
Jumlah 12 182
Diketahui:
a. Uji Validitas
Apabila soal nomor 9 yang dicari validitasnya dengan rumus sebagai
berikut:

𝑀𝑝 − 𝑀𝑡 𝑝
𝛾𝑝𝑏𝑖 = √
𝑆𝑡 𝑞

maka perhitungannya melalui langkah-langkah sebagai berikut:


16+11+10+13+9+15+17+14+14+9+12+14
1. Mencari 𝑀𝑝 = = 12,83
12
16+11+8+10+13+9+15+17+14+9+14+9+12+11+14
2. Mencari 𝑀𝑡 = = 12,13
15

3. Dari aplikasi excel diperoleh standar deviasi skor total = 2,83


12
4. Menentukan harga 𝑝 = 15 = 0,80

5. Menentukan harga 𝑞 = 1 − 0,8 = 0,20


6. Memasukkan dalam persamaan:
7.

𝑀𝑝 − 𝑀𝑡 𝑝
𝛾𝑝𝑏𝑖 = √
𝑆𝑡 𝑞

12,83 − 12,13 0,80


= √ = 0,49
2,83 0,20

Jadi, rhitung = 0,49 > rtabel = 0,48 berarti soal dikatakan valid.

b. Uji Reliabilitas
Diketahui:
k = 20
St = 2,83
Σ𝑝𝑖 𝑞𝑖 = 4,42
Apabila soal nomor 9 yang dicari reliabilitasnya dengan rumus sebagai
berikut:
𝑘 𝑆𝑡2 − Σ𝑝𝑖 𝑞𝑖
𝑟𝑖 = ( )
(𝑘 − 1) 𝑆𝑡2

20 2,832 − 4,42
= ( ) = 0,47
20 − 1 2,832

Jadi, nilai reliabilitas adalah 0,47 dan berada pada rentang nilai 0,400≤ r
< 0,600 yang termasuk dalam kategori cukup.
2. Analisis Validitas pada Soal Uraian
TABEL ANALISIS ITEM UNTUK PERHITUNGAN
VALIDITAS PADA SOAL URAIAN
Butir Soal
Responden
1 2 3 4 5 6 7 8 9 10
1 7 7 6 9 7 7 7 8 7 10
2 8 10 8 8 7 4 8 5 6 7
3 10 7 7 9 8 6 8 8 6 6
4 6 6 7 4 6 8 7 9 8 4
5 8 11 11 6 4 3 6 5 7 6
6 5 11 6 5 5 6 6 7 10 9
7 5 10 4 5 6 4 8 6 8 7
8 6 9 9 5 4 6 9 5 7 7
9 10 6 10 4 6 8 8 5 9 9
10 8 9 10 7 7 8 12 9 7 10
11 10 7 6 9 8 7 11 9 7 4
12 10 13 8 5 6 8 8 7 10 10
13 10 10 11 8 8 8 8 9 8 6
14 10 5 11 9 8 8 12 9 7 10
15 9 13 9 7 8 8 6 9 7 9
16 8 8 11 7 8 8 8 9 10 8
17 6 10 8 8 8 5 9 8 6 10
18 9 13 11 9 8 8 9 9 10 10
19 10 13 11 4 6 8 8 8 7 10
20 10 11 11 5 8 8 8 9 10 9
21 10 9 6 5 5 4 8 9 10 9
22 9 13 11 8 6 8 12 9 10 8
23 9 6 9 7 6 8 8 9 7 10
24 9 11 11 9 8 4 7 9 10 9
25 9 13 8 5 6 8 5 9 7 4
26 9 13 8 8 8 8 10 9 10 10
27 9 5 7 6 8 5 9 4 10 10
28 6 6 8 7 8 8 12 4 7 10
TABEL PERHITUNGAN UNTUK MENGHITUNG VALIDITAS
ITEM NOMOR 1
R X Y X2 Y2 XY
1 7 75 49 5625 525
2 8 71 64 5041 568
3 10 75 100 5625 750
4 6 65 36 4225 390
5 8 67 64 4489 536
6 5 70 25 4900 350
7 5 63 25 3969 315
8 6 67 36 4489 402
9 10 75 100 5625 750
10 8 87 64 7569 696
11 10 78 100 6084 780
12 10 85 100 7225 850
13 10 86 100 7396 860
14 10 89 100 7921 890
15 9 85 81 7225 765
16 8 85 64 7225 680
17 6 78 36 6084 468
18 9 96 81 9216 864
19 10 85 100 7225 850
20 10 89 100 7921 890
21 10 75 100 5625 750
22 9 94 81 8836 846
23 9 79 81 6241 711
24 9 87 81 7569 783
25 9 74 81 5476 666
26 9 93 81 8649 837
27 9 73 81 5329 657
28 6 76 36 5776 456
Jumlah 235 2222 2047 178580 18885
a. Uji Validitas
Apabila soal nomor 1 yang dicari validitasnya maka:
Diketahui:
𝑁 = 28
∑𝑌 = 2222
2
∑𝑌 = 178580
∑X = 235
2
∑𝑋 = 2047
∑XY = 18885
dengan persamaan sebagai berikut:
𝑁∑𝑋𝑌 − (∑𝑋)(∑𝑌)
𝑟𝑥𝑦 =
√{(𝑁∑𝑋 2 − (∑𝑋)2 )} √{(𝑁∑𝑌 2 − (𝛴𝑌)2 )}

28. (18885) − (235)(2222)


𝑟𝑥𝑦 = = 0,58
√{28. (2047) − (235)2 } √{28. (178580) − (2222)2 }

Jadi, rhitung = 0,58 > rtabel = 0,36 berarti soal dikatakan valid.

b. Uji Reliabilitas

Untuk menghitung reliabilitas soal tes tersebut, maka harga-harga yang

diperlukan yaitu sebagai berikut:

Diketahui:

𝑘 = 10
(ΣX)2
Σ𝑋 2 −
∑𝜎𝑖2 = 𝑁
𝑁

∑𝜎𝑖2 = 34,37
∑𝜎𝑡2 = 80,30
Dengan persamaan;
𝑘 ∑𝜎2
𝑟11 = (𝑘−1) (1 − ∑𝜎𝑖2 )
𝑡

Keterangan:
𝑟11 = Reliabilitas instrument
𝑘 = Banyaknya butir soal pertanyaan dan butir soal
∑𝜎𝑖2 = Jumlah siswa uji coba
∑𝜎𝑡2 = varians total
Sehingga;
𝑘 ∑𝜎2
𝑟11 = (𝑘−1) (1 − ∑𝜎𝑖2 )
𝑡

10 34,37
𝑟11 = (10−1) (1 − 80,30)

𝑟11 = 0,64
Jadi, nilai reliabilitas adalah 0,64 dan berada pada rentang nilai 0,60≤
r < 0,80 yang termasuk dalam kategori tinggi.
BAB III
PENUTUP
A. Kesimpulan
1. Validitas adalah suatu ukuran yang menunjukan tingkat kevalidan atau
kesahihan suatu instrumen. Prinsif validitas adalah pengukuran atau
pengamatan yang berarti prinsif keandalan instrumen dalam
mengumpulkan data. Instrumen harus dapat mengukur apa yang
seharusnya diukur. Jadi validitas lebih menekankan pada alat
pengukuran atau pengamatan. Uji validitas adalah suatu langkah
pengujian yang dilakukan terhadap isi (content) dari suatu instrumen,
dengan tujuan untuk mengukur ketepatan instrumen yang digunakan
dalam suatu penelitian. Untuk menguji validitas setiap butir soal maka
skor-skor yang ada pada butir yang dimaksud dikorelasikan dengan skor
totalnya. Skor tiap butir soal dinyatakan skor X dan skor total dinyatakan
sebagai skor Y, dengan diperolehnya indeks validitas setiap butir soal,
dapat diketahui butir-butir soal manakah yang memenuhi syarat dilihat
dari indeks validitasnya.
2. Reliabilitas mengarah kepada keakuratan dan ketepatan dari suatu alat
ukur dalam suatu prosedur pengukuran. Koefisien reliabilitas
mengindikasikan adanya stabilitas skor yang didapatkan oleh individu,
yang merefleksikan adanya proses reproduksi skor. Skor disebut stabil
bila skor yang didapat pada suatu waktu dan pada waktu yang lain
hasilnya relatif sama. Makna lain reliabilitas dalam terminologi stabilitas
adalah subjek yang dikenai pengukuran akan menempati ranking yang
relatif sama pada testing yang terpisah dengan alat tes yang ekuivalen.
3. Ada dua macam validitas yaitu validitas logis dan validitas empiris.
Validitas empiris dibagi lagi kedalam beberapa bagian yaitu validitas isi
(content validity), validitas konstruksi (construct validity), validitas “ada
sekarang” (concurrent validity), dan validitas prediksi (predictive
validity).

B. Saran
Penulis berkeyakinan bahwa dalam makalah ini masih terdapat
beberapa kekurangan dan bahkann mungkin kekeliruan/kesalahan yang
terjadi diluar keinginan dan kehendak penulis. Sangat diharapkan bagi
perbaikan dan penyempurnaan makalah ini.
DAFTAR PUSTAKA

Arikunto, Suharsimi, Dasar-dasar Evaluasi Pendidikan. Bumi Aksara, Jakarta.


2013.

Djalli dan Muryono, Puji. Pengukuran dalam bidang pendidikan, Gramedia.


Semarang. 2002.

Purwanto, Ngalim, M., Prinsip-prinsip dan Teknik Evaluasi Pengajaran,


Bandung, PT. Remaja Rosdakarya, 2009.

Ridwan dan sunarto. Pengantar statistika. Alfabeta. Bandung, 2013.

Sudjana, Nana, Penilaian Hasil Proses Belajar Mengajar, Bandung, PT.


Remaja Rosdakarya, 2009.
Analisis Daya Pembeda Soal
Pilihan Ganda

Anda mungkin juga menyukai