Anda di halaman 1dari 33

Tugas Pribadi Kedua (Kel.

4)
Rabu, 3 Maret 2021

TUGAS MAKALAH
PENGEMBANGAN ASESMEN PEMBELAJARAN FISIKA
“VALIDITAS DAN REALIBILITAS”

Oleh:
PRIMA NORA ANANDA
NIM. 20175012

DOSEN PEMBIMBING :
Prof. Dr. FESTIYED, M.S
Dr. FATNI MUFIT, S.Pd, M.Si

PROGRAM PASCASARJANA
PROGRAM STUDI MAGISTER PENDIDIKAN FISIKA
UNIVERSITAS NEGERI PADANG
2021
KATA PENGANTAR

Puji syukur penulis ucapkan kepada Allah SWT karena atas karunia-Nya, penulis
dapat menyelesaikan tugas mata kuliah Pengembangan Asesmen Pembelajaran Fisika yang
menjelaskan tentang Validitas dan Realibilitas dan menghadirkannya kepada pembaca dalam
bentuk makalah.
Makalah ini dibuat dalam rangka memenuhi Makalah Pengembangan Asesmen
Pembelajaran Fisika. Dalam pembuatan makalah ini, penulis banyak menerima bantuan dari
berbagai pihak. Untuk itu penulis mengucapkan terima kasih kepada Ibu Prof. Dr. Frestiyed,
M. S dan Ibu Dr. Fatni Mufit, S.Pd, M.Si yang telah memberikan bimbingan dan terima kasih
kepada teman-teman yang telah memberikan dukungannya dalam penyelesaian makalah ini.
Penulis menyadari bahwa makalah ini belum sempurna. Oleh karena itu, penulis
dengan senang hati menerima masukan, kritikan dan saran dari pembaca yang sifatnya
membangun demi kesempurnaan makalah ini. Semoga apa yang diharapkan dapat dicapai
dengan sempurna.

Padang, Maret 2021

Penulis

i
DAFTAR ISI
KATA PENGANTAR ........................................................................................................... i

DAFTAR ISI .........................................................................................................................ii

DAFTAR TABEL ............................................................................................................... iii

BAB I PENDAHULUAN ..................................................................................................... 4

A. Latar Belakang .......................................................................................................... 4

B. Rumusan Masalah ..................................................................................................... 5

C. Batasan Masalah ........................................................................................................ 5

D. Tujuan Penulisan ....................................................................................................... 6

E. Manfaat Penulisan ..................................................................................................... 6

F. Landasan Religius ..................................................................................................... 6

G. Landasan Yuridis ....................................................................................................... 7

BAB II KAJIAN TEORI ....................................................................................................... 9

A. Validitas..................................................................................................................... 9

B. Reliabilitas ............................................................................................................... 17

BAB III PEMBAHASAN ................................................................................................... 21

BAB IV SOAL DAN JAWABAN ...................................................................................... 29

BAB V PENUTUP .............................................................................................................. 31

A. Kesimpulan.............................................................................................................. 31

B. Saran ........................................................................................................................ 31

DAFTAR PUSTAKA ......................................................................................................... 32

ii
DAFTAR TABEL
Tabel 1. Kriteria Korelasi Koefisien Validitas ........................................................................ 16
Tabel 2. Kriteria Reliabilitas Suatu Instrumen ........................................................................ 20
Tabel 3. Matriks Jenis Validitas............................................................................................... 21
Tabel 4. Matriks Reliabilitas .................................................................................................... 24

iii
BAB I
PENDAHULUAN

A. Latar Belakang
Pembelajaran merupakan suatu rangkaian proses dan kegiatan untuk
memajukan serta meningkatkan kompetensi dari peserta didik sehingga nantinya
peserta didik memiliki bekal dan skill dalam menghadapi persaingan pada dunia
kerja atau setelah proses pembelajaran berakhir. Proses pembelajaran merupakan
tonggak utama dalam pelaksanaan pendidikan. Dengan kata lain apabila dalam
proses pembelajaran terjadi hambatan atau gangguan akan berdampak pada
penurunan kualitas pendidikan. Pembelajaran sendiri secara sederhana terdiri dari
3 tahap utama yaitu perencanaan, pelaksanaan dan asesmen. Pembelajaran tidak
akan lengkap apabila tidak diikuti oleh perencanaan yang matang serta
menggunakan teknik dan komponen penilaian yang tepat. Penyusunan rencana
penilaian merupakan rangkaian program pendidikan dan pembelajaran yang utuh
dan merupakan satu kesatuan yang tidak dapat dipisahkan
satu dengan yang lainnya.
Dalam sebuah proses pembelajaran komponen yang turut menentukan
keberhasilan sebuah proses adalah asesmen. Melalui asesmen orang akan
mengetahui sampai sejauh mana penyampaian pembelajaran atau tujuan
pendidikan atau sebuah program dapat dicapai sesuai dengan tujuan yang
diinginkan. Sesuai dengan PP No. 13 tahun 2015. Asesmen pendidikan adalah
kegiatan pengendalian, penjaminan dan penetapan mutu pendidikan terhadap
berbagai komponen pendidikan pada setiap jalur, jenjang dan jenis pendidikan
sebagai bentuk pertanggungjawaban penyelenggara pendidikan.
Asesmen merupakan salah satu kegiatan utama yang harus dilakukan
dalam kegiatan pendidikan dan pembelajaran. Melalui asesmen, kita akan
mengetahui perkembangan hasil belajar, intelegensi, bakat khusus, minat,
hubungan sosial, sikap dan kepribadian siswa atau peserta didik serta keberhasilan
sebuah program.

4
Peraturan Pemerintah no 13 tahun 2013 telah dijelaskan tentang Standar
Nasional Pendidikan yaitu berjumlah delapan buah: standar isi, standar proses,
standar kompetensi lulusan, standar pendidik dan tenaga pendidik, standar sarana
dan prasarana, standar pengelolaan, standar pembiayaan, standar penilaian
pendidikan. Dari delapan standar pendidikan nasional, standar pendidikan
merupakan bagian yang tak terpisahkan dengan standar nasional pendidikan.
Setiap pendidikan harus dapat memberikan pelayanan yang prima dan
memperlakukan peserta didik secara adil, objektif, bertanggung jawab, tidak
terkecuali dalam penilaian pendidikan.
Berlandaskan landasan yuridis di atas terlihat bahwa guru sebagai salah
seorang pelaksana pendidikan memiliki peran penting dalam proses penilaian.
Guru yang berkualitas akan mampu melakukan penilaian dengan baik, sehingga
hasil belajar yang diukur akan terllihat dengan jelas, apakah pembelajaran yang
dilakukan sudah mencapai standar kompetensi lulusan atau belum. Guru atau
pendidik harus menguasai dan memahami mekanisme, prosedur, maupun
instrument penialaian yang harus digunakan. Guru diharapkan mampu
melaksanakan proses penialain secara berkesinambungan agar dapat memantau
proses, kemajuan, dan perbaikan dan perbaikan hasil dalam bentuk ulangan
harian, ulangan tengah semester, ulangan akhir semester, ulangan kenaikan kelas.
Oleh karena itu, dalam makalah ini penulis akan menjabarkan tentang
beberapa hal yang harus diketahui oleh seorang guru diantaranya penilaian,
asesmen, pengukuran dan testing serta perbandingannya dll.
B. Rumusan Masalah
Berdasarkan latar belakang yang teah diungkapkan, maka rumusan masalah
pada makalah ini adalah
1. Bagaimanakah kualitas sebuah instrument asesmen yang baik?
2. Bagaimanakah perbedaan validitas dan reliabilitas dari sebuah instrument?
C. Batasan Masalah
Agar penulisan ini lebih terarah, maka penulis membatasi masalah
menganalisis kualitas instrument yang dinilai dari validitas dan reliabilitas

5
D. Tujuan Penulisan
Adapun tujuan dalam pembuatan makalah ini adalah
1. Untuk mengetahui kualitas sebuah instrument asesmen yang baik.
2. Untuk mengetahui perbedaan validitas dan reliabilitas dari sebuah
instrumen.
E. Manfaat Penulisan
Adapun manfaat dalam pembuatan makalah ini adalah :
1. Sebagai bahan pertimbangan oleh guru dalam membuat sebuah instrument
asesmen pembelajaran di sekolah .
2. Dapat dijadikan pengalaman dan bekal ilmu pengetahuan bagi pembaca
khususnya untuk tenaga pendidik kedepannya.
3. Membantu mahasiswa memahami tentang bagaimana pelaksanaan
asesmen dalam pendidikan.
4. Memenuhi persyaratan untuk mengikuti mata kuliah Pengembangan
asesmen
F. Landasan Religius
Allah berfirman dalam Quran surat Maryam ayat 84 dan Al-Hujurat ayat 6 yang
berbunyi :

ِ ُ ‫بس ُۢ ُق ِبىَ َب ٖئ َفت َ َب ٍَّىُ َٰٓىاْ أَن ت‬


َ‫صٍبُىاْ قَ ۡى ُۢ َمب ِب َج َهلَ ٖة فَتُصۡ ِب ُحىاْ َعلَى َمب فَ َع ۡلت ُ ۡم وَد ِِمٍه‬ ِ َ‫ٌََٰٓأٌَُّ َهب ٱلَّذٌِهَ َءا َمىُ َٰٓىاْ ِإن َجب َٰٓ َء ُك ۡم ف‬
Artinya: “maka janganlah kamu tergesa-gesa memintakan siksa terhadap mereka,
karena sesungguhnya Kami hanya menghitung datangnya (hari siksaan) untuk
mereka dengan perhitungan yang teliti”.
Allah berfirman dalam Quran surat An-Naml ayat 32 yang berbunyi :

ِ َ‫قَبلَ ۡت ٌََٰٓأٌَُّ َهب ۡٱل َملَ ُؤاْ أ َ ۡفتُىوًِ فِ ًَٰٓ أ َ ۡم ِزي َمب ُكىتُ ق‬
ِ ‫بط َعةً أَمۡ ًزا َحتَّى ت َۡش َهد‬
‫ُون‬
Artinya: “Berkata dia (Balqis): "Hai para pembesar berilah aku pertimbangan
dalam urusanku (ini) aku tidak pernah memutuskan sesuatu persoalan sebelum
kamu berada dalam majelis(ku)”
Asesmen dalam pembelajaran harus dihitung reliabilitasnya atau tingkat

6
kepercayaan.reliabilitas ini penting karena pembelajaran merupakan pedoman
bagi siswa dalam mendapatkan ilmu, sehingga pembelajaran yang dibuat oleh
guru harus sesuai dengan kebenaran. Konsep reliabilitas terdapat dalam surat Ali-
Imran ayat 139 :
َ‫َو ََل ت َ ِهىُىاْ َو ََل ت َۡحزَ وُىاْ َوأَوت ُ ُم ۡٱۡل َ ۡعلَ ۡىنَ ِإن ُكىتُم ُّم ۡؤ ِمىٍِه‬
Artinya :Janganlah kamu bersikap lemah, dan janganlah (pula) kamu bersedih
hati, padahal kamulah orang-orang yang paling tinggi (derajatnya), jika kamu
orang-orang yang beriman.
Sejalan dengan ayat diatas, reliabilitas juga terdapat dalam surat Fussilat ayat 30 :

َٰٓ
ً‫ٱستَقَ ُمىاْ تَتَى ََّز ُل َعلَ ٍۡ ِه ُم ۡٱل َملَئِكَةُ أ َ ََّل تَخَبفُىاْ َو ََل ت َۡحزَ وُىاْ َوأ َ ۡبش ُِزواْ ِب ۡٱل َج َّى ِة ٱلَّ ِت‬ َّ ‫ِإ َّن ٱلَّذٌِهَ قَبلُىاْ َربُّىَب‬
ۡ ‫ٱَّللُ ث ُ َّم‬
َ‫ُكىت ُ ۡم تُى َعدُون‬
Artinya: Sesungguhnya orang-orang yang mengatakan: "Tuhan kami ialah
Allah" kemudian mereka meneguhkan pendirian mereka, maka malaikat
akan turun kepada mereka dengan mengatakan: "Janganlah kamu takut
dan janganlah merasa sedih; dan gembirakanlah mereka dengan jannah
yang telah dijanjikan Allah kepadamu"

Surat Al-Qori’ah; 6-9, Allah berfirman :

(9) (8). (7). (6).

Artinya : Dan adapun orang-orang yang berat timbangan amal (kebaikan)nya,


maka ia berada dalam kehidupan yang memuaskan, adapun orang-orang yang
ringan timbangan (kebaikan)nya maka tempat kembalinya adalah neraka
Hawiyah.
G. Landasan Yuridis
Standar Penilaian Pendidikan adalah kriteria mengenai lingkup, tujuan,
manfaat, prinsip, mekanisme, prosedur, dan instrumen penilaian hasil belajar

7
peserta didik yang digunakan sebagai dasar dalam penilaian hasil belajar peserta
didik pada pendidikan dasar dan pendidikan menengah.
Penilaian adalah proses pengumpulan dan pengolahan informasi untuk
mengukur pencapaian hasil belajar peserta didik. Pembelajaran adalah proses
interaksi antar peserta didik, antara peserta didik dengan pendidik dan sumber
belajar pada suatu lingkungan belajar. Penilaian hasil pendidikan dasar dan
pendidikan menengah terdiri atas: (1) penilaian hasil belajar oleh pendidik, (2)
penilaian hasil belajar oleh peserta didik, (3) penilaian hasil belajar oleh
pemerintah. Penilaian hasil belajar meliputi aspek sikap, pengetahuan dan
keterampilan.
Undang-Undang Noomor 20 Tahun 2003 tentang Sistem Pendidikan Nasional
menjalaskan bahwa evaluasi dilakukan terhadap peserta didik, lembaga, dan
program pendidikan pada jalur formal dan nonformal untuk semua jenjang,
satuan, dan jenis pendidikan.
Asesmen hasil belajar peserta didik dilakukan oleh pendidik untuk memantau
proses, kemajuan, dan perbaikan hasil belajar peserta didik secara
berkesinambungan. Evaluasi peserta didik, satuan pendidikan, dan program
pendidikan dilakukan oleh lembaga mandiri secara berkala, menyeluruh,
transparan, dan sistemik untuk menilai pencapaian standar nasional pendidikan.
Peraturan Pemerintah Nomor 13 tahun 2015 tentang Standar Pendidikan
Nasional, penilaian adalah proses pengumpulan dan pengolahan informasi untuk
mengukur pencapaian hasil belajar Peserta Didik. Evaluasi pendidikan adalah
kegiatan pengendalian, penjaminan, dan penetapan mutu pendidikan terhadap
berbagai komponen pendidikan pada setiap jalur, jenjang, dan jenis pendidikan
sebagai bentuk pertanggungjawaban penyelenggaraan pendidikan.

8
BAB II
KAJIAN TEORI

A. Validitas
a. Pengertian
Validitas adalah suatu konsep yang berkaitan dengan sejauhmana tes telah
mengukur apa yang seharusnya diukur.Validitas berkenaan dengan ketetapan alat
penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang
yang seharusnya dinilai. Sebagai contoh menilai kemampuan siswa dalam fisika.
Misalnya diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga
sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak
memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara,
tetapi ditanyakan mengenai tata bahasa atau kesusastraan seperti puisi atau sajak.
Penilaian tersebut tidak tepat (valid).
Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan
penilaian. Alat penilaian yang telah valid untuk suatu tujuan tertentu belum
otomatis akan valid untuk tujuan yang lain. Contoh prestasi belajar dan motivasi
belajar dapat dinilai oleh tes ataupun oleh kuesioner. Caranya juga bisa berbeda,
bisa dilaksanakan secara tertulis atau bisa secara lisan. Ketentuan penting dalam
evaluasi adalah bahwa hasilnya harus sesuai dengan keadaan yang dievaluasi.
Mengevaluasi dapat diumpamakan sebagai pekerjaan memotret. Gambar potret
atau foto dikatakan baik apabila sesuai dengan aslinya. Gambar pemotretan hasil
evaluasi tersebut di dalam kegiatan evaluasi dikenal dengan data evaluasi.
Data evaluasi yang baik sesuai dengan kenyataan disebut data valid. Agar
dapat dieroleh data yang valid, instrumen atau alat untuk mengevaluasinya harus
valid. Jika pernyataan tersebut dibalik, instrumen evaluasi dituntut untuk valid
karena diinginkan dapat diperoleh data yang valid. Dengan kata lain, instrumen
evaluasi dipersyaratkan valid agar hasil yang diperoleh dari kegiatan evaluasi
valid.
b. Bentuk Validitas

9
Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas
empiris.
1) Validitas Logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika”
atau validitas logis sering juga disebut sebagai analisis kualitatif yaitu berupa
penalaran atau penelaahan. Dengan makna demikian maka validitas logis
untuk sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil
penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen yang
bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang
ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah karangan,
jika penulisan sudah mengikuti aturan mengarang, tentu secara logis
karangannya sudah baik.
Berdasarkan penjelasan tersebut maka instrumen yang sudah disusun
berdasarkan teori penyusunan instrumen, secara logis sudah valid. Dari
penjelasan tersebut dapat dipahami bahwa validitas logis dapat dicapai apabila
instrumen disusun mengikuti ketentuan yang ada. Dengan demikian, dapat
disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi langsung
diperoleh sesudah instrumen tersebut selesai disusun. Ada dua macam
validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu validitas isi
dan validitas konstrak (construct validity). Validitas isi bagi sebuah instrumen
menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan isi materi
pelajaran yang dievaluasi. Selanjutnya validitas konstrak sebuah instrumen
menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan konstrak
aspek-aspek kejiwaan yang seharusnya dievaluasi.
Untuk menganalisis soal ditinjau dari segi teknis, isi, dan editorial.
Analisis secara teknis dimaksudkan sebagai penelaahan soal berdasarkan
prinsip-prinsip pengukuran dan format penulisan soal. Analisis secara isi
dimaksudkan sebagai penelaahan khusus yang berkaitan dengan kelayakan
pengetahuan yang ditanyakan. Analisis secara editorial dimaksudkan sebagai
penelaahan yang khususnya berkaitan dengan keseluruhan format dan

10
keajegan editorial dari soal yang satu ke soal yang lainnya. Analisis kualitatif
lainnya dapat juga dikategorikan dari segi materi, konstruksi, dan bahasa.
Analisis materi dimaksudkan sebagai penelaahan yang berkaitan dengan
substansi keilmuan yang ditanyakan dalam soal serta tingkat kemampuan yang
sesuai dengan soal. Analisis konstruksi dimaksudkan sebagai penelaahan yang
umumnya berkaitan dengan teknik penulisan soal. Analisis bahasa
dimaksudkan sebagai penelaahan soal yang berkaitan dengan penggunaan
bahasa Indonesia yang baik dan benar menurut EYD. Melalui analisis
kualitatif dapat diketahui berfungsi tidaknya sebuah soal.
2) Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya
“pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas empiris
apabila sudah diuji dari pengalaman. Analisis soal secara kuantitatif
menekankan pada analisis karakteristik internal tes melalui data yang
diperoleh secara empiris. Karakteristik internal secara kuantitatif dimaksudkan
meliputi parameter soal tingkat kesukaran, daya pembeda dan reliabilitas.
Khusus soal-soal pilihan ganda, dua tambahan parameter yaitu dilihat dari
peluang untuk menebak atau menjawab soal benar dan berfungsi tidaknya
pilihan jawaban, yaitu penyebaran semua alternative jawaban dari subyek-
subyek yang dites.
Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan
kualitas soal, yaitu apakah suatu soal dapat diterima karena telah didukung
oleh data statistik yang memadai, diperbaiki karena terbukti terdapat beberapa
kelemahan atau bahkan tidak digunakan sama sekali karena terbukti secara
empiris tidak berfungsi sama sekali. Sebagai contoh sehari-hari, sesorang
dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan
bahwa orang tersebut memang jujur. Contoh lain, seseorang dapat dikatakan
kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut sudah
banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang
sudah ada. Dari penjelasan dan contoh-contoh tersebut diketahui bahwa

11
validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumen
berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan
melalui pengalaman.
Ada dua macam validitas empiris, yakni ada dua cara yang dapat
dilakukan untuk menguji bahwa sebuah instrumen memang valid. Pengujian
tersebut dilakukan dengan membandingkan kondisi instrumen yang
bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang digunakan
sebagai pembanding kondisi instrumen dimaksud ada dua cara, yaitu yang
sudah tersedia dan yang belum ada tetapi akan terjadi di waktu yang akan
datang. Bagi instrumen yang kondisinya sesuai dengan kriterium yang sudah
ada tersedia, yang sudah ada disebut memiliki validitas “ada sekarang”, yang
ada dalam istilah bahasa inggris disebut memiliki concurrent validity.
Selanjutnya instrumen yang kondisinya sesuai dengan kriterium yang
diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas
prediksi, yang dalam istilah bahasa inggris disebut memiliki predictive
validity. Ada empat jenis validitas yang sering digunakan, yakni:
a) Validitas isi (content validity)
Validitas isi (content validity) sering pula dinamakan validitas
kurikulum yang mengandung arti bahwa suatu alat ukur dipandang
valid apabila sesuai dengan isi kurikulum yang hendak diukur.
Validitas isi berkenaan dengan kesanggupan alat penilaian data
mengukur isi yang seharusnya. Artinya, tes tersebut mampu
mengungkapkan isi suatu konsep atau variabel yang hendak diukur.
Misalnya tes hasil belajar bidang studi IPA harus bisa mengungkapkan
isi bidang studi tersebut. Hal ini bisa dilakukan dengan cara menyusun
tes yang bersumber dari kurikulum bidang studi yang hendak diukur.
Disamping kurikulum dapat juga diperkaya dengan melihat atau
mengkaji buku sumber. Tes hasil belajar tidak mungkin dapat
mengungkapkan semua materi yang ada dalam bidang studi tertentu
sekalipun hanya untuk satu semester. Oleh sebab itu, harus diambil

12
sebagian dari materi dalam bentuk sampel tes. Sampel harus dapat
mencerminkan materi yang terkandung dalam sseluruh materi bidang
studi. Cara yang ditempuh dalam menetapkan sampel tes adalah
memilih konsep-konsep materi yang esensial. Misalnya menetapkan
sejumlah konsep dari setiap pokok bahasan yang ada. Dari setiap
konsep dikembangkan beberapa pertanyaan tes. Disinilah pentingnya
peranan kisi-kisi sebagai alat untuk memenuhi validitas isi. Dalam hal
tertentu untuk tes yang telah disusun sesuai dengan kurikulum (materi
dan tujuannya) agar memenuhi validitas isi, dapat pula dimintakan
bantuan ahli bidang studi untuk menelaah apakah konsep materi yang
diajukan telah memadai atau tidak sebagai sampel tes. Dengan
demikian validitas isi tidak memerlukan uji coba dan analisis statistic
atau dinyatakan dalam bentuk angka-angka.
b) Validitas konstruksi (construct validity)
Konstruk (construct) adalah sesuatu yang berkaitan dengan
fenomena dan objek yang abstrak, tetapi gejalanya dapat diamati dan
diukur. Misalnya gaya grafitasi dapat dijadikan sebagai contoh untuk
memahami validitas konstruk.ketika buah apel jatuh ketanah, konstruk
tentang grafitasi dapat digunakan untuk menjelaskan memperkirakan
prilaku yang diamati.namun demikian kita tidak dapat melihat yang
dimaksud dengan kontruk grafitasi itu sendiri.
Hal yang bisa kita lihat hanyalah apel itu jatuh. Kita dapat
mengukur grafitasi dan mengembangkan teori tentang grafitasi.
Sebagai contoh lain jika rumusan Tujuan Instruksional Khusus (TIK).
“Siswa dapat membandingkan antara efek biologis dan efek
psikologis”, maka butir soal pada tes merupakan perintah agar siswa
membedakan anatar dua efek tersebut. “Konstruksi” dalam pengertian
ini bukanlah “susunan” seperti yang sering dijumpai dalam teknik,
tetapi merupakan rekaan psikologis yaitu suatu rekaan yang dibuat
oleh para ahli ilmu jiwa yang dengan suatu cara tertentu “memerinci”

13
isi jiwa atas beberapa aspek seperti ingatan (pengetahuan),
pemahaman, aplikasi dan seterusnya. Dalam hal ini, mereka
menganggap seolah-olah jiwa dapat dibagi-bagi. Tetapi sebenarnya
tidak demikian. Pembagian ini hanya merupakan tindakan sementara
untuk mempermudah mempelajari. Seperti halnya validitas isi,
validitas konstruksi dapat diketahui dengan cara memerinci dan
memasangkan setiap butir soal dengan setiap aspek dalam TIK.
Pengerjaannya dilakukan berdasarkan logika bukan pengalaman.
c) Validitas “ada sekarang” (concurrent validity)
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah
tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang
dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau
sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang,
concurrent). Dalam membandingkan hasil sebuah tes maka diperlukan
suatu kriterium atau alat banding. Maka hasil tes merupakan sesuatu
yang dibandingkan. Untuk jelasnya di bawah ini dikemukakan sebuah
contoh.
Misalnya seorang guru ingin mengetahui apakah tes sumatif yang
disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium
masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan
harian atau nilai ulangan sumatif yang lalu.
d) Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dengan meramal selalu mengenai
hal yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan
memiliki validitas prediksi atau validitas ramalan apabila mempunyai
kemampuan untuk meramalkan apa yang akan terjadi pada masa yang
akan datang. Misalnya tes masuk Perguruan Tinggi adalah sebuah tes
yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam

14
mengikuti kuliah di masa yang akan datang. Calon yang tersaring
berdasarkan hasil tes diharapkan mencerminkan tinggirendahnya
kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin
keberhasilannya kelak. Sebaliknya seorang calon dikatakan tidak lulus
tes karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak
mampu menikuti perkuliahan yang akan datang. Sebagai alat
pembanding validitas prediksi adalah nilainilai yang diperoleh setelah
peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika ternyata
siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester 1
dibandingkan dengan yang dahulu nilai tesnya lebih rendah maka tes
masuk yang dimaksud tidak memiliki validitas prediksi.

c. Mengukur Validitas

Pengertian umum untuk validitas item adalah demikian sebuah item dikatakan
valid apabila mempunyai dukungan yang besar terhadap skor total. Skor pada
item menyebabkan skor total menjadi tinggi atau rendah. Dengan kata lain dapat
dikemukakan di sini bahwa sebuah item memiliki validitas yang tinggi jika skor
pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini dapat
diartikan dengan korelasi sehingga untuk mengetahui validitas item digunakan
rumus korelasi seperti sudah diterangkan di atas. Untuk soal-soal bentuk objektif
skor untuk item biasa diberikan dengan 1 (bagi item yang dijawab benar) dan 0
(item yang dijawab salah), sedangkan skor total selanjutnya merupakan dari skor
untuk semua item yang membangun soal tersebut. Salah satu cara untuk
menetukan validitas alat ukur adalah dengan menggunakan korelasi product
moment dengan simpangan yang dikemukakan oleh Person sebagai berikut :

Keterangan:

15
= koefisien korelasi antara variable x dan variabel y, dua variabel lain yang
dikorelasikan

= jumlah perkalian antara x dan y

= kuadrat dari x

= kuadrat dari Y

Tabel 1. Kriteria Korelasi Koefisien Validitas


No Nilai r antara Klasifikasi
1. 0,000 – 0,200 Korelasi sangat rendah
2. 0,200 – 0,400 Korelasi rendah
3. 0,400 – 0,600 Korelasi cukup
4. 0,600 – 0,800 Korelasi tinggi

d. Faktor yang Mempengaruhi Validitas


Hasil Tes Banyak faktor yang dapat mempengaruhi hasil tes evaluasi tidak
valid. Beberapa faktor tersebut secara garis besar dapat dibedakan menurut
sumbernya, yaitu faktor internal dari tes, faktor eksternal tes dan faktor yang
berasal dari peserta didik yang bersangkutan.
1) Faktor yang berasal dari dalam tes. Beberapa sumber yang pada umumnya
berasal dari faktor internal tes evaluasi di antaranya sebagai berikut.
a) Arahan tes yang disusun dengan makna tidak jelas sehingga dapat mengurangi
validitas tes.
b) Kata-kata yang digunakan dalam struktur instrumen evaluasi terlalu sulit.
c) Item-item tes dikonstruksi dengan jelek.
d) Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang
diterima peserta didik.
e) Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu
kurang atau terlalu longgar.

16
f) Jumlah item tes terlalu sedikit sehingga tidak mewakili sampel materi
pembelajaran.
g) Jawaban masing-masing item evaluasi bisa diprediksi peserta didik.
2) Faktor yang berasal dari administrasi dan skor
Faktor ini dapat mengurangi validitasi interpretasi tes evaluasi, khususnya tes
evaluasi yang dibuat oleh guru. Berikut beberapa contoh faktor yang sumbernya
berasal dari proses administrasi dan skor.
a) Waktu pengerjaan tidak cukup sehingga peserta didik dalam
b) Memberikan jawaban dalam situasi yang tergesa-gesa.
c) Adanya kecurangan dalam tes sehingga tidak bisa membedakan antara peserta
didik yang belajar dengan yang melakukan kecurangan.
d) Pemberian petunjuk dari pengawas yang tidak dapat dilakukan pada semua
peserta didik.
e) Teknik pemberian skor yang tidak konsisten, misalnya pada tes esai, juga dapat
mengurangi validitas tes evaluasi.
f) Peserta didik tidak dapat mengikuti arahan yang diberikan dalam tes baku.
g) Adanya joki (orang lain bukan peserta didik) yang masuk dan menjawab item
tes yang diberikan.
3) Faktor-faktor yang berasal dari jawaban peserta didik Seringkali terjadi bahwa
interpretasi terhadap item-item tes evaluasi tidak valid, karena dipengaruhi oleh
jawaban peserta didik daripada interpretasi itemitem pada tes evaluasi. Sebagai
contoh, sebelum tes para peserta didik menjadi tegang karena guru pengampu
mata pelajaran dikenal killer, galak dan sebagainya sehingga peserta didik yang
ikut tes banyak yang gagal.Contoh lain, ketika peserta didik melakukan tes unjuk
kerja (seperti di laboratorium), ruangan terlalu ramai atau gaduh sehingga para
peserta didik tidak dapat konsentrasi dengan baik.Ini semua dapat mengurangi
nilai validitas instrumen evaluasi.

B. Reliabilitas
a. Pengertian Reliabilitas

17
Beberapa pengertian validitas menurut para ahli sebagai berikut
a. Sudijono (2005), Pengertian Reliabilitas adalah serangkaian pengukuran
atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran
yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reabilitas
tes adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu
tes dapat dipercaya untuk menghasilkan skor yang ajeg, relatif tidak
berubah walaupun diteskan pada situasi yang berbeda-beda.
b. Sukadji (2000), reliabilitas suatu tes adalah seberapa besar derajat tes
mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan
dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti
reliabilitas tinggi.
c. Nursalam (2003), reliabilitas adalah kesamaan hasil pengukuran atau
pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati
berkali – kali dalam waktu yang berlainan. Alat dan cara mengukur atau
mengamati sama – sama memegang peranan penting dalam waktu yang
bersamaan.
d. Festiyed (2013), reliabilitas didefinisikan sebagai tingkat kemampuan hasil
dari dua pengukuran terhadap hal yang sama. Atau reliabilitas adalah
ukuran untuk menilai apakah alat ukur yang diuraikan mampu
memberikan nilai pengukuran yang konsisten.
Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka
dapat diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk
mengukur atau mengamati sesuatu yang menjadi objek ukur.

b. Metode untuk Menentukan Reliabilitas


1) Tes metode (Stabilitas)
Menggunakan sebuah instrumen, namun diteskan dua kali.Hasil atau skor
pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya
indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang
digunakan yaitu rumus korelasi produk momen.

18
2) Paralel (Ekuivalen)
Metode ekuivalen sering pula dinamakan alternate-forms methods.
Metode ini berkaitan dengan pengguanaan dua buah tes yang sama atau
alternatif sama kepada peserta didik yang sama. Kesamaan yang
dimaksud pada tes adalah kesamaan tujuan, tingkat kesukaran, dan
susunan. Pelaksanaan metode ini adalah dengan cara sebagai berikut :
a) Sajikan satu bentuk tes misalnya saja tes fisika seri pertama kepada
peserta didik kelas XII SMA.
b) Setelah beberapa waktu, sajikan satu bentuk tes fisika seri kedua
kepada peserta didik kelas XII SMA yang sama. Skor perolehan kedua tes
itu lalu dikorelasikan.Koefisien korelasi dari kedua tes tersebut digunakan
untuk mengestimasi koefisien reliabilitas tes.Korelasi yang digunakan
adalah korelasi produk momen.Jika koefisien korelasi tinggi, maka
reliabilitas tesnya juga tinggi.
3) Belah Dua(Split-Half Methods)
Metode ini sering pula dinamakan sebagai single-test-single-trial
method.Metode ini merupakan metode yang sangat sederhana yaitu:
a) Menyelenggarakan satu kali tes
b) Membagi tes tersebut menjadi dua bagian yang sama (sama banyak
soalnya),
c) Mengkorelasikan skor kedua belahan ini untuk mengestimasi
reliabilitas tes
⁄ ⁄
r11 =
( ⁄ ⁄
)

Keterangan :
r1/2r/2= korelasi antara skor-skor setiap belahan tes
r11 = koefisien reliabilitas yang sudah disesuaikan.

4) Internal Konsistensi

19
Nunnaly (1972) menyatakan bahwa internal konsistensi
didasarkan pada homogenitas atau korelasi antar skor jawaban pada setiap
butir tes.Iya juga menyatakn bahwa metode inikhususnya digunakan pada
butir-butir yang dikotomi seperti soal pilihan ganda. Jika korelasi rerata
antar butir soal tinggi maka reliabilitasnya juga tinggi.Jika korelasi rerata
mendekati nol, maka internal konsistensi nol pula dan reliabilitasny
rendah. Terdapat teknik dan persamaan yang digunakan untuk mencari
reliabilitas dengan internal konsistensi ini yaitu: Persamaan Kuder-
Richardson (KR-20). Kuder Richardson adalah dua orang ahli psikometri
yang merumuskan persamaan untuk mencari reliabilitas sebagai berikut:
Seperti yang telah dijelaskan sebelumnya, bahwa reliabilitas dari bahan
ajar cetak dapat ditentukan dengan melihat nilai reliabilitas butir item angket uji
validitas yang diberikan pada validator. Pengolahan data dari angket yang telah
diisi validator dilakukan secara statistik. Reliabilitas dikenal juga dengan istilah
konseistensi, keajengan, ketatapan, kestabilan dan keandalan.
Instrumen yang reliabel belum tentu valid. Reliablitas instrumen digunakan
sebagai syarat untuk pengujian validitas instrumen. Instrumen digunakan sebagai
syarat untuk pengujian validitas instrumen.
Tabel 2. Kriteria Reliabilitas Suatu Instrumen
No Koefisien Reliabilitas Klasifikasi
1 0,00≤r11<0,20 Sangat rendah
2 0,20≤ r11<0,40 Rendah
3 0,40≤ r11<0,60 Sedang
4 0,60≤ r11<0,80 Tinggi
5 0,80≤ r11<1,00 Sangat tinggi
(Sumber: Arikunto, 2012: 119)
Nilai r yang diperoleh di bandingkan dengan r tabel. Jika fhitung> ftabel, maka di
simpulkan item angket reliabel, dengan demikian maka dapat juga disimpulkan
bahwa bahan ajar cetak yang dirancang bersifat reliabel.

20
BAB III
PEMBAHASAN
A. Matriks Validitas dan Reliabilitas
Sebuah instrumen yang valid belum tentu reliabel, tetapi instrumen yang reliabel sudah tentu valid. Pernyataan ini
menandakan bahwa sebuah validitas dan reliabilitas adalah dua hal yang tidak dapat dipisahkan dalam pengkonstruksian sebuah
instrumen, jika ingin dikatakan baik. Hal tersebut secara implisit diuraikan pada Tabel 2 dan Tabel 3.
Tabel 3. Matriks Jenis Validitas
Pengertian Festiyed (2019), validitas adalah suatu konsep yang berkaitan dengan sejauhmana tes telah mengukur apa yang
seharusnya diukur.
Azwar (1986) Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan
suatu alat ukur dalam melakukan fungsi ukurnya.
Arikunto (1999) Validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes.
Suharsimi Arikunto, validitas adalah keadaan yang menggambarkan tingkat instrumen bersangkutan yang mampu
mengukur apa yang akan diukur.
Nursalam (2003), validitas adalah suatu ukuran yang menunjukkan tingkat kevalidan atau kesahihan suatu
instrumen
Jenis Validitas Menurut Festiyed (2019) terdapat berbagai bentuk validitas, antara lain:
a. Validitas Logis

21
Validitas logis untuk sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrument, yaitu validitas isi dan
validitas konstruk.
1) Validitas isi (content validity)
Validitas isi berkenaan dengan kesangguapan dengan alat penilaian data mengukur isi yang seharusnya,
artinya, tes tersebut mampu mengungkapkan isi suatu konsep atau variabel yang hendak diukur.
2) Validitas konstruksi (construct validity)
Konstruk adalah sesuatu yang berkaitan dengan fenomena dan objek yang abstrak, tetapi gejalanya dapat
diamati dan diukur.
b. Validitas Empiris
Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman.
Ada dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan untuk menguji bahwa sebuah
instrument memang valid. Pengujian tersebut dilakukan dengan membandingkan kondisi instrument yang
bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang digunakan sebagai pembanding kondisi
instrument dimaksud ada dua cara yaitu yang sudah tersedia atau sering disebut validitas ada sekarang
(concurrent validity) dan yang belum ada tetapi akan terjadi di waktu yang akan datang disebut validitas
prediksi (predictive validity).

22
Mengukur Validitas Untuk mencari tingkat validitas digunakan rumus productmoment metodaPearson sebagai berikut:

dimana x = X – Xrata-rata dan y = Y – Yrata-rata(1)


Keterangan:
x = Deviasi penilaian akhir
y = Deviasi penilaian awal
r = Korelasi antara x dan y (dua variabel yang akan dikorelasikan)
Dari nilai r yang telah didapatkan maka perlu interpretasi dari nilai tersebut untuk menunjukkan kevalidan
suatu penilaian. Kriteria nilai r yang digunakan untuk menentukan suatu penilaian valid dapat dilihat pada Tabel 1
berikut:
Tabel Kriteria Korelasi Koefisien Validitas
Koefisien Makna
0.00-0.20 Kecil
0.20-0.40 Rendah
0.40-0.70 Sedang
0.70-0.90 Tinggi
0.90-1.00 Sangat Tinggi
(Sumber: surapranata,2005:56-59)

23
Tabel 4. Matriks Reliabilitas
Pengertian Sugiono (2005), Pengertian Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki
konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reabilitas tes adalah
tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang
ajeg, relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda.
Sukadji (2000), reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang
diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas
tinggi.
Nursalam (2003), reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup
tadi diukur atau diamati berkali – kali dalam waktu yang berlainan. Alat dan cara mengukur atau mengamati sama
– sama memegang peranan penting dalam waktu yang bersamaan.
Jenis Reliabilitas Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu:
1. Relibilitas stabilitas. Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau
setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang
sama, definisi operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada waktu yang
berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau
hampir sama.
2. Reliabilitas ekivalen. Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang
berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indicator

24
yang berbeda, batasan-batasan operasional, paeralatan pengumpulan data, dan / atau pengamat-pengamat.
Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa
bentuk. Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam
survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka
pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan
sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam
skor, lalu skor masing-masing bagian terseb itu dibandingkan. Apabila dalam skor kemudian skor masing-
masing bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah.
Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan
misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai
dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah
menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.
Teknik Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada diluat tes (consistency external) dan
Pengujian pada tes itu sendiri (consistency internal). Teknik mencari besarnya reliabilitas terbagi atas 3.
Realibilitas a. Metode bentuk paralel
Instrument Tes paralel atau tes ekivalen adalah 2 buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan
susunan tetapi butir-butir soalnya berbeda. Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan
dua buah tes, dan masig-masing dicobakan pada kelompok siswa yang sama. Oleh sebab itu disebut juga double
test-double-trial method. Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus

25
menyusun dua seri tes. Lagipula harus tersedia waktu yang lama untuk mencobakan 2 kali tes.
b. Metode tes ulang
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam metode ini pengetes
hanya memiliki satu seri tes tetapi dicobakan 2 kali. Oleh karena itu tes nya hanya satu dan dicobakan 2 kali
disebut juga dengan single test-double –trial method. Kemudian hasil dari kedua kali tes tersebut dihitung
korelasinya.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes yang pertama. Hal ini tidak
mengapa karena pengetes harus sadar akan adanya practice effect dan carry over effect.
c. Metode Belah Dua atau Split-half Method
Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh
karena itu, disebut juga single-test-single trial method.
d. Internal konsistensi
Internal konsistensi didasarkan pada homogenitas atau korelasi antar skor jawaban pada setiap butir tes.
Metode ini khususnya digunakan pada butir-butir yang dikotomi sperti soal pilihan ganda.
Penilaian Salah satu cara yang bisa dipakai untuk menentukan reliabilitas adalah dengan cara ekuivalen. Metode
Reliabilitas ekuivalen sering pula dinamakan alternate-forms methods atau doble-test-trial method. Menurut Sumarna (2005:
97),metode ini berkaitan dengan penggunaan dua buah penilaian tertulis yang sama atau relatif sama kepada
peserta didik yang sama. Kesamaan yang dimaksudadalah kesamaan tujuan, tingkat kesukaran, dan susunan.
Persamaan yang dipakai untuk menentukan reliabilitas penilaian tertulis dengan metode ekuivalen adalah sebagai

26
berikut :
n
 n  n 
N  x1i x2i    X 1i   X 2i 
r i 1  i 1  i 1  (2)
 n  n

2
  n
 n

2

 N  X 12i    X 1i    N  X 22i    X 2i  
 i 1  i 1    i 1  i 1  

Keterangan :
r = Reliabilitas secara keseluruhan
N = Jumlah peserta
X1 = Nilai awal
X2 = Nilai akhir
Klasifikasi Indeks Reliabilitas
No Indeks Klasifikasi
1. 0,00 – 0,20 Sangat rendah
2. 0,20 – 0,40 Rendah
3. 0,40 – 0,60 Sedang
4. 0,60 – 0,80 Tinggi
5. 0,80 – 1,00 Sangat tinggi
(Guilforfd dalam Rusfendi, 2005:160)

27
28
BAB IV
SOAL DAN JAWABAN

1. Bagaimana suatu perangkat dapat dikatakan memiliki kualitas empiris?


Jawaban:
Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari
pengalaman
2. Apa perbedaan antara reabilitas stabilitas dengan reabilitas ekivalen?
Jawaban:
Relibilitas stabilitas. Menyangkut usaha memperoleh nilai yang sama atau serupa untuk
setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya sedangkan
Reliabilitas ekivalen. Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis
ukuran yang berbeda pada waktu yang sama.
3. Jelaskan masing-masing cara melakukan tes reabilitas
Jawaban:
a. Metode bentuk paralel
Tes paralel atau tes ekivalen adalah 2 buah tes yang mempunyai kesamaan tujuan, tingkat
kesukaran, dan susunan tetapi butir-butir soalnya berbeda. Dalam menggunakan metode
tes paralel ini pengetes harus menyiapkan dua buah tes, dan masig-masing dicobakan pada
kelompok siswa yang sama. Oleh sebab itu disebut juga double test-double-trial method.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus
menyusun dua seri tes. Lagipula harus tersedia waktu yang lama untuk mencobakan 2 kali
tes.
b. Metode tes ulang
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam metode
ini pengetes hanya memiliki satu seri tes tetapi dicobakan 2 kali. Oleh karena itu tes nya
hanya satu dan dicobakan 2 kali disebut juga dengan single test-double –trial method.
Kemudian hasil dari kedua kali tes tersebut dihitung korelasinya.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes yang pertama.
Hal ini tidak mengapa karena pengetes harus sadar akan adanya practice effect dan carry
over effect.
c. Metode Belah Dua atau Split-half Method
Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu
kali. Oleh karena itu, disebut juga single-test-single trial method.

29
d. Internal konsistensi
Internal konsistensi didasarkan pada homogenitas atau korelasi antar skor jawaban pada
setiap butir tes. Metode ini khususnya digunakan pada butir-butir yang dikotomi sperti
soal pilihan ganda.

30
BAB V
PENUTUP

A. Kesimpulan
1. Sebuah instrumen asesmen yang baik harus meninjau dari validitas dan reliabilitas
2. Perbedaan validitas dan reliabilitas dari sebuah instrumen asesmen dilihat pertama dari
pengertiannya. Validitas adalah suatu standar ukuran yang menunjukkan ketepatan dan
kesahihan suatu instrument. Sedangkan, reliabilitas adalah suatu keajegan suatu tes untuk
mengukur atau mengamati sesuatu yang menjadi objek ukur. Kedua, dari cara mengukur.
Untuk mencari tingkat validitas digunakan rumus productmoment metode Pearson dengan
melihat hubungan antara x dan y, sedangkan untuk mengetahui reliabilitas seluruh tes
harus digunakan rumus Spearman-Brown.
B. Saran
Demikianlah makalah ini kami buat, semoga apa yang telah disajikan akan memberikan
ilmu dan informasi. Selanjutnya demi kesempurnaan makalah ini kami memohon saran dan
kritik guna memperbaiki dikemudian hari.

31
DAFTAR PUSTAKA

Al-Qur`an dan Terjemahan. Depag. PT. Syaamil Cipta Media.


Permendikbud No. 23 tahun 2016 tentang Standar Penilaian Pendidikan. Jakarta: Depdiknas
Arikunto, Suharsimi. (2009). Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
Azwar, S. (1986). Reliabilitas dan Validitas: Interpretasi dan Komputasi. Yogyakarta :
Liberty.
Festiyed. (2019). Evaluasi Pembelajaran Fisika. Padang: SUKABINA Press
Purwanto. (2011). Evaluasi Hasil Belajar. Surakarta: Pustaka Pelajar.
Ruseffendi, E. T. (2005). Dasar-dasar Penelitian Pendidikan dan Bidang Non Eksakta
Lainnya. Bandung: Tarsito.
Sudjana, Nana. (2010). Penilaian Hasil Proses Belajar Mengajar. Bandung: PT Remaja
Rosdakarya
Sudijono, A. (2009).Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press.
Sukadji, Soetarlinah. (2000). Penyusunan dan Mengevaluasi Laporan Penelitian.Universitas
Indonesia Press:Jakarta
Surapranata, Sumarna. (2004). Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes.
Bandung: PT Remaja Rosda Karya.
Zainul & Nasution. (2001). Penilaian Hasil belajar. Jakarta: Dirjen Dikti.

32

Anda mungkin juga menyukai