Anda di halaman 1dari 48

VALIDITAS &

RELIABILITAS
Langkah-Langkah Pengembangan Instrumen
Langkah-langkah pengembangan instrumen penelitian
kinerja adalah :

1. Merumuskan definisi konseptual & operasional

2. Pengembangan spesifikasi & penulisan pernyataan

3. Penelaahan pernyataan

4. Uji coba

5. Analisa

6. Revisi

7. Perakitan instrumen menjadi instrumen final


Validitas Instrumen

 Instrumen yang baik (baik tes maupun non tes) harus valid
dan reliabel.

 Valid berarti instrumen tersebut dapat digunakan untuk


mengukur apa yang hendak diukur.

 Validitas suatu tes menunjukkan tingkat ketepatan suatu


tes untuk mengukur apa yang harus diukur.
Validitas Instrumen

 Berdasarkan cara pengujiannya validitas dibagi menjadi:


 Validitas internal atau rasional, yaitu bila kriteria yang
ada dalam instrumen secara rasional (teoritis) telah
mencerminkan apa yang diukur.
Dikembangkan menurut teori yang relevan.

 Validitas eksternal, yaitu bila kriteria di dalam instrumen


disusun berdasarkan luar atau fakta-fakta empiris yang
telah ada.
Dikembangkan menurut fakta empiris.
Validitas Instrumen

 Validitas suatu tes adalah sejauh mana ketepatan tes tersebut


dalam mengukur apa yang seharusnya diukur oleh tes tersebut.

 The American Education Research Association (AERA) dan


Fraenkel (1990), membedakan validitas menjadi tiga jenis, yaitu :

1. Validitas isi (content validity),

2. Validitas yang dikaitkan dengan kriteria (criterion-related


validity), dan

3. Validitas konstruk (construct validity).


Validitas Isi (content validity)
 Validitas isi (content validity) menunjuk kepada sejauh mana
tes tersebut mencerminkan isi materi yang akan diukurnya.

Cara Penetapan Validitas Isi:


 Penilaian validitas isi suatu tes, adalah untuk menilai
seberapa jauh isi tes tersebut mencerminkan seluruh pokok
bahasan dan tingkatan pengetahuan (aspek) yang akan
diukur.
 Validitas isi tidak dapat dinyatakan dalam bentuk angka.
Penetapan (validasi) isi hanya didasarkan pada
pertimbangan (judgement) belaka.
Validitas Isi (content validity)
 Penetapan validitas isi  dengan membuat tabel spesifikasi (kisi-
kisi) tes atau instrumen yang akan disusun
 Untuk melakukan evaluasi eksternal terhadap validitas isi,
dilakukan melalui validasi ahli (expert judgement).

 Validitas muka (validitas bentuk soal)


merupakan keabsahan susunan kalimat atau kata-kata dalam
soal, sehingga jelas pengertiannya atau tidak menimbulkan
tafsiran lain.
Validitas Muka
 tipe validitas yang paling rendah signifikasinya karena hanya
didasarkan pada penilaian sepintas tentang isi alat ukur.
 merupakan keabsahan susunan kalimat atau kata-kata dalam
soal, sehingga jelas pengertiannya atau tidak menimbulkan
tafsiran lain.
 Jika isi alat ukur sudah tampak sesuai dengan apa yang ingin
diukur maka bisa dikatakan validitas muka telah terpenuhi.
Kisi-Kisi Soal Unas
BAHASA INDONESIA SMP/MTs
STANDAR KOMPETENSI KEMAMPUAN YANG DIUJI
LULUSAN
MEMBACA Menentukan isi dan bagian suatu
Membaca dan paragraf
memahami berbagai Menentukan kritik terhadap isi
ragam wacana tulis bacaan
(artikel, berita,
Menentukan isi dan penyajian
opini/tajuk, tabel,
teks berita, opini/tajuk
bagan, grafik, peta,
denah), berbagai Menentukan kalimat
karya sastra fakta/pendapat
berbentuk puisi, Menyimpulkan isi paragraf
cerpen, novel, dan Menentukan isi tajuk, dsb.
drama.
Validitas yang Dikaitkan dengan Kriteria
 Validitas yang dikaitkan dengan kriteria menunjukkan kepada
sejauhmana hubungan antara skor tes yang dikembangkan
dengan kriteria luar yang mandiri dan dipercaya dapat
menggambarkan tingkah laku atau ciri-ciri yang diselidiki.

 Validasi suatu instrumen dengan membandingkannya dengan


instrument pengukuran lainnya yang sudah valid dan reliabel
dengan cara mengkorelasikannya, bila korelasinya signifikan,
maka instrumen tersebut mempunyai validitas kriteria.
Validitas Pengukuran Setara
(Congruent Validity)
 Jenis validitas ini ditetapkan dengan cara mengkorelasikan
antara skor tes yang sedang disusun/dikembangkan dengan skor
dari tes yang setara/sejenis.

 Pada validitas pengukuran setara yang dijadi-kan tolok ukurnya


adalah skor-skor tes yang sejenis yang sudah baku.
 Misalnya, dengan mengkorelasikan hasi tes intelegensi yang baru,
yang akan divalidasi dengan skor tes inteligensi yang sudah baku.
Validitas Pengukuran Serentak
(Concurrent Validity)
 Validitas ini ditetapkan dengan cara mengkorelasikan hasil skor
tes yang sedang disusun dengan skor tes lain (yg tidak sejenis)
yang saat pengetesannya dilakukan bersamaan atau hampir
berdekatan waktunya (minimal time).

 Tolok ukur pada validitas pengukuran serentak ini adalah skor tes
yang tidak sejenis yang diasumsikan dapat mencerminkan aspek
perilaku yang sedang dikembangkan tesnya, tetapi diberikan
dalam waktu yang sama atau hampir bersamaan.
Validitas Ramalan
(Predictive Validity)
 Jenis validitas ini ditetapkan dengan cara mengkorelasikan skor
tes yang sedang disusun dengan kriteria yang menyangkut hasil
karya atau prestasinya di masa yang akan datang.
 Misal, menyelidiki hubungan antara skor tes masuk perguruan
tinggi (SNMPTN) dengan indeks prestasi (IP) di perguruan tinggi
yang dicapai oleh seorang mahasiswa, ATAU korelasi antara skor
tes seleksi CPNS dgn kinerja pegawai tsb.
Validitas Konstruk
(Construct Validity)
 Validitas konstruk disebut juga sebagai validitas konsep.

 Tolok ukur untuk menilai validitas konstruk ini adalah


konsep/konstruk teori yang melatar-belakangi penyusunan tes/
instrumen yang bersangkutan.
Cara Penetapan Validitas Konstruk
 Korelasi dengan ukuran lain, misal: korelasi antara skor tes
inteligensi yg sedang dikembangkan dengan prestasi belajar.

 Pembedaan (kontras) antar kelompok yg memang benar-benar


berbeda, misal: perbandingan kinerja antara sekolah kategori
baik dan kurang.

 Melalui analisis intra tes  Analisis Faktor

 Dengan matriks multi-trait multi metode  untuk menentukan


validitas konvergen dan validitas deskriminan.
Kesalahan Terkait Validitas Konstruk
 Terdapat sumber referensi yang menyatakan bahwa
validitas konstruk dapat ditetapkan berdasarkan validasi
ahli (expert judgement).

 Validitas konstruk yg didasarkan pada validasi ahli 


disebut validitas logical construct.

 Validitas konstruk pada umumnya banyak ditentukan


berdasarkan bukti-bukti empiris.

 Validitas konstruk tidak mudah dipahami oleh orang yg


tidak belajar pengukuran.
Permasalahan yang terkait Validitas
yang dikaitkan dengan Kriteria:
 Pada validitas yang berkaitan dengan kriteria, tes dikatakan
memiliki validitas yang tinggi jika hasilnya memiliki kesejajaran
dengan kriteria yang telah ditetapkan.
 Validitas ini lebih memberikan tekanan pada kriterianya, dan
bukan pada tesnya sendiri.
 Tes yang valid atau mempunyai kesejajaran dengan kriteria
belum tentu mengukur aspek-aspek yang seharusnya diukur oleh
tes tersebut. Atau tes tersebut tidak memiliki validitas isi yang
baik.
 Kemungkinan mengambil suatu kriteria yang kurang relevan
dengan konsep yang akan diukurnya.
Permasalahan dalam Penetapan Validitas Isi
 Lebih mendasarkan pada keputusan subyektif (judgment)
penilai.

 Kesulitan dlm menentukan sampel SK-KD maupun butir yg dapat


mewakili universum isi materi yg akan diujikan.

 Untuk materi yg berasal dari kurikulum yg berbeda-beda, dan


cakupannya sangat luas serta heterogen (seperti Unas Kejuruan
SMK), sulit dalam menentukan SK-KD esensial yang akan diujikan.
Validitas Isi
Validitas
Teoritik Validitas Konstruk

Validitas

Validitas Banding
Validitas
Kriterium Validitas Ramal
Validitas Teoritik
Merupakan validitas yang didasarkan pada pertimbangan para
ahli.
Validitas teoritik terdiri dari:
1. Validitas isi (validitas kurikuler),
merupakan ketepatan suatu tes ditinjau dari segi materi
yang diujikan.
2. Validitas muka (validitas bentuk soal),
merupakan keabsahan susunan kalimat atau kata-kata
dalam soal, sehingga jelas pengertiannya atau tidak
menimbulkan tafsiran lain.
Validitas Kriterium
yaitu validitas yang ditinjau berdasarkan hubungannya dengan kriteria
tertentu.
 Tinggi-rendahnya koefisien validitas tes hasil ditentukan berdasarkan hasil
perhitungan koefisien korelasi.
 Validitas kriterium terdiri dari:
1. Validitas banding (validitas bersama atau validitas yang ada sekarang)
yaitu validitas tes yang diperoleh dengan cara menghitung koefisien
korelasi antara nilai-nilai hasil tes yang akan diuji validitasnya
dengan nilai-nilai hasil tes terstandar yang telah mencerminkan
kemampuan siswa.
Jika tes terstandar belum tersedia, maka kita dapat menggunakan nilai
rata-rata ulangan harian sebagai hasil dari tes terstandar.
Validitas Kriterium
2. Validitas ramal,
yaitu validitas yang berkenaan dengan kemampuan suatu tes untuk dapat
meramalkan keadaan yang akan datang berdasarkan kondisi yang ada
sekarang.

Untuk menentukan tingkat validitas kriterium suatu tes dilakukan dengan


menghitung koefisien korelasi antara nilai-nilai hasil tes yang akan diuji
validitasnya dengan nilai-nilai hasil tes yang telah ada dan sudah diketahui atau
diasumsikan memiliki validitas tes yang memadai.
Validitas Butir
 Validitas butir  adalah korelasi antara skor butir tertentu
dengan skor tes atau instrumen secara keseluruhan.

 Butir tes yg valid  adalah butir yang memiliki kesejajaran


(korelasi yg tinggi) dengan total tes.
Validitas Butir
Cara Menentukan Validitas Butir:

1. Skor butir interval/rasio  korelasi product moment

2. Skor butir dikhotomi  korelasi point-biserial

3. Skor butir ordinal/nominal  korelasi rank-spearman


Koefisien Validitas
Ada tiga cara mencari koefisien validitas suatu tes, yaitu:
1. Korelasi produk momen dengan memakai simpangan

x y i i
rxy  i 1

 n
2 
n
2
  x i   yi 
 i 1  i 1 
Koefisien Validitas
Ada tiga cara mencari koefisien validitas suatu tes, yaitu:
2. Korelasi produk momen menggunakan angka kasar
(korelasi produk momen Pearson)

n n n
n  x i yi   x i  yi
rxy  i 1 i 1 i 1

 n 2  n  2  n 2  n  2 
 n x   x   n y   y  
  i   i    i   i  
 i 1   i 1  i 1  
 i 1
Koefisien Validitas
Ada tiga cara mencari koefisien validitas suatu tes, yaitu:
3. Korelasi Rank Spearman-Brown

n
6 d i
2

rxy  1  i 1
n(n  1)2
Kriteria Koefisien Validitas
Berdasarkan Guilford, 1956, h. 145 adalah sebagai berikut:

0,80 < rxy  1,00 korelasi sangat tinggi (sangat baik)


0,60 < rxy  0,80 korelasi tinggi (baik)
0,40 < rxy  0,60 korelasi sedang (cukup)
0,20 < rxy  0,40 korelasi rendah (kurang)
0,00 < rxy  0,20 korelasi sangat rendah (jelek)
rxy  0,00 tidak valid
Pengujian Keberartian Koefisien Korelasi

Reliabilitas
 adalah tingkat ketetapan suatu tes mengukur apa yang harus diukur.

Teknik Belah
Tes
Dua
Tunggal
Teknik Non
Tes
Belah Dua
Reliabilitas Cara Ulang
Pengujian

Tes
Ekuivalen

Tes Uraian
Reliabititas tes tunggal
 Tes tunggal adalah tes yang terdiri dari satu set yang diberikan
terhadap sekelompok subjek dalam satu kali pengetesan,
sehingga dari hasil pengetesan hanya diperoleh satu
kelompok data.

 Ada dua teknik untuk perhitungan reliabilitas tes, yaitu:

- Teknik Belah Dua

- Teknik Non Belah Dua


Reliabititas tes tunggal
Teknik belah dua
 Dilakukan dengan cara membagi tes menjadi dua bagian
yang relatif sama (banyaknya soal sama), sehingga masing-
masing test mempunyai dua macam skor, yaitu skor belahan
pertama (awal / soal nomor ganjil) dan skor belahan kedua
(akhir / soal nomor genap).
 Koefisien reliabilitas belahan tes dinotasikan dengan r(1/2,1/2)
dan dapat dihitung dengan menggunakan rumus korelasi
angka kasar Pearson.
Reliabititas tes tunggal
Teknik belah dua
 Koefisien reliabilitas keseluruhan tes dihitung menggunakan
formula Spearman-Brown, yaitu:

2r1 1
r11  22

1  r1 1
22
Reliabititas tes tunggal
Teknik non belah dua
 Salah satu kelemahan perhitungan koefisien reliabilitas dengan
menggunakan teknik belah dua adalah :
(1) banyaknya butir soal harus genap,
(2) dapat dilakukan dengan cara yang berbeda
sehingga menghasilkan nilai yang berbeda pula
 Untuk mengatasi masalah tersebut dapat dilakukan dengan
menggunakan teknik non belah dua.
Reliabititas tes tunggal
Teknik non belah dua
 Untuk perhitungan koefisien reliabilitas dapat dilakukan
dengan menggunakan rumus Kuder-Richardson (KR-20) yaitu:

 2 n 
 s t   pi q i 
n  
r11  i 1
n 1  st2 
 
 
Reliabititas tes tunggal
Teknik non belah dua

Reliabititas tes tunggal
Teknik non belah dua
rumus Kuder-Richadson (KR-21), yaitu:

n  x t (n  x t ) 
r11   1  
n 1 2
ns t 
xt  rata - rata skor total
Reliabititas tes ulang
 Seperangkat tes diberikan terhadap sekelompok siswa
sebanyak dua kali. Reliabilitas tes dihitung dengan cara
menghitung koefisien korelasi antara hasil tes pertama dengan
hasil tes kedua untuk setiap siswa yang sama.
Reliabititas tes ekuivalen
 Dua buah tes dengan soal-soal pada tes pertama ekuivalen
dengan soal-soal pada tes kedua. Kedua soal diujikan kepada
sekelompok siswa yang sama kemudian dihitung koefisien
korelasi antara hasil tes pertama dengan hasil tes kedua.
Reliabititas tes uraian
 Untuk menghitung reliabilitas tes bentuk uraian dapat
dilakukan dengan menggunakan rumus Cronbach-Alpha,
yaitu:

 n
2 

n   si 
r11  1  i 1 2 
n 1 st 
 
 
Reliabititas tes uraian
 n adalah banyaknya butir soal.
 si adalah standar deviasi skor soal ke-i.
 st adalah standar deviasi skor total.
Kriteria Koefisien reliabilitas
Kriteria koefisien reliabilitas (Guilford, 1956: 145) adalah sebagai
berikut:

0,80 < r11  1,00korelasi sangat tinggi


0,60 < r11  0,80korelasi tinggi
0,40 < r11  0,60korelasi sedang
0,20 < r11  0,40korelasi rendah
-1,00  r11  0,20 korelasi sangat rendah (tidak reliable)
Daya pembeda soal
 Daya pembeda butir soal adalah angka yang menyatakan
kesanggupan suatu soal untuk membedakan siswa pandai
dengan yang kurang pandai.
 Untuk menentukan daya pembeda soal tersebut dapat
digunakan rumus:

Ba Bb
D 
Ja Jb
Daya pembeda soal
 D merupakan daya pembeda
 Ba merupakan jumlah kelompok atas yang menjawab benar
 Bb merupakan jumlah kelompok bawah yang menjawab
benar
 Ja merupakan jumlah kelompok atas
 Jb merupakan jumlah kelompok bawah
Kriteria Daya pembeda soal
INDEKS DAYA BEDA KLASIFIKASI
0,00 ≤ D ≤ 0,20 Jelek
0,20 < D ≤ 0,40 Cukup
0,40 < D ≤ 0,70 Baik
0,70 < D ≤ 1,00 Baik Sekali
Negatif Jelek Sekali

Sudijono (2006:372)
Indeks kesukaran
 Indeks kesukaran digunakan untuk melihat apakah soal tersebut
tergolong soal yang mudah, sedang atau sukar.
 Menurut Sudijono (2006: 372) untuk menentukan indeks
kesukaran digunakan rumus:

B
P
JS
Indeks kesukaran
 P menyatakan indeks kesukaran
 B menyatakan jumlah siswa yang menjawab pertanyaan betul
 JS menyatakan jumlah seluruh siswa peserta tes
Kriteria indeks kesukaran
 Ik (Indeks Kesukaran) Kualifikasi
P < 30 % terlalu sukar
30 % ≤ P ≤ 70 % sedang
P > 70 % terlalu mudah

Anda mungkin juga menyukai