Anda di halaman 1dari 7

1.

Validitas
Validitas isi ditentukan menggunakan kesepakatan ahli. Kesepakatan ahli bidang studi
atau sering disebut dengan domain yang diukur menentukan tingkatan validitas isi (content
related). Hal ini dikarenakan instrumen pengukuran, misalnya berupa tes atau angket
dibuktikan valid jika ahli (expert) meyakini bahwa istrumen tersebut mengukur penguasaan
kemampuan yang didefinisikan dalam domain ataupun juga konstruk psikologi yang diukur.
Untuk mengetahui kesepakatan ini, dapat digunakan indeks validitas, diantaranya dengan
indeks yang diusulkan oleh Aiken (1980; 1985). Indeks validitas butir yang diusulkan Aiken
ini dirumuskan sebagai berikut:
∑𝑆
V=
𝑛(𝑐−1)
S = skor yang ditetapkan oleh validator
n = Banyaknya Validator
c = Banyakya kategori yang dipilih validator
Dengan V adalah indeks validitas butir; s skor yang ditetapkan setiap rater dikurangi
skor terendah dalam kategori yang dipakai (s = r – lo, dengan r = skor kategori pilihan rater
dan lo skor terendah dalam kategori penyekoran); n banyaknya rater; dan c banyaknya
kategori yang dapat dipilih rater. Berdasarkan pendapat tersebut, V merupakan indeks
kesepakatan rater terhadap kesesuaian butir (atau sesuai tidaknya butir) dengan indikator
yang ingin diukur menggunakan butir tersebut. Jika diterapkan untuk instrument
pengukuran, menurut seorang rater maka n dapat digantidengan m (banyaknya butir dalam
satu instrumen). Indeks V ini nilainya berkisar diantara 0-1.
Kategori dari validitas instrument yang mengacu pada pengklasifikasian validitas yang
dikemukakan oleh Guilford (1956, h.145) adalah sebagai berikut:
0,80 < rxy ≤ 1,00 validitas sangat tinggi (sangat baik)
0,60 < rxy ≤ 0,80 validitas tinggi (baik)
0,40 < rxy ≤ 0,60 validitas sedang (cukup)
0,20 < rxy ≤ 0,40 validitas rendah (kurang)
0,00 < rxy ≤ 0,20 validitas sangat rendah (jelek)
Rxy ≤ 0,00 tidak valid
2. Reliabilitas
Reliabilaitas adalah tingkat ketetapan suatu instrumen mengukur apa yang harus diukur.
Ada tiga cara pelaksanaan untuk menguji reliabilitas suatu tes, yaitu: tes tunggal (single
test), tes ulang (test retest), dan tes ekuivalen (alternate test).
Reliabilitas Tes Tunggal (Internal Consistency Reliability)
Tes tunggal adalah tes yang terdiri dari satu set yang diberikan terhadap
sekelompok subjek dalam satu kali pengetesan, sehingga dari hasil pengetesan hanya
diperoleh satu kelompok data. Ada dua teknik untuk perhitungan reliabilitas tes, yaitu:
a. Teknik Belah Dua (Split-Half Technique).
Dilakukan dengan cara membagi tes menjadi dua bagian yang relatif sama
(banyaknya soal sama), sehingga masing-masing testi mempunyai dua macam skor,
yaitu skor belahan pertama (awal / soal nomor ganjil) dan skor belahan dinotasikan
dengan 𝑟1 1 dan dapat dihitung dengan menggunakan rumus yaitu korelasi angka
22

kasar Pearson. Selanjutnya koefisien reliabilitas keseluruhan tes dihitung


menggunakan formula Spearman-Brown, yaitu:
2𝑟1 1
22
𝑟11 =
1 + 𝑟1 1
22

Kategori koefisien reliabilitas (Guilford, 1956: 145) adalah sebagai berikut:

0,80 < r11 1,00 reliabilitas sangat tinggi


0,60 < r11 0,80 reliabilitas tinggi
0,40 < r11 0,60 reliabilitas sedang
0,20 < r11 0,40 reliabilitas rendah
-1,00 r11 0,20 reliabilitas sangat rendah (tidak reliable)

b. Teknik Non Belah Dua (Non Split-Half Technique).

Salah satu kelemahan perhitungan koefisien reliabilitas dengan menggunakan


teknik belah dua adalah banyaknya butir soal harus genap, dan dapat dilakukan
dengan cara yang berbeda sehingga menghasilkan nilai yang berbeda pula. Untuk
mengatasi masalah tersebut dapat dilakukan dengan menggunakan teknik non belah
dua. Untuk perhitungan koefisien reliabilitas dapat dilakukan dengan menggunakan
rumus Kuder-Richardson (KR-20) yaitu:

𝑟 2 𝑛
𝑛 𝑠 − ∑𝑖=1 𝑝𝑖 𝑞𝑖
11= 𝑛−1 ( 𝑡 )
𝑠𝑡2

dengan
n adalah banyaknya butir soal
pi adalah proporsi banyak subjek yang menjawab benar pada butir soal ke-i
qi adalah proporsi banyak subjek yang menjawab salah pada butir soal ke-i
s 2t adalah varians skor total.

Atau rumus Kuder-Richadson (KR-21), yaitu:

𝑟 𝑛 𝑥̅ ( 𝑛 − 𝑥̅ 𝑡 )
11= 𝑛−1 (1− 𝑡 )
𝑛𝑠𝑡2

dengan
r11 adalah koefisien reliabilitas
n adalah banyaknya butir soal
x t adalah rata-rata skor total
s 2t adalah varians skor total.

c. Reliabilitas Tes Uraian


Untuk menghitung reliabilitas tes bentuk uraian dapat dilakukan dengan
menggunakan rumus Cronbach-Alpha, yaitu:

𝑟 𝑛
𝑛 2
∑𝑖=1 𝑠𝑖
11= (1− )
𝑛−1 𝑠𝑡2

dengan:
r11 adalah koefisien reliabilitas
n adalah banyaknya butir soal.
𝑠𝑖2 adalah varians skor soal ke-i.
𝑠𝑖2 adalah varians skor total.
3. Indeks Kesukaran
Analisis indeks kesukaran dimaksudkan untuk mengetahui apakah soal tersebut
tergolong mudah atau sukar. Tingkat kesukaran adalah bilangan yang menunjukan sukar
atau mudahnya sesuatu soal. (Arikunto, 1999: 207).
Untuk menghitung tingkat kesukaran tiap butir soal digunakan persamaan:
𝐵
𝑃=
𝐽𝑥
Dengan
P adalah indeks kesukaran
B adalah banyaknya siswa yang menjawab soal dengan benar
Jx adalah jumlah seluruh siswa peserta tes.

Indeks kesukaran diklasifikasikan seperti tabel berikut:

P-P Klasifikasi
0,00 – 0,29 Soal sukar
0,30 – 0,69 Soal Sedang
0,70 – 1,00 Soal Mudah
(Arikunto; 1999: 210)

Rumus lain yang digunakan untuk menentukan tingkat kesukaran soal uraian sama dengan
soal pilihan ganda yaitu :

SA SB
T
k 100%
IA I B
Keterangan: Tk : Indeks tingkat kesukaran butir soal

SA : jumlah skor kelompok atas


SB : jumlah skor kelompok bawah
IA : jumlah skor ideal kelompok atas
IB : jumlah skor ideal kelompok bawah

Setelah indeks tingkat kesukaran diperoleh, maka harga indeks kesukaran tersebut
diinterpretasikan pada kriteria sesuai tabel berikut:
Indeks Tingkat Kriteria
Kesukaran
0 – 15 % Sangat sukar, sebaiknya
Dibuang
16 % – 30 % Sukar
31 % – 70 % Sedang
71 % – 85 % Mudah
86 % – 100 % Sangat mudah, sebaiknya di
Buang
(Karno To, 1996:15)

4. Daya Pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang
berkemampuan tinggi dengan siswa yang berkemampuan rendah (Arikunto, 1999 : 211).
Daya pembeda butir soal dihitung dengan menggunakan persamaan:
𝐵𝐴 𝐵𝐵
DP = −
𝐽𝐴 𝐽𝐵
(Arikunto, 1999: 213).
Dengan
DP merupakan Indeks daya pembeda
BA adalah banyaknya peserta tes kelompok atas yang menjawab soal dengan benar
BB adalah banyaknya peserta tes kelompok bawah yang menjawab soal dengan benar
JA merupakan banyaknya peserta tes kelompok atas
JB adalah banyaknya peserta tes kelompok bawah.
Kriteria indeks daya pembeda adalah sebagai berikut.

DP Kualifikasi

0,00 – 0,19 jelek

0,20 – 0,39 cukup

0,40 – 0,69 baik

0,70 – 1,00 baik sekali

Negatif tidak baik, harus

dibuang
Untuk mengetahui keberartian daya pembeda soal dilakukan dengan statistik uji-t,
dengan persamaan berikut.
𝑋𝑎 − 𝑋𝑏
t=
2 𝑆2
√ 𝑆𝑎 + √ 𝑏
𝑁𝑎 𝑁𝑏

(Subino dalam sunardi, 2003: 27).


dengan
t adalah Indeks Daya Pembeda (DP) antara kemampuan kelompok atas dengan kemampuan
kelompok bawah
Xa adalah skor rata-rata tiap item tes kelompok atas
Xb adalah skor rata-rata tiap item tes kelompok bawah
Sa adalah standar deviasi tiap item tes kelompok atas
Sb merupakan standar deviasi tiap item tes kelompok bawah
Na adalah jumlah siswa kelompok atas
Nb adalah jumlah siswa kelompok bawah.

Harga thitung yang dihasilkan dibandingkan dengan harga ttabel dengan dk = (Na –1)+(Nb – 1)
pada taraf kepercayaan 95%. Jika thitung > ttabel maka daya pembeda untuk soal tersebut
adalah signifikan.

Persamaan lain yang dapat digunakan untuk menentukan daya pembeda yaitu :
𝑆𝐴 − 𝑆𝐵
DP = 𝑥 100%
𝐼𝐴

Keterangan
DP : Indeks daya pembeda satu butir soal tertentu
𝑆𝐴 : Jumlah skor kelompok atas pada butir soal yang diolah
𝑆𝐵 : Jumlah skor kelompok bawah pada butir soal yang diolah
𝐼𝐴 : Jumlah skor maksimum salah satu kelompok pada butir soal yang diolah

Setelah indeks daya pembeda diketahui, maka harga tersebut diinterpretasikan pada kriteria
daya pembeda sesuai dengan tabel berikut.
Indeks Daya Kriteria Daya
Pembeda Pembeda
Negatif – 9% Sangat buruk, harus
dibuang
10 % – 19 % Buruk, sebaiknya
dibuang
20 % – 29 % Agak baik atau cukup
30 % - 49 % Baik
50 % ke atas Sangat baik
(Karno To, 1996:15)

Anda mungkin juga menyukai