Anda di halaman 1dari 17

BAB I

PENDAHULUAN

1.1 Latar Belakang

Mengukur adalah membandingkan sesuatu dengan satu ukuran, pengukuran


bersifat kuantitatif, Menilai adalah mengambil suatu keputusan terhadap sesuatu
dengan ukuran baik buruk, penilaian bersifat kualitatif dan Mengadakan evaluasi
meliputi kedua langkah di atas, yaitu mengukur dan menilai.
Analisis kualitas instrumen evaluasi atau istilah lainnya kualitas alat evaluasi
merupakan hal penting dalam melakukan evaluasi karena instrumen atau alat ukur
yang dibuat ada banyak kelemahannya dari beberapa sisi. Kelemahan itu bisa terjadi
karena alat untuk mengevaluasi tidak tepat untuk mengevaluasi, berbobot mudah,
sedang, dan sukar bagi siswa.
Menguji instrumen sangat diperlukan karena disamping kesesuaian instrumen
yang dibuat dengan objek yang akan diuji dikatakan juga bahwa perlu diuji kualitas
instrumen untuk dapat dipakai pada lain kesempatan dan objek lain dalam satuan
pendidikan yang sama. Kadangkala kita menemui instrumen seperti soal tes
matematika yang tidak dapat dipakai untuk menguji objek sekolah yang berbeda
walaupun sama satuan pendidikannya. Kualitas instrumen evaluasi yang rendah
menyebabkan produk lulusan yang tidak baik.
Oleh karena pentingnya evaluasi suatu instrumen disini penulis akan
membahas mengenai validitas dan realibilitas suatu instrumen. Sebagai calon guru
tentunya hal ini sangat diperlukan untukmenguji kevalidan suatu instrumen.
1.2 Rumusan Masalah
1. Apa pengertian validitas dan realibilitas?
2. Apa saja jenis-jenis validitas dan realibilita?
3. Bagaimana cara menguji validitas dan realibilitas instrumen?
1.3 Tujuan dan Manfaat
1.3.1 Tujuan
1. Untuk mengetahui pengertian validitas dan realibilitas
2. Untuk mengetahui jenis-jenis validitas dan realibilitas
3. Untuk mengetahui cara menguji validitas dan realibilitas suatu
instrumen
1.3.2 Manfaat
1. Agar mengetahui pengertian validitas dan realibilitas
2. Agar mengetahui jenis-jenis validitas dan realibilitas
3. Agar mengetahui cara menguji validitas dan realibilitas suatu
instrumen

Evaluasi Pembelajaran Matematika 1


BAB II
PEMBAHASAN
2.1 Validitas
2.1.1 Pengertian
Validitas berasal dari kata validity yang berarti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Scarvia B. Anderson
dkk yang dikutip Suharsini Arikunto menyatakan: "A test ia valid it measure what it
purpose to measure – suatu tes dikatakan valid apabila tes tersebut mengukur apa
yang hendak diukur." Valid berarti sahih, artinya keabsahan instrumen itu tidak
diragukan lagi. Suatu tes atau nontes dari alat ukur atau instrumen pengukuran
dikatakan memiliki validitas yang tinggi apabila alat tersebut menjalankan fungsi
ukurnya atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya
pengukuran itu.1
Istrumen yang valid berarti alat ukur yang digunakan untuk mendapatkan data
(mengukur) itu valid. Valid berarti instrument tersebut dapat digunakan untuk
mengukur apa yang seharusnya diukur.2
Berdasarkan pengertian di atas tentang validitas dapatlah disimpulkan bahwa
validitas adalah derajat yang menunjukkan sejauh mana ketepatan dan kecermatan
suatu alat ukur tes atau nontes dalam melakukan fungsi ukurnya benar-benar
mengukur apa yang hendak diukur. Alat ukur itu hanya valid untuk suatu tujuan,
tidak universal.
2.1.2 Jenis-jenis Validitas

Validitas suatu instrumen tes secara umum dibagi dua yaitu validitas teori dan
validitas empirik. Ali Hamzah dalam bukunya yang berjudul evaluasi pembelajaran
matematika mengutip bahwa macam validitas lainnya dibagi menjadi empat bagian,
yaitu validitas isi, konstruk, kongkruen, dan prediksi.3

1. Validitas isi (content validity)


Validitas isi adalah suatu tes yang mempermasalahkan seberapa jauh suatu tes
mengukur tingkat penguasaan terhadap isi suatu materi tertentu yang seharusnya
dikuasai sesuai dengan tujuan pengajaran. Menurut Sukardi validitas isi adalah
derajat di mana sebuah tes mengukur cakuoan substnsi yang ingin diukur. Menurut
Gregory validitas isi menunjukkan sejauh mana pertanyaan, tugas atau butir dalam
suatu tes atau instrumen mampu mewakili secara keseluruhan dan proporsional
perilaku sampel yang dikenal tes tersebut.

1
Hamzah, Ali. 2014. Evaluasi Pembelajaran Matematika. Jakarta: PT RajaGrafindo Persada. hal 214

2
Sugiyono. 2016. Metode Penelitian Pendidikan (Pendekatan Kuantitatif, Kualitatif, dan R&D). Bandung:
Alfabeta. hal 173
3
Hamzah, Ali. 2014. Evaluasi Pembelajaran Matematika. Jakarta: PT RajaGrafindo Persada. hal. 216

Evaluasi Pembelajaran Matematika 2


Tes yang mempunyai validitas isi yang baik ialah tes yang benar-benar
mengukur penguasaan materi yang seharusnya dikuasai dengan konten pengajaran
yang tercantum dalam garis-garis besar program pengajaran. Validitas isi dapat
diusahakan tercapainya sejak saat penyusunan dengan cara memerinci atau materi
buku pelajaran.
2. Validitas konstruk (construct validity)
Validitas konstruk adalah validitas yang mempermasalahkan seberapa jauh
item-item tes mampu menukur apa yang benar-benar hendak diukur sesuai dengan
konsep khusus atau definisi konseptual yang telah ditetapkan. Validitas konstruk
biasanya digunakan untuk instrumen-instrumen yang dimaksudkan mengukur
variabel-variabel konsep baik yang sifatnya performansi tipikal seperti instrumen
untuk mengukur sikap, minat, konsep diri, fokus kontrol, gaya kepemimpinan,
motivasi berprestasi, dan sebagainya maupun yang sifatnya performansi maksimum
seperti instrumen untuk mengukur bakat (tes bakat) inteligensi (kecerdasan
intelektual), kecerdasan emosional, dan sebagainya.
Untuk menentukan validitas konstruk suatu instrumen harus dilakukan proses
penelaahan teoretis dari suatu konsep dari variabel yang hendak diukur, mulai dari
perumusan konstruk, penentuan dimensi dan indikator, sampai kepada penjabaran dan
penulisan butir butir item instrumen. Validitas konstruk suatu instrumen harus
dilakukan melalui penelaahan atau justifikasi pakar atau melalui penilaian
sekelompok panel yang terdiri dari orang-orang yang menguasai substansi atau
konten dari variabel yang hendak diukur.
3. Validitas Konkruen (ada sekarang)
Suatu tes dikatakan memiliki validitas "ada sekarang" jika hasilnya sesuai
dengan pengalaman. Pengalaman selalu mengenai hasil yang telah lampau sehingga
data pengalaman tersebut sudah ada (ada sekarang, concurrent).
4. Validitas Prediksi
Validitas prediksi adalah tes yang mempunyai kemampuan meramalkan apa
yang akan terjadi pada masa yang akan datang. Sebagai alat pembanding validitas
prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di
perguruan tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam
ujian semester dibandingkan dengan mahasiswa yang dahulu nilai tesnya lebih rendah
maka tes masuk yang dimaksud itu tidak memiliki validitas prediksi.
2.1.3 Cara mengukur validitas

Untuk menghitung koefisien korelasi antara skor butir dengan skor total
instrumen digunakan rumus statistika yang sesuai dengan jenis skor butir dari
instrumen tersebut. Jika skor butir kontinum maka untuk menghitung koefisien

Evaluasi Pembelajaran Matematika 3


korelasi antara skor butir dengan skor total instrumen digunakan koefisien korelasi
product moment (r).4

r xy=N ∑ XY −¿ ¿

Catatan:

r xy = koefisien korelasi antara variabel X dan Y

∑ X = jumlah rerata nilai X


∑ Y = jumlah rerata nilai Y
N = banyaknya responden

Rumus korelasi product moment dengan simpangan dari Pearson untuk


menghitung validitas suatu alat tes berikut ini:

r xy =
∑ XY
√( ∑ X 2)(∑ Y 2)
Catatan:

r xy = koefisien korelasi antara variabel X dan variabel Y dua variabel yang


dikorelasikan (x= X−x) , x = perbedaan skor X dengan skor reratanya; y=Y − y , y =
perbedaan skor Y dengan skor reratanya

∑ xy = jumlah perkalian x dan y


( ∑ x 2 ) = jumlah kuadrat dari x

∑ y 2 = jumlah kuadrat dari y


Jika skor butir dikotomi (0 , 1) maka untuk menghitung koefisien korelasi
antara skor butir dengan skor total instrumen digunakan koefisien korelasi poin
biserial (r pbis ) yang menggunakan rumus:

r pbis =
x i−x t
St √ pi
qi

Catatan:

r pbis = koefisien korelasi poin biserial antara skor butir soal nomor i dengan skor total

X i = rata-rata skor total responden yang menjawab benar butir soal nomor nomor 1

4
Hamzah, Ali. 2014. Evaluasi Pembelajaran Matematika. Jakarta: PT RajaGrafindo Persada. hal 220

Evaluasi Pembelajaran Matematika 4


X t = rata-rata skor total semua responden

St = standar deviasi skor total semua responden

Pi = proporsi jawaban yang benar untuk butir soal nomor i

q i = proporsi jawaban yang salah untuk butir soal nomor i

2.2 Realibiitas
2.2.1 Pengertian
Reliabilias adalah tingkat atau derajat konsistensi dari suatu instrumen.
Reliabilitas tes berkenaan dengan pertanyaan, apakah suatu tes teliti dan dapat
dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu tes dapat dikatakan
reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang
sama pada waktu atau kesempatan yang berbeda5.
Instrument yang reliabel adalah instrument yang bila digunakan beberapa kali
untuk mengukur obyek yang sama, akan menghasilkan data yang sama. Instrument
yang reliabel belum tentu valid. Meteran yang putus dibagian ujungnya, bila
digunakan berkali-kali akan menghasilkan data yang sama (reliabel) tetapi tidak
valid. Hal ini disebabkan karena instrument (meteran) tersebut rusak.
Gronlund (1985 ) mengemukakan ada empat faktor yang dapat memengaruhi
reliabilitas, yaitu “ panjang tes, sebaran skor, tingkatan kesukaran,dan objektivitas.”
1. Panjang tes (length of test ). Panjang tes berarti banyaknya soal tes. Ada
kecenderungan, semakin panjang suatu tes akan lebih tinggi tingkat
reliabilitas suatu tes, karena semakin banyak soal, maka akan semakin banyak
sampel yang diukur dan proporsi jawaban yang benar semakin
banyak,sehingga faktor tebakan ( guessing ) akan semakin rendah.
2. Sebaran skor (spread of scores ). Besarnya sebaran skor akan membuat
tingkat reliabilitas menjadi lebih tinggi, karena koefisisen reliabilitas yang
lebih besar diperoleh ketika peserta didik tetap padda posisi yang relatif sama
dalam satu kelompok pengujian ke pengujian berikutnya. Dengan kata lain,
peluang selisih dari perubahan posisi dalam kelompok dapat memperbesar
koefisien reliabilitas.
3. Tingkat kesukaran ( difficulty indeks ). Dalam penilaian yag menggunakan
pendekatan penilaian acuan norma, baik untuk soal yang mudah maupun
sukar, cenderung menghasilkan tingkat reliabilitas yang rendah. Hal ini
disebabkan antara hasil tes yang mudah dengan hasil tes yang sukarkeduanya
dalam satu sebaran skor yang terbatas. Untuk tes yang mudah, skor akan
berada dibagian atas dan akhir dari skala penilaian. Bagi kedua tes ( mudah
dan sukar ), perbedaan antar peserta didik kecil sekali dan cenderung tidak
5
4 Arifin,zainal. 2017 Evaluasi Pembelajaran Bandung: PT Remaja Rosdakarya Offset. hal 258.

Evaluasi Pembelajaran Matematika 5


dapat dipercaya. Tingkat kesukaran soal yang ideal untuk meninngkatkan
koefisien reliabilitas adalah soal yang menghasilkan sebaran skor berbentuk
genta atau kurva nomal.
4. Objektivitas ( obyektivity ). Objektivitas disini menunjukkan skor tes
kemampuan yang sama antara peserta didik yang satu dengan peserta didik
yang lainnya. Peserta didik memperoleh hasil yang sama dalam mengerjakan
suatu tes. Jika peserta didik memiliki tingkat kemampuan yang sama, maka
akan memperoleh hasil te yang sama pada saat mengerjakan tes yang sama.
Objektivitas prosedur tes yang tinggi akan memperoleh reliabilitas hasil tes
yang tidak dipengaruhi oleh prosedur penskoran .

Konsep realibilitas mendasari kesalahan pengukuran yang mungkin terjadi


pada suatu proses pengukuran atau pada nilai tunggal tertentu, sehingga menimbulkan
perubahan pada susunan kelompoknya.

2.2.2 Jenis-jenis Realibilitas

Menurut pehitungan produc-moment dari pearson, ada tiga macam reliabilitas,


yaitu koefisien stabilitas, koefisien ekuivalen, dan koefisien konsistensi internal.

1. Koefisien Stabilitas
Koefisien stabilitas ( coefficient of stability ) adalah jenis reliabilitas yang
menggunakan teknik test and retest, yaitu memberikan tes kepada sekelompok
individu, kemudian diadakan pengulangan tes pada kelompok yang sama dengan
waktu yang berbeda. Cara memperoleh koefisien stabilitas adalah dengan
mengorelasikan hasil tes pertama dengan hasil tes kedua dari kelompok yang sama,
tes yang sama, pada waktu yang berbeda. Jika antara waktu tes yang pertama dengan
tes kedua cukup lama, kemudian diadakan latihan-latihan tambahan, maka bisa jadi
nilai tes kedua akan lebih besar daripada tes pertama. Sebaliknya, jika antara waktu
tes pertama dengan tes kedua relatif pendek, maka nilai tes kedua bisa jadi sama atau
lebih besara daripada tes pertama karena soal dan jawaban masih dapat diingat.
Patut dipertimbangkan bahwa penggunaan kelompok yang sama dan tes yang
sama dalam dua kali tesakan mempengaruhi hasil tes yang kedua, karena responden
sudah memiliki pengalaman mengerjakan tes yang pertama. Hal ini sekaligus
menunjukkan kelemahan teknik test and retest.
2. Koefisien Ekuivalen
Koefisien ekuivaalen ( coefficient of equivalence )adalah jika mengorelasikan
dua buah tes yang paralel pada kelompok dan waktu yang sama. Metode yang
digunakan untuk memperoleh koefisien ekuivalen adalah metode dengan
menggunakan dua buah bentuk tes yang paralel ( equivalen ). Syarat-syarat yang
harus dipenuhi kedua tes paralel adalah kriteria yang dipakai pada kedua tes sama,

Evaluasi Pembelajaran Matematika 6


masing-masing tes dikontruksikan tersendiri, jumlah item, isi, dan corak sama,
tingkat kesukaran sama, petunjuk waktu yang disediakan untuk mengerjakan tes, dan
contoh-contoh juga sama. Kemungkinan kesalahan pada teknik ini bersumber dari
derajat keseimbangan antara dua tes tersebut, serta kondisi tempat yang mungkin
berbeda pada kelompokm tes pertama dengan kelompok tes kedua, meskipun
dilakukan pada waktu yang sama.
3. Koefisien Konsistensi Internal
Koefisien konsistensi internal ( coefficient of internal cinsistensy ) adalah
reliabilitas yang didapat dengan jalan mengorelasikan dua buah tes dari kelompok
yang sama, tetapi diambil dari butir-butir yang bernomor genap untuk tes yang
pertama dan butir-butir bernomor ganjil untuk tes yang kedua. Teknik ini sering
disebut split-half-method. Spilt berarti membelah dan half berati setengah atau
separuh. Jadi split-half adalah tes yang dibagi menjadi dua bagian yang sama,
kemudian mengorelasikan butir soal yang bernomor ganjil dalam belahan pertama
(X) dan yang bernomor genap dalam belahan kedua (Y). Untuk membagi tes menjadi
dua bagian dapat juga dilakukan dengan jalan mengambil nomor soal secara acak,
tetapi jumlahnya tetap harus sama untuk masing-masing kelompok. Disamping itu,
pembagian tes juga dapat dilakukan dengan cara setengah bagian pertama untuk
kelompok pertama dan setengah lagi untuk kelompok kedua.
2.2.3 Cara mengukur Realibilitas
Untuk menghitung koefisien stabilitas, koefisien ekuivalen, dan koefisien
eksistensi internal dapat digunakan analisis korelasi seperti pada pengujian validitas.
Khusus bagi perhitungan koefisien konsistensi internal, korelasi tersebut baru
sebagian dari seluruh tes. Untuk memperoleh angka koefisien korelasi secara
menyeluruh dari tes tersebut harus dihitung dari nomor-nomor kedua tes itu dengan
rumus Sparman Brown :

2 r 1.2
r nn=
1+ ( n−1 ) r 1.2

Keterangan : n = panjang tes yang selalu sama dengan 2karena seluruh tes =
1
2x .
2

Disamping itu, dapat pula digunakan teknik Kuder-Richardson ( dua orang


ahli psikometri yang merumuskan persamaan untuk mencari realibilitas )yang lebih
populer dengan istilah KR 20. Salah satu rumus Kr 20 adalah sebagai berikut.

(
K S t−∑ pi. qi
)
2
ru =
K −1 S2t

Keterangan :

Evaluasi Pembelajaran Matematika 7


p = Proporsi peserta didik yang menjawab betul dari suatu butir soal.

q=1-P

2
St =¿ n ∑ x 2−¿ ¿

k = jumlah butir soal

Teknik kuder-Richardson biasanya digunakan jika suatu instrumen mengukur


satu gejala psikologis atau perilaku yang sama. Artinya, tes tersebut dapat dikatakan
reliabel bila terbukti ada konsistensi jawaban antara soal yang satu dengan soal yang
lain. Jika sifat dan tingkatan homoginitas antara soal tidak terpenuhi, maka tes
tersebut dianggap mengukur lebih satu variabel. Jika dalam suatu tes terdapat lebih
dari satu skala pengukuran atau mengukur lebih dari satu variabel dan setiap variabel
memiliki beberapa aspek, maka pengecekan reliabilitas dilakukan terhadap masing-
masing skala pengukuran. Teknik ini lebih cocok untuk tes yang menggunakan soal
dua pilihan dengan salah satu jawaban benar.

Teknik lain yang biasa digunakan untuk menguji konsistensi internal dari suatu
tes adalah Cronbach’s ALPHA atau koefisien Alpha. perbedaannya dengan teknik
Kuder-Richardson adalah teknik ini tidak hanya digunakan untuk tes dengan dua
pilihan saja, tetapi penerapannya lebih luas, seperti menguji reliabilitas skala
pengukuran sikap dengan tiga, lima atau tujuh pilihan. Adapun rumus yang
digunakan untuk menghitung koefisien Alpha adalah;

( ∑σ
)
2
R
α= 1− 2 i
R−1 σi

Keterangan :

R = Jumlah butir soal.

σ 2i =¿ varian butir soal

2
σ x = varian skor total

Untuk butir soal yang bersifat dikotomi seperti pilihan-ganda, varian butir
soal diperoleh dengan rumus:

σ 2x = Pi q 1

keterangan; pi adalah kesukaran soal dan q 1 adalah (1 – p1 )

BAB III

Evaluasi Pembelajaran Matematika 8


PENUTUP
3.1 Kesimpulan

validitas adalah derajat yang menunjukkan sejauh mana ketepatan dan


kecermatan suatu alat ukur tes atau nontes dalam melakukan fungsi ukurnya benar-
benar mengukur apa yang hendak diukur. Alat ukur itu hanya valid untuk suatu
tujuan, tidak universal.

Validitas suatu instrumen tes secara umum dibagi dua yaitu validitas teori dan
validitas empirik. Ali Hamzah dalam bukunya yang berjudul evaluasi pembelajaran
matematika mengutip bahwa macam validitas lainnya dibagi menjadi empat bagian,
yaitu validitas isi, konstruk, kongkruen, dan prediksi.

Untuk mencari validitas soal, menggunakan formula:

r xy =N ∑ XY −¿ ¿

Rumus korelasi product moment dengan simpangan dari Pearson untuk


menghitung validitas suatu alat tes berikut ini:

r xy =
∑ XY
√( ∑ X 2)(∑ Y 2)
Jika skor butir dikotomi (0 , 1) maka untuk menghitung koefisien korelasi
antara skor butir dengan skor total instrumen digunakan koefisien korelasi poin
biserial (r pbis ) yang menggunakan rumus:

r pbis =
x i−x t
St √ pi
qi

Reliabilias adalah tingkat atau derajat konsistensi dari suatu instrumen.


Menurut pehitungan produc-moment dari pearson, ada tiga macam reliabilitas, yaitu
koefisien stabilitas, koefisien ekuivalen, dan koefisien konsistensi internal.

Untuk memperoleh angka koefisien korelasi secara menyeluruh dari tes


tersebut harus dihitung dari nomor-nomor kedua tes itu dengan rumus Sparman
Brown :
2 r 1.2
r nn=
1+ ( n−1 ) r 1.2

Disamping itu, dapat pula digunakan teknik Kuder-Richardson ( dua orang


ahli psikometri yang merumuskan persamaan untuk mencari realibilitas )yang lebih
populer dengan istilah KR 20. Salah satu rumus Kr 20 adalah sebagai berikut.

Evaluasi Pembelajaran Matematika 9


(
K S t−∑ pi. qi
)
2
ru = 2
K −1 S t

Adapun rumus yang digunakan untuk menghitung koefisien Alpha adalah;

(
∑σ
)
2
R
α= 1− 2 i
R−1 σi

Untuk butir soal yang bersifat dikotomi seperti pilihan-ganda, varian butir
soal diperoleh dengan rumus:

σ x = Pi q 1
2

3.2 Saran
Dengan mempelajari validitas dan realibilitas suatu instrument, kita sebagai
calon pendidik dapat menguji validitas dan realibilitas suatu instrument. Ketika kita
dapat menguji suatu validitas dan realibilitas dari suatu instrument diharapkan
nantinya kita bisa meluluskan siswa dengan kualitas yang baik.

DAFTAR PUSTAKA

Evaluasi Pembelajaran Matematika 10


Hamzah, Ali. 2014. Evaluasi Pembelajaran Matematika. Jakarta: PT
RajaGrafindo Persada.

Zainal, Arifin. 2017. Evaluasi Pembelajaran. Bandung : PT Remaja Rosdakarya


Offset.

Sugiyono. 2016. Metode Penelitian Pendidikan (Pendekatan Kuantitatif,


Kualitatif, dan R&D). Bandung: Alfabeta

LAMPIRAN

Evaluasi Pembelajaran Matematika 11


Contoh Perhitungan Validitas Soal Matematika

Kepada siswa kelas II SMP X dilakukan tes matematika untuk uji


validitasnya. Sebelumnya ada hasil tes ulangan harian matematika. Hasil tes
matematika yang akan diuji validitasnya dengan simbol X san nilai tes ulangan harian
dengan simbol Y. Datanya sebagai berikut:

Tabel 1. Hasil tes Matematika (X) dan Ulangan Harian (Y)

No Nama X Y
1 Ahmad 6.5 6.3
2 Budi 7 6.8
3 Cevi 7.5 7.2
4 Didu 7 6.8
5 Efendi 6 7
6 Farida 6 6.2
7 Gamda 5.5 5.1
8 Hariadi 6.5 6
9 Ihsan 7 6.5
10 Januar 6 5.9
Jumlah   65 63.8

X=
∑ = 65 =6.5
N 10

Y=
∑ = 63.8 =6.38
N 10

Harga x dan y dapat dicari dengan menggunakan rumus berikut:

x=X −Y

y=Y −X

Kemudian dicari nilai kuadratnya. Lihat tabel berikut:

Tabel 2. Hasil Tes Matematika (X) dan Ulangan Harian (Y)


2 2
No Nama X Y X  Y x y Xy
1 Ahmad 6.5 6.3 0 -0.1 0.0 0.01 0.0
2 Budi 7 6.8 +0.5 +0.4 0.25 0.16 +0.2
3 Cevi 7.5 7.2 1.0 +0.8 1.0 0.64 +0.8
4 Didu 7 6.8 +0.5 0.4 0.25 0.16 0.2
5 Efendi 6 7 -0.5 0.6 0.25 0.36 -0.3
6 Farida 6 6.2 -0.5 -0.2 0.25 0.04 +0.1
7 Gamda 5.5 5.1 -1.0 -1.3 1.0 1.69 +1.3
8 Hariadi 6.5 6 0 -0.4 0.0 0.16 0.0
9 Ihsan 7 6.5 +0.5 0.1 0.25 0.01 +0.05
10 Januar 6 5.9 -0.5 -0.5 0.25 0.25 +0.25
Jumlah  65 63.8     3.5 3.48 2.60

Evaluasi Pembelajaran Matematika 12


Misalkan untuk Januar:

Hasil tes matematika yang akan divalidasi = 6; ulangan hariannya = 5.9. bila
rerata hasil tes matematika untuk 10 siswa = 6,5, maka x = deviasi hasil tes
matematika sebesar ¿ 6−6.5=−0.5. ; harga x 2=0.25

Rerata hasil tes harian untuk 10 siswa ¿ 6.4 (dibulatkan), maka harga y yakni
deviasi hasil tes harian sebesar ¿ 5.9−6.4=−0.5 ; harga y 2=0.25 . Harga
xy=(−0.5 )( 0.5 )=0.25

r xy =
∑ xy
√¿¿ ¿

2.65
r xy =
√ ( 3.5 ) (3.48)
¿ 0.7

Analogi dengan rumus yang berbeda dapat dihitung harga koefisien korelasi yang
hasilnya tidak jauh berbeda dapat ditoleransi. Koefisien korelasi ada antara 0.0−1.00.
Kita dapat melakukan interpretasi dari koefisien korelasi yang diperoleh sebagai
berikut:

Antara 0.00−0.20 kategori rendah sekali

0.20−0.40 kategori rendah

0.40−0.60 kategori cukup

0.60−0.80 kategori baik

0.80−1.00 kategori sangat baik.

Di samping mencari validitas soal tes secara keseluruhan kita dapat mencari
soal tes setiap butirnya atau dikenal dengan validitas item.
Hasil tes matematika tingkat SLTA dari 8 siswa diperoleh data tentang butir
soal yang dapat dijawab dan tidak oleh siswa serta skor total masing-masing siswa.
Jenis soal pilihan ganda. Perhatikan tabel berikut.

Tabel 3. Hasil tes Matematika Siswa Tingkat SLTA

Butir Soal / item (X) Skor total


No Nama
1 2 3 4 5 6 7 8 9 10 (Y)
1 Alan 1 0 1 0 1 1 1 1 1 1 8
2 Badrul 0 0 1 0 1 0 0 1 1 1 5
3 Cecep 1 1 0 0 0 1 0 1 0 1 3
4 Dadang 1 1 0 0 1 1 0 0 1 0 5
5 Elan 1 1 1 1 1 1 0 0 0 0 6
6 Farida 0 0 1 0 1 0 1 0 0 0 4
7 Gayus 1 1 1 1 1 1 1 0 0 0 7
8 Hanafi 1 1 0 1 1 1 1 0 1 1 8

Ditanya: Validitas soal atau item tes matematika nomor 6?

Jawab:

Evaluasi Pembelajaran Matematika 13


Data Soal no. 6 seperti pada tabel di bawah ini.

No Nama X Y
1 Alan 1 8
2 Badrul 0 5
3 Cecep 1 3
4 Dadang 1 5
5 Elan 1 6
6 Farida 0 4
7 Gayus 1 7
8 Hanafi 1 8

Rumus yang dipakai ada dua macam yakni rumus korelasi point biserial dan
korelasi product moment Spearman.

r pbis =
Xi−Xt
St √ pi
qi

Bentuk lain dari rumus di atas yaitu:

r pbis =
Mp−Mt
St √ p
q

Catatan:

r pbis =¿ koefisien korelasi biserial

Mp=¿ rerata skor dari subjek yang menjawab benar bagi item yang dicari
validitasnya.

Mt=¿ rerata skor total

St=¿ standar deviasi dari skor total

P=¿ proporsi siswa yang menjawab benar

banyaknya siswa yang menjawab benar


P=
( jumlah seluruh siswa)

q=¿ proporsi siswa menjawab salah

q=1− p

Menghitung nilai dari komponen rumus koefisien korelasi biserial adalah:

8+3+5+6 +7+8
Mp= =6.17
6

8+5+3+ 5+6+ 4+7+ 8


Mt= =5.75
8

St=1.7139

6
P= =0.75
8

q=1−0.75=0.25

Evaluasi Pembelajaran Matematika 14


r pbis =
1.7139 √
6.17−5.57 0.75
0.25

0.42
¿ =0.4244
1.7139

Dengan cara yang sama dapat dihitung dan ditetapkan validitas item yang
lainnya. Dari koefisien korelasi yang diperoleh dapat dibandingkan dengan tabel
korelasi dengan melihat besar n yang ada.

Contoh Perhitungan Realibilitas Soal

10 orang peserta didik dites dalam mata pelajaran Ilmu Pengetahuan Alam
( IPA ) dan Ilmu Pengetahuan Sosial ( IPS ). Jumlah soal masing-masing Lima buah.
Dua buah nomor genap diambil dari hasil tes IPA dan tiga buah nomor ganjil diambil
dari hasil tes IPS. Data diperoleh sebagai berikut :

Tabel 4.1
Nilai 10 orang peserta didik
Dalam Mata Pelajaran IPA dan IPS

Nama Skor IPA Skor IPS


No. Genap (2 dan 4 ) No. Ganjil (1, 3 dan 5 )

A 8 6 8 7 10
B 7 7 6 7 5
C 5 6 6 6 6
D 8 6 7 6 9
E 5 6 5 5 5
F 4 7 4 6 6
G 5 9 7 5 5
H 7 5 8 5 4
I 7 8 4 9 7
J 9 5 9 9 4

Tabel 4.2
Perhitungan Koefisien Konsistensi Internal

X Y x y x
2
y
2
Xy
14 25 +1 +6 1 36 6
14 8 +1 -1 1 1 -1
11 18 -2 -1 4 1 2
14 22 +1 +3 1 9 3
11 15 -2 -4 4 16 8
11 16 -2 -3 4 9 6
14 17 +1 -2 1 4 -2
12 17 -1 -2 1 4 2
15 20 +2 +1 4 1 2
14 22 +1 +3 1 9 3
130 190

Evaluasi Pembelajaran Matematika 15


X=13 X=19

r xy=
∑ xy 29
=
20
=
29
= 0,65
√ ¿ ¿ ¿ √ ( 22 ) ( 90) √ 1980 44,50

Untuk menghitung seluruh tes itu, dapat digunakan rumus Spearman Brown
sebagai berikut :

2 r 1.2
r nn = =¿ ( 2 ) ¿ ¿
1+ ( n−1 ) r 1.2

Disamping itu, dapat pula digunakan teknik Kuder-Richardson ( dua orang


ahli psikometri yang merumuskan persamaan untuk mencari realibilitas )yang lebih
populer dengan istilah KR 20. Salah satu rumus Kr 20 adalah sebagai berikut.

(
K S t−∑ pi. qi
)
2
ru =
K −1 S2t

Contoh:

10 orang peserta didik di tes dengan 10 butir soal bentuk objektif. Hasil
perhitungan adalah sebagai berikut :

NAMA Nomor Soal x x


2

1 2 3 4 5 6 7 8 9 10
A 0 0 1 1 1 1 1 1 0 1 7 49
B 0 1 1 1 1 0 1 1 1 1 8 64
C 1 1 0 1 1 1 1 1 1 1 9 81
D 1 1 1 1 0 0 0 0 1 1 6 36
E 1 0 1 0 1 1 0 1 1 1 7 49
F 1 1 1 1 1 0 0 0 0 0 5 25
G 1 1 0 0 0 0 1 1 1 1 6 36
H 0 1 1 1 1 1 1 1 0 0 7 49
I 1 0 1 0 0 0 0 0 1 1 4 16
J 1 1 1 0 0 0 0 0 0 0 3 9
∑ 7 7 8 6 6 4 5 6 6 7 6 41
2 4
P 0,7 0, 0,8 0,6 0,6 0, 0,5 0,6 0, 0,7
7 4 6
Q 0,3 0, 0,2 0,4 0,4 0, 0,5 0,4 0, 0,3
3 6 4
Pq 0,2 0, 0,1 0,2 0,2 0, 0,2 0,2 0, 0,2
1 2 6 4 4 2 5 4 2 1
1 4 4

2
2 10 ( 414 ) −(62) 4140−3844 296
S =¿ n ∑ x −¿ ¿ ¿
t
2
= = =3,288
10 (10−1) 90 90

k = 10 ( jumlah butir soal )

∑ p ∙q = 2,24

Evaluasi Pembelajaran Matematika 16


(
K S t −∑ pi .qi
) ( )
2
10 3,228−2,24
KR 20= =¿
K−1 2
S t 10−1 3,288

= 1,11 ( 0,318 ) = 0,35

Evaluasi Pembelajaran Matematika 17

Anda mungkin juga menyukai