Anda di halaman 1dari 18

MAKALAH EVALUASI PEMBELAJARAN MATEMATIKA

(PERHITUNGAN VALIDITAS TES DENGAN BERBAGAI RUMUS,


PERHITUNGAN REABILITAS TES DENGAN BERBAGI RUMUS)
Dosen Pengampu : Drs. Yasifati Hia M.Si

Disusun Oleh : Kelompok XII

Melisa Pasaribu 4191111059

Febry Damayanti 4191111066

PRODI PENDIDIKAN MATEMATIKA 2019 A

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS NEGERI MEDAN

2020
KATA PENGANTAR

Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa atas berkat dan rahmatNya
penulis dapat menyelesaikan tugas Makalah ini dengan tepat waktu.Dan penulis juga
mengucapkan terimakasih kepada Bapak Drs. Yasifati Hia M.Si selaku Dosen Mata Kuliah
Evaluasi Pembelajaran Matematika yang telah memberikan tugas ini kepada penulis. Penulis
berharap Makalah ini dapat berguna dalam rangka menambah wawasan serta pengetahuan
pembaca mengenai Refresentasi dan Sikap Terhadap Matematika.
Penulis menyadari bahwa didalam Makalah ini terdapat banyak kekurangan dan jauh
dari kata sempurna. Oleh sebab itu, penulis berharap adanya saran dan kritik yang membangun
demi perbaikan Makalah yang telah disusun, mengingat tidak ada sesuatu yang sempurna tanpa
saran yang membangun. Semoga Makalah yang telah disusun ini dapat berguna bagi pembaca.
Akhir kata penulis mengucapkan sekian dan terimakasih.

Medan, 14 September
2020

Kelompok Penyusun

2
DAFTAR ISI

Kata Pengantar ........................................................................................................... 2

Daftar Isi .................................................................................................................... 3

BAB 1 PENDAHULUAN ........................................................................................ 4

A. Latar Belakang ...................................................................................................... 4

B. Rumusan Masalah ................................................................................................ 4

C. Tujuan.................................................................................................................... 4

BAB II PEMBAHASAN ........................................................................................... 5

A. Pengertian Uji Validitas dan Reliabilitas .............................................................. 6

B. Langkah Dalam Melakukan Uji Validitas san Reliabilitas ................................. 9

C. Jawaban Pengecoh................................................................................................. 13

BAB III PENUTUP ................................................................................................... 17

A. Kesimpulan .......................................................................................................... 17

B. Saran ...................................................................................................................... 17

DAFTAR PUSTAKA ................................................................................................ 18

3
BAB I
PENDAHULUAN

A. LATAR BELAKANG
Dalam sebuah evaluasi alat yang digunakan digolongkan menjadi dua macam yaitu tes
dan non tes. Teknik-teknik Evaluasi adalah suatu percobaan yang diadakan untuk mengetahui
ada tidaknya hasil–hasil pelajaran tertentu pada seseorang murid atau kelompok murid. Tes itu
sendiri mempunyai dua bentuk yaitu bentuk obyektif (multiple choice) dan bentuk subyektif
(uraian). Sebuah tes dikatakan baik sebagai alat pengukur harus memenuhi persyaratan tes
yaitu diantaranya adalah tes itu harus mempunyai tingkat validitas dan reliabilitas yang tinggi.
Disamping mencari validitas soal kita perlu juga mencari validitas item.
Selain validitas, sebuah tes dikatakan baik, juga jika mempunyai reliabilitas yang
tinggi. Reliabilitas berhubungan dengan masalah taraf kepercayaan. Suatu tes dikatakan
mempunyai taraf kepercayaan yang tinggi jika tes tersebut memberikan hasil yang tetap. Maka
pengertian reliabilitas tes berhubungan dengan masalah ketetapan hasil tes, atau seandainya
hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti.
Dalam persyaratan tes, yaitu validitas dan reliabilitas sangat penting. Dalam hal ini
validitas lebih penting, dan reliabilitas ini perlu karena menyokong terbentuknya validitas.
Sebuah tes mungkin reliabel tetapi tidak valid. Sebaliknya, sebuah tes yang valid biasanya
reliabel.
B. RUMUSAN MASALAH
1. Apakah Pengertian Validitas?
2. Apakah Pengertian Reliabilitas?
3. Bagaimana melakukan uji Validitas?
4. Bagaimana melakukan uji Reliabilitas?
C. TUJUAN
1. Untuk mengetahui pengertian dari Validitas.
2. Untuk mengetahui pengertian dari Reliabilitas.
3. Untuk mengetahui cara melakukan uji Validitas.
4. Untuk mengetahui cara melakukan uji Reliabilitas.

4
BAB II
PEMBAHASAN

A. PENGERTIAN UJI VALIDITAS DAN RELIABILITAS

1. Validitas adalah untuk melihat apakah definisi operasional telah benar-benar


mengukur atau sesuai dengan definisi konseptual. Dengan kata lain, validitas berkenaan
dengan tingkat kesesuaian antara definisi konseptual dan definisi operasional dari
variabel.
2. Reliabilitas adalah pengujian alas ukur yang bertujuan untuk melihat stabilitas dan
konsistensi dari suatu definisi operasional. Suatu alat ukur dikatakan reliabel jika kita
selalu mendapatkan hasil yang tetap sama dari pengukuran gejala yang sama, meski
dilakukan pada waktu yang berbeda-beda. Tiga jenis reliabilitas yaitu stability
reliability, representative reliability, equivalence reliability.

Reliabilitas menyangkut ketepatan alat ukur. Pengertian reliabilitas dapat lebih


mudah dipikirkan jika pertanyaan berikut dijawab:
1) Jika set objek yang sama diukur berkali-kali dengan alat ukur yang sama, apakah
kita akan memperoleh hasil yang sama?
2) Apakah alat ukur yang diperoleh dengan menggunakan alat ukut tertentu adalah alat
ukur yang sebenarnya dari objek tersebut?
3) Berapa besar error yang kita peroleh dengan menggunakan ukuran tersebut
terhadap objek?
Jawaban terhadap pertanyaan tersebut tidak lain dari 3 aspek pengertian tentang
reliabilitas. Suatu alat ukur disebut mempunyai reliabilitas tinggi atau dapat dipercaya
jika alat ukur itu mantap, dalam pengertian bahwa alat ukur tersebut stabil, dapat
diandalkan (dependability) dan dapat diramalkan (predictability).Suatu alat ukur yang
mantap tidak berubah-ubah pengukurannya dan dapat diandalkan karena penggunaan alat
ukur tersebut berkali-kali akan memberikan hasil yang serupa.
Pertanyaan kedua member aspek akurasi. Suatu pertanyaan atau ukuran yang
akurat adalah ukuran yang cocok dengan yang ingin diukur. Jika kedua aspek di atas,
yaitu aspek stabilitas dan aspek akurasi digabungkan, maka dapat disimpulkan bahwa
alat ukur tersebut mantap dan dapat mengukur secara cermat dan tepat. Suatu alat ukur

5
juga harus sedemikian rupa sifatnya sehingga error yang terjadi, yaitu error pengukuran
yang random sifatnya, dapat ditolerir.

3. Uji validitas dan reliabilitas adalah merupakan proses “audit” terhadap instrument
penelitan (angket, kuesioner) sebelum “go public”. Audit yang dimaksud di sini bersifat
antisipasi, preventif bukan evaluatif seperti lazimnya pengertian audit di dunia keuangan.
Kualitas hasil riset salah satunya ditentukan oleh faktor uji validitas dan reliabilitas.

Validitas atau kesahihan menunjukan pada kemampuan suatu instrumen (alat pengukur)
mengukur apa yang harus diukur (…. a valid measure if it succesfully measure the
phenomenon), seseorang yang ingin mengukur tinggi harus memakai meteran, mengukur berat
dengan timbangan, meteran, timbangan merupakan alat ukur yang valid dalam kasus tersebut.
Dalam suatu penelitian yang melibatkan variabel/konsep yang tidak bisa diukur secara
langsung, masalah validitas menjadi tidak sederhana, di dalamnya juga menyangkut penjabaran
konsep dari tingkat teoritis sampai tingkat empiris (indikator), namun bagaimanapun tidak
sederhananya suatu instrumen penelitian harus valid agar hasilnya dapat dipercaya.

Beberapa jenis validitas yaitu:


1. Validitas Rupa (Face validity)
Adalah validitas yang menunjukan apakah alat pengukur/instrumen penelitian dari segi
rupanya nampak mengukur apa yang ingin diukur, validitas ini lebih mengacu pada bentuk dan
penampilan instrumen. Menurut Djamaludin Ancok validitas rupa amat penting dalam
pengukuran kemampuan individu seperti pengukuran kejujuran, kecerdasan, bakat dan
keterampilan.

2. Validitas isi (Content Validity)


Valditas isi berkaitan dengan kemampuan suatu instrumen mengukur isi (konsep) yang
harus diukur. Ini berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau
variabel yang hendak diukur. Misalnya test bidang studi IPS, harus mampu mengungkap isi
bidang studi tersebut, pengukuran motivasi harus mampu mengukur seluruh aspek yang
berkaitan dengan konsep motivasi, dan demikian juga untuk hal-hal lainnya. Menurut Kenneth
Hopkin penentuan validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar
ini Dia berpendapat bahwa validitas isi berbeda dengan validitas rupa yang kurang
menggunakan analisis logis yang sistematis, lebih lanjut dia menyatakan bahwa sebuah

6
instrumen yang punya validitas isi biasanya juga mempunyai validitas rupa, sedang keadaan
sebaliknya belum tentu benar.

3. Validitas kriteria (Criterion validity)


Adalah validasi suatu instrumen dengan membandingkannya dengan instrumen-
pengukuran lainnya yang sudah valid dan reliabel dengan cara mengkorelasikannya, bila
korelasinya signifikan maka instrumen tersebut mempunyai validitas kriteria. Terdapat dua
bentuk Validitas kriteria yaitu : Validitas konkuren (Concurrent validity), Validitas ramalan
(Predictive validity).
 Validitas konkuren adalah kemampuan suatu instrumen pengukuran untuk mengukur gejala
tertentu pada saat sekarang kemudian dibandingkan dengan instrumen pengukuran lain
untuk konstruk yang sama.
 Validitas ramalan adalah kemampuan suatu instrumen pengukuran memprediksi secara
tepat dengan apa yang akan terjadi di masa datang. Contohnya apakah test masuk sekolah
mempunyai validitas ramalan atau tidak ditentukan oleh kenyataan apakah terdapat korelasi
yang signifikan antara hasil test masuk dengan prestasi belajar sesudah menjadi siswa, bila
ada, berarti test tersebut mempunyai validitas ramalan.

4. Validitas konstruk (Construct Validity)


Konstruk adalah kerangka dari suatu konsep, sedangkan validitas konstruk adalah validitas
yang berkaitan dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep
yang diukurnya. Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas konstruk)
merupakan yang terluas cakupannya dibanding dengan validasi lainnya, karena melibatkan
banyak prosedur termasuk validasi isi dan validasi kriteria.
Instrumen Valid (sah) jika pertanyaan tersebut mampu mengungkapkan sesuatu yang
akan diukur oleh instrumen (kuesioner).Instrumen Reliabel (andal) jika jawaban responden
terhadap pertanyaan adalah konsisten atau stabil dari waktu ke waktu.

Reliabilitas Internal (Internal Consistensy), Reliabilitas internal digunakan untuk


menghilangkan kelemahan-kelamahan pada uji reliabilitas eksternal.
1. Dengan rumus Spearman-Brown
2. Dengan rumus Flanagant
3. Dengan rumus Rulon
4. Dengan rumus K – R.21

7
5. Dengan rumus Hoyt
6. Dengan rumus Alpha Cronbach

B. LANGKAH DALAM MELAKUKAN UJI VALIDITAS DAN RELIABILITAS


INTERNAL ADALAH SEBAGAI BERIKUT:
- Cobalah item di lapangan kepada paling sedikit 30 orang responden (batas sampel besar
dalam statistik)
- Tabulasi data yang telah masuk
- Ujilah validitas dan reliabilitasnya

Langkah-langkah uij validitas den reliabilitas, yaitu:


- Mempersiapkan butir-butir pertanyaan berdasarkan konstruk, konsep dan indikator dari
variabel yang akan diteliti.
- Instrumen (pertanyaan) diberikan kepada responden untuk di ujicobakan
- Setelah instrumen diujicobakan kepada responden, kemudian ditabulasikan untuk
mempermudah penghitungan dan analisis ujicoba tersebut.
- Responden target ujicoba instrumen, tidak dapat dijadikan responden penelitian

Beberapa analisis yang sering dipergunakan untuk melakukan uji validitas, adalah:
1. Korelasi Product Moment
Item butir dinyatakan valid jika mempunyai korelasi dengan skor total (r hitung) di atas r
tabel. Perhitungan dengan SPSS menggunakan Analyze ==> correlate ==> bivariate, pilih
Pearson. Pindahkan data jawaban pada masing-masing butir dan skor total dari kiri ke kanan.
Hasilnya pada output, ikat table yang paling kanan.

2. Corrected Item to Total Correlation


Adalah dengan mengkoreksi nilai r hitung karena adanya spurious overlap. Perhitungan
dengan SPSS menggunakan Analyze ==> Scale ==> Reliability Analysis, pindahkan jawaban
responden pada masing-masing butir (tanpa skor total) dari kiri ke kanan ==> Pilih Statistic
==> Klik pada Scale if item deleted ==> OK. Nilai yang dipergunakan pada kolom Corrected
item-total correlation.

8
3. Analisis Faktor
Item yang valid akan mengelompok pada konstruk yang diukur. Analisis dengan SPSS
menggunakan Analyze ==> Data reduction ==> Factor Analysis ==> masukan semua jawaban
responden. Item pertanyaan yang tidak mengelompok dinyatakan tidak valid.
Uji reliabilitas adalah untuk melihat apakah rangkaian kuesioner yang dipergunakan
untuk mengukur suatu konstruk tidak mempunyai kecenderungan tertentu. Nilai yang lazim
dipakai adalah 0,6. Perhitungan dengan SPSS sama dengan perhitungan validitas dengan
Corrected Item to Total Correlation. Nilai yang dilihat adalah Alpha, pada bagian kiri bawah.
Uji validitas menunjukkan ukuran yang benar-benar mengukur apa yang akan diukur.
Jadi dapat dikatakan semakin tinggi validitas suatu alat test, maka alat test tersebut semakin
mengenai pada sasarannya, atau semakin menunjukkan apa yang seharusnya diukur. Suatu test
dapat dikatakan mempunyai validitas tinggi apabila test tersebut menjalankan fungsi ukurnya,
atau memberikan hasil ukur sesuai dengan makna dan tujuan diadakannya test tersebut. Jika
peneliti menggunakan kuesioner di dalam pengumpulan data penelitian, maka item-item yang
disusun pada kuesioner tersebut merupakan alat test yang harus mengukur apa yang menjadi
tujuan penelitian.
Salah satu cara untuk menghitung validitas suatu alat test yaitu dengan melihat daya
pembeda item (item discriminality). Daya pembeda item adalah metode yang paling tepat
digunakan untuk setiap jenis test. Daya pembeda item dalam penalitian ini dilakukan dengan
cara “korelasi item-total”.
Korelasi item-total yaitu konsistensi antara skor item dengan skor secara keseluruhan
yang dapat dilihat dari besarnya koefisien korelasi antara setiap item dengan skor keseluruhan,
yang dalam penelitian ini menggunakan koefisien korelasi Rank–Spearman karena skala
pengukuran dalam penelitian ini adalah skala ordinal.
Adapun langkah-langkah melakukan uji validitas adalah:
1. Tentukan koefesien korelasi Rank Sperman dengan cara sebagai berikut:
Apabila item yang dihadapi berbentuk skala ordinal (skala sikap), maka nilai korelasi rank
spearman pada item ke-i adalah :
Rumus diatas digunakan apabila tidak terdapat data kembar. Jika terdapat banyak data kembar,
maka digunakan rumus berikut:
dimana : R(X) = Ranking nilai X
R(Y) = Ranking nilai Y

9
2. Bandingkan nilai koefesien korelasi rank sperman (rs) dengan nilai korelasi rank spearman
dalam table (rtabel), atau bandingkan nilai p-value (Sig.) pada koefesien korelasi rank sperman
(rs) dengan taraf (nyata)

3. Jika rs > rtabel atau p-value < , maka item tersebut valid dan dapat dijadikan sebagai
indikator terhadap dimensi/variabel tersebut.
Reliabilitas artinya adalah tingkat keterpercayaan hasil suatu pengukuran. Pengukuran yang
memiliki reliabilitas tinggi, yaitu pengukuran yang mampu memberikan hasil ukur yang
terpercaya (reliabel). Reliabilitas merupakan salah satu ciri atau karakter utama intrumen
pengukuran yang baik. Kadang-kadang reliabilitas disebut juga sebagai keterpercayaan,
keterandalan, keajegan, konsistensi, kestabilan, dan sebagainya, namun ide pokok dalam
konsep reliabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya, artinya sejauh
mana skor hasil pengukuran terbebas dari kekeliruan pengukuran (measurement error).
Tinggi rendahnya reliabilitas, secara empiris ditunjukkan oleh suatu angka yang disebut
koefisien reliabilitas. Walaupun secara teoritis, besarnya koefisien reliabilitas berkisar antara
0,00 – 1,00; akan tetapi pada kenyataannya koefisien reliabilitas sebesar 1,00 tidak pernah
dicapai dalam pengukuran, karena manusia sebagai subjek pengukuran psikologis merupakan
sumber kekeliruan yang potensial. Di samping itu walaupun koefisien korelasi dapat bertanda
positif (+) atau negatif (-), akan tetapi dalam hal reliabilitas, koefisien reliabilitas yang besarnya
kurang dari nol (0,00) tidak ada artinya karena interpretasi reliabilitas selalu mengacu kepada
koefisien reliabilitas yang positif. Ada beberapa metode yang dapat digunakan dalam
menentukan tingkat reliabilitas suatu alat ukur, salah satunya adalah dengan internal cosistency
dengan teknik belah dua (split half) yang dianalisis dengan rumus Spearman-Brown yaitu:
x 100%
Keterangan:
R = nilai koefesien reliabilitas
r = nilai korelasi antara item belahan pertama dengan item belahan kedua.

Pengujian validitas dan reabilitas instrument:


1. Reliablitas
 Stabilitas
o Test-retest reliability
Pada teknik ini kita membagi kuesioner yang sama pada waktu yang berbeda.

10
Misalnya:
Pada minggu I ditanyakan:
Bagaimana tanggapan saudara terhadap kualitas dosen di Universitas Calibakal ?
Pada minggu III ditanyakan:
Ditanyakan lagi pada responden yang sama dengan pertanyaan yang sama.
- Pararel Form reliability
Pada teknik ini kita membagi kuesioner kepada responden yang intinya sama akan
tetapi menggunakan kalimat yang berbeda:
Misalnya:
Apakah menurut saudara harga tiket di kereta ini tidak mahal ?
Apakah harga di kereta ini telah
sesuai dengan pelayanan yang saudara terima ?
 Konsistensi
- Interitem consis Tency reliability
adalah konsistensi jawaban responden atas semua item quest instrument, diukur dengan
korelasi yang tinggi antara masing-masing quest.
- Split half
menunjukkan korelasi antar dua bagian quest dan diukur dengan koef korelasi yang tinggi
dari dua kelompok tersebut.

2. Validitas
 Validitas Internal
digunakan untuk menjawab pertanyaan apakah penelitian sudah menggunakan konsep yang
seharusnya (actually). Validitas internal biasanya membantu mengatasi kelemahan validitas
eksternal.
1. Content Validity
Jika instrumen yang digunakan dianggap cukup mencakup topik yang sudah
didefinisikan sebagai dimensi dan elemen yang menggambarkan konsepnya. untuk
mengukur validitas instrumen ini biasanya menggunakan judgement ahli (panel
evaluation).

11
Mis: imej perusahaan dengan dimensi opini masyarakat atas tanggung jawab sosialnya.
2.Criterion-related validity
Digunakan untuk mengukur perbedaan-perbedaan individual berdasarkan kriteria yang
digunakan. Validitas concurent (serentak) terjadi ketika skala yang ditetapkan dapat
membedakan individual yang telah diketahui berbeda sehingga skor utk masing-masing
instrumen seharusnya juga berbeda. Diukur dengan koef korelasi hasil uji kelompok yang
berbeda harus menunjukkan korelasi yang rendah. Validitas Predictive, menunjukkan
kemampuan instrumen membedakan individu dalam kriteria masa depan, diukur dengan
koef korelasi antara skor instrumen pengukur dengan skor hasil masadepan yang
seharusnya tinggi.

3.Construct validity
Menunjukkan seberapa baik hasil yang diperoleh dari penggunaan instrumen sesuai
dengan teori yang digunakan untuk mendefinisikan suatu konstruk. Validitas konvergen
terjadi ketika skor yang dihasilkan oleh dua buah instrumen yang mengukur konsep yang
sama memiliki korelasi yang tinggi. Diukur dengan tingginya koef korelasi dua
instrumen. Validitas diskriminan terjadi ketika berdasar teori dua buah variabel
diperkirakan tidak berkorelasi dan skor hasil menunjukkan hal yang sama. Diukur
dengan analisis faktor.

 Validitas Eksternal
Bila data yang dicapai dapat digeneralisasi kesemua objek, situasi dan waktu yang berbeda.
1. Pemilihan sampel yang tidak bias.
2. Jumlah Sampel besar
3. Melibatkan banyak situasi
4. Periode waktu yang relatif panjang

1. Contoh Uji Validitas dan Uji Reliabilitas


Contoh perhitungan korelasi butir untuk soal bentuk uraian dengan skor butir
kontinum.
Uji Validitas :
Jika skor butir instrumen atau soal tes kontinum (misalnya skala sikap atau soal
bentuk uraian dengan skor butir 1-5 atau skor soal 0-10) dan diberi simbol Xi dan skor

12
total instrumen atau tes diberi simbol Xt, maka rumus yang digunakan untuk menghitung
koefesien korelasi antara skor butir instrumen atau soal dengan skor total instrumen atau
skor total tes adalah sebagai berikut:
Keterangan:
rit = koefisien korelasi antara skor butir soal dengan skor total.
xi = jumlah kuadrat deviasi skor dari Xi
xt = jumlah kuadrat deviasi skor dari Xt
Data hasil uji coba adalah sebagai berikut:
Nomor Butir Pertanyaan
Nomor Responden Jumlah
1 2 3 4 5 6 7
1 5 4 3 5 3 5 3 28
2 5 4 3 4 3 4 3 26
3 4 4 2 4 3 4 3 24
4 4 3 3 3 4 3 4 24
5 5 5 3 4 5 5 4 31
6 3 3 2 3 2 3 1 17
7 3 3 2 3 2 2 2 17
8 3 2 2 3 2 2 2 16
9 2 2 1 2 1 2 1 11
10 2 1 1 1 1 1 1 8
Jumlah 36 31 22 32 26 31 24 202
Penyelesaian:
Untuk n=10 dengan alpha sebesar 0,05 didapat nilai table r=0,631. Karena nilai
koefesien korelasi antara skor butir dengan skor total untuk semua butir lebih besar dari
0,631, maka semua butir mempunyai korelasi signifikan dengan skor total tes. Dengan
demikian maka semua butir tes dianggap valid atau dapat digunakan untuk mengukur
hasil belajar.
Uji reliabilitas :
Dari soal diatas, selanjutnya akan dihitung koefesien reliabilitas dengan
menggunakan rumus koefesien Alpha, yaitu:
Keterangan:
rii = koefisien reliabilitas tes
k = cacah butir

13
= varian skor butir
= varian skor total
Koefisien reliabilitas dari contoh diatas dapat dihitung dengan cara pertama-tama
dihitung varian butir sebagai berikut:
Nomor butir Varian Butir
1 1,24
2 1,29
3 0,56
4 1,16
5 1,44
6 1,69
7 1,24
Jumlah 8,62
Jadi koefesien reliabilitas tes (dengan 7 butir) pada contoh diatas adalah 0,97.

2. Contoh Perhitungan Korelasi Butir untuk Soal Bentuk Objektif


Uji Validitas :
Jika skor butir soal diskontinum (misalnya soal bentuk objektif dengan skor butir soal
0 atau 1) maka kita menggunakan koefesien korelasi biserial dan rumus yang digunakan
untuk menghitung koefesien korelasi biserial antara skor butir soal dengan skor total tes
adalah:
Keterangan:
rbis(i) = koefesien korelasi beserial antara skor butir soal nomor i dengan skor total
X1 = rata-rata skor total responden yang menjawab benar butir soal nomor i
Xt = rata-rata skor total semua responden
st = standar deviasi skor total semua responden
pi = proporsi jawaban yang benar untuk butir soal nomor i
qi = proporsi jawaban yang salah untuk butir soal nomor i
Contoh hasil uji coba adalah sebagai berikut:
Nomor Butir Pertanyaan
Nomor Responden Jumlah
1 2 3 4 5 6 7
1 1 1 1 1 0 0 0 4
2 1 1 0 1 1 1 0 5

14
3 0 1 1 1 0 0 0 3
4 1 1 0 0 0 0 0 2
5 0 1 0 0 0 0 0 1
6 1 1 1 1 1 1 1 7
7 1 1 1 1 1 1 0 6
8 0 0 0 0 0 0 0 0
9 1 1 0 0 1 0 0 3
10 1 1 1 1 1 0 0 5
Jumlah 7 9 5 6 5 3 1 36
Xt = 3,60
St = 2,107
Nomor Butir r-butir r-tabel Status
1 0,70 0,63 Valid
2 0,57 0,63 Tidak valid
3 0,66 0,63 Valid
4 0,81 0,63 Valid
5 0,76 0,63 Valid
6 0,75 0,63 Valid
7 0,54 0,63 Tidak valid
Ternyata dari tujuh butir soal tes ada 5 butir yang valid dan dua butir tidak valid. Oleh
karena itu perlu dilakukan perhitungan untuk menghitung koefesien antara skor butir
dengan skor total baru (5 butir), sebagai berikut:
Data hasil uji coba adalah sebagai berikut:
Nomor Butir
Nomor
Pertanyaan Jumlah
Responden
1 3 4 5 6
1 1 1 1 0 0 3
2 1 0 1 1 1 4
3 0 1 1 0 0 2
4 1 0 0 0 0 1
5 0 0 0 0 0 0
6 1 1 1 1 1 5
7 1 1 1 1 1 5

15
8 0 0 0 0 0 0
9 1 0 0 1 0 2
10 1 1 1 1 0 4
Jumlah 7 5 6 5 3 26
Xt = 2,6
St = 1,8
Untuk n = 10 dengan alpha sebesar 0,05 didapat nilai table r = 0,631. Karena niai
koefesien korelasi biserial antara skor butir dengan skor total untuk semua butir lebih
besar dari 0,631, maka semua butir mempunyai korelasi biserial yang signifikan dengan
skor total tes. Dengan demikian maka semua butir tes (5 butir) dianggap valid atau dapat
digunakan untuk mengukur hasil belajar.

Uji Reliabilitas :
Selanjutnya akan dihitung koefesien reliabilitas dengan menggunakan rumus KR-20,
sebagai berikut:
Keterangan:
rii = koefesien reliabilitas tes
k = cacah butir
piqi = varian skor butir
pi = proporsi jawaban yang benar untuk butir nomor i
qi = proporsi jawaban yang salah untuk butir nomor i
= varian skor total
Koefesien reliabitas dari contoh diatas adalah:
Pertama-tama dihitung varian butir (piqi) sebagai berikut:
Nomor butir pi qi piqi
1 0,7 0,3 0,21
3 0,5 0,5 0,25
4 0,6 0,4 0,24
5 0,5 0,5 0,25
6 0,3 0,7 0,21
Jumlah 1,16
St = 3,24
Jadi koefesien reliabilitas tes (dengan 5 butir) pada contoh diatas adalah 0,80.

16
BAB III
PENUTUP

A. KESIMPULAN
Bila dikaji secara umum, persyaratan minimal yang lazim dimiliki oleh instrumen yang
dibuat adalah alat ukurnya harus memiliki minimal dua keunggulan, yakni validitas dan
reliabilitas. Validitas dan reliabilitas lazim diperlukan bila instrumen yang dibuat merupakan
instrumen baru dan belum pernah digunakan oleh peneliti-peneliti terdahulu. Karena biasanya
instrumen baru secara umum belum memiliki validitas dan reliabilitas. Validitas dan reliabilitas
lazim diujikan jika instrumen baru itu masih belum memiliki validitas dan reliabilitas yang
belum terukur. Dengan demikian, jika alat ukur yang digunakan mampu memberikan informasi
yang sesungguhnya tentang apa yang kita inginkan untuk diukur dinamakan valid. Atau dengan
kata lain, instrumen yang dipakai dalam penelitian memiliki validitas yang baik.

B. SARAN
1. Seorang peneliti sebaiknya menggunakan alat pengukuran data yang valid dan reliabel
dalm mengadakan penelitian.
2. Seorang pendidik hendak betul-betul memahami metode belajara atau pun model
pembelajaran yang mereka gunakan, sehingga hasil pembelajaran nya dapat maksimal

17
DAFTAR PUSTAKA

Hamang, Abdul (2005) Metode Statistika, Yogyakarta: Graha Ilmu

Sugiyono (2003) Statistik Untuk Penelitian, Bandung: Alfabeta

Santoso, Singgih (2003) Mengatasi Berbagai Masalah Statistik , Jakarta:Gramedia.

18

Anda mungkin juga menyukai