Anda di halaman 1dari 23

VALIDITAS DAN RELIABILITAS HASIL PENGUKURAN

MAKALAH
UNTUK MEMENUHI TUGAS MATAKULIAH
Evaluasi Pendidikan
Dosen Pengampu Bapak Dr. Eddy Sutadji, M.Pd

Oleh
KELOMPOK 5
Eko Yusup Edi Wijaya (130513605961)
Eka Yuda Primasatya (130513605950)

UNIVERSITAS NEGERI MALANG


FAKULTAS TEKNIK
PROGRAM STUDI PENDIDIKAN TEKNIK OTOMOTIF
Februari 2015

KATA PENGANTAR

Assalamualaikum Wr. Wb.


Segala puji syukur kami limpahkan kehadirat Allah SWT, Tuhan semesta alam
yang telah melimpahkan rahmat taufik, hidayah dan inayahnya sehingga penulis dapat
menyelesaikan punyusunan makalah ini dengan baik dan tepat waktu tanpa ada suatu
halangan apapun.
Tak lupa ucapan terima kasih kami ucapkan kepada pihak-pihak yang telah
membantu dan bekerja sama dalam penyusunan makalah dengan tema VALIDITAS
DAN RELIABILITAS HASIL PENGUKURAN ini, antara lain :
1. Kedua orang tua kami di rumah yang selalu memberi dukungan serta doa pada kami.
2. Bapak Dr. Eddy Sutadji, M.Pd selaku dosen pengampu mata kuliah Evaluasi
Pendidikan yang selalu membimbing dan mendampingi kami dalam proses
perkuliahan
3. Rekan-rekanan kelompok yang menyumbangkan tenaga dan pikiran untuk bekerja
sama dalam penyusunan makalah ini.
4. Serta rekan-rekan mahasiswa dan semua pihak yang bersedia memberikan
partisipasinya dalam penyusunan makalah ini.
Semoga dengan adanya makalah ini dapat bermanfaat buat kami pribadi selaku
penyusun makalah ini khususnya serta buat semua pembaca umumnya. Kami sadar
bahwa penyusunan makalah ini masih jauh dari sempurna, maka kami selaku penyusun
mengharap kritik serta saran-saran yang membangun dari para pembaca.
Wallahul Muafieq Illaa Aqwaamieth Tharieq
Wassalamualaikum Wr. Wb.

Malang, Februari 2015

Penulis

BAB I

PENDAHULUAH

A. LATAR BELAKANG
Dalam proses pembelajaran terdapat rencana tujuan yang ingin dicapai. Untuk
mengetahuai tingkat keberhasilan dari proses pembelajaran adalah dengan
mengadakan evaluasi.
Evaluasi berasal dari bahasa Inggris evaluation yang berarti penilaian.
Evaluasi diartikan sebagai suatu proses penilaian untuk mengambil keputusan
yang menggunakan seperangkat hasil pengukuran dan berpatokan kepada tujuan
yang telah dirumuskan.
Evaluasi dapat dilakukan dengan menggunakan tes dan non tes. Dalam tes
maupun non tes proses evaluasi biasanya dengan memberikan pertanyaan atau soalsoal kepada yang dievaluasi/diukur.
Menurut Arikunto dalam pelaksanaan tes hasil belajar dapat dikatakan baik
jika setidaknya mencangkup lima ciri-ciri berikut ini, yaitu: validitas, reliabilitas,
objektifitas, praktikabilitas dan ekonomis.
Sedangkan menurut Anas (2007) yaitu: valid, reliabel, obyektif, dan praktis.
Valid dapat diartkan sebagai ketepatan, kebenaran, keshahihan. Reliabel yaitu
keajegan, kemantapan. Obyektif maksudnya jika suatu tes itu menurut apa adanya
dari sumber. Praktis artinya suatu tes tersebut harus mudah dilaksanakan karena test
itu harusbersifat sederhana dan lengkap.
Dari kedua pendapat di atas dalam ciri-ciri pelaksanaan evaluasi hasil belajar
yang baik masing-masing menyebutkan evaluasi haruslah valid (validitas) dan
reliabel (reliabilitas). Kedua hal tersebut lah yang akan kami bahas dalam makalah
ini.

B. POKOK BAHASAN
Dalam makalah ini penulis akan menyajikan dua pokok bahasan yaitu:
1. Validitas: pengertian, jenis-jenis dan cara-cara mengetahui validitas alat ukur
2. Reliabilitas: pengertian, cara mencari besar reliabilitas soal objektif dan soal
uraian
3. Hubungan antara validitas dan reliabilitas

BAB II
PEMBAHASAN
A. VALIDITAS
1. Pengertian Validitas
Karakter pertama dan memiliki peranan sangat penting dalam instrument
evaluasi adalah valid. Suatu instrument dikatakan valid, seperti yang diterangkan
oleh Gay (1983) dan Johnson (2002), apabila instrument yang digunakan dapat
mengukur apa yang seharusnya diukur (Sukardi, 2008).
Pernyataan serupa juga disampaikan oleh Scarvia B. Anderson (dalam
Arikunto, 1997) bahwa A test is valid if it measures what is purpose to
measure. Atau jika diartikan kurang lebih adalah, sebuah tes dikatakan valid
apabila tes tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia
Valid bisa disebut dengan istilah Sahih.
Sebuah data atau informasi dapat dikatakan valid apabila sesuai dengan
data yang sebenarnya. Sebagai contoh, informasi tentang seorang bernama A
menyebutkan bahwa si B pendek karena tingginya tidak lebih dari 130
sentimeter. Data tentang si B ini dikatakan valid apabila memang sesuai dengan
kenyataan, yakni bahwa tinggi A kurang dari 130 sentimeter. Contoh lain data si
E yang diperoleh dari cerita orang lain menunjukkan bahwa ia pembohong. Bukti
bahwa si E pembohong diperoleh dari kenyataan bahwa si E sering
berbicara tidak benar, tidak sesuai dengan kenyataan. Dengan demikian maka
data tentang si E tersebut valid dan cerita orang tersebut benar.
Jika data yang dihasilkan dari sebuah instrument valid, maka dapat
dikatakan bahwa instrument tersebut valid, karena dapat memberikan gambaran
tentang data secara benar sesuai dengan kenyataan atau keadaan sesungguhnya.
Dari sedikit uraian dan contoh tersebut dapat disimpulkan bahwa: Jika data yang
dihasilkan oleh instrument benar dan valid, sesuai kenyataan, maka instrument
yang digunakan tersebut juga valid.

2. Jenis-jenis Validitas
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Hal yang pertama akan diperoleh adalah validitas logis (logical
validity) dan selanjutnya adalah validitas empiris (empirical validity). Dua hal

tersebut yang dijadikan unsur dasar pengelompokan validitas tes.


a. Validitas logis
Pada istilah validitas logis terdapat kata logis yang berasal dari kata
logika, yag berarti penalaran. Maksudnya ialah evaluasi apabila telah
dirancang dengan baik, mengikuti teori dan ketentuan yang ada, maka secara
logis sudah valid.
Ada dua macam yang dapat dicapai oleh sebuah instrumen, yaitu:
1) Validitas isi (content validity)
Validitas isi merupakan validitas yang diperoleh setelah penganalisisan
terhadap isi yang terkandung dalam tes hasil belajar. Validitas isi
sering disebut validitas kurikuler karena materi yang diajarkan pada
umumnya tertuang pada GBPP. Validitas isi dapat diketahui dengan
membandingkan isi yang terkandung dalam tes hasil belajar dengan
tujuan instruksional khusus yang telah ditentukan.
2) Validitas konstruksi (contruct validity)
Sebuah tes dikatakan memiliki validitas konstuksi apabila butir-butir soal
yang membangun tes tersebut mengukur setiap aspek berfikir seperti
yang disebutkan oleh Tujuan Intruksional Khusus. Dengan kata lain jika
butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan
aspek berfikir yang menjadi tujuan intruksional.
Sebagai contoh jika rumusan Tujuan Intruksional Khusus (TIK) siswa
dapat membandingkan antara motor bensin dengan motor diesel, maka
butir soal pada tes merupakan perintah agar siswa membedakan antara
kedua jenis motor tersebut. Sekarang TIK dikenal dengan Indikator.
b. Validitas empiris
Pada istilah validitas empiris terdapat kata empiris, yang artinya adalah
pengalaman. Sebuah instrument dapat dikatakan memiliki validitas empiris
apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari seseorang
dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan
bahwa orang tersebut memang jujur. Validitas empiris tidak bisa didapat
hanya dengan menyusun instrumen berdasarkan ketentuan saja seperti
layaknya validitas logis, tetapi validitas ini harus dibuktikan berdasarkan
pengalaman di lapangan.
Validitas tes secara empiris dapat ditelusuri dari dua segi, yaitu:
1) Validitas ada sekarang (concurrent validity)
Validitas ini sering disebut validitas empiris (sesuai dengan pengalaman).

Pengalaman selalu mengenai hal yang telah berlalu sehingga data


pengalaman tersebut sekarang sudah ada (ada sekarang, concurent).
Dalam hal ini dapat disimpulkan bahwa hasil tes harus dibandingkan
hasil tes yang sejenis mas lampau (yang sudah ada).
Contohnya guru ingin mengetahui kevalidan hasil tes sumatif yang akan
disusun. Dengan begitu maka guru harus membandingkan hasil nilai tes
sumatif sekarang dengan hasil nilai sumatif yang lampau.
2) Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dengan meramal selalu mengeai hal-hal
yang akan datang jadi sekarang belum terjadi. Validitas ramalan dari
sebuah tes merupakan suatu kondisi yang menunjukkan sejau mana
sebuah tes dapat menunjukkan

kemampuannya

untuk

memberikan

ramalan terhadap kondisi yang akan terjadi pada masa yang akan datang.
Misalnya, tes masuk Perguruan Tinggi adalah
diperkirakan

sebuah

tes

yang

mampu meramalkan keberhasilan peserta tes dalam

mengikuti kuliah dimasa yang akan dating. Calon yang tersaring


berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya
kemampuan mengikuti kuliah. Jika nilai tesnya tinggi, tentu menjamin
keberhasilannya kelak. Sebaliknya, seorang calon dikatakan tidak
lulus tes karena memiliki nilai tes yang rendah jadi diperkirakan akan
tidak mampu menikuti perkuliahan yang akan datang.
Sebuah tes dikatakan memiliki validitas ramalan apabila

terdapat

korelasi yang positif dan signifikan antara tes hasil belajar yang
sedang

diuji

dengan kriterium yang ada. Korelasi tersebut dapat

diketahui dengan menggunakan teknik analisis korelasi product moment


dari Karl Pearson.
3. Cara Mengetahui Validitas Alat Ukur
Tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium,
dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium.
Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi
product moment yang dikemukakan oleh Pearson.
Rumus kolerasi product moment ada 2 (dua) macam, yaitu:
a. Kolerasi Product moment dengan simpangan, dan
b. Kolerasi Product moment dengan angka kasar.

Rumus korelasi product moment dengan simpangan:

r xy =

xy

( 2)( 2)
x

Keterangan:
rxy

= koefisien kolerasi antara variabel X dan variabel Y, dua


variabel yang dikolerasikan (x = X

xy
x2

= jumlah perkalian x dengan y


= kuadrat dari x

y2

= kuadrat dari y

dan y = Y Y ).

Contoh perhitungan:
Suatu misal akan menghitung validitas tes prestasi belajar matematika. Sebagai
kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi kode X
dan rata-rata nilai harian diberi kode Y. Kemudian dibuat tabel persiapan sebagai
berikut.
TABEL PERSIAPAN UNTUK MENCARI VALIDITAS
TES PRESTASI MATEMATIKA
No

Nama

x2

y2

Xy

1.

Andi

6,5

6,3

0,1

0,0

0,01

0,0

2.

Ardi

6,8

+ 0,5

+ 0,4

0,25

0,16

+ 0,2

3.

Aziz

7,5

7,2

+ 0,1

+ 0,8

1,0

0,64

+ 0,8

4.

Bagus

6,8

+ 0,5

+ 0,4

0,25

0,16

+ 0,2

5.

Bunga

0,5

+ 0,6

0,25

0,36

0,3

6.

Citra

6,2

0,5

0,2

0,25

0,04

+ 0,1

7.

Deni

5,5

5,1

0,1

1,3

1,0

1,69

+ 0,1

8.

Eko

6,5

0,4

0,0

0,16

0,0

9.

Nana

6,5

+ 0,1

+ 0,1

0,25

0,01

+ 0,05

10.

Rina

5,9

0,5

0,6

0,25

0,36

+ 0,3

Jumla

65,0

63,8

3,5

3,59

2,65

X
N

Y
N

x =X-

65 ' 5
10

= 6,5

63 ' 8
10

= 6,38 dibulatkan menjadi 6,4

y=Y- Y

Kemudian dimasukkan ke rumus

xy
r xy =
( 2)( 2)

r xy =

2,65
3,5 x 3,59

r xy =

2,65
12,565

r xy =

2,65
3,545

= 0,749

Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.
Rumus korelasi product moment dengan angka kasar:
X
Y

X 2

Y 2
N X 2

XY
N
r xy=
Di mana:

r xy = koefisien korelasi antara variabel X dan variabel Y, dua variabel


yang
Dikorelasikan.
Dengan menggunakan hasil data tes prestasi matematika di atas sekaran
dihitung dengan rumus korelasi product moment dengan angka kasar yang
tabel persiapannya sebagai berikut:
TABEL PERSIAPAN
No

Nama

X2

Y2

XY

1.

Andi

6,5

6,3

42,25

39,69

40,95

2.

Ardi

6,8

49

46,24

47,6

3.

Aziz

7,5

7,2

56,25

51,84

54,0

4.

Bagus

6,8

49

46,25

47,6

5.

Bunga

36

49

42

6.

Citra

6,2

36

38,44

37,2

7.

Deni

5,5

5,1

30,25

26,01

28,05

8.

Eko

6,5

42,25

45,5

39

9.

Nana

6,5

49

36

45,5

10.

Rina

5,9

36

34,81

35,4

65,0

63,8

426,0

410,52

417,3

Jumla
h

Kemudian dimasukkan dalam rumus:

X
Y

X 2

Y 2
N X 2

XY
N
r xy=
r xy =

10 x 417,3(65 x 63,8)
( 10 x 4264225 ) (10 x 410,524070,44)

r xy =

41734147
( 42604225 ) (4105,24070,44)

r xy =

26
35 x 34,76

r xy =

26
1216,6

26
34,8797 = 0,745

Dari hasil tersebut jika dibandingkan dengan validitas soal yang


dihitung dengan rumus simpangan ternyata terdapat selisih 0,003. Hal
tersebut wajar karena dalam perhitungan terdapat pembulatan angka pada 3
angka dibelakang koma. Perbedaan 0,003 sangat kecil jadi dapat diabaikan.
4. Validitas Butir Soal atau Validitas Item
Apa yang sudah dibicarakan di atas adalah validitas soal secara
keseluruhan tes. Disamping mencari validitas soal perlu juga dicari validitas
item. Jika seorang peneliti atau seorang guru mengetahui bahwa validitas soal
tes misalnya terlalu rendah dan rendah saja, maka selanjutnya ingin mengetahui
butir-butir tes manakah yang menyebabkan soal secara keseluruhan tersebut
jelek karena memiliki validitas rendah. Untuk kepentingan inilah dicari validitas
butir soal.

Pengertian umum untuk validitas item adalah demikian sebuah item


dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total.
Skor pada item menyebabkan skor total menjadi tinggi atau rendah. Dengan kata
lain dapat dikemukakan di sini bahwa item memiliki validitas yang tinggi jika
skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini
dapat diartikan dengan kolerasi sehingga untuk mengetahui validitas item
digunakan rumus kolerasi seperti sudah diterangkan di atas.
Untuk soal yang bersifat objektif biasanya diberikan nilai 1 untuk benar
dan 0 untuk yang salah. Sedangkan skor total merupakan jumlah total dari skor
untuk semua item yang diujikan.
Contoh perhitungan:
TABEL ANALISA ITEM UNTUK
PERHITUNGAN VALIDITAS ITEM
Total

Nomor Butir Soal

Nama

Skor

10

Andi

Ardi

Aziz

Bagus

Bunga

Citra

Deni

Eko

Dari tabel di atas misalnya dihitung validitas item nomor 6, maka skor item
tersebut variabel X dan skor total disebut variabel Y. Selanjutnya disini saya
menggunakan rumus korelasi product moment dengan angka kasar.
Untuk menghitung validtas item nomor 6, maka dibuat dahulu tabel
persiapan sebagai berikut:
No

Nama

.
1.

Andi

2.

Ardi

3.

Aziz

4.

Bagus

5.

Bunga

6.

Citra

7.

Deni

8.

Eko

Keterangan:

X = skor item nomor 6


Y = skor total
X

X = 6

=6

2
Y = 288

Y = 46
XY = 37
X t

p=

= 5,57
6
8

= 0,75

X p

= 6,17
q=

2
8

= 0,25

Selanjutnya dimasukkan ke rumus korelasi product moment angka kasar:


X
Y

X 2

Y 2
N X 2

XY
N
r xy=
r xy =

r xy =

8 x 376 x 46

( 8 x 66 ) (8 x 28846 )
2

296276
( 4836 ) (23042116)

r xy

20
12 x 188

20
2256

20
47,497

= 0,421

Dengan hasil tersebut dapat disimpulkan validitas item tersebut kurang


meyakinkan. Tentu saja validitasnya rendah.
Selain dengan rumus di atas untuk mengetahui validitas item juga dapaat
menggunakaan rumus pbi sebagai berikut:
pbi =

M pM t
St

p
q

Keterangan:
pbi

= Koefisiensi korelasi biserial

Mp

= Rerata skor dari subjek yang menjawab betul pada


item yang dicari validitasnya

Mt

= Rerata skor total

St

= Standart deviasi dari skor total

= Proporsi siswa yang menjawab benar


(p=

banyaknya siswa yang benar


jumlah seluruh siswa

= Proporsi siswa yang menjawab salah


(q=1p)
Apabila item nomor 6 di atas dicari validitasnya dengan rumus ini makaa

melalui langkah-langkah sebagai berikut:

Mencari
Mp

Mencari
Mt

Mp
8+3+5+6+7 +8
6

37
6

= 6,17

Mt
8+5+3+5+6+ 4+ 7+8
8

46
8

= 5,75

Dari perhitungan dihasilkan standar deviasi, S t


6
Mencari p, p = 8 = 0,75

= 1,7139

2
8

Mencari q,

Masukkan ke rumus pbi

q=

= 0,25

pbi =

M pM t
St

pbi =

6,175,75 0,75
1,7139
0,25

pbi =

0,42
1,7139

p
q

x 1,7321

= 0,4244

Hasil dari perhitungan ini berbada sedikt dengan yang sebelumnya, itu
wajar karena dalam perhitungan sering terjadi pembulatan.
5. Tes Terstandar sebagai Kriterium dalam Menentukan Validitas
Tes terstandar adalah tes yang yang diulang berkali-kali sehingga terjamin
kebaikannya. Tes ini biasa diterapkan di negara-negara berkembang. Tes
terstandar biasanya memiliki kriteria: sudar dicoba beberapa kali dan di manamana, beberapa koefisien validitas, reliabilitas, taraf kesukaran, daya pembeda
dan lain-lain keterangan yang dianggap perlu.
Cara menentukan validitas soal yang menggunakan tes terstandar sebagai
kriterium dilakukan dengan mengalikan koefisien validitas yang diperoleh
dengan koefisien validitas tes terstandar tersebut.
6. Validitas Faktor
Selain validitas soal secara keseluruhan dan validitas item harus pula
dihitung validitas faktor-faktor atau bagian keseluruhan materi.
Butir-butir soal dalam faktor dikatakan valid apabila mempunyai dukungan
terhadap soal-soal secara keseluruhan. Bentuk dukungan yaang diaksud adalah
jika jumlah skor untuk butir-butir faktor tersebut menunjukkan adanya
keselarasan dengan skor soal secara keseluruhan.

B. RELIABILITAS
1. Pengertian Reliabilitas
Yang dimaksud reliabilitas adalah sebagai berikut:
a. Sejauh mana hasil pengukuran dapat dipercaya
b. Sejauh mana hasil pengukuran dapat dipercaya bila dilakukan pengukuran
pada waktu yg berbeda pada kelompok subjek yg sama diperoleh hasil yang

relatif sama asalkan aspek yg diukur dalam diri subjek memang belum
berubah
c. Tinggi/rendahnya

reliabilitas

secara

empirik ditunjukkan oleh suatu

angka yang disebut nilai koefisien reliabilitas


d. Reliabilitas yg tinggi ditunjukkan dengan nilai 1.00, reliabilitas

yg

dianggap sudah cukup memuaskan atau tinggi adalah 0.70


Sehubungan

dengan

reliabilitas

ini,

Scarvia

B. Anderson

nmenyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini
penting. Dalam hal ini, validitas lebih penting, dan reliabilitas ini perlu karena
menyokong terbentuknya validitas. Sebuah tes mungkin reliable tetapi bisa tidak
valid. Sebaliknya, sebuah tes yang valid biasanya reliable.
Untuk dapat memperoleh gambaran yang ajeg memang sulit karena
unsur kejiwaan manusia itu sendiri tidak ajeg. Misalnya, kemampuan,
kecakapan, sikap, dan sebagainya berubah-ubah dari waktu ke waktu.
Ada beberapa hal yang sedikit banyak mempengaruhi hasil tes. Secara
garis besar dapat dikelompokkan menjadi 3 hal berikut ini:
a. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas
butir-butir soalnya.
Semakin banyak jumlah soal maka lebih valid. Maka tingginya jumlah soal
membuat tinggi pula reliabilitas dari tes tersebut. Untuk menghitung tingginya
reliabilitas soal dalam tes mengenai penambahan soal bisa dihitung dengan
rumus Spearman Brown berikut ini:
nr
r nn =
1+ ( n1 ) r
Keterangan:

r nn

= berapa kali butir-butir soal ditambah

= besar kooefisien reabilitas sebelum penambaahan butir soal

= besar koefisien reliabilitas sesudah tes tersebut ditambah butir soal

Penambahan butir soal dapat menambah tinggi reliabilitas, tetapi ada kalanya
penambahan tidak berarti bahkan bisa merugikan.
b. Hal yang berhubungan dengan tercoba (testee)
Suatu tes yang dicobakan pada suatu kelompok yang terdiri dari banyak siswa
akan menunjukkan keragaman hasil tes yang menggambarkan besar kecilnya
reliabilitas tes. Tes yang dicobakan pada bukan kelompok terpilih, akan

menunjukkan reliabilitas yang lebih tinggi dari pada yang diujikan kepada
kelompok tertentu yang dipilih.
c. Hal yang berhubungan dengan penyelenggaraan tes
Hal administratif sangat menentukan hasil tes.
Contoh:
Petunjuk pengerjaan tes
Pengawas yang tertib
Suasana lingkungan dan tempat tes
Adanya beberapa hal yang mempengaruhi hasil tes di atas, maka akan
berdampak pula pada reliabilitas soal tes.

2. Cara-cara Mencari Besarnya Reliabilitas Jenis Objektif


Untuk mengetahui besarnya reliabilitas maka harus ada beberapa hasil
ujian untuk dikorelasikan.
Ada beberap metode atau cara yang bisa digunakan untuk mengetahui
besarnya reliabilitas, antara lain adalah sebagai berikut:
a. Metode bentuk paralel (equivalent)
Tes peralel atau equivalen adalah dua tes yang mempunyai kesamaan tujuan,
tingkat kesukaran dan susunan, tetapi butir soal dibuat berbeda.
Contoh dalam tes Matematika Seri A yang dicari reliabilitasnya dan Seri B
yang diteskan kepada kelompok siswa yang sama, kemudian hasilnya
dikorelasikan. Jika koefisien korelasi tinggi maka tes tersebut sudah reliabel
dan dapat digunakan sebagai alat pengetes yang terandalkan.
Kelebihan metode ini baik digunakan karena siswa mengerjakan dua Seri tes
dengan soal yag berbeda jadi tidak terjadi faktor ingatan dalaam
pengerjaannya.
kelemahannya adalah bahwa pengetes (Guru) harus membuat dua seri tes
yang berbeda.
b. Metode tes ulang (test-retest method)
Metode tes ulang ini biasa diterapkan karena pengetes tidak perlu membuat
dua Seri tes yang berbeda. Dalam metode ini pengetes melakukan satu Seri tes
yang dicobakan dua kali. Kemudian hasil kedua tes dikorelasikan.
Untuk tes yang banyak mengungkap ingatan metode ini kurang mengena
karena eserta tes bisa mengingat tes yang pertama dan tentunya berakibat
membaiknya skor yang diperoleh pada tes kedua. Hal tersebut tidak mengapa
yang terpenting adalah adanya kesejajaaran hasil yang ditunjukkan oleh
koefisien korelasi yang tinggi (kenaikan skor dialami oleh semua siswa).
c. Metode belah dua atau split-half method
Metode ini mempermudah dari dua metode sebelumnya. Dalam metode ini

pengetes hanya membuat satu Seri tes dan melakukan pengetesan satu kali.
Dalam mencari reliabilitas pada metode ini haris menghitung dengan rumus
Spearman-Brown sebagai berikut:
2r1 1
22
r 11 =
(1+ r 1 1 )
22

r1 1

= Korelasi antara skor-skor setiap belahan tes

22

r 11

= Koefisien reliabilitas yang sudah disesuaikan

Dalam penggunaan metode ini ada persyaratannya yaitu item soal harus
berjumlah genap, sehingga dapat dibelah menjadi dua bagian.
Dalam metode belaah dua ada dua cara yang dapat dilakukan, yaitu:
1 Membelah item-item genap dan item-item ganjil, biasa disebut belahan
2

genap ganjil.
Membelah setengah awal dari jumlah item keseluruhan dan setengah ahir
dari keseluruhan item, biasaa disebut dengan belahan awal ahir.

Selain dengan mengunakan rumus di atas ada seorang ahli yang bernama
Flanagan membuat rumus belah dua ganjil-genap, dan Rulon membuat
rumus belah dua awal-ahir.
1

Penggunaan rumus Flanagan


2
2
S +S
1
2
1
2
Rumus =
)
S
t
r 11 =2
Di mana:
r 11

= reliabilitas tes

2
1

= varian belahan pertama (1), varian skor item ganjil

2
2

= varian belahan kedua (2), varian skor item genap

2
t

= varian total

Penggunaan rumus Rulon


2
S
d
r 11 =1
Rumus =
2
S
t
Di mana:

2
d

= varian beda (varians difference)


= difference yaitu perbedaan antara skor belahan pertama

(awal)
dengan skor belahan kedua (ahir)
Telah disinggung di bagian depan bahwa syarat untuk menggunakan
metode belah dua adalah jumlah item harus genap dan antara belahan
terjadi keseimbangan (homogen).
Untuk mengatasi kesulitan dalam memenuhi persyaratan tersebut, mencari
reliabilitas juga dapat dicari dengan menggunakan rumus dari Kuder dan
Richardson. Rumus yang digunakan untuk mencari reliabilitas yang biasa
digunakan ada dua yaitu rumus K-R.20 dan rumus K-R.21.
1 Penggunaan rumus K-R. 20
S2 pq
n
r 11 =(
)(
)
Rumus =
n1
S2
Di mana:
r 11

= reliabilitas tes secara keseluruhan

= proporsi subjek yang menjawap item dengan benar

= proporsi subjek yang menjawap item dengan salah (q = 1-p)

pq

= jumlah hasil perkalian antara p dan q

= banyaknya item

= standar deviasi item (standar deviasi adalah akar varians)

Dalam referensi lain untuk n diganti pakai k, dan S biasa diganti dengan
2

SB. Hal tersebut juga sama pada rumus K-R.21.


Penggunaan rumus K-R. 21
M ( nM )
n
r 11 =(
)(1
)
n1
2
Rumus K-R. 21:
nS
t

M = Mean atau rerata skor total


Selain dengan rumus-rumus di atas masih ada satu rumus lagi yang dapat
digunakan untuk menghitung reliabilitas, yaitu dengan rumus Hoyt.
1 Penggunaan rumus Hoyt
Vs
VrVs
r 11 =
Rumus: r 11 =1 Vr
atau
Vr
r 11

= Reliabilitas seluruh soal

Vr

= Varians responden

Vs

= Varians sisa

Untuk mencari reliabilitas dengan rumus ini harus melalui beberapa


langkah-langkah sebagai berikut:
Langkah 1: mencari jumlah kuadrat responden:
Xt

2
Xt
JK (r )=

k
JK (r )
Xt

= jumlah kuadrat responden


= skor total tiap responden

k
= banyaknya item
N
= banyaknya responden atau subjek
Langkah 2: mencari jumlah kuadrat item:
Xt

2
B

JK (i)=

N
JK (i)

B
item

Xt

= jumlah kuadrat item


2

= jumlah kuadrat jawaban benar seluruh

= kuadrat dari jumlah skor total

Langkah 3: mencari jumlah kuadrat total:

B
S

JK (t )=
JK (t )

B
S

= jummlah kuadrat total


= jumlah jawab benar seluruh item
= jumlah jawab salah seluruh item

Langkah 4: mencari jumlah kuadrat sisa:


JK (s) =JK (t )JK (r )JK (i)
Langkah 5: mencari varians responden dan varians sisa dengan tabel F.
Dalam mencari varians ini deperlukan d.b (derajat kebebasan)
dari masing-masing sumber varians kemudian d.b ini
digunakan
sebagai penyebut terhadap setiap jumlah kuadrat untuk
memperoleh variansi.
d.b
= banyaknya N setiap sumber variansi dikurangi 1.
Jumlah Kuadrat
Jadi Variansi =
d.b
Langkah 6: memasukkan ke rumus r 11
Rumus r 11 adalah rumus Hoyt yang telah tertulis di atas.
3. Mencari reliabilitas tes bentuk soal uraian
Rumus-rumus yang telah kami uraikan di atas merupakan rumus yang
hanya untuk mencari reliabilitas pada soal tes jenis objektif, yaitu soal yang
terdiri dari butir soal yang dinilai hanya benar atau salah. Untuk menilai soal
bentuk uraian tidak bisa dilakukan seperti itu. Suatu soal uraian menghendaki
gradualisasi penilaian. Bisa jadi pada butir soal nomor 1 penilaian terendah 0 dan
tertinggi 8, tetapi nomor dua tertinggi 6, butir nomor 3 tertinggi 10, dan lain
sebagainya.
Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan

asalisa butir soal seperti halnya pada soal bentuk objektif. Skor untuk masingmasing butir soal dicantumkan pada kolom item menurut apa adanya. Rumus
yang digunakan untuk menghitung reliabilitas soal bentuk uraian adalah rumus
Alpha sebagai berikut:
r 11 =(

n
)(1
)
2
( n1 )

Di mana:
r 11 = reliabilitas yang dicari
2

2
t

= jummlah varians skor tiap-tiap item

= varians total

Menguji reliabilitas angket penelitian dalam pengumpulan data, rumus Alpha


ini dapat diterapkan. Karena untuk rumus belah dua hanya dapat digunakan
jika jumlah item harus genap, rumus Alpha ini bisa jadi alternatif.
C. HUBUNGAN VALIDITAS DENGAN RELIABILITAS
Hubungan antara validitas dan reliabilitas sering membingungkan para guru
muda/baru, terutama bagi yang baru mengetahui batasan dalam konteks instrumen
evaluasi dan penelitian ini. Reliabilitas pengukuran instrumen evaluasi diperlukan
untuk mencapai hasil pengukuran yang valid. Dalam kaitannya dengan posisi
konsistensi, para guru bisa memiliki instrumen evaluasi yang reliabel tanpa valid, dan
sebaliknya bisa memiliki instrumen valid dengan reliabilitas yang baik.
Gambar di bawah ini akan menunjukkan kaitan antara validitas dan
reliabilitas:

Gambaran valid dan reliabel ditunjukan dari hasil tembakan pada target yang
telah ditetapkan:
Gambar a: hasil tembakan menunjukkan valid dan reliabel, karena tembakan

tepat sasaran dan dalam luasan yang konsisten


Gambar b: hasil tembakan menunjukkan tidak valid dan juga tidak reliabel,
karena sasaran gerak labil dan berpencar merata pada seluruh sasaran.

Gambar c: hasil tembakan menunjukkan reliabel tetapi tidak valid, karena


hasil tembakan konsisten pada luasan tetapi diluar dari ketetapan target.

BAB III
PENUTUP
KESIMPULAN
Dari uraian di atas dapat ditarik kesimpulan bahwa bila dikaji secara umum,
persyaratan minimal yang lazim dimiliki oleh instrumen yang dibuat adalah alat ukur
harus memiliki minimal dua keunggulan, yakni validitas dan reliabilitas. Validitas
dan reliabilitas lazim diperlukan bila instrumen yang dibuat merupakan instrumen
baru dan belum pernah digunakan oleh peneliti-peneliti terdahulu. Karena biasanya
instrumen baru secara umum belum memiliki validitas dan reliabilitas. Dengan
demikian, jika alat ukur yang digunakan mampu memberikan informasi yang
sesungguhnya tentang apa yang kita inginkan untuk diukur dinamakan valid. Atau
dengan kata lain, instrumen yang dipakai dalam penelitian memiliki validitas yang
baik.
Dengan validnya alat ukur makaa akaan menimbulkan reliabilitas pula,
karena biasaanya sebuah tes atau evaluasi yang valid juga reliabel. Dengan valid dan
reliabelnya tes atau evaluasi diharapkan akan terpenuhi pula tujuan dari tes atau
evaluasi tersebut yang sesuai dengan semestinya.

DAFTAR PUSTAKA
Arikunto. (2012). Dasar-Dasar Evaluasi Pendidikan. Jakarta. Bumi Aksara.
Sukardi. (2008). Evaluasi Pendidikan (Prinsip & Operasionalnya). Jakarta. Bumi
Aksara.
Sudargo. (2012). Bahan Kuliah Pertemuan 7 Validitas dan Reliabilitas Instrumen
(http://file.upi.edu/Direktori/SPS/PRODI.PENDIDIKAN_IPA/1951072619780
32-FRANSISCA_SUDARGO/KULIAH_PENPENDS2/Pertemuan_7.pdf).
(Online). Diakses pada 10 Februari 2015.
Pramana, dkk. Evaluasi Pendidikan
Zulkifli. (2011). Validitas dan Reliabilitas Instrumen (http://digilib.unimed.ac.id/public/UNIMED-Article-24576-Zulkifli.pdf). (Online). Diakses pada 12
Februari 2015.
Zuhaili. (2013). Resume Buku Dasar-dasar Evaluasi Pendidikan Suhasimi Arikunto
(https://zainzuhaili.wordpress.com/2013/06/25/resume-buku-evaluasi-pai-profdr-suharsimi-arikunto/). (Online). Diakses pada 12 Februari 2015.

Anda mungkin juga menyukai