Anda di halaman 1dari 32

BAB I

PENDAHULUAN
A. Latar Belakang
Dalam penelitian kuantitatif, peneliti akan menggunakan instrumen untuk
mengumpulkan data, sedangkan dalam penelitian kulitatif naturalistic peneliti
akan lebih banyak menjadi instrumen karena dalam penelitian kulitatif merupakan
key instruments.
Instrumen penelitian digunakan untuk mengukur nilai variabel yang
diteliti. Dengan demikian jumlah instrumen yang akan digunakan untuk penelitian
akan tergantung pada jumlah variabel yang diteliti. Bila variabel penelitiannya
lima, maka jumlah instrumen yang digunakan untuk penelitian juga lima.
Instrumen instrumen penelitian sudah ada yang dibakukan, tetapi masih ada
yang harus dibuat peneliti sendiri. Karena instrumen penelitian akan digunakan
untuk melakukan pengukuran dengan tujuan menghasilkan data kuantitatif yang
akurat, maka setiap instrumen perlu diuji terlebih dahulu. Bagaimana cara
pengujian instrumen tersebut? Untuk menjawab pertanyaan tersebut, kelompok
kami akan mengemukan pembahasan mengenai cara Pengujian Instrumen yang
berkenaan dengan pengujian validitas dan reabilitas.
B. Rumusan Masalah
1. Bagaimana cara pengujian instrumen?
2. Apa yang dimaksud dengan pengujian validitas instrumen?
3. Apa yang dimaksud dengan pengujian reabilitas instrumen?

C. Tujuan
1. Mengetahui cara pengujian instrumen.
2. Mengetahui tentang pengertian pengujian validitas isntrumen.
3. Mengetahui tentang pengertian pengujian reabilitas instrumen.


BAB II
PEMBAHASAN
A. Validitas dan Reliabilitas Instrumen
Dalam hal ini perlu dibedakan antara hasil penelitian yang valid dan
reliable dengan instrumen yang valid dan reliabel. Hasil penelitian yang valid bila
terdapat kesamaan antara data yang terkumpul dengan data yang sesungguhnya
teradi pada obyek yang diteliti. Kalau dalam obyek berwarna merah, sedangkan
data yang terkumpul memberikan data berwarna putih maka hasil penelitian tidak
valid. Selanjutnya hasil penelitian yang reliabel, bila terdapat kesamaan data
dalam waktu yang berbeda. Kalau dalam obyek kemarin berwarna merah, maka
sekarang dan besok tetap berwarna merah.
Instrumen yang valid berarti alat ukur yang digunakan untuk mendapatkan
data (mengukur) itu valid. Valid berarti instrumen tersebut dapat digunakan
untuk mengukur apa yang seharusnya diukur. Meteran yang valid dapat
digunakan untuk mengukur panjang dengan teliti, karena meteran memang alat
untuk mengukur panjang. Meteran tersebut menjadi tidak valid jika digunakan
untuk mengukur berat. Instrumen yang reliabel adalah instrumen yang bila
digunakan beberapa kali untuk mengukur obyek yang sama, akan menghasilkan
data yang sama. Alat ukur panjang dari karet adalah contoh instrumen yang tidak
reliabel / konsisten.
Dengan menggunakan instrumen yang valid dan reliabel dalam
pengumpulan data, maka diharapkan hasil penelitian akan menjadi valid dan
reliabel. Jadi instrumen yang valid dan reliabel merupakan syarat mutlak untuk
mendapatkan hasil penelitian yang valid dan reliabel. Hal ini tidak berarti bahwa
dengan menggunakan instrumen yang telah teruji validitas dan reabilitasnya,
otomatis hasil (data) penelitian menjadi valid dan reliabel. Hal ini masih akan
dipengaruhi oleh kondisi obyek yang diteliti, dan kemampuan orang yang
menggunakan instrumen untuk mengumpulkan data. Oleh karena itu peneliti
harus mampu mengendalikan obyek yang diteliti dan meningkatkan kemampuan
dan menggunakan instrumen untuk mengukur variabel yang diteliti.
Instrumen instrumen dalam ilmu alam, misalnya meteran, thermometer,
timbangan, biasanya telah diakui validitasnya dan reliabilitasnya (kecuali
instrumen yang sudah rusak dan oalsu). Instrumen instrumen ini dapat dipercaya
validitas dan reliabilitasnya karena sebelum instrumen itu digunakan / dikeluarkan
dari pabrik telah diuji validitas dan reliabilitasnya / ditera.
Instrumen instrumen dalam ilmu sosial sudah ada yang baku (standar),
karena telah teruji validitas dan reliabilitasnya, tetapi banyak juga yang belum
baku bahkan belum ada. Untuk itu maka peneliti harus mampu menyusun sendiri
instrumen setiap penelitian dan menguji validitas dan reliabilitasnya. Instrumen
yang tidak teruji validitas dan reliabilitasnya bila digunakan untuk penelitian akan
menghasilkan data yang sulit dipercaya kebenarannya.
Instrumen yang reliabel belum tentu valid. Meteran yang putus dibagian
ujungnya, bila digunakan berkali kali akan menghasilkan data yang sama
(reliabel) tetapi selalu tidak valid. Hal ini disebabkan karena instrumen (meteran)
tersebut rusak. Penjual jamu berbicara di mana mana kalau obatnya manjur
(reliabel) tetapi selalu tidak valid, karena kenyataannya jamunya tidak manjur.
Reliabilitas instrumen merupakan syarat untuk pengujian validitas instrumen.
Oleh karena itu, walaupun instrumen yang valid, umumnya reliabel, tetapi
pengujian reliabilitas instrumen perlu dilakukan.
Pada dasarnya terdapat dua macam instrumen, yaitu instrumen yang
berbentuk test untuk mengukur prestasi belajar dan instrumen yang nontest untuk
mengukur sikap. Instrumen yang berupa test jawabannya adalah salah atau
benar, sedangkan instrumen sikap jawabannya tidak ada yang salah atau benar
tetapi bersifat positif dan negatif. Skema tentang instrumen yang baik dan cara
pengujiannya ditunjukkan pada gambar 1.
Pada gambar tersebut ditunjukkan bahwa instrumen yang baik, (yang
berupa test mauppun nontest) harus valid dan reliabel. Instrumen yang valid harus
mempunyai validitas internal dan eksternal. Instrumen yang mempunyai validitas
internal atau rasional, bila kriteria yang ada dalam instrumen secara rasional
(teoritis) telah mencerminkan apa yang diukur. Jadi kriterianya ada di dalam
instrumen itu. Instrumen yang mempunyai validitas eksternal bila kriteria di
dalam instrumen disusun berdasarkan fakta fakta empiris yang telah ada. Kalau
validitas internal instrumen dikembangkan menurut teori yang relevan, maka
validitas eksternal instrumen dikembangkan dari fakta empiris. Misalnya akan
mengukur kinerja (performance) sekelompok pegawai, maka tolak ukur (kriteria)
yang digunakan didasarkan pada tolak ukur yang telah ditetapkan dikepegawaian
itu. Sedangkan validitas internal dikembangkan dari teori teori tentang kinerja.
Untuk itu penyusunan instrumen yang baik harus memperhatikan teori dan fakta
di lapangan.



Gambar 1. Skema Tentang Instrumen dan Cara Cara Pengujian Validitas
dan Reliabilitas.
Penelitian yang mempunyai validitas internal, bila data yang dihasilkan
merupakan fungsi dari rancangan dan istrumen yang digunakan. Instrumen
tentang kepemimpinan akan menghasilkan data kepemimpinana, bukan motivasi.
Penelitian yang mempunyai validitas ekstrenal bila, hasil penelitian dapat
diterapkan pada sampel yang lain, atau hasil penelitian itu dapat digeneralisasikan.
Validitas internal instrumen yang berupa test harus memenuhi construct
validity (validitas konstruksi) dan content validity (validitas isi). Sedangkan untuk
instrumen yang nontest yang digunakan untuk mengukur sikap cukup memenuhi
validitas konstruksi (construct). Sutrisno Hadi (1986) menyamakan construct
validity sama dengan logical validity atau validity by definition. Instrumen yang
mempunyai validitas konstruksi, jika instrumen tersebut dapat digunakan untuk
mengukur gejala sesuai dengan yang didefinisikan. Misalnya akan mengukur
efektivitas organisasi, maka perlu didefinisikan terlebih dahulu efektivitas
organisasi. Setelah itu disiapkan instrumen yang digunakan untuk mengukur
efektivitas organisasi sesuai dengan definisi yang telah dirumuskan itu. Untuk
melahirkan definisi, maka diperlukan teori teori. Dalam hal ini Sutrisno Hadi
menyatakan bahwa bila bangunan teorinya sudah benar, maka hasil pengukuran
dengan alat ukur (instrumen) yang berbasis pada teori itu sudah dipandang sebagai
hasil yang valid.
Instrumen yang harus mempunyai validitas isi (content validity) adalah
isnstrumen yang berbentuk test yang sering digunakan untuk mengukur perstasi
belajar (achievement) dan mengukur efektivitas pelaksanaan program dan tujuan.
Untuk menyusun instrumen prestasi belajar yang mempunyai validitas isi (content
validity), maka isntrumen harus disusun berdasarkan materi pelajaran yang telah
diajarkan. Sedangkan instrumen yang digunakan untuk mengetahui pelaksanaan
program, maka instrumen disusun berdasarkan program yang telah direncanakan.
Selanjutnya instrumen yang digunakan untuk mengukur tingkat tercapainya tujuan
(efektivitas) maka instrumen harus disusun berdasarkan tujuan yang telah
dirumuskan.


B. Pengujian Validitas Instrumen
1. Pengujian Validitas Konstrak (Construct Validity)
Untuk menguji validitas konstrak, dapat digunakan pendapat dari ahli
(judgment expert). Dalam hal ini setelah instrument dikonstruksi tentang aspek
aspek yang akan diukur dengan berlandaskan teori tertentu, maka selanjutnya
dikonsultasikan dengan ahli. Para ahli diminta pendapatnya tentang instrument
yang telah disusun itu. Mungkin para ahli akan memberi keputusan: instrumen
dapat digunakan tanpa perbaikan, ada perbaikan, dan mungkin dirombak total.
Jumlah tenaga ahli yang digunakan minimal tiga orang dan umumnya mereka
yang telah bergelar doctor sesuai dengan lingkup yang diteliti.
Setelah pengujian konstrak dari ahli dan berdasarkan pengalaman empiris
di lapangan selesai, maka diteruskan dengan uji coba instrument. Instrumen
tersebut dicobakan pada sampel dari mana populasi diambil (pengujian
pengalaman empiris ditunjukkan pada pengujian validitas eksternal). Jumlah
anggota sampel yang digunakan sekitar 30 orang. Setelah data ditabulasikan,
maka pengujian validitas konstruksi dilakukan dengan analisis faktor, yaitu
dengan mengkorelasikan antar skor item instrument dalam suatu faktor, dan
mengkorelasikan skor faktor dengan skor total. Berikut ini diberikan contoh
analisis faktor untuk menguji construct validity.
Misalkan akan dilakukan pengujian construct validity melalui analisis
faktor terhadap instrument untuk mengukur prestasi kerja guru. Jadi dalam hal ini
variabel penelitiannya adalah prestasi kerja. Berdasarkan teori dan hasil
konsultasi ahli, indicator prestasi kerja pegawai meliputi dua faktor yaitu: kualitas
hasil kerja dan kecepatan kerja. Selanjutnya indikator (faktor) kecepatan kerja
dikembangkan menjadi tiga pernyataan, dan kualitas hasil kerja dikembangkan
menjadi 4 butir pernyataan. Instrumen yang terdiri dari 7 butir pertanyaan
tersebut, selanjutnya diberikan kepada 5 guru sebagai responden untuk
menjawabnya. (Dalam prakteknya menggunakan sekitar 30 responden) Jawaban 7
responden ditunjukkan pada tabel 1. Arti angka 4 berarti sangat tinggi, 3 tinggi, 2
rendah, 1 sangat rendah prestasinya.
Seperti telah dikemukakan bahwa, analisis faktor dilakukan dengan cara
mengkorelasikan jumlah skor faktor dengan skor total. Bila korelasi tiap faktor
tersebut positif dan besarnya 0,3 ke atas maka faktor tersebut merupakan construct
yang kuat. Jadi berdasarkan analisis faktor itu dapat disimpulkan bahwa
instrument tersebut memiliki validates konstruksi yang baik.
Tabel 1. Data Prestasi Kerja 7 Pegawai
No.
Res.
Skor Faktor 1 untuk
butir No:
Jml 1
(X
1
)
Skor Faktor 2 untuk butir No: Jml 2
(X
2
)
Jml
Total
Y 1 2 3 1 2 3 4
1. 3 4 3 10 3 3 2 4 12 22
2. 4 3 2 9 4 3 4 4 15 24
3. 1 2 1 4 3 2 1 2 8 12
4. 3 3 3 9 4 4 3 3 14 23
5. 2 2 4 8 3 1 2 1 7 15

Berdasarkan tabel 2. telah dihitung bahwa korelasi antara jumlah faktor
1(X
1
) dengan skor total (Y) = 0,85 dan korelasi antara jumlah faktor 2(X
2
) dengan
skor total (Y) = 0,94. Karena koefisien korelasi ke dua faktor tersebut di atas 0,30,
maka dapat disimpulkan bahwa kualitas hasil kerja dan kecepatan kerja
merupakan konstruksi (construct) yang valid untuk variabel prestasi kerja
pegawai.
Selanjutnya apakah setiap butir dalam instrumen itu valid atau tidak, dapat
diketahui dengan cara mengkorelasikan antara skor butir dengan skor total (Y).
Jadi untuk keperluan ini ada tujuh koefisien korelasi yang perlu dihitung. Bila
harga korelasi di bawah 0,30, maka dapat disimpulkan bahwa butir instrumen
tersebut tidak valid, sehingga harus diperbaiki atau dibuang.
Dari hasil perhitungan diketahui bahwa korelaai ke tujuh butir instrumen
dengan skor total ditunjukkan pada tabel 2. berikut:
Tabel 2. Hasil Pengujian Validitas Konstuk
No. r hitung r kristis Keputusan
r
1
y 0,95 0,30 valid
r
2
y 0,79 0,30 valid
r
3
y 0,22 0,30 tidak valid
r
4
y 0,73 0,30 valid
r
5
y 0,79 0,30 valid
r
6
y 0,84 0,30 valid
r
7
y 0,83 0,30 valid

Berdasarkan tabel 2. berikut dapat diketahui, bahwa butir no 3(faktor 1)
tidak valid, karena korelasi butir tersebut dengan skor total hanya 0,22 (di bawah r
kritis 0,3). Butir tersebut tidak selaras dengan butir yang lain.
Pengujian seluruh butir instrumen dalam satu variabel dapat juga
dilakukan dengan mencari daya pembeda skor tiap item dari kelompok yang
memberikan jawaban tinggi dan jawaban rendah. Dalam hal ini Masrun (1979)
menyatakan bahwa analisis untuk mengetahui daya pembeda, sering juga
dinamakan analisis untuk mengetahui validitas item. Jumlah kelompok yang
tinggi diambil 27% dan kelompok yang rendah diambil 27% dari sampel uji coba.
Pengujian analisis daya pembeda dapat menggunakan t-test. Berikut ini diberikan
contoh analisis daya pembeda untuk menguji validitas instrumen.
Contoh:
Suatu instrumen penelitian akan digunakan untuk mengukur kinerja
Kepala Dinas Kabupaten. Instrumen tersebut telah dikonsultasikan kepada para
ahli kinerja Kepala Dinas. Berdasarkan 25 responden tersebut dapat
dikelompokkan 27% responden yang memberikan skor tinggi dan 27% skor
rendah (27% responden berarti 0,27 x 25 = 7), seperti tertera dalam tabel 3.
berikut.
Tabel 3. Kelompok Skor Tinggi dan Rendah Pada Instrumen Untuk Mengukur
Kinerja Kepala Dinas
Skor skor Kelompok Tinggi Skor skor Kelompok Rendah
126 81
128 96
135 104
135 107
135 108
140 108
142 109



Untuk menguji daya pembeda secara signifikan digunakan rumus t-test
sebagai berikut.


Dimana:

(

)

Berdasarkan data yang ada pada tabel 3. di atas dan rumus tersebut, maka
varian gabungan (Sgab) dapat dihitung.

( ) ( )
( )

Sgab = 8,4 (selanjutnya dimasukkan ke dalam rumus t).




Jadi t hitung = 7,37.
Untuk mengetahui apakah perbedaan itu signifikan atau tidak maka harga t
hitung tersebut perlu dibandingkan dengan harga t tabel. Bila t hitung lebih besar
dengan t tabel, maka perbedaan itu signifikan, sehingga instrumen dinyatakan
valid.
Berdasarkan tabel t (tabel II dalam lampiran), dapat diketahui bahwa bila
tingkat kesalahan 5%, dengan dk 12, maka harga t tabel = 1,78. (dk = n
1
+ n
2
2 =
7 + 7 2 = 12). Ternyata harga t hitung 7,37 jauh lebih besar daripada t tabel 1,78
sehingga dapat dinyatakan terdapat perbedaan yang signifikan antara kelompok
skor tinggi (X
1
) dan kelompok rendah (X
2
). Hal ini dapat disimpulkan bahwa
instrumen tersebut valid.
Pengujian validitas dengan uji beda ini didasarkan asumsi bahwa
kelompok responden yang digunakan sebagai uji coba berdistribusi normal.
Dengan demikian kelompok skor tertinggi dan rendah harus berbeda secara
signifikan, sesuai dengan bentuk kurve normal.

2. Pengujian Validitas Isi (Content Validity)
Untuk instrumen yang berbentuk test, pengujian validitas ini dapat
dilakukan dengan membandingkan antara isi instrumen dengan materi pelajaran
yang telah diajarkan. Seorang dosen yang memberi ujian di luar pelajaran yang
telah ditetapkan, berarti instrumen ujian tersebut tidak mempunyai validitas isi.
Untuk instrumen yang akan mengukur efektivitas pelaksanaan program, maka
pengujian validitas isi dapat dilakukan dengan membandingkan antara isi
instrumen dengan isi atau rancangan yang telah ditetapkan.
Secara teknis pengujian validitas konstrak dan validitas ini dapat dibantu
dengan menggunakan kisi kisi instrumen, atau matrik pengembangan instrumen.
Dalam kisi kisi itu terdapat variabel yang diteliti, indikator sebagai tolak ukur
dan nomor butir (item) pertanyaan atau pernyataan yang telah dijabarkan dari
indikator. Dengan kisi kisi instrumen itu maka pengujian validitas dapat
dilakukan dengan mudah dan sistematis.
Pada setiap instrumen baik test maupun nontest terdapat butir butir
(item) pertanyaan atau pernyataan. Untuk menguji validitas butir butir instrumen
lebih lanjut, maka setelah dikonsultasikan dengan ahli, maka selanjutnya
diujicobakan, dan dianalisis dengan analisis item atau uji beda (seperti contoh di
atas). Analisis item dilakukan dengan menghitung korelasi antara skor butir
instrumen dengan skor total dan uji beda dilakukan dengan menguji signifikansi
perbedaan antara 27% skor kelompok atas dan 27% skor kelompok bawah.

3. Pengujian Validitas Eksternal
Validitas eksternal instrumen diuji dengan cara membandingkan (untuk
mencari kesamaan) antara criteria yang ada pada instrumen dengan fakta fakta
empiris yang terjadi di lapangan. Misalnya instrumen untuk mengukur kinerja
sekelompok pegawai, maka kriteria kinerja pada isntrumen itu dibandingkan
dengan catatan catatan di lapangan (empiris) tentang kinerja pegawai yang baik.
Bila telah terdapat kesamaan antara kriteria dalam instrumen tersebut mempunyai
validitas eksternal yang tinggi.
Instrumen penelitian yang mempunyai validitas eksternal yang tinggi akan
mengakibatkan hasil penelitian mempunyai validitas eksternal yang tinggi pula.
Penelitian mempunyai validitas eksternal bila hasil penelitian dapat
digeneralisasikan atau diterapkan pada sampel lain dalam populasi yang diteliti.
Untuk meningkatkan validitas eksternal instrumen, maka dapat dilakukan dengan
memperbesar jumlah sampel.
C. Pengujian Reabilitas Instrumen
Reliabilitas menunjuk pada satu pengertian bahwa suatu instrumen cukup
dapat dipercaya untuk digunakan sebagai alat pengumpul data karena instrumen
tersebut sudah baik. Instrumen yang baik tidak akan bersifat tendensius
mengarahkan responden untuk memilih jawaban-jawaban tertentu. Instrumen
yang sudah dapat dipercaya, yang reliabel akan menghasilkan data yang dapat
dipercaya juga. Apabila datanya memang benar sesuai dengan kenyataannya,
maka berapa kalipun diambil, tetap akan sama. Reliabilitas menunjuk pada tingkat
keterendalan sesuatu. Reliabilitas artinya, dapat dipercaya, jadi dapat diandalkan.
Pengertian umum menyatakan bahwa instrumen penelitian harus reliabel.
Dengan pengertian ini sebenarnya kita dapat salah arah (mis leading). Yang
diusahakan dapat dipercaya adalah datanya, bukan semata-mata instrumennya.
Ungkapan yang mengatakan bahwa instrumen tersebut cukup baik sehingga
mampu mengungkap data yang bisa dipercaya. Apabila pengertian ini sudah
tertangkap maka akan tidak begitu menjumpai kesulitan dalam menentukan cara
menguji reliabilitas instrumen.
Secara garis besar ada dua jenis reliabilitas, yaitu reliabilitas eksternal dan
reabilitas internal. Seperti halnya pada pembicaraan validitas, dua nama ini
sebenarnya menunjuk pada cara-cara menguji tingkat reliabilitas instrumen. Jika
ukuran atau kriteriumnya berada di luar instrumen maka dari hasil pengujian ini
diperoleh reliabilitas eksternal. Sebaliknya jika perhitungan dilakukan
berdasarkan data dari instrumen tersebut saja, akan menghasilkan reabilitas
internal.
a. Reabilitas Eksternal
Ada dua cara untuk menguji reliabilitas eksternal sesuatu instrumen yaitu
dengan teknik paralel dan teknik ulang. Apabila peneliti ingin menggunakan
teknik pertama yakni teknik paralel, peneliti mau tidak mau harus menyusun dua
stel instrumen. Kedua instrumen tersebut sama-sama diujicobakan kepada
sekelompok responden saja (responden mengerjakan dua kali) kemudian hasil dari
dua kali tes uji coba tersebut dikolerasikan, dengan teknik kolerasi product-
moment atau kolerasi person. Dari data dua kali uji coba dari dua instrumen yang
satu dipandang sebagai nilai X, yang satu Y. Tinggi rendahnya indeks kolerasi
inilah yang menunjukkan tinggi rendahnya reliabilitas instrumen. Oleh karena
dalam menggunakan teknik ini peneliti mempunyai dua instrumen dan melakukan
dua kali tes, maka disebut teknik double test double trial.
Teknik reliabilitas eksternal kedua adalah teknik ulang. Dengan
menggunakan teknik ini peneliti hanaya menyusun satu perangkat instrumen.
Instrumen tersebut diujicobakan kepada sekelompok responden, hasilnya dicatat.
Pada kali lain instrumen tersebut diberikan kepada kelompok yang semua untuk
dikerjakan lagi, dan hasil yang kedua juga dicatat. Kemudian kedua hasil tersebut
dikorelasikan. Dengan teknik ini peneliti hanya menggunakan satu tes tetapi
dilaksanakannya dua kali uji coba. Maka teknik ini juga disebut sebagai teknik
single test double trial.
b. Reliabilitas Internal
Kalau reliabilitas eksternal diperoleh dengan cara mengolah hasil
pengetesan yang berbeda, baik dari instrumen yang berbeda maupun yang sama,
reliabilitas internal diperoleh dengan cara menganalisis data dari satu kali hasil
pengetesan. Ada bermacam-macam cara untuk mengetahui reliabilitas internal.
Pemilihan sesuatu teknik didasarkan atas bentuk instrumen maupun selera
peneliti. Kadang-kadang penggunaan teknik yang berbeda mengasilkan indeks
reliabilitas yang berbeda pula. Hal ini wajar saja karena kadang-kadang
dipengaruhi oleh sifat atau karakteristik datanya sehingga dalam penghitungan
diperoleh angka berbeda sebagai akibat pembulatan angka. Namun demikian
untuk beberapa teknik, diperlukan persyaratan-persyaratan tertentu sehingga
peneliti begitu saja memilih teknik-teknik tersebut.
Berbagai teknik mencari reliabilitas yaitu sebagai berikut :
1. Mencari reliabilitas dengan rumus Spearman-Brown
Dalam menghitung reliabilitas dengan teknik ini peneliti harus melalui
langkah membuat tabel analisis butir soal atau butir pertanyaan. Dari
analisi ini skor-skor dikelompokkan menjadi dua berdasarkan belahan
bagian soal. Ada dua cara membelah yaitu belah ganjil-genap dan
belah awal-akhir. Oleh karena inilah maka teknik Spearman-Brown
dalam mencari reliabilitas juga disebut teknik belah dua.
Dengan tekni belah dua ganjil-genap peneliti mengelompokkan skor
butir bernomor ganjil sebagai belahan pertama dan kelompok buti
bernomor genap sebagai skor belahan kedua. Langkah selanjutnya
adalah mengkorelasikan skor belahan pertama dengan skor belahan
kedua, dan akan diperoleh harga r
xy
. Oleh karena indeks korelasi yang
diperoleh baru menunjukkan hubungan antara dua belahan instrumen,
maka untuk memperoleh indeks reliabilitas soal masih harus
menggunakan rumus Spearman-Brown, yaitu:

)

Dengan keterangan :
r
11
= reliabilitas instrumen

= r
xy
yang disebutkan sebagai indeks korelasi antara dua
belahan instrumen
Jika sudah memperoleh angka reliabilitas, langkah selanjutnya adalah
mengkonsultasikan harga tersebut dengan r product moment.
2. Mencari reliabilitas dengan rumus Flanagan
Untuk mencari reliabilitas instrumen dengan menggunakan rumus
Flanagan, kita juga harus melakukan analisis butir dahulu dan
menggunakan teknik belah dua ganjil-genap. Rumusnya adalah
sebagai berikut.

)
Dengan keterangan:
r
11
= reliabilitas instrumen

= varians belahan pertama (varian skor butir-butir ganjil)

= varians belahaan kedua (varian skor butir-butir genap)

= varians skor total


Untuk semua varians rumusnya adalah:

()


Kadang-kadang V ditulis dengan S
2
, karena varians adalah standatr
deviasi kuadrat.
Jika sudah memperoleh angka reliabilitas, langkah selanjutnya adalah
mengkonsultasikan harga tersebut dengan r product moment.
3. Mencari reliabilitas dengan rumus Rulon
Untuk menguji reliabilitas instrumen dengan rumus Rulon, kita juga
harus melalui langkah analisis butir.
Rumusnya adalah :


Dengan keterangan:
r
11
= reliabilitas instrumen

= varians total atau varians skor total

= varians (varians difference)


d =skor pada belahan awal dikurang skor pada belahan akhir.
Untuk memperjelas keterangan, dalam perhitungan ini perlu dikutip
skor belahan awal dan skor belahan akhir dari tabel analisi butir yang
sudah digunakan.
Jika sudah memperoleh angka reliabilitas, langkah selanjutnya adalah
mengkonsultasikan harga tersebut dengan r product moment.
Mencari reliabilitas dengan menggunakan teknik belah dua ini sangat
digemari oleh peneliti, khususnya para mahasiswa yang melakukan penelitian
skripsi atau tesis. Kesalahan umum yang seringkali ada yakni bahwa para
mahasiswa tersebut menggunakan reknik belah dua tanpa mengingat persyaratan
yang seharusnya dipenuhi.
Sekurang-kurangnya ada dua persyaratan pokok yang harus dipenuhi
terlebih dahulu sebelum menentukan teknik pengujian reliabilitas instrumen
dengan teknik dua, yaitu:
1) Banyaknya butir pertanyaan atau butir soal dalam instrumen harus
genap agar dapat dibelah
2) Antara belahan pertama dengan belahan kedua harus seimbang.
Persyaratan pertama barangkali tidak begitu sulit dipenuhi. Tetapi
persyaratan kedua betul-betul membutuhkan pertimbangan dan kecermatan dari
pihak penenliti. Mahasiswa sering hanya mempertimbangkan persyaratan pertana
begitu saja menganngap bahwa belahan pertama dan kedua sudah seimbang, atau
bahkan melupakan persyaratan itu.
Belahan instrumen dikatakan seimabang jika jumlah butir pertanyaannya
sama dan pertanyaan tersebut mengungkap aspek yang sama. Untuk memperoleh
belahan yang seimbang peneliti harus sudah merancang sejak instrumen tersebut
disusun. Sebagai usaha hati-hati, peneliti membuat pertanyaan dalam jumlah
genap untuk setiap aspek atau faktor. Dengan demikian, letak butir dapat disebar
sedemikian rupa agar kalau dalam analisis data akan melakukan pembelahan
sudah diketahui dengan pasti manakah pasangan-pasangan butir pertanyaannya.
Itulah sebabnya perencanaan penelitian harus terpadu dalam memperhatikan
variabel, pembuatan instrumen, uji coba, pengujian reliabilitas, analisi data, dan
sebagainya.
4. Mencari reliabilitas dengan rumus K-R 20
Apabila peneliti memiliki instrumen dengan jumlah butir pertanyaan
ganjil, maka peneliti tersebut tidak mungkin menggunakan teknik belah dua untuk
pengujian reliabilitasnya. Untuk ini maka ia boleh menggunakan rumus K-R 20.
Rumus :


)(

)
Dengan keterangan :
r
11
= reliabilitas instrumen

= varians skor total


k = banyaknya butir pertanyaan
p = proporsi subjek yang menjawab betul pada sesuatu butir
(proposi subjek yang mendapat skor 1).
p =


q =

()

Jika sudah memperoleh angka reliabilitas, langkah selanjutnya adalah
mengkonsultasikan harga tersebut dengan r product moment.
5. Mencari Reliabilitas dengan rumus K-R. 21
K-R adalah singkatan dari Kuder dan Richardson, dua orang ahli
matematika dan statistik yang banyak menemukan rumus-rumus. Dua buah rumus
yang digunakan untuk mencari reliabilitas instrumen penelitian adalah rumus K-
R.20 dan K-R.21. Rumus K-R.21


)(
(

)
Dengan keterangan:
r
11
= reliabilitas instrumen
k = banyaknya butir soal atau butir pertanyaan
m = skor rata-rata
V
t
= varians total.
6. Mencari reliabilitas dengan rumus Hoyt
Untuk instrumen yang penyekorannya 1 dan 0 masih ada lagi cara lain
untuk mengetahui reliabilitasnya yaitu dengan rumus Hoyt. Rumusnya ada dua
macam, yaitu:

atau


Dengan keterangan:

= reliabilitas instrumen

= Varians responden

= Varians sisa
Untuk mencari reliabilitas instrumen langkah-langkah yang dilalui adalah
sebagai berikut:
Langkah 1 Mencari jumlah kuadrat responden dengan rumus:

()

( )

Dengan keterangan:
JK
(r)
= jumlah kuadrat responden
k = banyaknya butir pertanyaan
N = banyaknya responden atau subjek
X
t
= skor total setiap responden.
Langkah 2 Mencari jumlah kuadrat butir dengan rumus:

()

( )

Dengan keterangan:
JK
(b)
= jumlah kuadrat butir.

= jumlah kuadrat jawab benar seluruh butir


(

= kuadrat dari jumlah skor total


Langkah 3 Mencari jumlah kuadrat total dengan rumus

()

()()
() ()

Dengan keterangan:
JK
(t)
= jumlah kuadrat total
= jumlah jawab benar seluruh butir
= jumlah jawab salah seluruh butir
Langkah 4 Mencari jumlah kuadrat sisa dengan rumus:

()

()

()

()

Langkah 5 Mencari varians responden dan varians dengan
menggunakan tabel F
Langkah 6 Memasukkan kedalam rumus r
11
.
7. Mencari reliabilitas dengan rumus Alpha
Enam jenis teknik untuk mencari reliabilitas yang sudah dibicarakan hanya
dapat digunakan untuk mencari reliabilitas instrumen yang skornya 1 dan 0. Jika
dihubungkan dengan pengertian variabel, hanya untuk skor dengan variabel
diskrit. Banyak pertanyaan diajukan oleh peneliti pemula bagaimana cara mencari
reliabilitas instrumen yang skornya merupakan rentangan antara beberapa nilai
(misalnya 0-10 atau 0-100) atau yang berbentuk skala 1-3, 1-5 atau 1-7 dan
seterusnya. Beberapa peneliti mengambil langkah pintas yakni mengubah skor
bukan 1 dan 0 menjadi 1 dan 0 misalnya jika skornya antara 1 sampai dengan 5,
asal skor lebih dari, diberi skor baru 1 dan kalau kurang, dari diberi skor 0.
Rumus Alpha digunakan untuk mencari reliabilitas instrumen yang
skornya bukan 1 dan 0, misalnya angket atau soal bentuk uraian.
Rumus Alpha:


)(

)
Dengan keterangan:
r
11
= reliabilitas instrumen
k = banyaknya butir pertanyaan atau banyaknya soal

= jumlah varians butir

= varians soal.
Demikian cara-cara untuk menguji reliabilitas instrumen yang dilakukan
dengan rumus-rumus statistik. Instrumen yang berbentuk tes prestasi belajar
angket yang diskor dengan 1 dan 0 yakni tes bentuk objektif dan angket yang
dijawab dengan Ya dan Tidak diuji reliabilitasnya dengan teknik dan rumus-
rumus tersebut. Untuk tes prestasi belajar yang berbentuk uraian atau angket dan
skala bertingkat (rating scale) diuji dengan rumus Alpha.
Peneliti pemula kadang-kadang salah tafisr dengan cenderung
mengutamakan kualitas instrumen, dan melupakan makna bahwa sebenarnya yang
dituju adalah kualitas data. Seharusnya perhatian peneliti bukan ditujukan kepada
instrumen. Instrumen hanyalah alat. Yang penting dalam penelitian adalah data
yang benar, data yang reliabel, data yang sesuai dengan keadaan sebenarnya.
Apabila peneliti sudah memusatkan perhatiannya pada kebenaran data,
maka masalah prosedur pengujian reliabilitas instrumen menjadi nomor dua. Kini
perhatian peneliti mengarah pada pemikiran bagaimana cara myakinkan diri
bahwa data yang diperolehnya sudah benar. Untuk keperluan ini peneliti bisa
menggunakan logika demikian.
Kebenaran data yang diperoleh dari wawancara dengan guru dapat
dicek melalui dokumentasi atau wawancara dengan orang lain.
Sebagai contoh, peneliti bertemu guru dan menanyakan tentang
berapa kali serta kelengkapan pembuatan satuan pelajaran. Jika
peneiti tidak/kurang yakin akan jawaban guru tersebut, peneliti
dapat menghubungi kepala sekolah, meminjam satuan pelajaran
milik guru tersebut.
Kebenaran data yang diperoleh dari observasi selintas tentang cara
mengajar guru dapat dicek dan wawancara dengan beberapa siswa
tentang kebiasaan cara mengajar guru tersebut.
Kebenaran data mengenai kepemimpinan kepala sekolah yang
diperoleh dari wawancara dengan kepala sekolah dapat dicek
dengan notulen rapat, wawancara dengan guru dan TU.
8. Mencari reliablitas pengamatan (observasi)
Di antara berbagai metode pengumpulan data, pengamatan merupakan
metode yang paling rawan dalam arti tingkat kemantapannya paling rendah.
Jika peneliti menggunakan angket yang diisi oleh responden, jawabannyan masih
dapat disimpan oleh peneliti dan dapat dilihat lagi sewaktu-waktu. Apabila ada
satu atau beberapa jawaban yang diragukan, peneliti dapat mendatangi responden
lagi untuk memperoleh kejelasan. Demikian pula dengan wawancara, adalah
pendapat responden tentang sesuatu hal yang sifatnya relatif mantap sehingga
dapat dilihat kembali.
Metode pengamatan atau observasi dilakukan oleh pengamat dengan
sasaran benda diam atau proses. Untuk sasaran benda diam, data dapat diamabil
lagi sewaktu-waktu apabila ada keraguan pada diri peneliti. Sebaliknya, apabila
ada sasaran suatu proses, pengulangan pengamatan hampir tidak mungkin
dilakukan kecuali peneliti mempunyai rekaman video atau film yang dapat
menunjukkan proses yang diamati. Inilah salah satu kelemahan dari metode
penagamatan. Kelemahan lain dari pengamatan, terletak pada diri pengamat.
Bagaimanapun upaya pengamat untuk bersikap netral, subjektivitas diri tentu
masih mengiringi kegiatan sehingga hasilnya menjadi tidak 100% objektif.
Demikianlah apabila pengamatan terhadap oleh dua orang, maka perbedaan hasil
pengamatan terhadap oleh dua orang, maka perbedaaan hasil pengamatan
terhadap sesuatu objek proses akan dapat sangat berbeda karena latar belakang
pribadi yang mewarnai pengamatan serta intensitas subjektivitas yang berbeda
pula.
Dengan alasan-alasan tersebut maka sebaiknya sebelum melakukan
pengamatan yang sesungguhnya, para pengamat, pengumpul data perlu dilatih
terlebih dahulu untuk menyingkirkan atau menekan sampai sedikit mungkin
unsur subjektivitas pengamat. Misalnya, jika peneliti akan menggunakan lima
orang pengamat untuk mengamati proses mengajar guru. Sangat disarankan di
dalam latihan pengamatan digunakan rekaman video. Namun apabila tidak ada,
hasil pengamatan yang diperoleh dapat lebih baik seteah dilakukan latihan
beberapa kali, dan perbedaan hasil pengamatan sudah sama atau hanya berbeda
sedikit.
Proses latihan dalam rangka menyamakan persepsi agar diperoleh hasil
pengamatan yang sama dapat dilakukan melalui langkah-langkah sebagai berikut.
1. Pengamat I dan pengamat II bersama-sama mengamati proses
mengajar yang dilakukan oleh guru, dengan menggunakan sebuah
format pengamatan, dan diisi bersama-sama. Format isian dimaksud
hanya terdiri dari dua kolom yang memuat alternatif ya dan tidak,
atau lebih dari dua kolom (biasanya 4 atau 5) dan menujukkan gradasi.
Judul kolom mulai dari 0 (tidak muncul), 1 (sangat rendah), 2
(rendah), 3 (sedang/cukup), 4 (tinggi), dan 5 (sangat tinggi). Sebelum
membubuhkan kolom mana dari lembar pengamatan tersebut yang
akan diisi kode, kedua orang pengamat berunding dahulu
memantapkan kesepakatan.
2. Pengamat I dan II bersama-sama mengamati lanjutan proses, tetapi
pada tempat yang berbeda dengan menggunakan dua format. Beberapa
lama kemudian setelah kolom-kolom formatnya terisi, kedua orang
pengamat mencocokkan hasil pengamatannya. Jika ada perbedaan,
rekaman diputar kembali untuk mencari letak perbedaan pendapat.
3. Pengamat I dan II mengulangi lagi proses seperti langkah ke-2, dan
begitulah berkali-kali dilakukan sampai diperoleh persamaan hasil
pengamatan, atau apabila masih ada saja perbedaan, peredaan hasil
pengamatan tersebut sangat minim.
Jika pengamatannya lebih dari dua orang, perlu diadakan penyamaan
antara-pengamat sampai dicapai persamaan persepsi dari semua
pengamat yang akan bekerja mengumpulkan data.
Untuk menentukan toleransi perbedaan hasil pengamatan, digunakan
teknik pengetesan reliabilitas pengamatan. Rumus yang paling banyak
digunakan, dikemukkan oleh H.J.K. Fernandes (1984:40), penulis
modifikasi, sebagai berikut:


Dengan keterangan:
KK = koefisien kesepakatan
S = sepakat, jumlah kode yang sama untuk objek yang sama
N
1
= jumlah kode yang dibuat oleh pengamat I
N
2
= jumlah kode yang dibuat oleh pengamat II
Rumus Reliabilitas dari Scott
Seorang ahli statistik bernama Scott telah berusaha mengadakan
penyempurnaan terhadap rumus Indeks Kesesuaian Kasar (Crude
Index Agreement) ini, yaitu memasukkan faktor koreksi ke dalamnya.
Menurut ahli ini, di dalam hasik pengamatan mungkin ada faktor
untung-untungan (change agreement) yang akan mengotori koefisien
reliabilitas. Agar diperoleh koefisien reliabilitas bersih harus dilakukan
koreksi. Rumus yang dikemukakan oleh Scott adalah sebagai berikut


Dengan keterangan:
KK = koefisien kesepakatan pengamatan
P
o
= proporsi frekuensi kesepakatan
P
e
= kemungkinan sepakat (change agreement). (peluang
kesesuaian antar-pengamat).
Untuk mencari harga P
e
kita gunakan rumus sebagai berikut:


Dengan keterangan:
P
e
= change agreement
P
i
= proposi tallies (jari-jari yang ada setiap sel terhadapa N total
(jumlah objek amatan).

Rumus Reliabilitas dari Cohen-Kappa
Selain dengan rumus umum dan rumus Scott, kita dapat mencari koefisien
reliabilitas pengamatan dengan rumus Cohen-Kappa. Pada dasarnya rumus ini
mirip dengan rumus Scott, tetapi untuk menghitung P
e
digunakan landasan
distribusi marginal dari jumlah kategori di dalam tabel kontingensi (Scott
menggunakan marginal yang diharapkan atau expected marginal).
Rumus :

)(

)
Dengan keterangan :
N = jumlah keseluruhan jari-jari yang menunjukkan munculnya
gejala yang teramati.
(

) = jumlah jari-jari kategori ke-1 untuk pengamat pertama.


(

) = jumlah jari-jari kategori ke-1 untuk pengamat kedua.


Adapun rumus reliabilitas Cohen-Kappa adalah sebagai berikut:


Disamping perlu dikahui tingkat kesepakatan antara-pengamat untuk
meyakinkan kebenaran hasil pengamatan, perlu juga diketahui keajekan
pengamat. Keajekan ini menunjuk pada kualitas pengamat, apakah ia
menghasilkan data yang benar-benar sama baiknya dari waktu ke waktu. Untuk
pengujian terhadap keajekan pengamatan ini dilakukan verifikasi data
pengamatan, dan menetapkan koefisien keajekan dengan rumus yang
dikemukakan oleh Fernandes yaitu:

( )


Dengan keterangan:
P = koefisien keajekan.

= kuadrat rata-rata bars (aspek yang diamati).

= kuadrat rata-rata sisa.


= jumlah kolom.
Beberapa hal yang perlu dipertimbangkan dalam menentukan banyaknya
subjek uji coba antara lain:
1. Tersedianya subjek yang akan dijadikan sasaran.
2. Unit analisis yang diambil.
3. Kemampuan peneliti dalam hal waktu dan dana.
4. Tingkat kesulitan dalam pelaksanaan.

9. Mencari reliabilitas data dengan instrumen lain
Realibilitas data menunjuk pada keandalan data, artinya bahwa data
tersebut betul-bertul sesuai benar dengan kenyataannya. Dengan demikian, maka
kedua istilah tersebut, yakni reliabilitas instrumen dan reliabilitas data, maknanya
sama. Yang berbeda adalah cara memandang. Reliabilitas instrumen memandang
dari alat yang digunakan, sedangkan reliabilita data memandang dari hasilnya.
Bertitik tolak dari dua pandangan tersebut dapat disimpulkan bahwa yang
penting di dalam penelitian adalah benarnya data. Penelitian mana pun selalu
menghendaki diperolehnya data yang benar, yang sesuai dengan keadaan
senyatanya.
Cara-cara yang dijelaskan di depan adalah mencari insrumen dengan
berbagai teknik, dengan berbagai rumus. Yang dimasalahkan adalah instrumen itu
sendiri. Pada bagian ini akan diajak untuk memasalahkan data, tetapi selanjutnya
digunakan untuk mengetahui keandalan instrumen. Asumsi yang mendasari
pendapat ini adalah:
Jika sebuah instrumen berhasil digunakan untuk mengum-pulkan data
yang benar sesuai dengan keadaan senyatanya, maka instrumen tersebut sudah
andal.
Untuk mengetahui bahwa data yang dikumpulkan dengan instrumen benar-
benar benar amak dapat dilakukan pengecekan kembali. Mengadakan pengecekan
kembali terhadap data yang sudah terkumpul di dalam istilah yang biasa
digunakan di dalam penelitian adalah triangulasi. Secara utuh yang dimaksud
dengan triangulasi adalah pengecekan terhadap kebenaran data dan penafsirannya.
Kata triangulasi sendiri, menurut Ensiklopedi Indonesia, diambil dari penerapan di
dalam ilmu geodesi, yaitu mengukur jarak antara 2 titik yang berjauhan, dengan
menggunakan kaidah segi tiga ilmu ukur datar.
Di dalam penelitian, yang dimaksud dengan triangulasi adalah upaya untuk
mengadakan pengecekan kebenaran data melalui cara lain. Cara-cara yang
diusulkan sesuai dengan asumsi di atas adalah melakukan pengumpulan data yang
sama dengan menggunakan instrumen lain. Oleh karena sifatnya melakukan
pengecekan, maka upaya ini tidak boleh dilakukan asal-asalan, tetapi harus secara
serius dan sistematis. Artinya adalah bahwa data hasil pengumpulan yang kedua
bukan hanya dilihat dengan masa satu, dikira-kira sudah sama dengan data
pertama, tetapi harus direncanakan dengan baik kemudian hasilnya disejajarkan
dengan hasil terdahulu melalui teknik analisis tertentu.
Dalam hal ini kita dapat menggunakan teknik korelasi product moment
dari Spearman apabila jenis data tersebut keduanya interval. Dengan kata lain,
penggunaan rumus untuk melakukan pengecekan kebenaran data juga harus
didasarkan atas ketentuan yang berlaku dalam analisis data.
Alternatif cara yang dapat digunakan dalam melakukan pengecekan data
antara lain adalah sebagai berikut.
a. Mencari reliabilitas angket, dilakukan pengecekan data yang sudah
terkumpul dengan wawancara, baik kepada responden yang sama atau
melalui orang lain.
b. Mencari reliabilitas instrumen/pedoman pengamatan, dilakukan
dengan dokumentasi atau wawancara.
c. Mencari reliabilitas pedoman wawancara dilakukan dengan
pengamatan atau dkumentasi.
Dan lain-lain cara, yang penting bahwa peneliti sudah melakukan
sesuatu upaya untuk menguji kebenaran data yang selanjutnya
diberlakukan untuk melihat keandalan instrumen.
Sesudah data kedua (hasil pengecekan) terkumpul, peneliti membuat
tabel untuk melihat kesejajaran data sebagai berikut.
Tabel Persiapan untuk Menghitung Korelasi Data tentang ......
(misalnya dari Angket dan Wawancara)
No. Aspek yang Diukur Data dari
Angket
Data dari
Wawancara
1. Ditulis semua (misalnya 4) (misalnya 3)
2. Butir pertanyaan . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3. Yang ditanyakan . . . . . . . . . . . . . . . . . . . . . . . . . . . .
- - Dan seterusnya - -

Dengan menggunakan rumus product moment, penelitian akan
menghasilkan indeks korelasi. Tentu saja dari sebuah tabel seperti disajikan
peneliti baru memperoleh informasi kesejajaran dari seorang responden. Apabila
di dalam melakukan uji coba tersebut peneliti mengambil misalnya 15 orang
responden sebagai subjek uji coba, pengecekan juga dilakukan kepada semua
responden. Dari masing-masing indeks korelasi tersebut peneliti dapat
menghitung rata-ratanya. Dari data-data tersebut jika diketahui misalnya hanya
0,34, dapat disimpulakn bahwa reliabilitas angket yang diujicobakan adalah
rendah.














BAB III
PENUTUP
A. Kesimpulan
Dalam suatu penelitian diperlukan adanya instrumen untuk menjadi alat
ukur dari suatu data yang ingin diperoleh. Untuk memperoleh hasil yang valid dan
reliabel, diperlukan instrumen yang valid dan reliabel pula. Untuk mengetahui
suatu instrumen tersebut valid dan reliabel maka harus dilakukan pengujian, yaitu
pengujian validitas dan pengujian reliabilitas. Instrumen dikatakan valid berarti
isntrumen tersebut dapat digunakan untuk mengukur apa yang seharusnya diukur.
Instrumen dikatakan reliabel berarti instrumen yang bila digunakan beberapa kali
untuk mengukur obyek yang sama, akan menghasilkan data yang sama.
B. Saran
Dalam suatu penelitian, hendaknya setiap peneliti harus benar benar
memastikan bahwa instrumen yang digunakan valid dan reliabel serta telah
melalui pengujian untuk instrumen tersebut. Sehingga hasil penelitian yang
diperolehpun akan valid dan reliabel.








DAFTAR PUSTAKA
Arikunto, Suharsimi. 2010. Prosedur Penelitian. Yogyakarta: Rineka Cipta
Sugiyono, Dr, Prof. 2013. Metode Penelitian Pendidikan (Pendekatan
Kuantitatif, Kualitatif, dan R&D). Bandung: Alfabeta.