Anda di halaman 1dari 60

MAKALAH

Instrumen Penelitian,Validitas dan Reabilitas Instrumen Penelitian


Di Buat Untuk Tugas
METODOLOGI PENELITIAN PENDIDIKAN FISIKA

Di Buat Oleh : Kelompok 3


1. Utari Prisma Dewi (RSA1C316008)
2. Sofia Christine Samosir (RSA1C316011)
3. Purnama Ramadani (RSA1C316012)

Dosen Pengampu :
Dwi Agus Kurniawan, S.Pd., M.Pd.

PRODI PENDIDIKAN FISIKA PGMIPA-U


FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS JAMBI
2018
KATA PENGANTAR

Dengan menyebut nama Allah yang Maha Pengasih lagi Maha


Penyanyang. Puja dan puji tetap bagi Allah SWT yang tiada pernah menghentikan
nikmatnya bagi umatnya. Salawat dan salam semoga tercurah limpah kepada
junjungan alam Nabi besar Muhammad SAW, keluarganya, sahabanya, serta
seluruh umat yang taat kepadanya.
“Instrumen Penelitian, Validitas dan Reabilitas Instrumen Penelitian”
adalah judul makalah yang diberikan kepada kelompok 6. Yang mana makalah ini
kami susun dalam rangka memenuhi salah satu tugas bagian dari Metodologi
Penelitian Pendidikan Fisika, dan berkat rahmat Allah karya tulis yang berbentuk
makalah ini dapat kami selesaikan sesuai dengan waktunya.
Kami menyadari bahwa tersusunnya makalah ini adalah atas bantuan dan
bimbingan dari berbagai pihak. Maka sewajarnyalah dalam kesempatan ini kami
mengucapkan terima kasih kepada yang terhormat :
1. Bapak Dwi Agus Kurniawan, S.Pd., M.Pd. selaku dosen mata kuliah
Metodologi Penelitian Pendidikan Fisika
2. Seluruh pihak yang telah berkenan membantu kami dalam penyusunan
makalah.
Akhirnya kepada Allah jualah kami memuji dan bersyukur atas segala
nikmat-nya. Dan kepada-Nya lah kami memohon taufik,hidayah,dan inayah-Nya.

Jambi, September 2018

Tim Penulis

i
DAFTAR ISI

KATA PENGANTAR ............................................................................................. i


BAB I ...................................................................................................................... 1
PENDAHULUAN .................................................................................................. 1
1.1. Latar Belakang ......................................................................................................... 1
1.2.Tujuan Penulisan....................................................................................................... 2
BAB II ..................................................................................................................... 3
PEMBAHASAN ..................................................................................................... 3
2.1.Kajian Pustaka .......................................................................................................... 3
2.1.1.Pengertian Instrumen ......................................................................................... 3
2.1.2.Jenis-jenis instrumen penelitian ......................................................................... 4
2.1.3.Pengertian validitas .......................................................................................... 13
2.1.4.Jenis – jenis validitas........................................................................................ 18
2.1.5.Uji validitas ...................................................................................................... 21
2.1.6.Pengertian Reliabilitas ..................................................................................... 28
2.1.7.Teknik Perhitungan Reliabilitas ....................................................................... 30
2.2.Kajian kritis............................................................................................................. 42
BAB III ................................................................................................................. 52
PENUTUP ............................................................................................................. 52
3.1.Kesimpulan ............................................................................................................. 52
3.2.Saran ....................................................................................................................... 56
DAFTAR PUSTAKA

ii
BAB I
PENDAHULUAN
1.1. Latar Belakang
Instrumen memegang peranan yang sangat penting dalam menentukan mutu
suatau penelitian, karena validitas atau keabsahan data yang diperoleh akan sangat
ditentukan oleh kualitas atau validitas instrumen yang digunakan, disamping
prosedur pengumpulan data yang ditempuh. Hal ini mudah dipahami karena
instrumen berfungsi mengungkapkan fakta menjadi data, sehingga jika instrumen
yang digunakan mempunyai kualitas yang memadai dalam arti valid dan reabel
maka data yang diperoleh akan sesuai dengan fakta atau keadaan sesungguhnya di
lapangan. Sedangkan jika kualitas instrumen yang digunakan tidak baik dalam arti
mempunyai validitas dan reabilitas yang rendah, maka data yang diperoleh juga
tidak valid atau tidak sesuai dengan fakta di lapangan sehingga dapat
menghasilkan kesimpulan yang keliru. Untuk mengumpulkan data dari suatu
penelitian kita dapat menggunakan instrumen yang dibuat sendiri, instrumen yang
telah tersedia pada umumnya adalah instrumen yang sudah dianggap baku untuk
mengumpulkan data variabel-variabel tertentu.
Dalam menyusun dan sebelum mengaplikasikan instrumen penelitian, ada
tahapan yang begitu penting bagaimana hasil dari penelitian tersebut dapat
dipertanggung jawabkan. Hal penting tersebut adalah yang biasa disebut dengan
validitas dan reabilitas. Statistika yang digunakan untuk menguji hipotesis
walaupun telah sesuai dengan hipotesis yang diajukan. Skala data dan rancangan
penelitian yang digunakan. Bila instrumen penelitian yang digunakan validitas
dan reabilitasnya rendah sudah tentu kesimpulan dari pengujian hipotesis tersebut
tidak tepat. Instrumen harus memenuhi persyaratan validitas dan reabilitas.
Instrumen yang valid berarti instrumen mampu mengukur tentang apa yang
diukur, misalnya seseorang ingin mengukur berat badannya, maka alat yang
digunakannya adalah timbangan. Termometer adalah alat yang valid untuk
mengukur suhu, tetapi tidak valid digunakn untuk mengukur berat bedan.
Instrumen yang memenuhi persyaratan reabilitas berarti instrumen menghasilkan
ukuran yang konsisten walaupun instrumen tersebut digunakan mengukur berkai-
kali. Instrumen yang valid dan reliable merupakan syarat mutlak untuk

1
mendapatkan hasil penelitian yang valid dan reliable. Namun, hal ini masih
dipengaruhi oleh kondisi objek yang diteliti dan kemampuan orang yang
menggunakan instrumen untuk mengumpulkan data. Selain memenuhi
persyaratan validitas dan realibilitas, instrumen hendaknya memenuhi persyaratan
kepraktisan. Artinya instrumen tersebut praktis untuk dilaksanakan, ringkas,
mudah dimengerti dan hemat biaya.

1.2. Tujuan Penulisan


Tujuan penulisan makalah ini adalah untuk mengidentifikasi instrumen
penelitian, menjelaskan jenis-jenis penelitian instrumen penelitian, serta cara
untuk menentukan hasil penelitian yang bisa di pertanggung jawabkan dengan
menggu-nakan validitas dan realibilitas instrumen penelitian.

2
BAB II
PEMBAHASAN

2.1. Kajian Pustaka


2.1.1. Pengertian Instrumen
Menurut Arifin (2011:225) instrumen merupakan komponen kunci dalam
penelitian. Mutu istrumen akan menentukan mutu data yang digunakan dalam
penelitian, sedangkan data merupakan dasar kebenaran empirik dari penemuan
atau kesimpulan penelitian. Oleh Karena itu, instrumen harus dibuat dengan
sebaik-baiknya. Untuk membuat instrumen yang akan digunakan setidaknya ada
tiga hal yang harus diperhatikan, yaitu masalah penelitian, variabel penelitian dan
jenis instrumen yang akan digunakan.
Menurut penelitian Matondang (2009:96) memberikan kesimpulaan,
bahwa instrumen merupakan suatu alat yang karena memenuhi persyaratan
akademis maka dapat dipergunakan sebagai alat untuk mengukur suatu objek atau
mengumpulkan data mengenai suatu variabel.
Menurut Wilkinson dan Birmingham (2002:3) Research instru-
ments are simply devices for obtaining information relevant to your research
project, and there are many alternatives from which to choose. The
professor’s second point was intended to boost students’ flagging morale on
hearing the first. Basically, if you run into difficulties and your research
begins to flounder, that needn’t be the end of it. Rather, you should see it as
an opportunity for conducting your research differently, by using alternative
means. He was impressing upon the class that there is no such thing as the
definitive method of conducting social research. There is no single research
method or instrument par excellence. Research is not a ‘one-size-fits-all’
enterprise. No single research instrument is inherently superior to any other.
All can be used well or poorly. Each has its own strengths and weaknesses.
Each is more or less appropriate to use in any single research exercise.
Whatever your own circumstances, the highest quality social research
projects are always those which employ the most suitable methods and
instruments in the most thoughtful and careful way.

Instrumen penelitian adalah alat untuk memperoleh informasi yang


relevan dengan proyek riset Anda, dan ada banyak alternatif untuk dipilih. Poin
kedua professor itu dimaksudkan untuk meningkatkan moralitas para siswa yang
sedang belajar mendengarkan sidang pertama. Pada dasarnya, jika Anda
mengalami kesulitan dan penelitian Anda mulai gagal, itu tidak perlu menjadi
akhir. Sebaliknya, Anda harus melihatnya sebagai peluang untuk melakukan riset

3
Anda secara berbeda, dengan menggunakan cara alternatif. Dia terkesan pada
kelas bahwa tidak ada hal seperti metode definitif melakukan penelitian sosial.
Tidak ada metode penelitian tunggal atau instrumen par excellence. Penelitian
bukanlah usaha 'satu-ukuran- semua-semua'. Tidak ada instrumen penelitian
tunggal yang secara inheren lebih unggul dari yang lain. Semua bisa digunakan
dengan baik atau buruk. Masing-masing memiliki kekuatan dan kelemahannya
sendiri. Masing-masing lebih atau kurang tepat untuk digunakan dalam setiap
penelitian tunggal. Apapun keadaan Anda sendiri, proyek penelitian sosial
dengan kualitas terbaik selalu merupakan metode dan instrumen yang paling
sesuai dengan cara yang paling bijaksana dan hati-hati

2.1.2. Jenis-jenis instrumen penelitian


Menurut Arifin (2011:226), jenis instrumen penelitian hampir sama
dengan jenis instrumen evaluasi. Instrumen penelitian dikelompokkan menjadi
dua, yaitu tes dan nontes. Tes memiliki sifat mengukur, sedangkan nontes
memiliki sifat menghimpun. Tes terdiri dari beberapa jenis, diantaranya tes
tertulis, tes lisan,dan tes tindakan, sedangkan nontes terdiri dari angket, observasi,
wawancara, skala sikap, skala minat, daftar cek, skala penilaian dan studi
dokumentasi.
a. Tes
Tes adalah suatu teknik pengukuran yang didalamnya terdapat berbagai
pertanyaan, pernyataan, atau serangkaian tugas yang harus dikerjakan atau
dijawab oleh responden. Tes dapat dibedakan atas beberapa jenis, dan pembagian
jenis-jenis ini dapat ditinjau dari berbagai sudut pandang.
Berdasarkan bidang psikologi, tes dapat diklasifikasikan menjadi empat
bagian, yaitu tes intelegensia umum, tes kemampuan khusus, tes prestasi belajar
dan tes kepribadian. Berdasarkan jumlah peserta didik tes dapat dibagi menjadi
dua jenis, yaitu tes kelompok dan tes perseorangan. Berdasarkan cara
penyusunannya tes dapat dibedakan menjadi dua jenis, yaitu tes buatan guru dab
tes baku atau tes standar. Bedasarkan aspek kemampuan tes dibedakan menjadi
dua bagian, yaitu tes kemampuan dan tes kecepatan. Ditinjau dari bentuk jawaban
responden tes dibedakan menjadi tiga jenis, yaitu tes tertulis, tes lisan dan tes
perbuatan. Tes tertulis ada dua bentuk, yaitu tes uraian dan tes objektif.

4
Pembagian tes tersebut menunjukkan banyaknya ragam tes yang dapat
digunakan dalam penelitian. Jenis tes yang digunakan bergantung pada masalah
dan tujuan penelitian. Setiap jenis tes tertentu mempunyai tujuan dan fungsi
masing-masing. Salah satu bentuk tes yang banyak digunakan dalam penelitian
adalah tes objektif atau yang sering disebut dikotomi (dichotomously scored item)
karena jawabannya antara benar atau salah dan skornya antara 1 dan 0. Disebut tes
objektif karena penilaiannya objektif. Siapa pun yang mengoreksi jawaban tes
objektif hasilnya akan sama karena kunci jawabannya sudah jelas dan pasti.
Tes objektif menuntun responden untuk memilih jawaban yang benar
diantara kemungkinan jawaban yang telah disediakan, memberikan jawaban
singkat, dan melengkapi pertanyaan atau pertanyaan yang belum sempurna. Tes
objektif sangat cocok untuk menilai kemampuan yang menuntut proses mental
yang tidak begitu tinggi, seperti mengingat, mengenal, pengertian, dan penerapan
prinsip-prinsip. Tes objektif terdiri atas beberapa bentuk, yaitu: benar-salah,
pilihan ganda, menjodohkan, dan melengkapi atau jawaban singkat.
Kebaikan tes objektif antara lain a) seluruh ruang lingkup (scope) materi
dapat dinyatakan pada item atau soal, b) kemungkinan jawaban spekulatif dalam
ujian dapat dihindari, c) jawaban bersifat mutlak, jadi penilaian dapat dilakukan
secara objektif, d) pengoreksian dapat dilakukan siapa saja, sekalipun tidak
mengetahui dan mengusai materinya, e) pemberian skor dapat dilakukan dengan
mudah dan cepat, f) korektor tidak akan terpengaruh oleh baik-buruknya tulisan,
dan g) tidak mungkin terjadi dua orang responden yang jawabannya sama, tetapi
mendapat skor yang berbeda. Sedangkan kelemehannya yakni, a) mengkontruksi
soalnya sangat sulit, b) membutuhkan waktu yang lama, c) ada kemungkinan
responden mencontoh jawaban orang lain dan berfikir pasif, dan d) umumnya
hanya mampu mengukur proses mental yang dangkal.
b. Angket (questioner)
Menurut (Mathers,dkk, 2009:9), Questionnaires are a useful option
to consider when conducting a postal survey. They can be cheaper than
personal interviewing and quicker if the sample is large and widely
dispersed. For any postal survey regardless of the sample size you must
allow at least six weeks for the first wave of questionnaires to be returned,
and another four weeks for each successive mailing. As with telephone
interviewing, a postal survey is useful if your respondents are widely
distributed. However, due to the lack of personal contact between the

5
respondent and the researcher, the design and layout of the questionnaire is
all important.

Kuesioner adalah pilihan yang berguna untuk dipertimbangkan ketika


melakukan survei pos. Mereka bisa lebih mudah daripada wawancara pribadi dan
lebih cepat jika sampelnya besar dan tersebar luas. Untuk setiap survei pos
terlepas dari ukuran sampel Anda harus mengizinkan setidaknya enam minggu
untuk gelombang pertama kuesioner yang akan dikembalikan, dan empat minggu
untuk setiap pengiriman berikutnya. Seperti halnya wawancara melalui telepon,
survei pos berguna jika responden Anda didistribusikan secara luas. Namun,
karena kurangnya kontak pribadi antara responden dan peneliti, desain dan tata
letak kuesioner sangat penting.
Menurut Arifin (2011: 228) Angket adalah instrumen penelitian yang berisi
serangkaian pertanyaan atau pernyataan untuk menjaring data atau informasi yang
harus dijawab responden secara bebas sesuai dengan pendapatnya. Keuntungan
dari angket, ialah a) responden dapat menjawab dengan bebas tanpa dipengaruhi
oleh hubungan dengan peneliti atau penilai, dan waktu relative lama, sehingga
objektifitas dapat terjamin, b) informasi atau data terkumpul lebih mudah karena
itemnya homogeny, dan c) dapat digunakan untuk mengumpulkan data dari
responden yang jumlahnya cukup banyak. Sedangkan kelemahannya ialah a) ada
kemungkinan angket diisi oleh orang lain, b) hanya diperuntukkan bagi yang
dapat melihat, dan c) responden hanya menjawab berdasarkan jawaban yang ada.
Angket terdiri dari dua bentuk, yaitu bentuk angket berstruktur dan bentuk angket
tidak berstruktur. Bentuk angket berstruktur ialah angket yang menyediakan
beberapa kemungkinan jawaban. Sedangkan bentuk angket tidak berstruktur ialah
bentuk angket yang memberikan jawaban secara terbuka dimana responden secara
bebas menjawab pertanyaan tersebut. Hal ini dapat memberikan pemahaman yang
lebih mendalam tentang situasi, tetapi kurang dapat dinilai secara objektif.
Jawabannya tidak dapat dianalisis secara statistik, sehingga kesimpulannya pun
hanya merupakan pandangan yang bersifat umum.
Angket terdiri dari beberapa bentuk, yaitu
a. Bentuk angket berstruktur, yaitu angket yang menyediakan beberapa
kemungkinan jawaban. Bentuk angket berstruktur terdiri tiga bentuk, yaitu a)
bentuk jawaban tertutup, yaitu angket setiap pertanyaanya sudah tersedia berbagai

6
alternatif jawaban, b) bentuk jawaban tertutup, tetapi ada alternatif jawaban
terakhir diberikan secara terbuka. Hal ini dimaksudkan untuk memberikaan
kesempatan kepada responden untuk menjawab secara bebas, dan c) bentuk
jawaban bergambar, yaitu angket yang memberikan jawaban dalam bentuk
gambar.
b. Bentuk angket tak berstruktur, yaitu bentuk teknik angket yang memberikan
jawaban secara terbuka dimana responden secara bebas menjawab pertanyaan
tersebut. Hal ini dapat memberikan pemahaman yang lebih mendalam tentang
situasi, tetapi kurang dapat dinilai secara objektif. Jawaban tidak dapat dianalisis
secara statistik, sehingga kesimpulannya pun hanya merupakan pandangan yang
bersifat umum.
Untuk menyusun angket, dapat mengikuti langkah-langkah ssebagai berikut,
a) Menyusun kisi-kisi angket
No Masalah Tujuan indikator Sumber Nomor
data angket

b) Menyusun pertanyaan-pertanyaan dan bentuk jawaban yang diinginkan,


setiap pertanyaan harus mengambarkan atau mencerminkan data yang
diperlukan. Pertanyaan harus berurutan supaya pertanyaan satu dan yang
lainnya berkesinambungan.
c) Membuat pedoman atau petunjuk menjawab pertanyaan, sehingga
memudahkan responden menjawabnya
d) Harus dilakukan uji-coba lapangan, sehingga dapat diketahui kelemahan-
kelemahannya.
e) Setelah uji-coba maka harus dilakukan revisi, dari bahasa, pertanyaannya
maupun jawabannya
f) Menggandakan angket sesuai dengan banyak jumalah responden
Menurut penelitian (Taherdoost,2016:34), validity and reliability of
questionnaire/survey as a significant research instrument tool were reviewed.
Various types of validity were discussed with the goal of validity improving
the skills and knowledge of survey validity tests among researchers. As
discussed, there are four main validity test of the questionnaire namely; face

7
validity, content validity, construct validity and criterion validity. Depends on
the types of questionnaire, some of these validity tests are mandatory to apply
and some recommended

Validitas dan reliabilitas kuesioner / survei sebagai alat instrumen penelitian


yang signifikan telah ditinjau. Berbagai jenis validitas dibahas dengan tujuan
validitas meningkatkan keterampilan dan pengetahuan tes validitas survei di
kalangan peneliti. Seperti yang telah dibahas, ada empat uji validitas utama dari
kuesioner yaitu; validitas wajah, validitas isi, validitas konstruk dan validitas
kriteria. Tergantung pada jenis kuesioner, beberapa tes validitas ini wajib untuk
diterapkan dan beberapa yang direkomendasikan.
c. Observasi (observation)
Menurut Arifin (2011:230) Observasi merupakan teknik pengumpulan data
yang dilakukan dengan jalan pengamatan dan pencatatan secara sistematis, logis,
objektif dan rasional mengenai berbagai fenomena, baik dalam situasi yang
sebenarnya maupun dalam situasi buatan untuk mencapai tujuan tertentu. Teknik
observasi sering digunakan dalam penelitian kualitatif. Tujuan utama observasi
yaitu a) untuk mengumpulkan data dan informasi mengenai suatu fenomena, baik
yang berupa peristiwa maupun tindakan, baik dalam situasi yang sesungguhnya
maupun dalam situasi buatan, b) untuk mengukur perilaku, tindakan, dan proses
atau kegiatan yang sedang dilakukan, interaksi antara responden dan lingkungan,
dan faktor-faktor yang dapat diamati lainnya, terutama kecakapan sosial.
Teknik observasi ini banyak manfaatnya, antara lain : a) peneliti lebih
mampu memahami konteks data dalam keseluruhan situasi, b) memungkinkan
peneliti menggunakan pendekatan induktif. Jadi tidak dipengaruhi oleh konsep-
konsep atau pandangan sebelumnya, c) peneliti dapat melihat hal-hal yang tidak
diamati oleh orang lain, karena telah dianggap bisa dan tidak terungkap dalam
wawancara, d) peneliti tidak hanya dapat melakukan pengamatan, tetapi juga
memperoleh kesan-kesan pribadi. Langkah-langkah untuk menyusun pedoman
observasi yaitu : a) merumuskan tujuan observasi, b) membuat kisi-kisi observasi
c) menyusun pedoman observasi, d) menyusun aspek-aspek yang akan
diobservasi, baik yang berkenaan dengan proses belajar peserta didik maupun
kepribadiannya, e) melakukan uji-coba pedoman observasi untuk melihat
kelemahan-kelemahan pedoman observasi, f) merevisi pedoman observasi

8
bersarkan hasil uji-coba, g) melaksanakan observasi pada saat kegiatan
berlangsung, dan h) mengolah dan menafsirkan hasil observasi.
Sebagaimana instrumen penelitian yang lain, observasi secara umum
mempunyai kelebihan dan kekurangan. Kelebihan dari observasi yaitu a)
observasi merupakan alat untuk mengamati berbagai macam fenomena, b)
observasi cocok untuk mengamati orang yang sedang melakukan suatu keadaan,
c) banyak hal yang tidak dapat diukur dengan tes, tetapi justru lebih tepat dengan
observasi, dan d) tidak terikat dengan laporan pribadi. Adapaun kelemahannya
yaitu a) pelaksanaan observasi sering tergangggu oleh keadaan cuaca, bahkan ada
kesan yang kurang menyenangkan dari observer ataupun dari observasi itu sendiri,
b) biasanya masalah pribadi sulit diamati, dan c) jika proses yang diamati
memakan waktu yang lama, maka observer sering menjadi jenuh.
d. Wawancara (interview)
Menurut Arifin (2011:233) Wawancara merupakan teknik pengumpulan
data yang dilakukan melalui percakapan dan Tanya-jawab, baik secara langsung
maupun tidak langsung dengan responden untuk mencapai tujuan tertentu. Ada
tiga bentuk pertanyaan wawancara yang dapat digunakan dalam penelitian, yaitu:
a) bentuk pertanyaan berstruktur, yaitu pertanyaannya menuntut jawaban agar
sesuai dengan apa yang terkandung dalam pertanyaan tersebut, biasanya
digunakan untuk permasalahan yang tidak terlalu kompleks dan jawabannya
sudah konkret, b) bentuk pertanyaan tak berstruktur, yaitu pertanyaan yang
bersifat terbuka dimana responden bebas menjawab pertanyaan tersebut. Biasanya
digunakan untuk mengungkapkan perasaan, fikiran dan tingkah lakunya, dan c)
bentuk pertanyaan campuran, yaitu yang menuntut jawaban campuran, ada yang
berstruktur ada pula yang bebas.
Untuk menyusun pedoman wawancara dapat mengikuti langkah-langkah
sebagai berikut: a) merumuskan tujuan wawancara, b) membuat kisi-kisi dan
pedoman wawancara, c) menyusun pertanyaan sesuai data yang diperlukan dan
bentuk pertanyaan yang diinginkan. Untuk itu perlu diperhatikan kata-kata yang
digunakan, cara bertanya, dan jangan membuat peserta didik bersikap defensive,
d) melaksanakan uji coba untuk melihat kelemahan-kelemahan pertanyaan yang

9
disusun, sehingga dapat diperbaiki lagi, dan e) melaksanakan wawancara dalam
situasi sebenarnya.
Dalam pelaksanaan wawancara, ada beberapa hal yang perlu diperhatikan,
yaitu a) hubungan baik antara pewawancara dan orang yang diwawancarai perlu
dipupuk dan dibina, sehingga akan tampak hubungan yang sehat dan harmonis, b)
dalam wawancara, jangan terlalu kaku, tunjukkan sikap yang bebas, ramah,
terbuka, dan adaptasikan diri dengannya, c) perlakukan responden itu sebagai
sesama manusia dengan jujur, d) hilangkan prasangka-prasangka yang kurang
baik, sehingga pertanyaan-pertanyaan yang diajukan bersifat netral, dan e)
pertanyaan hendaknya jelas, tepat dengan bahasa yang sederhana dan mudah
dimengerti.
e. Skala sikap
Menurut Arifin (2011:235) Secara umum, sikap adalah suatu kesiapan yang
kompleks dari seorang individual untuk memperlakukan suatu objek (orang,
benda,lingkungan, sekolah, dll) dengan cara, metode, teknik, dan pola tertentu.
Kesiapan itu mempunyai aspek-aspek kognitif, afektif, dan kecenderungan
bertindak yang dapat disimpulkan dari perilaku individu bersangkutan. Dalam
mengukur sikap, perlu diperhatikan tiga komponen sikap, yaitu kognisi
(pengetahuan), afeksi (perasaan) dan konasi (kecenderungan bertindak) seseorang
terhadap objek. Dalam skala likert, responden tidak hanya memilih pertanyaan-
pertanyaan positif, tetapi juga pertanyaan-pertanyaan negatif. Tiap item dibagi
kedalam lima skala, yaitu sangat setuju, setuju, tidak tentu, tidak setuju, dan
sangat tidak setuju. Setiap pertanyaan positif diberi bobot 4, 3, 2, 1 dan 0.
Sedangkan pertanyaan negatif diberi bobot sebaliknya, yaitu 0, 1, 2, 3, dan 4.
Model skala sikap yang dapat digunakan untuk mengukur sikap,
diantaranya, ; a) menggunakan bilangan untuk menunjukkan tingkat-tingkat dari
objek sikap yang dinilai, seperti 1,2,3,4 dan seterusnya, b) menggunakan frekuensi
terjadinya atau timbulnya sikap itu, seperti selalu, sering kali, kadang-kadang,
pernah dan tidak pernah, c) menggunakan ilstilah-istilah yang bersifat lialitatif,
seperti bagus sekali, baik, sedang, dan kurang. Ada juga istilah-istilah lain, seperti
sangat setuju, setuju, tidak tahu (tidak punya pendapat), tidak setuju dan sangat
tidak setuju, d) menggunakan istilah-istilah yang menunjukkan kedudukan, seperti

10
sangat rendah, dibawah rata-rata, dan sangat tinggi dan e) menggunakan kode
bilangan atau huruf, seperti : selalu (diberi kode), 5) kadang-kadang (4) jarang (3)
jarang sekali (2) dan tidak pernah (1)
Untuk menyusun pertanyaan sikap yang bermutu, likert memberi petunjuk
sebagai berikut: a) pertanyaan harus menggambarkan perilaku yang diinginkan
dan bukan menyatakan suatu fakta, b) pertanyaan harus jelas, singkat, terarah,
dan tidak mempunyai tafsiran ganda (ambiguity), c) diusahankan supaya
kecenderungan jawaban tidak terhimpun di satu ujung kontinu, tetapi sebagian
berada diujung lain, dan sebagian lagi terletak ditengah kontinu arah sikap itu, d)
keseluruhan perangkat skala sikap itu hendaknya menczkuo dus kelompok
pertanyaan, yaitu pertanyaan positif dan pertanyaan negatif. Tujuannya untuk
mneghindari jawaban yang strereotip dari responden, dan e) setiap pernyataan
harus mengandung satu variabel sikap dan tidak boleh lebih.
f. Skala minat
Menurut Arifin (2011:241) Minat adalah dorongan atau aktivitas mental
yang dapat merangsang perasaan senang tehadap sesuatu. Sesuatu itu bisa berupa
orang, benda, kegiatan, pengalaman, dan lain-lain yang dapat dijadikan sebagai
stimulus yang memerlukan respon terarah. Minat sangat berhubungan dengan
sikap, misalnya jika materi pelajaran diminati peserta didik, maka sikap peserta
didik cenderung memperhatikan pelajaran tesebut. Perlu diperhatikan faktor-
faktor yang dapat mempengaruhi munculnya minat, seperti motivasi, belajar,
materi pelajaran, keluarga, teman pergaulan, cita-cita, dan lain-lain. Berminat
tidaknya seseorang terhadap sesuatu dapat dilihat dari beberapa indikator, antara
lain perhatian, perasaan, motivasi, dan sikap. Minat dapat diukur dengan teknik
observasi, wawancara, angket, inventori dan skala minat.
Tabel.1 contoh skala minat
No Pertanyaan Ya Kadang-kadang Tidak
01 Mengikuti diskusi kelompok
02 Memperhatikan penjelasan guru
03 Menuruti perintah guru
04 Mengerjakan tugas di rumah
05 Menghafal materi pelajaran
06 Membeli buku-buku pelajaran

11
g. Daftar cek
Daftar cek adalah suatu daftar yang berisi subjek dan aspek-aspek yang akan
diamati. Melalui daftar cek memungkinkan seseorang mencatat tiap-tiap kejadian
(betapapun kecilnya), tetapi dianggap penting. Ada bermacam-macam aspek
perbuatan yang biasanya dicantumkan dalam daftar cek, kemudian peneliti
sebagai observer tinggal memberikan tanda cek (v) pada tiap-tiap aspek tersebut
sesuai dengan hasil pengamatannya. Daftar cek banyak manfaatnya, antara lain, a)
dapat membantu peneliti untuk mengingat-ingat apa yang harus diamati, b) dapat
memberikan informasi kepada stakeholder.
Table 2. daftar cek tentang keaktifan peserta didik dalam diskusi kelompok
No Nama SA A CA KA TA
01 Eliyanti V
02 Yulia v
03 Ida V
04 Nuraziza V
05 Ningratina v
Keterangan : SA= Sangat aktif, A = Aktif, CA = Cukup Aktif, KA = Kurang
aktif, dan TA = Tidak Aktif
h. Skala penilaian
Dalam daftar cek, peneliti hanya dapat mencatat ada atau tidaknya variabel
tertentu, sedangkan dalam skala penilaian, fenomena-fenomena yang akan
diobservasi itu disusun dalam tingkatan-tingkatan yang telah ditentukan. Jadi
untuk mengukur hal-hal tersebut baiknya digunakan skala penilaian.
Kelemahan dari skala penilaian yang akan timbul jika dalam pencatatan
observasi terpikat oleh kesan-kesan umum yang baik pada responden, sedangkan
peniliti tidak menyelidiki kesan-kesan umum yang baik pada responden, misalnya
terkesan akan kecantikan, sopan santun, cara komunikasi dan atau model
berpakaian. Sebaliknya peneliti mungkin memberikan nilai yang rendah, karena
responden tidak cantik, kurang sopan, cara komunikasi tidak etis, dan tidak
berpakaian rapih (Arifin 2011:242)
i. Studi dokumentasi
Dokumen adalah bahan-bahan tertulis. studi dokumentasi adalah teknik
untuk mempelajari dan menganalisis bahan-bahan tertulis kantor atau sekolah,
seperti: silabus, program tahunan,program bulanan, program mingguan, rencana

12
pelaksanaan pembelajaran (RPP), catatan pribadi peserta didik, buku raport, kisi-
kisi, daftar nilai, lembar soal/tugas, lembar jawaban, dan lain-lain. Selain itu,
dokumen mengenai kondisi lingkungan sekolah, data guru, data peserrta didik,
dan organisasi sekolah. Untuk menguji kredibilitas data penelitian yang sudah
diperoleh melalui studi dokumentasi ini, peneliti perlu mengkonfirmasikan
dengan sumber-sumber lain yang relevan guna memperoleh tanggapan, jika perlu
melengkapi dan mengurangi. (Arifin 2011:243)

2.1.3. Pengertian validitas


Menurut Arifin (2011:245-246) validitas merupakan suatu derajat
ketepatan instrument (alat ukur), maksudnya apakah instrument yang digunakan
betu-betul tepat untuk mengukur apa yang harus di ukur. Namun Kerlinger (1986)
menjelaskan bahwa validitas instrumen tidak cukup di tentukan oleh derajat
ketepatan instrument untuk mengukur apa yang seharusnya diukur, tetapi perlu
juga dilihat dari tiga kriteria yang lain, yaitu approriatness, meaningfullness, dan
usefullness. Approriatness menunjukkan kelayakan dari tes sebagai suatu
instrumen, yaitu seberapa jauh instrumen dapat menjangkau keragaman aspek
perilaku peserta didik. Meaningfullness menunjukkan kemampuan instrumen
dalam memberikan keseimbangan soal-soal pengukurannya berdasarkan tingkat
kepentingan dari setiap fenomena. Useufullness to inferences menunjukkan
sensitif tidaknya instrument dalam menangkap fenomena perilaku dan tingkat
ketelitian yang ditunjukkan dalam membuat kesimpulan.
Dalam Penelitian Heale (2015:66) Validity is defined as the extent to
which a concept is accurately measured in a quantitative study. For example, a
survey designed to explore depression but which actually measures anxiety
would not be considered valid. The second measure of quality in a quantitative
study is reliability, or the accuracy of an instrument. In other words, the extent
to which a research instrument consistently has the same results if it is used in
the same situation on repeated occasions.
The final measure of validity is criterion validity. A criterion is any
other instrument that measures the same variable. Correlations can be
conducted to determine the extent to which the different instruments measure
the same variable. Criterion validity is measured in three ways:
1. Convergent validity shows that an instrument is highly correlated with
instruments measuring similar variables.
2. Divergent validity shows that an instrument is poorly correlated to
instruments that measure different variables. In this case, for example,

13
there should be a low correlation between an instrument that measures
motivation and one that measures self efficacy
3. Predictive validity means that the instrument should have high
correlations with future criterions.

Dalam Penelitian Heale (2015: 66) Validitas didefinisikan sebagai sejauh


mana suatu konsep diukur secara akurat dalam studi kuantitatif. Misalnya, survei
yang dirancang untuk mengeksplorasi depresi tetapi sebenarnya mengukur kece-
masan tidak akan dianggap valid. Ukuran kualitas kedua dalam penelitian
kuantitatif adalah reliabilitas, atau keakuratan instrumen. Dengan kata lain, sejauh
mana instrumen penelitian secara konsisten memiliki hasil yang sama jika digu-
nakan dalam situasi yang sama pada kesempatan berulang.
Ukuran terakhir validitas adalah validitas kriteria. Kriteria adalah instrumen
lain yang mengukur variabel yang sama. Korelasi dapat dilakukan untuk menen-
tukan sejauh mana berbagai instrumen mengukur variabel yang sama. Validitas
kriteria diukur dalam tiga cara:
1. Validitas konvergen menunjukkan bahwa instrumen sangat berkorelasi
dengan instrumen yang mengukur variabel serupa.
2. Validitas yang berbeda menunjukkan bahwa instrumen berkorelasi buruk
dengan instrumen yang mengukur variabel yang berbeda. Dalam hal ini,
misalnya, harus ada korelasi rendah antara instrumen yang mengukur
motivasi dan yang mengukur self efficacy.
3. Validitas prediktif berarti bahwa instrumen harus memiliki korelasi tinggi
dengan kriteria masa depan.
Dalam Penelitian Widi (2011:27-28) validitas adalah suatu indeks yang
menunjukkan alat ukur itu benar-benar mengukur apa yang hendak diukur.
Apabila seorang anak balita beratnya 20 kg, maka timbangan yang digunakan
untuk menimbang anak tersebut juga menunjukkan berat 20 kg, bukan 19.5 kg
atau 20.5 kg. Hal ini berarti timbangan tersebut valid. Demikian pula kuisioner
sebagai alat ukur harus bisa mengukur apa yang ingin diukur. Untuk mengetahui
apakah kuisioner yang kita susun tersebut mampu mengukur apa yang hendak kita
ukur, maka perlu diuji dengan uji korelasi antara skor (nilai) tiap-tiap item
(pertanyaan) dengan skor total kuisioner tersebut.

14
Menurut Sugiyono (2016: 348) instrument yang valid berarti alat ukur yang
ya untuk mendapatkan data (mengukur) itu valid. Valid berarti instrumen tersebut
dapat untuk mengukur apa yang hendak diukur. Meter yang valid dapat digunakan
untuk mengukur panjang dengan teliti, karena meteran memang alat untuk
mengukur panjang. Meter tersebut menjadi tiadak valid jika digunakan untuk
mengukur berat.
Namun bukan berarti bahwa dengan menggunakan instrumen yang telah
teruji validitasnya, otomatis hasil (data) peneliti menjadi valid. Hal ini masih akan
dipengaruhi oleh kondisi obyek yang diteliti, dan kemampuan orang yang
menggunakan isntrumen. Oleh karena itu peneliti harus mampu mengendalikan
obyek yang akan diteliti dan meningkatkan kemampuan dan menggunakan
isntrumen untuk mengukur variabel yang teliti.
Dalam Penelitian Borsboom (2004:1063) when claiming that a test is
valid, one is taking the ontological position that the attribute being measured
exists and affects the outcome of the measurement procedure. This is probably
one of the more serious scientific claims one can make, and it is often difficult
to prove or refute. This, however, does not mean that the validity concept itself
is complicated.
Validation is more like theory testing: the muddling around in the
data to find out which way to go. Now, most of the validity literature has not
dealt with the problem of validity but with the problem of validation. Although
there is nothing wrong with describing, classifying, and evaluating validation
strategies, such activities are not likely to elucidate the concept of validity
itself. In fact, if one concentrates on the epistemological problems long enough,
one will move away from the validity concept rather than toward it.

Dalam Penelitian Borsboom (2004: 1063) ketika mengatakan bahwa suatu


tes valid, seseorang mengambil kesimpulan bahwa obyek yang diukur itu ada dan
mempengaruhi hasil dari prosedur pengukuran. Ini mungkin salah satu kesim-
pulan ilmiah yang dapat dilakukan, dan seringkali sulit untuk dibuktikan atau
disanggah. Namun, ini tidak berarti bahwa konsep validitas itu sendiri rumit.
Validasi lebih seperti pengujian teori: kekacauan di dalam data untuk men-
cari tahu bagaimana cara penyelesaiaannya. Sekarang, sebagian besar literatur
validitas belum membahas konsep validitas dengan menggunakan masalah
validasi. Meskipun tidak ada yang salah dengan mendeskripsikan, mengkla-
rifikasi, dan mengevaluasi strategi validasi, kegiatan semacam itu tidak mungkin
untuk menjelaskan konsep validitas itu sendiri. Bahkan, jika seseorang berkonsen-

15
trasi pada masalah-masalah epistemologis cukup lama, seseorang akan menjauh
dari konsep validitas.
Menurut Sugiyono (2016: 350) Instrument yang valid harus mempunyai
validitas internal dan eksternal. Validitas yang mempunyai internal atau rasio, bila
kriteria yang adina dalam instrumen secara instumen secara rasional (teoritis)
telah mencerminkan apa yang diukur. Jadi kriterianya ada di dalam instrument itu.
Sedangkan instrumen yang mempunyai validitas eksternal bila kriteria di dalam
instmen disusun berdasarkan luar atau fakta-fakta empiris yang telah ada.

Instrument yang baik

Valid mengukur apa yang


hendak diukur (ketepatan)

Validitas eksternal Validitas internal


empiris rasional

Disusun CONTENT CONTENT


berdasarkan VALIDAT Disusun VALIDATY
fakta-fakta berdasarkan Disusun
empiris yang rancangan/program berdasarkan teori
telah terbukti yang telah ada yang relevan

UJI UJI UJI


VALIDITASNYA VALIDITASNYA VALIDITASNYA
Dibandingkan Dengan Dengan konsultasi
dengan standar membandingkan ahli. Analisis
yang telah terjadi program yang ada faktor
konsultasi ahli

Kalau validitas internal instrumen dikembangkan menurut teori yang


relevan, maka validitas eksternal isntrumen dikembangkan dari fakta empiris.

16
Misalnya akan mengukur kinerja (permormance) sekelompok pegawai, maka
tolak ukur yang telah ditetapkan di kepegawaian itu. Sedangkan validitas internal
dikembangkan dari teori-teori tentang kinerja. Untu itu penyusunan instrument
yang baik harus memperhatikan teori dan fakta di lapangan. Penelitian yang
mempunyai validitas inernal, bila data yang dihasilkan meupakan fugsi dari
rancangan dan instumen yang digunakan. Instrumen tentang kepemimpinan akan
menghasilkan data kepemimpinan, bukan motivasi. Penelitian yang mempunyai
vaiditas eksternal bila, hasil penelitian dapat diterapkan pada sampel yang lain,
atau hasil penelitian itu dapat digeneralisasikan.
Instrument yang harus mempunyai validitas ini adalah instrument yang
digunakan untuk mengukur prestasi belajar (achiement) dan mengukur efektivitas
pelaksanaan program dan tujuan. Untuk menyusun instrumen prestasi belajar yang
mempunyai validitas isi (content validity), maka instrument harus disusun
berdasarkan materi pelajaran yang telah diajarkan. Sedangkan instrumen yang
digunakan untuk mengetahui pelaksanaan program yang telah direncanakan.
Selanjtnya instrument yang digunakan untuk mengukur tingkat tercapainya tujuan
(efektivitas) maka instrument harus disusun berdasarkan tujuan yang telah
dirumuskan.
Menurut Franzen (2002:29) Discussions of the validity of a test may
be clarified by considering the conditions, populations, and types of
generalization that form the parameters of the inference. Instead of stating
that a given test is valid, we should state instead that it is valid (or invalid)
for drawing certain conclusions when it is administered to a certain
individual in a certain setting. Doing so helps to make it clear that validity
has as its central concern the evaluation of hypotheses formed by attempts to
generalize past the test situation.

Menurut Franzen (2002:29) Diskusi tentang validitas suatu tes dapat


diklarifikasi dengan mempertimbangkan kondisi, populasi, dan jenis generalisasi
yang membentuk parameter inferensi. Alih-alih menyatakan bahwa tes yang
diberikan itu valid, kita harus menyatakan bahwa itu sah (atau tidak valid) untuk
menarik kesimpulan tertentu ketika itu diberikan kepada individu tertentu dalam
pengaturan tertentu. Hal itu membantu untuk memperjelas bahwa validitas telah
menjadi pusat perhatiannya pada evaluasi hipotesis yang dibentuk oleh upaya
untuk menggeneralisasi melewati situasi ujian.

17
Menurut Taylor (2013:2-3) validation in research involves close
scrutiny of logical arguments and the empirical evidence to determine
whether they support theoretical claims. Similarly, validation in assessment
involves evaluating logical arguments and empirical evidence to determine
whether they support proposed inferences from, as well as interpretations
and uses of, assessment results. As consumers of research reports or users of
assessment tools, scientists, educators, and psychologists have an obligation
to examine both logical arguments and empirical evidence to determine
whether the claims made by the researchers and the interpretations proposed
by assessment developers can be trusted.

Menurut Taylor (2013:2-3) validasi dalam penelitian melibatkan pemerik-


saan ketat atas argumen logis dan bukti empiris untuk menentukan apakah
mendukung teoretis. Demikian pula, validasi dalam penilaian melibatkan evaluasi
argumen logis dan bukti empiris untuk menentukan apakah mendukung usulan
kesimpulan, serta interpretasi dan penggunaan, hasil penilaian. Sebagai konsumen
laporan penelitian atau pengguna alat penilaian, ilmuwan, pendidik, dan psikolog
memiliki kewajiban untuk memeriksa baik argumen logis dan bukti empiris untuk
menentukan apakah klaim yang dibuat oleh para peneliti dan interpretasi yang
diajukan oleh para pengembang penilaian dapat dipercaya.

2.1.4. Jenis – jenis validitas


Menurut Arifin (2011:246-248) dalam literatur modern tentang penelitian
dan evaluasi,banyak dikemukakan jenis-jenis validitas, antara lain :
1. Validitas permukaan. Validitas ini menggunakan kriteria yang sangat
sederhana, karena hanya melihat dari sisi muka atau tampang dari
instrument itu sendiri. Artinya, jika suatu tes secara sepintas telah dianggap
baik untuk mengungkapkan fenomena yang akan diukur, maka tes tersebut
sudah dapat dikatakan memenuhi syarat validitas permukaan, sehingga tidak
perlu lagi adanya judgement yang mendalam.
2. Validitas isi. Validitas ini sering digunakan dalam pengukuran hasil belajar.
Tujuan utamanya adalah untuk mengetahui sejauh mana peserta didik
menguasai materi pelajaran yang telah disampaikan, dan perubahan-
perubahan psokologis apa yang timbul pada peserta didik tersebut setelah
mengalami proses pembelajaran tertentu. Jika dilihat dari segi kegunaanya
validitas kurikuler dan validitas perumusan.

18
3. Validitas empiris. Validitas ini biasanya menggunakan teknik statistik, yaitu
analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan
antara skor tes dan suatu kriteria tertentu yang merupakan suatu tolak ukur
di luar tes yang bersangkutan. Validitas empiris disebut juga validitas yang
dihubungkan dengan kriteria ( criterion-related validity) atau validitas
statistik (statistical validity). Ada tiga macam validitas empiris, yaitu :
a. Validitas prediktif ialah jika kriteria standar yang digunakan adalah
untuk meramalkan prestasi belajar murid dimasa yang akan datang.
Validitas prediktif bermaksud melihat hingga mana suatu tes dapat
memperkirakan perilaku peserta didik pada masa yang akan datang.
b. Validitas konkuren ialah jika kriteria standarnya berlainan. Misalnya,
skor tes dalam pelajaran bahasa Indonesia dikorelasikan dengan skor tes
bahasa inggris.
c. Validitas sejenis ialah jika kriteria standarnya sejenis. Misalnya, bahasa
Indonesia dengan bahasa inggris. Untuk menguji validitas empiris dapat
menggunkan analisis korelasi product-moment dengan angka
simpangan.
4. Validitas konstruk. Konstruk adalah konsep yang dapat diobservasi
(observable) dan dapat diukur (measurable). Validitas konstruk sering juga
disebut validitas logis (logical validity). Validitas konstrsuk berkenaan
dengan pertanyaan hingga mana suatu tes betula-betul dapat mengobservasi
dan mengukur fungsi psikologis yang merupakan deskripsi perilaku peserta
didik yang akan diukur oleh tes tersebut. Validitas konstruk banyak dikenal
dan digunakan dalam tes-tes psikologis untuk mengukur gejala perilaku
yang abstrak, seperti kesetiakawanan, kematangan emosi, sikap, motivasi,
minat, dan sebagainya. Untuk menguji validitas konstruk dapat dilakukan
dengan berbagai sumber, antara lain validitas isi, validitas prediksi, dan
validitas konkuren.
5. Validitas faktor. Dalam penelitian sering di gunakan skala pengukuran
tentang suatu variabel yang terdiri atas beberapa faktor. Faktor-faktor
tersebut diperoleh berdasarkan dimensi/indikator dari variabel yang diukur
sesuai dengan apa yang terungkap dalam konstruksi teoritisnya. Meskipun

19
variabel terdiri beberapa faktor, prinsip homogenitas untuk keseluruhan
faktor harus tetap dipertahankan, sehingga tidak terjadi tumpang tindih
antara satu faktor dan faktor lain. Kriterium yang digunakan dalam validitas
faktor ini dapat diketahui dengan menghitung homogenitas skor setiap
faktor dengan total skor, dan antara skor dari faktor yang satu dengan skor
dari faktor yang lain.
Dalam Penelitian Siswanto (2008:110) Face validity (validitas wajah)
adalah tingkat dimana nampak relevan, penting dan menarik bagi peserta ujian.
Guru ingin siswa menikmati dalam melakukan tes dan merasakan bahwa mereka
tidak menyia-nyiakan waktu mereka. Yang penting adalah apakah kenyataannya
siswa membuang-buang waktu mereka pada tes yang tidak valid dan reliabel -
tidak masalah bagaimana tes nampak relevan. Meskipun begitu, untuk memotivasi
dan hubungan yang baik adalah penting bagi siswa dan orang tua merasa tes
adalah penting. Keluhan untuk sekolah utama siswa dapat dikurangi jika tes tidak
nampak sepele dalam isi atau tidak menggunakan bahasa yang rendah kepada
siswa. Beberapa butir mungkin mempunyai face validity, tapi kurang validitas
empirik. Itu mungkin bagi siswa untuk menikmati pengambilan pengalaman tanpa
menggunakan tes. Mungkin juga mengukur validitas empiris, tapi mempunyai
face validity yang kecil. Sering menulis ulang butir-butir dapat membuat butir
nampak lebih relevan. Tes aritmatika dasar untuk siswa SMA yang lambat
sebaiknya menggunakan cara dewasa, contoh tes membaca untuk seleksi
sekretaris perlu menggunakan contoh praktis dan menghindari kepustakaan, tes
matematika dengan ilmu fisika kelas perlu menggunakan contoh dari ilmu fisika.
Harus jelas bahwa face validity adalah tidaklah penting ke bentuk validitas lain.
Jika mungkin bagaimanapun butir-butir perlu nampak relevan untuk peserta ujian
sebab jika tes nampak sepele dan kekanak-kanakan mungkin, validitas empiris
mungkin lemah.
Dalam penelitian Taherdoost (2016:29) Face validity is a subjective
judgment on the operationalization of a construct. Face validity is the degree
to which a measure appears to be related to a specific construct, in the
judgment of non-experts such as test takers and representatives of the legal
system. That is, a test has face validity if its content simply looks relevant to
the person taking the test. It evaluates the appearance of the questionnaire in
terms of feasibility, readability, consistency of style and formatting, and the
clarity of the language used.

20
Dalam penelitian Taherdoost (2016:29) validitas Wajah adalah penilaian
subyektif pada operasionalisasi membangun. Validitas wajah adalah sejauh mana
suatu ukuran tampaknya terkait dengan konstruksi tertentu, dalam penilaian non-
ahli seperti pengambil tes dan perwakilan dari sistem hukum. Artinya, tes telah
menghadapi validitas jika kontennya terlihat relevan dengan orang yang mengi-
kuti tes. Mengevaluasi penampilan kuesioner dalam hal kelayakan, keterbacaan,
konsistensi gaya dan format, dan kejelasan bahasa yang digunakan.
Dalam Penelitian Matondang (2009:96) Validitas isi mempermasalahkan
sejauh mana suatu tes mengukur tingkat penguasaan terhadap isi atau materi
tertentu yang seharusnya dikuasai sesuai dengan tujuan pengajaran dan validitas
isi tidak mempunyai besaran. Validitas konstruk mempermasalahkan seberapa
jauh butir-butir tes mampu mengukur apa yang benar-benar hendak diukur sesuai
dengan definisi konseptual yang telah ditetapkan. Validitas empiris (validitas
kriteria) yang berarti bahwa validitas ditentukan berdasarkan kriteria, baik kriteria
internal maupu kriteria eksternal.

2.1.5. Uji validitas


Menurut Sugiyono (2016:352) validitas intrumen dapat diuji dengan
menggunakan :
1. Pengujian validitas kontruk (contruct validity)
Untuk menguji validitas kontruk, maka dapat digunkan pendapat para
ahli (judgment experts). Dalam hal ini setalah instrument dikontruksi
tentang aspek-aspek yang akan diukur berdasarkan teori tertentu, maka
selanjutnya dikonsultasikan dengan ahli. Para ahli diminta pendapatnya
tentang instrument yang telah disusun itu. Mungkin para ahli akan mem-
berikan pendapat: instrumen dapat digunkan tanpa perbaikan, ada perbaikan,
dan mungkin dirombak total. Jumlah tenaga ahli yang digunakan minimal
tiga orang dan umumnya mereka yang telah bergelar doctor sesuai dengan
lingkup yang diteliti. Setelah pengujian dari ahli selesai, maka diteruskan uji
coba instrument. Instrument yang telah disetujui paraem instrument. ahli
tersebut dicobakan pada sampel dari mana populasi diambil. Jumlah
anggota yang digunakan sekitar 30 orang. Setelah data ditabulasikan, maka

21
pengujian validitas konstruk dilakukan dengan analisis faktor, yaitu dengan
mengkorelasikan antara skor instrumen. Untuk keperluan maka diperlukan
bantuan komputer.
2. Pengujian validitas isi (content validity)
Untuk instrumen yang berbentuk test, maka pengujian validitas isi
dapat dilakukan dengan membandingkan antara isi instrumen dengan materi
pelajaran yang telah diajarkan. Seorang dosen yang memberi ujian di luar
pelajaran yang telah ditetapkan, berarti instrumen ujian tersebut tidak
mempunyai validitas. Untuk instrumen yang akan mengukur efektifitas
pelaksanaan program, maka pengujian validitas isi dapat dilakukan dengan
membandingkan antara isi instrumen dengan isi atau rancangan yang telah
ditetapkan. Secara umum pengujian validitas konstruksi dan validitas isi
dapat dibantu dengan menggunakan kisi-kisi instrumen. Dalam kisi-kisi itu
terdapat variabel yang diteliti, indikator sebagai tolak dan nomor butir
(item) pertanyaan atau pernyataan yang telah dijabarkan dari indikator.
Dengan kisi-kisi instrumen itu maka pengujian validitas dapat dilakukan
dengan mudah dan sistematis.
Pada setiap instrumen baik tes maupun nontest terdapat butir-butir
(item) pertnyaan atau pernytaan. Untuk menguji validitas butir-butir
instrumen lebih lanjut, maka setelah dikonsultasikan dengan ahli, maka
selanjutnya diujicobakan, dan dianalisis dengan analisis item. Analisis item
dilakukan dengan menghitung korelasi antara skor butir butir instrumen
dengan skor total, atau dengan mencari daya pembeda skor tiap item dari
kelompok yang membrikan jawaban tinggi dan jawaban rendah. Jumlah
kelompok yang tinggi diambil 29% dan kelompok yang rendah diamb% dan
kelompok yang rendah diambil 27% dari sampel uji coba.
3. Pengujian validitas eksternal
Validitas eksternal instrmen diuji dengan cara membandingkan (untuk
mencari kesamaan) antara kriteria yang ada pada instrumen dengan fakta-
fakta empiris yang terjadi di lapangan. Misalnya instrumen untuk mengukur
kinerja sekelompok pegawai, maka kriteria kinerja pada instrumen itu
dibandingkan dengan catatan-catatan di lapangan (empiris) tentang kinerja

22
pegawai yang baik. Bila telah terdapat kesamaan antara kriteria dalam
instrumen dengan fakta di lapangan, maka dapat dinyatkan instrumen ter-
sebut mempunyai validitas eksternal yang tinggi.
Instrumen penelitian yang mempunyai validitas eksternal yang tinggi
akan mengakibatkan hasil penelitian mempunyai validitas eksternal yang
tinggi pula. Penelitian mempunyai validitas eksternal bila hasil penelitian
dapat digeneralisasikan atau diterapkan pada sampel lain dalam populasi
yang diteliti. Untuk meningkatkan validitas eksternal selain meningkatkan
validitas eksternal instrumen, maka dapa dilakukan dengan memperbesar
jumlah sampel.

Menurut Endrayanto (2012:178-186) uji validitas digunakan untuk menge-


tahui kelayakan butir-butir dalam suatu daftar pertanyaan dalam mende-fenisikan
suatu variabel. Daftar pertanyaan ini pada umumnya mendukung suatu kelompok
variabel tertentu. Uji validitas sebaiknya dilakukan pada setiap butir pertanyaaan
di uji validitasnya. Hasil r hitung kita bandingkan dengan r tabel di mana df= n-2
dengan sig 5%. Jika r tabel < r hitung maka valid. Uji validitas menggunakan
teknik korelasi product moment dengan menggunakan rumus sebagai berikut:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
Contoh soal
Pelayanan merupakan satu yang sangat peting diperhatikan oleh Hotel,
jika konsumen merasa puas terhadap pelayanan yang diberikan oleh Hotel maka
itulah tujuan utama pelayanan. Ujilah validitas dari jawaban responden atas
pertanyaan yang diajukan sebagai berikut.
Skala
Butir Pertanyaan TS S SS STS
1 2 3 4
1 Apakah karyawan di Hotel kami ramah
2 Apakah karyawan di Hotel kami cepat
tamggap dengan apa yang diinginkan
konsumen
3 Apakah karyawan di Hotel kami telah
memberikan pelayanan sesuai dengan
keinginan konsumen

23
Skala
Butir Pertanyaan TS S SS STS
1 2 3 4
4 Apakah karyawan di Hotel kami dapat
selalu memberikan keterangan dengan
jelas setiap pertanyaan konsumen yang
berhubungan dengan Hotel
5 Apakah anda sebagai tamu mendapat
pelayanan yang baik di hotel kami
Keterangan :
STS = Sangat Tidak Setuju (Nilaniya 1)
TS = Tidak Setuju(Nilanya 2)
S = Setuju (Nilainya 3)
SS = Sangat Setuju (Nilainya 4)

Maka jawaban dari responden sebagai berikut:


Jawaban Responden Atas Pertanyaan Pelayanan
P1 P2 P3 P4 P5
4 4 1 4 4
1 1 2 4 4
1 1 2 4 4
2 2 3 4 2
4 1 2 1 2
3 3 2 2 2
4 4 4 4 4
3 2 2 3 2
2 2 3 2 2
2 1 3 4 3
1 1 1 3 2
1 1 1 2 2
1 1 1 2 2
3 1 2 2 2
2 2 2 1 2
3 2 2 4 3
3 3 2 3 3

24
Jawaban Responden Atas Pertanyaan Pelayanan
P1 P2 P3 P4 P5
1 1 2 3 2
2 2 2 2 2
3 2 2 2 3
1 1 1 1 1
2 2 3 3 3
1 1 1 1 2
4 4 3 4 4
1 1 1 1 1
1 1 2 2 1
3 3 3 3 3
3 2 2 3 3
3 1 3 3 2
1 1 1 1 1

Langkah-langkahnya:
1. Mencari uji validitas masing-masing item pertanyaan
Jawaban Responden Atas Pertanyaan Pelayanan
Sampel Total
P1 P2 P3 P4 P5
1 4 4 1 4 4 17
2 1 1 2 4 4 12
3 1 1 2 4 4 12
4 2 2 3 4 2 13
5 4 1 2 1 2 10
6 3 3 2 2 2 12
7 4 4 4 4 4 20
8 3 2 2 3 2 12
8 2 2 3 2 2 11
10 2 1 3 4 3 13
11 1 1 1 3 2 8
12 1 1 1 2 2 7
13 1 1 1 2 2 7

25
Jawaban Responden Atas Pertanyaan Pelayanan
Sampel Total
P1 P2 P3 P4 P5
14 3 1 2 2 2 10
15 2 2 2 1 2 9
16 3 2 2 4 3 14
17 3 3 2 3 3 14
18 1 1 2 3 2 9
19 2 2 2 2 2 10
20 3 2 2 2 3 12
21 1 1 1 1 1 5
22 2 2 3 3 3 13
23 1 1 1 1 2 6
24 4 4 3 4 4 19
25 1 1 1 1 1 5
26 1 1 2 2 1 7
27 3 3 3 3 3 15
28 3 2 2 3 3 13
29 3 1 3 3 2 12
30 1 1 1 1 1 5

2. Mencari validitas P1
Diketahui:
Sampel X Y X.X Y.Y X.Y
30 66 332 180 4112 827
Maka:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
(30 × 827)(66 × 332)
𝑟= = 0,782
√[(30 × 180) − (66 × 66)][(30 × 4112)(332 × 332)]

3. Mencari validitas P2
Diketahui:
Sampel X Y X.X Y.Y X.Y
30 54 332 126 4112 689

26
Maka:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
(30 × 689)(54 × 332)
𝑟= = 0,814
√[(30 × 26) − (54 × 54)][(30 × 4112)(332 × 332)]

4. Mencari validitas P3
Diketahui:
Sampel X Y X.X Y.Y X.Y
30 61 332 143 4112 740
Maka:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
(30 × 740)(61 × 332)
𝑟= = 0,713
√[(30 × 143) − (61 × 61)][(30 × 4112)(332 × 332)]

5. Mencari validasi P4
Diketahui:
Sampel X Y X.X Y.Y X.Y
30 78 332 238 4112 960
Maka:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
(30 × 960)(78 × 332)
𝑟= = 0,780
√[(30 × 238) − (78 × 78)][(30 × 4112)(332 × 332)]

6. Mencari validasi P5
Diketahui:
Sampel X Y X.X Y.Y X.Y
30 73 332 203 4112 896
Maka:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2

27
(30 × 896)(73 × 332)
𝑟= = 0,836
√[(30 × 203) − (73 × 73)][(30 × 4112)(332 × 332)]

Hasil uji validitas


Dengan menggunakan jumlah responden sebanyak 30 maka nilai r tabel dapat
diperoleh melalui tabel r dengam df (degree of freedon) = n-2, jadi df = 30-2=28
maka nilai r tabel=0,312. r tabel dapat dilihat pada tabel r pada lampiran. Butir
pertanyaan dikatakan valid jika nilai r hitung > r tabel. Hasil pengujian validitas
dapat dilihat sebagai berikut:
Item pertanyaan r hitung r tabel Keterangan
P1 0,782 0,312 Valid
P2 0,814 0,313 Valid
P3 0,713 0,314 Valid
P4 0,780 0,315 Valid
P5 0,836 0,316 Valid

2.1.6. Pengertian Reliabilitas


Menurut Matondang (2009) Reliabilitas berasal dari kata reliability berarti
sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu hasil pengukuran
dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap
kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama,
selama aspek yang diukur dalam diri subyek memang belum berubah
Menurut Sujarweni (2012:186) Reabilitas (keandalan) merupakan ukuran
suatu kestabilan dan konsitensi responden dalam hal yang berkaitan dengan
kontruk-kontruk pertanyaan yang merupakan dimensi suatu variable dan disusun
dalam bentuk suatu kuisioner.
Menurut Nawawi (2006:190) Realibilitas atau tingkat ketetapan
(consistency atau keajegan) adalah tingkat kemampuan instrument penelitian
untuk mengumpulkan data secara tetap dari sekelompok individu. Instrument
yang memiliki tingkat reliabilitas tinggi cenederung menghasilkan data yang sama
tentang suatu variable atau unsur-unsurnya, jika diulangi pada waktu yang
berbeda pada sekelompok individu yang sama. Contoh yang sederhana dapat
dilihat pada timbangan yang akan menjadi alat pengukur yang reliable, apabila

28
dalam menimbang sebungkus gula putih, yang bila mana diulangi hasilnya sama.
Jika gula putih itu ditimbang ternyata beratnya 2kg, kemudian diulang-ulangi lagi
pada hari-hari berikutnya, ternyata timbangan tetap menunjukkan beratnya
2kg.Timbangan seperti itu termasuk alat pengukur berat yang reliable (tingkat
reliabilitasnya tinggi).
Dengan demikian berarti realibilitas mengandung pengertian pokok sebagai
berikut :
1. Gejala atau unsur-unsur di dalam gejala yang diungkapkan dalam
pengukuran pertama, ternyata tidak berubah atau sama (tetap bertahan) pada
pengukuran kedua dan seterusnya, jika pengukuran dilakukan dengan
mempergunakan instrument (alat) yang sama.
2. Hasil pengukuran sebagai data penelitian yang kedua dan seterusnya,
bersifat ekuivalen (memiliki variasi yang sama) dengan hasil pengukuran
sebelumnya atau yang pertama, jika pengukuran dilakukan dengan
mempergunakan instrument yang sama.
Reliabilitas instrument penelitian hanya dapat diukur dengan perhitungan
statistic, berbeda dengan validitas yang terdiri dari beberapa jenis. Perhitungan
statistic yang dipergunakan adalah rumus kolerasi, dengan mempergunakan data
dari hasil uji coba (try out) angket atau test, dalam bentuk data kuantitatif. Data itu
merupakan distribusi nilai yang bersifat data interval.
Dari uraian-uraian diatas jelas bahwa instrument penelitian dikatakan
reliable apabila dalam mengukur gejala sebagai data penelitian, mampu
memberikan hasil yang relative tetap setiap kali dipergunakan pada sekelompok
individu yang sama. Dengan kata lain instrumen penelitian yang memiliki tingkat
reabilitas yang tinggi, berarti memiliki ketetapan atau keajegan (consistency)
hasilnya, meskipun digunakan secara berulang.
Menurut Matondang (2009) Konsep reliabilitas dalam arti reliabilitas alat
ukur berkaitan erat dengan masalah kekeliruan pengukuran. Kekeliruan
pengukuran sendiri menunjukkan sejauh mana konsistensi hasil pengukuran
terjadi apabila dilakukan pengukuran ulang terhadap kelompok subyek yang
sama. Sedangkan konsep reliabilitas dalam arti reliabilitas hasil ukur berkaitan
erat dengan kekeliruan dalam pengambilan sampel yang mengacu pada

29
konsistensi hasil ukur apabila pengukuran dilakukan ulang pada kelompok yang
berbeda.
Menurut Kumar (1999:99) Konsep reliabilitas dalam kaitannya dengan
instrument penelian memiliki arti yang sama : jika alat penelitian konsisten dan
stabil, maka dapat diprediksi dan akurat, dikatakan dapat diandalkan. Besar
tingkat konsistensi dan stabilitas dalam instrument, yang hebat adalah reliabilitas.
Oleh karena itu skala atau tes dapat ditinjau kembali jika pengukuran berulang
yang dilakukan olehnya kondisi konstan akan memberikan hasil yang sama. Hal
ini dinyatakan dalam :
The concept of reliability in relation to a research instrument has a
similar meaning if a research tool is consistent and stable, hence predictable
and accurate, it is said to be reliable. The great the degree of consistency and
stability in an instrument, to great is reliability. Therefore a scale or test is
reable to the extent that repeat measurements made by it under constant
condition will give the result.

2.1.7. Teknik Perhitungan Reliabilitas


Menurut Nawawi (2006:190) Tingkat realibilitas dapat diukur untuk setiap
item test atau angket dan dapat pula secara keseluruhannya. Dalam analysis item
untuk membuat test atau angket yang bersifat standar, relibilitas setiap item perlu
dihitung. Sedang dalam penelitian biasanya cukup dengan menghitung reliabilitas
instrumen secara keseluruhan.
Untuk menghitung reliabilitas instrumen secara keseluruhan dapat ditempuh
perhitungan korelasi, dengan berbagai cara sebagai berikut:
1. Korelasi belah dua (korelasi genap ganjil)
Distribusi nilai yang dikorelasikan dalam cara ini diperoleh dari hasil uji
coba satu angket atau test, yang dibuat menjadi dua distribusi nilai.
Distribusi nilai yang pertama diperoleh dari nilai item-item genap, sedang
distribusi nilai yang kedua berasal dari item-item ganjil. Distribusi pertama
berfungsi sebagai predictor dan kedua menjadi kriterium. Oleh karena
distribusi nilai awal dipecah atau dibagi menjadi dua, maka korelasi ini
disebut juga korelasi belah dua atau korelasi setegah-setengah.
Contoh dibawah ini tetap mempergunakan data fiktif yang telah digunakan
dalam perhitungan validitas dalam uraian-uraian terdahulu.
Tabel 1. Persiapan perhitungan reliabilitas

30
SUBYEK GANJIL(X) GENAP(Y) R(X) R(Y) D D2
A 21 38 3,00 14,00 -11,00 121,00
B 23 36 4,00 13,00 -9,00 81,00
C 24 17 5,00 2,50 2,50 6,25
D 31 25 11,00 6,50 4,50 20,25
E 30 27 9,50 8,50 1,00 1,00
F 35 33 14,00 12,00 2,00 4,00
G 28 30 7,00 11,00 -4,00 16,00
H 25 21 6,00 5,00 1,00 1,00
I 33 27 12,00 8,50 3,50 12,25
J 14 12 2,00 1,00 1,00 1,00
K 29 17 8,00 2,50 5,50 30,25
L 30 20 9,00 4,00 4,50 20,25
M 34 29 13,00 10,00 3,00 9,00
N 11 25 1,00 6,50 5,50 30,25
JUMLAH 353,50

Perhitungan mempergunakan rumus korelasi data jenjang berikut :


2
6∑𝐷
𝑟𝑔𝑔 = 1 − 𝑁 (𝑁 2 −1)
6 𝑥 353,50
𝑟𝑔𝑔 = 1 − 14 (142 −1)

𝑟𝑔𝑔 = 1 − 0,78 = 0,22

Hasil perhitungan itu dimasukkan dalam rumus untuk mendapatkan


koefisien korelasi variable X dan variable Y sebagai berikut :
2(𝑟𝑔𝑔 )
𝑟𝑋𝑌 =
1 + 𝑟𝑔𝑔
2 𝑋 0,22
𝑟𝑋𝑌 =
1 + 0,22
0,44
𝑟𝑋𝑌 =
1,22
𝑟𝑋𝑌 = 0,36
Koefesien korelasi yang diperoleh ternyata lebih kecil daripada indeks tabel
r pada N-1 = 14 -1 = 13 taraf signifikansi 90% sebesar ) 0,533. Dengan kata lain
0,36 < 0,533 (non signifikan).
Hasil perhitungan itu menunjukkan bahwa instrument penelitian yang
dipergunakan tidak reliable atau tingkat reliabilitasnya rendah. Untuk itu

31
instrument perlu direvisi (diperbaiki) dan setelah itu perlu pula diuji cobakan lagi,
karena hasil rekontruksi yang pertama instrument tidak dapat dipergunakan
(kurang baik sebagai alat pengumpul data).

2. Pengulangan Test (Tes-Retest)


Test sebagai instrument penelitian dalam teknik pengukuran, dapat
diketahui tingkat reliabilitasnya dengan menghitung korelasi antara dua
distribusi nilai test yang sama dan dari obyek yang sama pula. Untuk itu
dalam uji coba, test yang sama dikerjakan dua kali atau secara berulang
pada waktu yang berbeda. Pengulangan dimaksudkan untuk memperoleh
dua distribusi nilai dari test yang variasinya sama, yang dilakukan pada
waktu yang berbeda meskipun tidak terlalu lama jaraknya. Dibawah ini
diberikan contohnya dengan data fiktif.
Dalam penelitian tentang tingkat kemampuan bahasa inggris untuk
memangku suatu pekerjaan bagi calon tamatan SMA. Test yang akan
dipergunakan diuji-cobakan pada siswa semester akhir dikelas III SMA
sebanyak 20 orang secara berulang. Dari uji coba itu diperoleh dua
distribusi nilai (skor), yang dimasukkan dalam tabel sebagai berikut :

Tabel 2. Persiapan perhitungan reliabilitas dengan perhitungan test-retest


TEST I TEST II
SUBYEK X2 Y2 XY
(X) (Y)
Nurmala 20 29 400 841 580
Sugono 20 29 400 841 580
Muslimin 20 11 400 121 220
Rukmana 40 26 1.600 676 1.040
Solihin 44 37 1.936 1.369 1.628
Rakhmah 52 48 2.704 2.304 2.496
Kardiman 16 28 256 984 448
Abdul Razak 16 20 256 400 320
Siti 48 40 2.304 1.600 1.920
Ponirah 12 10 144 100 120
Saginem 28 26 784 676 728
M.Syafei 20 30 400 900 600
Salekan 48 40 2.304 1.600 1.920
Mardiana 20 26 400 676 520
Ali Marjan 35 40 1.225 900 1.400

32
TEST I TEST II
SUBYEK X2 Y2 XY
(X) (Y)

Karmila 52 48 2.704 2.304 2.496


Fatimah 40 40 1.600 1.600 1.600
Gozali 36 38 1.296 1.444 1.368
Edy Suherman 25 15 625 225 375
Hanifah 46 50 2.116 2.500 2.300
Jumlah 638 631 23.854 22.061 22.639

Dari tabel diatas diperoleh data :


N= 20 ΣX = 638 ΣY = 631
ΣX2 = 23.854 ΣY2 = 22.061
XY = 22.659
Dihitung dengan rumus korelasi angka kasar sebagai berikut :
𝑁𝛴𝑋𝑌 − (𝛴𝑋)(ΣY)
𝑟𝑥𝑦 =
√{𝑁𝛴𝑋 2 − (ΣX)2 }{𝑁𝛴𝑌 2 − (ΣY)2 }

20 𝑋 22.659 − (638)(631)
𝑟𝑥𝑦 =
√{20 𝑋 23.854 − (638)2 }{20 𝑋 22.061 − (631)2 }
𝑟𝑥𝑦 = 0,91
Koefisien korelasi reliabilitas yang diperoleh (𝑟𝑋𝑌 ) adalah 0,91. Koefesien
korelasi ini cukup tinggi, dimungkinkan terjadi karena subyek uji coba yang sama,
mengerjakan satu test dua kali. Dengan demikian berarti test memiliki realibilitas
yang tinggi, mengingat koefisien korelasi yang diperoleh lebih besar dari indeks
tabel pada (N-1) = 20 – 1 = 19 yang menunjukkan angka 0, 456 (alpha = 0,05).

3. Penggunaan Test yang sejajar


Perhitungan reliabilitas ini disebut juga penggunaan test yang
seimbang atau Bentuk Alternatif atau bentuk Keseimbangan Rasional.
Untuk keperluan ini seorang peneliti harus membuat atau merekontruksi dua
buah test, meskipun hanya salah satu diantaranya yang akan dipergunakan
sebagai alat (instrument) pengumpulan data. Test disusun dengan bentuk
dan mempergunakan bahan yang sama. Jika test yang pertama hanya berisi

33
item pilihan berganda (multiple choice items), untuk test kedua harus sama
bentuknya. Demikan juga jika materi test pertama diambil dari buku A
karangan saudara ALI Bab I sampai Bab X (terakhir), maka untuk test yang
kedua bahannya harus sama. Jumlah item test pertama dan kedua, sebaiknya
sama, jika yang pertama sebanyak 100 item, maka yang kedua juga 100
item. Perbedaan antara kedua test tersebut, terletak pada rumusan itemnya
yang semuanya berbeda. Untuk item pertama, kedua, ketida dan seterusnya
pada test yang kedua tidak harus menanyakan hal yang sama seperti pada
item pertama, kedua, ketiga dan seterusnya pada test pertama. Akan tetapi
perlu diupayakan agar terdapat kesamaan dalam ranah yang diungkapkan.
jika item pertama bersifat mengungkapkan ranah penguasaan pengetahuan,
sebaiknya sama antar kedua test tersebut. Demikian juga item kedua, ketiga
dan seterusnya yang mungkin mengungkapkan ranah pemahaman
(pengertian) atau ranah analisis, sintesis dan sebagainya.

Berdasarkan uraian diatas berarti test pertama berfungsi sebagai predictor


(yang akan di prediksi) dan dipersiapkan sebagai alat (instrument) penelitian.
Sedang test yang kedua sebagai kriterium (tolak ukur) untuk mengetahui tingkat
reliabilitas test pertama. Kedua test itu setelah siap diberikan pada sejumlah
subyek yang sama, sebagai kegiatan uji coba (try out), yang akan menghasilkan
dua distribusi nilai (skor). Waktu mengerjakan test itu oleh subyek harus berbeda,
meskipun tidak terlalu lama jaraknya.
Untuk mengetahui tingkat reabilitas test tersebut, dilakukan perhitungan
korelasi guna memperoleh korelasi. Perhitungan dapat dilakukan dengan
mempergunakan rumus-rumus korelasi banyak jumlahnya, yang dua diantaranya
telah diuraikan terlebih dahulu. Dengan mempergunakan salah satu rumus
korelasi itu, hubungan linieritas antar kedua distribusi nilai dapat diketahui
melalui koefisien korelasi yang diperoleh. Koefesien korelasi itu dibandingkan
dengan indeks tabel r product moment, untuk mengetahui signifikansinya, sebagai
ukuran reabilitas test yang akan dijadikan sebagai alat (instrument) pengumpulan
data.
Sugiono (2016:354) Pengujian reliabilitas instrumen dapat dilakukan secara
eksternal maupun internal. Secara eksternal pengujian dapat dilakukan dengan

34
test-retest (stability), equivalent, dan gabungan keduanya. Secara internal
reliabilitas instrumen dapat diuji dengan menganalisis konsistensi butir-butir yang
ada pada instrumen dengan teknik tertentu.
1. Test-retest
Instrumen penelitian yang reliabilitas diuji dengan test-retest dilakukan
kegiatan dengan cara mencobakan instrumen beberapa kali pada responden.
Jadi dalam hal ini instrumennya sama, respondennya sama dan waktunya
berbeda. Reliabilitas diukur dari koefisien korelasi antara percobaan
pertama dengan yang berikutnya. Bila koefisien korelasi positif dan
signifikan maka instrumen tersebut sudah dinyatakan reliabel. Pengujian
cara ini sering juga disebut stability.
2. Pengujian reliabilitas instrumen yang kedua adalah dilakukan dengan
membuat dua instrument yang ekuivalen
Instrument yang ekuivalen adalah pertanyaan yang secara bahasa berbeda,
tetapi maksudnya sama. Sebagai contoh (untuk satu butir saja); Berapa
tahun pengalaman kerja Anda dilembaga ini ? Pernyataan tersebut dapat
ekuivalen dengan pernyataan berikut. Tahun berapa Anda mulai bekerja
dilembaga ini?
Pengujian reliabilitas instrument dengan cara ini cukup dilakukan sekali,
tetapi instrumennya dua, pada responden yang sama, waktu sama,
instrument berbeda. Reliabilitas instrument dihitung dengan cara
mengkorelasikan antara data instrument yang satu dengan data instrument
yang satu dengan data instrument yang dijadikan equivalen.Bila korelasi
positif dan signifikan, maka instrument dapat dinyatakan reliable.

3. Gabungan
Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrument
yang equivalen itu beberapa kali, ke responden yang sama. Jadi cara ini
merupakan gabungan pertama dan kedua. Reliabilitas instrument dilakukan
dengan mengkorelasikan dua instrument, setelah itu dikorelasikan pada
pengujian kedua, dan selanjutnya dikorelasikan secara silang. Hal ini dapat
digambarkan sebagai berikut :

35
Instrument Equivalen

Skor Data Instrumen Pertama Skor Data Instrumen Kedua

Skor Data Instrumen Pertana Skor Data Instrumen Kedua

Gambar. Pengujian Reliabilitas dengan teknik gabungan.

Jika dengan dua kali pengujian dalam waktu yang berbeda, maka akan dapat
dianalisis keenam koefesien reliabilitas. Bila keenam koefesien korelasi itu
semuanya positif dan signifikan, maka dapat dinyatakan bahwa instrument
tersebut reliable.

4. Interval Consistency
Pengujian reliabilitas dengan interval consistency, dilakukan dengan cara
mencobakan instrument sekali saja, kemudian yang diperoleh dianalisis
dengan teknik tertentu. Hasil analisis dapat digunakan untuk memprediksi
reliabilitas instrument. Pengujian reliabilitas instrument dapat dilakukan
dengan teknik belah dua dari Spearman Brown (split half), KR 20, KR 21
dan Anova Hoyt.
Berikut diberikan rumus-rumus dan contoh perhitungannya.
a. Rumus Spearman Brown :
2𝑟𝑏
𝑟𝑖 =
1 + 𝑟𝑏
Dimana :
ri = reliabilitas internal seluruh instrument
rb= korelasi product moment antara belahan pertama dan kedua

b. Rumus KR 20 (Kuder Richardson) :


𝑘 𝑠𝑡2 −∑ 𝑝𝑖 𝑞𝑖
𝑟𝑖 = { }
(𝑘−1) 𝑠𝑡2

36
Dimana :
k = jumlah item dalam instrument
pi = proposi banyaknya subyek yang menjawab pada item 1
qi = 1 - pi
st2= varians total

Contoh :
Suatu instrument yang akan digunakan untuk penelitian, akan diuji
reliabilitasnya, karena skor yang dipergunakan dalam instrument tersebut
menghasilkan skor dikotomi (1 dan 0), maka instrument akan dianalisis dengan
rumus KR 20. Dari percobaan kepada 10 orang responden menghasilkan data
sebagai berikut :
Tabel 3. Penolong untuk uji reliabilitas instrument KR 20
No. Item no. Xt Xt2
Res 1 2 3 4 5 6 7 8 9 10
1 1 1 0 0 0 1 0 0 1 0 4 16
2 1 1 1 0 0 1 0 0 0 0 4 16
3 1 0 0 1 0 1 0 0 0 0 3 9
4 1 1 1 0 0 1 0 1 0 0 5 25
5 1 1 1 1 1 1 1 1 1 0 9 81
6 1 1 1 1 1 0 1 1 1 1 8 64
7 1 1 1 1 1 0 1 1 1 0 8 64
8 1 0 1 0 1 0 1 0 0 1 5 25
9 1 1 1 1 0 0 1 0 0 1 6 36
10 0 1 0 1 1 0 1 0 0 1 5 25
Np 9 8 7 6 5 5 6 4 4 3 57 361
p 0,90 0,80 0,70 0,60 0,50 0,50 0,60 0,40 0,40 0,30
q 0,10 0,20 0,30 0,40 0,50 0,50 0,40 0,60 0,60 0,70
Pq 0,09 0,16 0,21 0,24 0,25 0,25 0,24 0,24 0,24 0,21 Σpq=
2,13
Sebelum harga-harga tersebut dimasukkan dalam rumus, maka harus kita
hitung varians totalnya terlebh dahulu.
𝑥2
𝑠𝑡2 =
𝑛
(∑ 𝑥𝑡 )2
𝑥𝑡2 = ∑ 𝑥𝑡2 −
𝑛
2 (57)2 2
𝑥𝑡 = 361 – 10 𝑥𝑡 = 361
𝑥2 36,1
st 2 = = = 3,61
𝑛 10

37
Selanjutnya harga tersebut kita masukkan dalam rumus KR 20 :
10 3,61 − 2,13
𝑟𝑖 = { } = 3,61
10 − 1 10

c. Rumus KR 20
𝑘 𝑀 (𝑘 − 𝑀)
𝑟𝑖 = {1 − }
(𝑘 − 1) 𝑘 𝑠𝑡2
Dimana :
K = jumlah item dalam instrument
M = mean skor total
St2 = varians total
Contoh :
Apabila data tabel contoh KR 20 akan diuji reliabilitasnya dengan KR 21,
maka kita tinggal menghitung M (mean skor total). Harga M dihitung dengan
rumus :
∑ 𝑥1 57
M= = 10 = 5,7
𝑛

Selanjutnya diperoleh harga M, dengan tabel analisis butir yang sudah ada
harga ri dapat dihitung :
𝑘 𝑀 (𝑘 − 𝑀)
𝑟𝑖 = {1 − }
(𝑘 − 1) 𝑘 𝑠𝑡2
10 5,7 (10 − 5,7)
𝑟𝑖 = {1 − }
(10 − 1) 10 (3,6)
𝑟𝑖 = 0,357

Ternyata harga ri dari perhitungan dengan rumus KR 21 lebih rendah dari


harga ri dengan rumus KR 20. Memang perhitungan reliabilitas dengan
menggunakan rumus KR 20 cenderung memberikan harga yang lebih tinggi, kan
tetapi kelemahannya adalah peneliti harus mencari nilai Σpq yang langkahnya
lebih lama dan perlu ketelitian.
d. Analisis varians Hoyt (Anova Hoyt)
𝑀𝐾𝑒
𝑟𝑖 = 1 −
𝑀𝐾𝑠

38
Dimana :
MKs = mean kuadrat antara subyek
Mke = mean kuadrat kesalahan
ri = reliabilitas

Contoh :
Jika data Tabel. 3 akan diuji reliabilitasnya dengan rumus Anova Hoyt,
diperlukan langkah-langkah perhitungan sebagai berikut :
1. Menghitung Jumlah Kuadrat Total
(∑ 𝑋𝑡𝑜𝑡 )
JKtot = ΣXtot - 𝑛,𝑘

2. Menghitung Jumlah Kuadrat Item


∑(𝑁𝑝1 )2 (∑ 𝑋𝑡𝑜𝑡 )
JKite = -
𝑛 𝑛,𝑘

3. Menghitung Jumlah Kuadrat Subyek


∑(𝑋𝑡𝑜𝑡 )2 (∑ 𝑋𝑡𝑜𝑡 )
JKsub = -
𝑘 𝑛,𝑘

4. Menghitung Jumlah Kuadrat Interaksi (item x subyek)


JKtot = JKtot - JKite - JKsub
Kemudian jumlah kuadrat-kuadrat tersebut dimasukkan ke dalam tabel
Analisis Varians sebagai berikut :
Analisa varians hoty
Sumber Variasi JK Dk MK ri
Antara Item(I) Jki k-1 Mki
Antara Subyek (s) JKs n-1 MKs MKs-MKs/Mks

Interaksi(I*s) JKint (k-1)(n-1) Mke

Total Jktot (kn-1)

Berdasarkan pada tabel analisis butir (Tabel 9.4 harga-harga tersebut dapat
dihitung).
(57)2
JKtot = 57 - = 24,51
100

92 +82 +72 +62 +52 +52 +62 +42 +42 +32 (57)2
JKite = - = 3,21
10 100

39
42 +42 +32 +52 +92 +82 +52 +62 +52 (57)2
JKsub = - = 3,21
10 100

JKint = 24,51 – 3,21 – 3,61 = 17,69

Tabel . Penolong analisa varians HOYT


Sumber Variasi JK Dk MK ri
Antara Item(I) 3,21 9 0,357
0,401 − 0,48
Antara Subyek (s) 3,61 9 0,401
0,401

Interaksi(I*s) 17,69 81 0,218

Total JKt (n-k-1) 0,456

Harga koefisien reliabilitas dapat dihitung dengan rumus :


𝑀𝐾𝑒 0,218
𝑟𝑖 = 1 − = [1 − ] = 0,456
𝑀𝐾𝑠 0,401
Jadi, koefesien reliabilitasnya = 0,456

e. Alfa Cronbach
Pengujian reliabilitas dengan teknik alfa Cronbah dilakukan untuk jenis data
interval/essay. Rumus koefisien reliabilitas Alfa Cronbah
𝑘 ∑ 𝑠𝑖2
𝑟𝑖 = {1 − 2 }
𝑘−1 𝑠𝑖
Dimana :
k = mean kuadrat antara subyek
∑ 𝑠𝑖2 = mean kuadrat kesalahan
𝑠𝑖2 = varians total

Rumus untuk varians total dan varians item :


∑ 𝑠𝑖2 (∑ 𝑋𝑡 )2
𝑠𝑖2 = −
𝑛 𝑛2
𝐽𝐾𝑖 𝐽𝐾𝑠
𝑠𝑖2 = − 2
𝑛 𝑛

40
Dimana :
JKi = jumlah kuadrat seluruh skor item
JKs = jumlah kuadrat subyek
Contoh :
Misalnya hasil uji coba instrumen yang berupa angket dengan skala 1 s/d
menghailkan data sebagai berikut :
Tabel 4. Hasil uji coba instrument berupa angket
No Item no Xt Xt2
1 2 3 4 5 6 7 8 9 10
1 1 4 3 3 4 4 3 2 1 3 28 784
2 3 4 3 2 3 3 3 3 2 3 29 841
3 2 3 4 3 3 4 3 4 2 2 30 900
4 4 4 4 4 3 4 3 4 4 4 38 1.444
5 4 3 3 4 2 4 3 4 2 1 30 900
6 3 4 4 3 2 4 3 3 3 3 32 1.024
7 4 3 3 3 3 4 4 2 3 3 32 1.024
8 4 4 4 2 3 3 4 3 3 3 33 1.089
9 3 3 3 4 3 3 2 4 4 2 31 961
10 2 4 4 3 3 3 2 3 3 3 30 900
30 36 35 31 29 36 30 32 27 27 313 9.867
900 1296 1225 961 841 1296 900 1.24 729 729 9.901
Dengan harga-harga pada table 1, maka :
∑ 𝑋𝑡2 (∑ 𝑋𝑡 )2
𝑠𝑖2 = −
𝑛 𝑛2
9.867 (313)2
𝑠𝑖2 = − =7,01
10 𝑛2
𝐽𝐾𝑖 𝐽𝐾𝑠
𝑠𝑖2 = − 2
𝑛 𝑛
1.039 9.901
𝑠𝑖2 = − = 4,89
10 102

Jika dimasukkan dalam rumus Alfa Cronbah diperoleh :


10 4,89
𝑟𝑖 = {1 − } = 0,34
10 − 1 7,01
Jadi koefisien reabilitas instrument = 0,34

41
Menurut Matondang (2009), realibilitas mempermasalahkan sejauh mana
hasil atau suatu pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat
dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap
kelompok subyek yang sama, diperoleh hasil pengukuran yang relative sama.
Penentuan koefisien reabilitas instrument untuk skor butir dikotomi digunakan
rumus KR-20, sedang untuk skor politomi digunakan rumus alpha. Interpretasi
terhadap koefesien reabilitas merupakan interprestasi relative, artinya tidak ada
batasan mutlak yang menunjukkan berapa angka koefisien minimal yang harus
dicapai agar suatu pengukuran dapat disebut reliable. Namun memberikan
informasi tentang hubungan variasi skor teramati dengan varians skor sejati
kelompok individu.
2.2. Kajian kritis
Instrumen penelitian adalah alat bantu yang digunakan oleh peneliti untuk
mengumpulkan data penelitian. Instrument penelitian yang digunakan peneliti
bergantng pada jenis data yang dibutuhkan pada penelitiannya yang ditentukan
oleh rumusan masalah penelitian. Mutu istrumen akan menentukan mutu data
yang digunakan dalam penelitian. Instrumen yang akan digunakan pada penelitian
harus di sesuaikan dngan permasalahan penelitian dan variable penelitian.
Jenis–jenis instrumen penelitian hampir sama dengan jenis intrumen
evaluasi, yaitu instrumen tes dan nontes. Yang mana tes bersifat mengukur
mengukur dan nontes bersifat menghimpun. Jenis terdiri dari beberapa jenis, yaitu
tes tertulis, tes lisan dan tes tindakan. Sedangkan nontes terdiri dari angket,
observasi, wawancara, skala sikap, skala minat daftar cek, skala penilaian, dan
studi dokumentasi. Tes merupakan teknik pngukuran yang didalamya terdapat
berbagai pertanyaan, pernyataan, atau serangkaian tugas yang harus dikerjakan
oleh responden. Tes tertulis adalah tes yang menuntut jawaban responden dalam
bentuk tulisan responden. Tes tertulis ada dua bentuk yaitu, bentuk uraian dan
bentuk objektif. Setiap jenis atau bentuk tes mempunyai tujuan dan fungsi
masing-masing. Salah satu bentuk tes yang banyak digunakan dalam penelitian
adalah tes objektif, tes ini sering digunakan karena jawabannya antara benar dan
salah dan skornya antara 1 dan o. Mengapa disebut tes objektif karena

42
penilaiannya objektif. Siapapun yang mengkoreksi jawaban tes objektif hasilnya
kan tetap sama karena kunci jawabannya sudah jelas dan pasti.
Kelebihan saat peneliti menggunakan tes objektif ialah a) seluruh ruang
lingkup (scope) materi dapat dinyatakan pada item atau soal,lebih banyak materi
yang dapat diinyatakan dalam soal b) kemungkinan jawaban spekulatif dalam
ujian dapat dihindari, c) jawaban bersifat mutlak, jadi penilaian dapat dilakukan
secara objektif, d) pengoreksian dapat dilakukan siapa saja, sekalipun tidak
mengetahui dan mengusai materinya, e) pemberian skor dapat dilakukan dengan
mudah dan cepat, f) korektor tidak akan terpengaruh oleh baik-buruknya tulisan,
dan g) tidak mungkin terjadi dua orang responden yang jawabannya sama, tetapi
mendapat skor yang berbeda. Sedangkan kelemehannya saat menggunakan tes
objektif ialah , a) mengkontruksi soalnya sangat sulit, b) membutuhkan waktu
yang lama, c) ada kemungkinan responden mencontoh jawaban orang lain dan
berfikir pasif, dan d) umumnya hanya mampu mengukur proses mental yang
dangkal.
Instrumen penelitian nontes ialah angket, yaitu instrumen yang berisi
serangkaian pertanyaan dan penyataan untuk mendapat informasi terkalit
penelitian ynag dilakukan peneliti, responden harus menjawab ssecara bebas
sesuai dengan pendapat responden. Angket memiliki kesamaan degan wawancara
hanya saja angket dengan tulisan sedangkan wawancara dilakukan secara
langsung. Angket terdiri dari dua bentuk antara lain angket bentuk berstruktur dan
angket tidak berstuktur, angket berstruktur ialah angket yang sudah menyediakan
jawaban sehingga responden hanya menjawab dengan jawaban yang telah
disedakan atau tidak dapat menjawab perntanyaan atau pernyataan dngan bebas.
Sedangkan angket tidak berstruktur ialah angket yang memberikan jawaban secara
terbuka atau responden dapat menjawab pertanyaan secara bebas, hanya saja saat
pengkoreksian bentuk tidak berstuktur tidak dapat secara objektif karena
jawabannya tidak dapat dianalisis secara analisis.
Instrumen penelitian selanjutnya adalah observasi, yaitu teknik
pengumpulan data yang dilakukan dengan pengamatan dan pencatatan secara
sistematis, logis, objektif dan rasional mengenai berbagai fenomena, baik dalam
situasi yang sebenarnya maupun dalam situasi buatan untuk mencapai tujuan

43
tertentu. Teknik observasi sering digunakan dalam penelitian kualitatif. Tujuan
utama observasi yaitu a) untuk mengumpulkan data dan informasi mengenai suatu
fenomena, baik yang berupa peristiwa maupun tindakan, baik dalam situasi yang
sesungguhnya maupun dalam situasi buatan, b) untuk mengukur perilaku,
tindakan, dan proses atau kegiatan yang sedang dilakukan, interaksi antara
responden dan lingkungan, dan faktor-faktor yang dapat diamati lainnya, terutama
kecakapan sosial.
Wawancara ialah teknik pengambilan data yang dilakukan dengan cara
bertanya-jawab dengan responden yang dilakukan secara langsung maupun secara
tidak langsung.supaya saat wawancara kita mendapat data yang kita butuhkan dari
wawancara tersebut kita harus memperhatikan beberapa hal, yaitu harus
membangun hubungan baik antara pewawancara dan orang yang
diwawancarai,saat wawancara jangan terlalu kaku, tunjukkan sikap yang bebas,
ramah, terbuka, dan adaptasikan diri dengannya supaya responden dapat dnegan
rileks memberikan jawaban dari pertanyaan kita, hilangkan prasangka-prasangka
yang kurang baik, sehingga pertanyaan-pertanyaan yang diajukan bersifat netral,
dan pertanyaan hendaknya jelas, tepat dengan bahasa yang sederhana dan mudah
dimengerti.
Sikap merupakan kesiapan seseorang memperlakukan sesuatu, baik itu
orang lain benda ataupun lingkungannya, maka skala penilaian ialah skala untuk
menilai sikap seseorang terhadap suatu objek. Kesiapan itu mempunyai aspek-
aspek kognitif, afektif, dan kecenderungan bertindak yang dapat disimpulkan dari
perilaku individu tersebut. Dalam mengukur sikap, perlu diperhatikan tiga
komponen sikap, yaitu kognisi (pengetahuan), afeksi (perasaan) dan konasi
(kecenderungan bertindak) seseorang terhadap objek.
Minat adalah dorongan atau aktivitas mental yang dapat merangsang
perasaan senang tehadap sesuatu. bisa berupa orang, benda, kegiatan, pengalaman,
dan lain-lain yang dapat dijadikan sebagai stimulus yang memerlukan respon
terarah. Minat sangat berhubungan dengan sikap, misalnya jika materi pelajaran
diminati peserta didik, maka sikap peserta didik cenderung memperhatikan
pelajaran tesebut. Hal-hal yang dapat mempengaruhi munculnya minat,
diantaranya seperti motivasi, belajar, materi pelajaran, keluarga, teman pergaulan,

44
cita-cita, dan lain-lain. Berminat tidaknya seseorang terhadap sesuatu dapat dilihat
dari beberapa indicator, antara lain perhatian, perasaan, motivasi, dan sikap.
Daftar cek adalah suatu daftar yang berisi subjek dan aspek-aspek yang akan
diamati. Dengan daftar cek yang dibuat memungkinkan seseorang mencatat tiap-
tiap kejadian (betapapun kecilnya), tetapi dianggap penting. Ada bermacam-
macam aspek perbuatan yang biasanya dicantumkan dalam daftar cek, kemudian
peneliti sebagai observer tinggal memberikan tanda cek (v) pada tiap-tiap aspek
tersebut sesuai dengan hasil pengamatannya. Daftar cek banyak manfaatnya,
antara lain, a) dapat membantu peneliti untuk mengingat-ingat apa yang harus
diamati, b) dapat memberikan informasi kepada stakeholder.
Dalam skala penilaian, fenomena-fenomena yang akan diobservasi itu
disusun dalam tingkatan-tingkatan yang telah ditentukan. Jadi tidak hanya
mengukur secara mutlak ada atau tidaknya variable tertentu, tetapi lebih jauh
mengukur bagaimana intensitas fenomena yang ingin diukur. Kelemahan dari
skala penilaian yang akan timbul jika dalam pencatatan observasi terpikat oleh
kesan-kesan umum yang baik pada responden, sedangkan peniliti tidak
menyelidiki kesan-kesan umum yang baik pada responden, misalnya terkesan
akan kecantikan, sopan santun, cara komunikasi dan atau model berpakaian.
Sebaliknya peneliti mungkin memberikan nilai yang rendah, karena responden
tidak cantik, kurang sopan, cara komunikasi tidak etis, dan tidak berpakaian rapih.
Studi dokumentasi adalah teknik untuk mempelajari dan menganalisis
bahan-bahan tertulis kantor atau sekolah, seperti: silabus, program tahunan,
program bulannan, program mingguan, rencana pelaksanaan pembelajaran (RPP),
catatan pribadi peserta didik, buku raport, kisi-kisi, daftar nilai, lembar soal/tugas,
lembar jawaban, dan lain-lain. Untuk menguji kredibilitas data penelitian yang
sudah diperoleh melalui studi dokumentasi ini, peneliti perlu mengkonfirmasikan
dengan sumber-sumber lain yang relevan guna memperoleh tanggapan, jika perlu
melengkapi dan mengurangi.
Validitas merupakan suatu ukuran yang menunjukkan tingkat-tingkat
kevalidtan atau kesahihan suatu instrumen. Suatu instrumen yang valid atau sahih
mempunyai validitas tinggi. Sebaliknya, instrumen yang kurang valid bearti
memiliki validitas rendah.

45
Sebuah instrumen dikatakan valid apabila mampu mengukur apa yang
diinginkan. Sebuah instrumen dikatakan valid apabila dapat mengungkapkan data
dari variabel yang diteliti secara tepat. Tinggi rendahnya validitas instrumen
menunjukkan sejauh mana data yang terkumpul tidak menyimpang dari gambaran
tentang validitas yang dimaksud.
validasi dalam penelitian melibatkan pemeriksaan ketat atas argumen logis
dan bukti empiris untuk menentukan apakah mendukung teoretis. Demikian pula,
validasi dalam penilaian melibatkan evaluasi argumen logis dan bukti empiris
untuk menentukan apakah mendukung usulan kesimpulan, serta interpretasi dan
penggunaan, hasil penilaian.
Diskusi tentang validitas suatu tes dapat diklarifikasi dengan
mempertimbangkan kondisi, populasi, dan jenis generalisasi yang membentuk
parameter inferensi. Alih-alih menyatakan bahwa tes yang diberikan itu valid, kita
harus menyatakan bahwa itu sah (atau tidak valid) untuk menarik kesimpulan
tertentu ketika itu diberikan kepada individu tertentu dalam pengaturan tertentu.
Hal itu membantu untuk memperjelas bahwa validitas telah menjadi pusat
perhatiannya pada evaluasi hipotesis yang dibentuk oleh upaya untuk
menggeneralisasi melewati situasi ujian.

Jens – jenis validitas


1. Validitas permukaan. Validitas ini menggunakan kriteria yang sangat
sederhana, karena hanya melihat dari sisi muka atau tampang dari instrument
itu sendiri. Artinya, jika suatu tes secara sepintas telah dianggap baik untuk
mengungkapkan fenomena yang akan diukur, maka tes tersebut sudah dapat
dikatakan memenuhi syarat validitas permukaan, sehingga tidak perlu lagi
adanya judgement yang mendalam.
2. Validitas isi. Validitas ini sering digunakan dalam pengukuran hasil belajar.
Tujuan utamanya adalah untuk mengetahui sejauh mana peserta didik
menguasai materi pelajaran yang telah disampaikan, dan perubahan-
perubahan psokologis apa yang timbul pada peserta didik tersebut setelah
mengalami proses pembelajaran tertentu. Jika dilihat dari segi kegunaanya
validitas kurikuler dan validitas perumusan.

46
3. Validitas empiris. Validitas ini biasanya menggunakan teknik statistik, yaitu
analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan
antara skor tes dan suatu kriteria tertentu yang merupakan suatu tolak ukur di
luar tes yang bersangkutan. Validitas empiris disebut juga validitas yang
dihubungkan dengan kriteria ( criterion-related validity) atau validitas
statistik (statistical validity). Ada tiga macam validitas empiris, yaitu :
a. Validitas prediktif ialah jika kriteria standar yang digunakan adalah untuk
meramalkan prestasi belajar murid dimasa yang akan datang. Validitas
prediktif bermaksud melihat hingga mana suatu tes dapat memperkirakan
perilaku peserta didik pada masa yang akan datang.
b. Validitas konkuren ialah jika kriteria standarnya berlainan. Misalnya, skor
tes dalam pelajaran bahasa Indonesia dikorelasikan dengan skor tes bahasa
inggris.
c. Validitas sejenis ialah jika kriteria standarnya sejenis. Misalnya, bahasa
Indonesia dengan bahasa inggris. Untuk menguji validitas empiris dapat
menggunkan analisis korelasi product-moment dengan angka simpangan.
4. Validitas konstruk. Konstruk adalah konsep yang dapat diobservasi
(observable) dan dapat diukur (measurable). Validitas konstruk sering juga
disebut validitas logis (logical validity). Validitas konstrsuk berkenaan
dengan pertanyaan hingga mana suatu tes betula-betul dapat mengobservasi
dan mengukur fungsi psikologis yang merupakan deskripsi perilaku peserta
didik yang akan diukur oleh tes tersebut. Validitas konstruk banyak dikenal
dan digunakan dalam tes-tes psikologis untuk mengukur gejala perilaku yang
abstrak, seperti kesetiakawanan, kematangan emosi, sikap, motivasi, minat,
dan sebagainya. Untuk menguji validitas konstruk dapat dilakukan dengan
berbagai sumber, antara lain validitas isi, validitas prediksi, dan validitas
konkuren.
5. Validitas faktor. Dalam penelitian sering di gunakan skala pengukuran
tentang suatu variabel yang terdiri atas beberapa faktor. Faktor-faktor tersebut
diperoleh berdasarkan dimensi/indikator dari variabel yang diukur sesuai
dengan apa yang terungkap dalam konstruksi teoritisnya. Meskipun variabel
terdiri beberapa faktor, prinsip homogenitas untuk keseluruhan faktor harus

47
tetap dipertahankan, sehingga tidak terjadi tumpang tindih antara satu faktor
dan faktor lain. Kriterium yang digunakan dalam validitas faktor ini dapat
diketahui dengan menghitung homogenitas skor setiap faktor dengan total
skor, dan antara skor dari faktor yang satu dengan skor dari faktor yang lain.
6. Validitas wajah adalah sejauh mana suatu ukuran tampaknya terkait dengan
konstruksi tertentu, dalam penilaian non-ahli seperti pengambil tes dan
perwakilan dari sistem hukum. Artinya, tes telah menghadapi validitas jika
kontennya terlihat relevan dengan orang yang mengi-kuti tes. Mengevaluasi
penampilan kuesioner dalam hal kelayakan, keterbacaan, konsistensi gaya
dan format, dan kejelasan bahasa yang digunakan.

Uji validitas
1. Pengujian validitas kontruk (contruct validity)
Untuk menguji validitas kontruk, maka dapat digunkan pendapat para
ahli (judgment experts). Para ahli diminta pendapatnya tentang instrument
yang telah disusun itu. Mungkin para ahli akan mem-berikan pendapat:
instrumen dapat digunkan tanpa perbaikan, ada perbaikan, dan mungkin
dirombak total.
Setelah pengujian dari ahli selesai, maka diteruskan uji coba instrument.
Instrument yang telah disetujui para ahli tersebut dicobakan pada sampel dari
mana populasi diambil. Setelah data ditabulasikan, maka pengujian validitas
konstruk dilakukan dengan analisis faktor, yaitu dengan mengkorelasikan
antara skor instrumen. Untuk keperluan maka diperlukan bantuan komputer.
2. Pengujian validitas isi (content validity)
Untuk instrumen yang berbentuk test, maka pengujian validitas isi
dapat dilakukan dengan membandingkan antara isi instrumen dengan materi
pelajaran yang telah diajarkan. Seorang dosen yang memberi ujian di luar
pelajaran yang telah ditetapkan, berarti instrumen ujian tersebut tidak
mempunyai validitas.
Secara umum pengujian validitas konstruksi dan validitas isi dapat
dibantu dengan menggunakan kisi-kisi instrumen. Dalam kisi-kisi itu terdapat
variabel yang diteliti, indikator sebagai tolak dan nomor butir (item)

48
pertanyaan atau pernyataan yang telah dijabarkan dari indikator. Dengan kisi-
kisi instrumen itu maka pengujian validitas dapat dilakukan dengan mudah
dan sistematis.
3. Pengujian validitas eksternal
Validitas eksternal instrmen diuji dengan cara membandingkan (untuk
mencari kesamaan) antara kriteria yang ada pada instrumen dengan fakta-
fakta empiris yang terjadi di lapangan. Misalnya instrumen untuk mengukur
kinerja sekelompok pegawai, maka kriteria kinerja pada instrumen itu
dibandingkan dengan catatan-catatan di lapangan (empiris) tentang kinerja
pegawai yang baik. Bila telah terdapat kesamaan antara kriteria dalam
instrumen dengan fakta di lapangan, maka dapat dinyatkan instrumen ter-
sebut mempunyai validitas eksternal yang tinggi.
Instrumen penelitian yang mempunyai validitas eksternal yang tinggi
akan mengakibatkan hasil penelitian mempunyai validitas eksternal yang
tinggi pula. Penelitian mempunyai validitas eksternal bila hasil penelitian
dapat digeneralisasikan atau diterapkan pada sampel lain dalam populasi yang
diteliti. Untuk meningkatkan validitas eksternal selain meningkatkan validitas
eksternal instrumen, maka dapa dilakukan dengan memperbesar jumlah
sampel.

Ujii validitas juga bisa dihitung dengan memperhitungkan pada setiap butir
pertanyaaan di uji validitasnya. Hasil r hitung kita bandingkan dengan r tabel di
mana df= n-2 dengan sig 5%. Jika r tabel < r hitung maka valid. Uji validitas
menggunakan teknik korelasi product moment dengan menggunakan rumus
sebagai berikut:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2

Uji validitas digunakan untuk mengetahui kelayakan butir-butir dalam suatu


daftar pertanyaan dalam mende-fenisikan suatu variabel. Daftar pertanyaan ini
pada umumnya mendukung suatu kelompok variabel tertentu.

49
Reabilitas merupakan serangkaian alat ukur yang memiliki konsistensi bila
pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang.
Reliabilitas tes adalah tingkat keajegan (konsistensi) suatu tes, yakni sejauh mana
suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg, relative tidak
berubah meskipun diteskan pada situasi yang berbeda-beda. Reliabilitas
dinyatakan dalam bentuk angka, biasanya sebagai koefesien. Koefesiennya tinggi
akan menghasilkan reliabilitas yang tinggi pula.
Reliabilitas instrument penelitian hanya dapat diukur dengan perhitungan
statistic, berbeda dengan validitas yang terdiri dari beberapa jenis. Perhitungan
statistic yang dipergunakan adalah rumus kolerasi, dengan mempergunakan data
dari hasil uji coba (try out) angket atau test, dalam bentuk data kuantitatif. Data itu
merupakan distribusi nilai yang bersifat data interval.
Adapun konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat
dengan masalah kekeliruan pengukuran. Kekeliruan pengukuran sendiri
menunjukkan sejauh mana konsistensi hasil pengukuran terjadi apabila dilakukan
pengukuran ulang terhadap kelompok subyek yang sama. Sedangkan konsep
reliabilitas dalam arti reliabilitas hasil ukur berkaitan erat dengan kekeliruan
dalam pengambilan sampel yang mengacu pada inkonsistensi hasil ukur apabila
pengukuran dilakukan ulang pada kelompok yang berbeda.
Untuk menghitung reliabilitas instrument kita dapat menggunakan
perhitungan korelasi , dimana terdapat 3 cara pada perhitungan koralasi ini.
Pertama, korelasi belah dua dimana diperoleh dari uji coba angket atau tes soal ,
nilai pertama didapat dari soal genap dan nilai kedua dari soal ganjil. Rumus yang
digunakan sebagai berikut :
2
6∑𝐷
𝑟𝑔𝑔 =1−
𝑁 (𝑁 2 − 1)
Kedua dalam uji coba, test yang sama dikerjakan dua kali atau secara
berulang pada waktu yang berbeda. Pengulangan dimaksudkan untuk memperoleh
dua distribusi nilai dari test yang variasinya sama, yang dilakukan pada waktu
yang berbeda meskipun tidak terlalu lama jaraknya. Rumus yang digunakan
sebagai berikut :

50
𝑁𝛴𝑋𝑌 − (𝛴𝑋)(ΣY)
𝑟𝑥𝑦 =
√{𝑁𝛴𝑋 2 − (ΣX)2 }{𝑁𝛴𝑌 2 − (ΣY)2 }

Ketiga, Untuk item pertama, kedua, ketida dan seterusnya pada test yang
kedua tidak harus menanyakan hal yang sama seperti pada item pertama, kedua,
ketiga dan seterusnya pada test pertama. Akan tetapi perlu diupayakan agar
terdapat kesamaan dalam ranah yang diungkapkan. jika item pertama bersifat
mengungkapkan ranah penguasaan pengetahuan, sebaiknya sama antar kedua test
tersebut. Demikian juga item kedua, ketiga dan seterusnya yang mungkin
mengungkapkan ranah pemahaman (pengertian) atau ranah analisis, sintesis dan
sebagainya.
Koefisien reliabilitas konsistensi gabungan butir untuk skor butir dikotomi
dapat dihitung dengan menggunakan rumus Kuder-Richardson yang dikenal
dengan nama KR-20 dengan rumus:
𝐾 𝛴𝑝𝐼 𝑞𝑖
KR-20 = 𝐾−1 (1 − )
𝑠𝑡 2

Koefisien reliabilitas gabungan butir untuk skor butir politomi, maka


koefisien reliabilitas dihitung menggunakan koefisien Alpha dengan rumus:
𝐾 𝛴𝑠2
𝑟𝑖𝑖 = 𝐾−1 (1 − 𝑠𝑡 2𝑖 )

51
BAB III
PENUTUP

3.1. Kesimpulan
Instrumen penelitian adalah alat yang telah memenuhi persyaratan akademis
maka dapat digunakan sebagai alat untuk mengukur suatu objek dan
mengumpulkan informas dari suatu variable tertentu. Instrumen penelitian sangat
berpengaruhi pada data yang kita dapatkan dari penelitian kita. Maka saat memilih
instrumen harus dilakukan sebaik-baiknya. ada 3 hal yang harus diperhatikan
dalam memilih instrument penelitian, yaitu masalah penilitian, tujuan penelitian
dan jenis instrumen yang akan kita gunakan.
Jenis instrumen penelitian ada 9 yaitu, tes, angket, observasi, wawancara,
skala sikap, skala minat, dafatr cek, skala penilaian dan studi dokemuntasi. Tes
adalah teknik pengukuran yang berisi serangkaian pertanyaan, pernyataan ataupun
tugas-tugas yang harus diselesaikan oleh responden. Salah satu tes yang sering
digunakan ialah tes objektif, dikatakan tes objektif karena penilaian tes objektif
hanya 0 dan 1.
Angket atau questioner adalah instrumen penelitian yang berisi serangkaian
pernyataan atau pertanyaan untuk menjaring data atau informasi yang harus
dijawab oleh responden. Angket memiliki dua bentuk, yaitu angket bentuk
berstruktur dan angket bentuk tidak berstruktur. Angket bentuk berstruktur adalah
angket yang menyediakan beberapa kemungkinan yang harus dipulih oleh
responden. Sedangkan angket bentuk tidak berstruktur adalah angket yang
membrikan kebebasan untuk responden dalam menjawab pertanyaan tersebut.
Observasi adalah teknik pengumpulan data yang dilakukan dengan jalan
pengamatan dan pencatatan secara sistematis, logis, obsjektif dan rasional
mengenai beberapa fenomena. Observasi sering digunakan untuk instrument
penelitian kulalitatif. Digunkaan juga untuk mengukur perilaku, tindakan, dan
proses atau kegiatan yang sering berlangsung.
Wawancara adalah teknik pengumpulan data yang dilakukan melalui
perckapan dan Tanya-jawab. Ada 3 bentuk pertanyaan wawancara, yaitu
pertanyaan berstruktur, pertanyaan tak berstruktur, dan jenis pertanyaan
campuran.

52
Sikap adalah suatu kesiapan yang kompleks dengan individual untuk
memperlakukan suatu objek(orang, benda dan lingkungan) dengan cara tertentu.
Dalam mengukur sikap perlu diperhatikan kognisi(pengetahuan),
afeksi(perasaan), dan konasi (kecenderungan bertindak). Seseorang terhadap
objek.
Skala minat adalah dorongan yang dpat merangsakng perasaan senag
terhadap sesuatu. Sesuatu itu dapat orang, benda, dankegiatan. Minat sangat
berhubungan erat dengan sikap . misalnya jika satu mata pelajaran diminati
seorang peserta didik maka sikapnya cenderung memperhatikan mata pelajaran
tersebut.
Daftar cek adalah daftar yang berisi subjek dan aspek-aspek yang akan
diamati. Dengan daftar cek peneliti lebih mudah mencatat tiap-tiap hal dan
kejadian penting. Ada bermacam-macam aspek yang dapat dicantumkan dalam
daftar cek, kemudian peneliti tinggal memberikan tanda √ pada tiap aspek sesuai
hasil pengamatan.
Dalam skala penilaian, fenomena yang akan di observasi disusun dalam
tingkatan-tingkatan yang telah ditentukan. Tidak hanya mengukur satu variabel
tetapi lebih pada bagaimana intensitas fenomena yang ingin diukur.
Studi dokumentasi adalah teknik untuk mempelajari dan menganalsiis
bahan-bahan tertulis sekolah. Seperti silabus,program tahunan, program bulanan,
program mingguan, rencana pelaksanaan pembelajaran(RPP), catatan pribadi
peserta didik dan raport.

Validitas merupakan suatu ukuran yang menunjukkan tingkat-tingkat


kevalidtan atau kesahihan suatu instrumen. Suatu instrumen yang valid atau sahih
mempunyai validitas tinggi. Sebaliknya, instrumen yang kurang valid bearti
memiliki validitas rendah.
Sebuah instrumen dikatakan valid apabila mampu mengukur apa yang
diinginkan. Sebuah instrumen dikatakan valid apabila dapat mengungkapkan data
dari variabel yang diteliti secara tepat. Tinggi rendahnya validitas instrumen
menunjukkan sejauh mana data yang terkumpul tidak menyimpang dari gambaran
tentang validitas yang dimaksud.

53
Jenis-jenis validitas
1. Validitas permukaan. Validitas ini menggunakan kriteria yang sangat
sederhana, karena hanya melihat dari sisi muka atau tampang dari instrument
itu sendiri.
2. Validitas isi. Validitas ini sering digunakan dalam pengukuran hasil belajar.
Tujuan utamanya adalah untuk mengetahui sejauh mana peserta didik
menguasai materi pelajaran yang telah disampaikan, dan perubahan-
perubahan psokologis apa yang timbul pada peserta didik tersebut setelah
mengalami proses pembelajaran tertentu.
3. Validitas empiris. Validitas ini biasanya menggunakan teknik statistik, yaitu
analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan
antara skor tes dan suatu kriteria tertentu yang merupakan suatu tolak ukur di
luar tes yang bersangkutan.
a. Validitas prediktif ialah jika kriteria standar yang digunakan adalah untuk
meramalkan prestasi belajar murid dimasa yang akan datang. Validitas
prediktif bermaksud melihat hingga mana suatu tes dapat memperkirakan
perilaku peserta didik pada masa yang akan datang.
b. Validitas konkuren ialah jika kriteria standarnya berlainan. Misalnya, skor
tes dalam pelajaran bahasa Indonesia dikorelasikan dengan skor tes bahasa
inggris.
c. Validitas sejenis ialah jika kriteria standarnya sejenis. Misalnya, bahasa
Indonesia dengan bahasa inggris. Untuk menguji validitas empiris dapat
menggunkan analisis korelasi product-moment dengan angka simpangan.
4. Validitas konstruk. Konstruk adalah konsep yang dapat diobservasi
(observable) dan dapat diukur (measurable). Validitas konstrsuk berkenaan
dengan pertanyaan hingga mana suatu tes betula-betul dapat mengobservasi
dan mengukur fungsi psikologis yang merupakan deskripsi perilaku peserta
didik yang akan diukur oleh tes tersebut
5. Validitas faktor. Dalam penelitian sering di gunakan skala pengukuran
tentang suatu variabel yang terdiri atas beberapa faktor. Faktor-faktor tersebut
diperoleh berdasarkan dimensi/indikator dari variabel yang diukur sesuai
dengan apa yang terungkap dalam konstruksi teoritisnya. Meskipun variabel

54
terdiri beberapa faktor, prinsip homogenitas untuk keseluruhan faktor harus
tetap dipertahankan, sehingga tidak terjadi tumpang tindih antara satu faktor
dan faktor lain.
6. Face validity adalah sejauh mana suatu ukuran tampaknya terkait dengan
konstruksi tertentu, dalam penilaian non-ahli seperti pengambil tes dan
perwakilan dari sistem hukum. Artinya, tes telah menghadapi validitas jika
kontennya terlihat relevan dengan orang yang mengi-kuti tes. Mengevaluasi
penampilan kuesioner dalam hal kelayakan, keterbacaan, konsistensi gaya
dan format, dan kejelasan bahasa yang digunakan.

Uji validitas
1. Pengujian validitas kontruk (contruct validity)
Untuk menguji validitas kontruk, maka dapat digunkan pendapat para ahli
(judgment experts). Para ahli diminta pendapatnya tentang instrument yang
telah disusun itu. Mungkin para ahli akan mem-berikan pendapat: instrumen
dapat digunkan tanpa perbaikan, ada perbaikan, dan mungkin dirombak total.
2. Pengujian validitas isi (content validity)
Untuk instrumen yang berbentuk test, maka pengujian validitas isi dapat
dilakukan dengan membandingkan antara isi instrumen dengan materi
pelajaran yang telah diajarkan. Seorang dosen yang memberi ujian di luar
pelajaran yang telah ditetapkan, berarti instrumen ujian tersebut tidak
mempunyai validitas.
3. Pengujian validitas eksternal
Validitas eksternal instrmen diuji dengan cara membandingkan (untuk
mencari kesamaan) antara kriteria yang ada pada instrumen dengan fakta-
fakta empiris yang terjadi di lapangan. Instrumen penelitian yang mempunyai
validitas eksternal yang tinggi akan mengakibatkan hasil penelitian
mempunyai validitas eksternal yang tinggi pula. Untuk meningkatkan
validitas eksternal selain meningkatkan validitas internal instrumen, maka
dapa dilakukan dengan memperbesar jumlah sampel.

55
Ujii validitas juga bisa dihitung dengan menggunakan teknik korelasi
product moment dengan menggunakan rumus sebagai berikut:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2

Reliabilitas diartikan dengan keajekan (konsistensi) bila mana tes tersebut


diuji berkali-kali hasilnya relative sama, artinya setelah hasil tes yang pertama
dengan tes yang berikutnya dikorelasikan terdapat hasil korelasi yang signifikan.
Dengan adanya pengujian dari hasil sebuah penelitian atau sering disebut dengan
uji reliabilitas maka penelitian yang dihasilkan akan memiliki sebuah mutu yang
berkualitas. Karena penelitian yang sudah melalui uji penelitian sudah dianggap
bagus dan memenuhi standar. Didalam pengujian juga diperlukan sebuah rumus
rumus untuk menunjukkan bahwa hasil penelitian yang kita lakukan valid dan
dapat dipertanggungjawabkan.

3.2. Saran
Dari penjelasan baik dalam kajian pustaka maupun dalam hasil didkusi,
diharapkan pembaca dapat lebih memahami mengenai konsep monitoring,
evaluasi, asesmen di dunia pendidikan. Masih banyak lagi materi-materi yang
belum terangkum secara mendetail dan berpotensi untuk mengembangkan lebih
lanjut. Selain dari makalah ini kami menyarankan agar pembaca dapat menambah
wawasan melalui berbagai sumber lainnya.

56
DAFTAR PUSTAKA

Arifin, Zainal. 2011. Penelitian Pendidikan. Bandung : PT Remaja


Rosdakarya.

Borsboom. Denny. 2004. The Concept Validity. Jurnal Psychological


Review. Vol. 11. No. 4.

Endaryanto, Poly. 2012. Statitika Untuk Penelitian. Yogyakarta : Graha Ilmu.

Franzen. D. Michael. 2002. Reliability and Validity in Neuropsychological


Assessment. Second Edition. New York : Kluwer Academic.

Heale, Roberta. 2015. Validity and realibility in quantitative studies. Jurnal


Evid Based Nurs. Vol. 8. No. 3.

Kumar, Ranjit. 1999.Research Methodology. Los Angele : Sage.

Mathers,dkk. 2009. Surveys and Questionnaries. Nottingham : University or


Nottingham.

Matodang, Zulkifli. 2009.Validitas dan Reliabilitas Suatu Instrumen


Penelitian. Jurnal Tabularasa PPS UNIMED. Vol 6. No 1.

Nawawi, H.Hadari dan H.M. Martini Hadari. 2006. Instrumen Penelitian


Bidang Sosial. Yogyakarta : Gajah Mada Universitas Press

Siswanto. 2008. Validitas Sebagai Alat Penentuan Kehandalan Tes Hasil


Belajar. Jurnal Pendidikan Akutansi Indonesia. Vol. 6. No. 1.

Sugiono. 2016. Statistika Untuk Penelitian. Bandung : Alfabeta.

Sujarweni,V.Wiratna. 2012. Statitika Untuk Penelitian. Yogyakarta : Graha


Ilmu.

Taherdoost, Hamed. 2016. Validty and Reliability of the Research


Instrument: How to Test the Validation of a Questionnaire/Survey in
a Research. International Journal of Academic Research in
Management (IJARM). Vol. 5. No. 3.ISSN: 2296-1747.

Taylor. S. Catherine. 2013. Validiti and Validation. New York : Oxford


University Press.

Widi, Ristya. 2011. Uji Validitas dan Reliabilitas. Jurnal. Stomatognatic.


Vol. 8. No. 1.

Wilkinson, dan Birminghsm. 2003. Using Reasearch Instrument A guide.


Londod. Routledgefamler.

Anda mungkin juga menyukai