Dosen Pengampu :
Dwi Agus Kurniawan, S.Pd., M.Pd.
Tim Penulis
i
DAFTAR ISI
ii
BAB I
PENDAHULUAN
1.1. Latar Belakang
Instrumen memegang peranan yang sangat penting dalam menentukan mutu
suatau penelitian, karena validitas atau keabsahan data yang diperoleh akan sangat
ditentukan oleh kualitas atau validitas instrumen yang digunakan, disamping
prosedur pengumpulan data yang ditempuh. Hal ini mudah dipahami karena
instrumen berfungsi mengungkapkan fakta menjadi data, sehingga jika instrumen
yang digunakan mempunyai kualitas yang memadai dalam arti valid dan reabel
maka data yang diperoleh akan sesuai dengan fakta atau keadaan sesungguhnya di
lapangan. Sedangkan jika kualitas instrumen yang digunakan tidak baik dalam arti
mempunyai validitas dan reabilitas yang rendah, maka data yang diperoleh juga
tidak valid atau tidak sesuai dengan fakta di lapangan sehingga dapat
menghasilkan kesimpulan yang keliru. Untuk mengumpulkan data dari suatu
penelitian kita dapat menggunakan instrumen yang dibuat sendiri, instrumen yang
telah tersedia pada umumnya adalah instrumen yang sudah dianggap baku untuk
mengumpulkan data variabel-variabel tertentu.
Dalam menyusun dan sebelum mengaplikasikan instrumen penelitian, ada
tahapan yang begitu penting bagaimana hasil dari penelitian tersebut dapat
dipertanggung jawabkan. Hal penting tersebut adalah yang biasa disebut dengan
validitas dan reabilitas. Statistika yang digunakan untuk menguji hipotesis
walaupun telah sesuai dengan hipotesis yang diajukan. Skala data dan rancangan
penelitian yang digunakan. Bila instrumen penelitian yang digunakan validitas
dan reabilitasnya rendah sudah tentu kesimpulan dari pengujian hipotesis tersebut
tidak tepat. Instrumen harus memenuhi persyaratan validitas dan reabilitas.
Instrumen yang valid berarti instrumen mampu mengukur tentang apa yang
diukur, misalnya seseorang ingin mengukur berat badannya, maka alat yang
digunakannya adalah timbangan. Termometer adalah alat yang valid untuk
mengukur suhu, tetapi tidak valid digunakn untuk mengukur berat bedan.
Instrumen yang memenuhi persyaratan reabilitas berarti instrumen menghasilkan
ukuran yang konsisten walaupun instrumen tersebut digunakan mengukur berkai-
kali. Instrumen yang valid dan reliable merupakan syarat mutlak untuk
1
mendapatkan hasil penelitian yang valid dan reliable. Namun, hal ini masih
dipengaruhi oleh kondisi objek yang diteliti dan kemampuan orang yang
menggunakan instrumen untuk mengumpulkan data. Selain memenuhi
persyaratan validitas dan realibilitas, instrumen hendaknya memenuhi persyaratan
kepraktisan. Artinya instrumen tersebut praktis untuk dilaksanakan, ringkas,
mudah dimengerti dan hemat biaya.
2
BAB II
PEMBAHASAN
3
Anda secara berbeda, dengan menggunakan cara alternatif. Dia terkesan pada
kelas bahwa tidak ada hal seperti metode definitif melakukan penelitian sosial.
Tidak ada metode penelitian tunggal atau instrumen par excellence. Penelitian
bukanlah usaha 'satu-ukuran- semua-semua'. Tidak ada instrumen penelitian
tunggal yang secara inheren lebih unggul dari yang lain. Semua bisa digunakan
dengan baik atau buruk. Masing-masing memiliki kekuatan dan kelemahannya
sendiri. Masing-masing lebih atau kurang tepat untuk digunakan dalam setiap
penelitian tunggal. Apapun keadaan Anda sendiri, proyek penelitian sosial
dengan kualitas terbaik selalu merupakan metode dan instrumen yang paling
sesuai dengan cara yang paling bijaksana dan hati-hati
4
Pembagian tes tersebut menunjukkan banyaknya ragam tes yang dapat
digunakan dalam penelitian. Jenis tes yang digunakan bergantung pada masalah
dan tujuan penelitian. Setiap jenis tes tertentu mempunyai tujuan dan fungsi
masing-masing. Salah satu bentuk tes yang banyak digunakan dalam penelitian
adalah tes objektif atau yang sering disebut dikotomi (dichotomously scored item)
karena jawabannya antara benar atau salah dan skornya antara 1 dan 0. Disebut tes
objektif karena penilaiannya objektif. Siapa pun yang mengoreksi jawaban tes
objektif hasilnya akan sama karena kunci jawabannya sudah jelas dan pasti.
Tes objektif menuntun responden untuk memilih jawaban yang benar
diantara kemungkinan jawaban yang telah disediakan, memberikan jawaban
singkat, dan melengkapi pertanyaan atau pertanyaan yang belum sempurna. Tes
objektif sangat cocok untuk menilai kemampuan yang menuntut proses mental
yang tidak begitu tinggi, seperti mengingat, mengenal, pengertian, dan penerapan
prinsip-prinsip. Tes objektif terdiri atas beberapa bentuk, yaitu: benar-salah,
pilihan ganda, menjodohkan, dan melengkapi atau jawaban singkat.
Kebaikan tes objektif antara lain a) seluruh ruang lingkup (scope) materi
dapat dinyatakan pada item atau soal, b) kemungkinan jawaban spekulatif dalam
ujian dapat dihindari, c) jawaban bersifat mutlak, jadi penilaian dapat dilakukan
secara objektif, d) pengoreksian dapat dilakukan siapa saja, sekalipun tidak
mengetahui dan mengusai materinya, e) pemberian skor dapat dilakukan dengan
mudah dan cepat, f) korektor tidak akan terpengaruh oleh baik-buruknya tulisan,
dan g) tidak mungkin terjadi dua orang responden yang jawabannya sama, tetapi
mendapat skor yang berbeda. Sedangkan kelemehannya yakni, a) mengkontruksi
soalnya sangat sulit, b) membutuhkan waktu yang lama, c) ada kemungkinan
responden mencontoh jawaban orang lain dan berfikir pasif, dan d) umumnya
hanya mampu mengukur proses mental yang dangkal.
b. Angket (questioner)
Menurut (Mathers,dkk, 2009:9), Questionnaires are a useful option
to consider when conducting a postal survey. They can be cheaper than
personal interviewing and quicker if the sample is large and widely
dispersed. For any postal survey regardless of the sample size you must
allow at least six weeks for the first wave of questionnaires to be returned,
and another four weeks for each successive mailing. As with telephone
interviewing, a postal survey is useful if your respondents are widely
distributed. However, due to the lack of personal contact between the
5
respondent and the researcher, the design and layout of the questionnaire is
all important.
6
alternatif jawaban, b) bentuk jawaban tertutup, tetapi ada alternatif jawaban
terakhir diberikan secara terbuka. Hal ini dimaksudkan untuk memberikaan
kesempatan kepada responden untuk menjawab secara bebas, dan c) bentuk
jawaban bergambar, yaitu angket yang memberikan jawaban dalam bentuk
gambar.
b. Bentuk angket tak berstruktur, yaitu bentuk teknik angket yang memberikan
jawaban secara terbuka dimana responden secara bebas menjawab pertanyaan
tersebut. Hal ini dapat memberikan pemahaman yang lebih mendalam tentang
situasi, tetapi kurang dapat dinilai secara objektif. Jawaban tidak dapat dianalisis
secara statistik, sehingga kesimpulannya pun hanya merupakan pandangan yang
bersifat umum.
Untuk menyusun angket, dapat mengikuti langkah-langkah ssebagai berikut,
a) Menyusun kisi-kisi angket
No Masalah Tujuan indikator Sumber Nomor
data angket
7
validity, content validity, construct validity and criterion validity. Depends on
the types of questionnaire, some of these validity tests are mandatory to apply
and some recommended
8
bersarkan hasil uji-coba, g) melaksanakan observasi pada saat kegiatan
berlangsung, dan h) mengolah dan menafsirkan hasil observasi.
Sebagaimana instrumen penelitian yang lain, observasi secara umum
mempunyai kelebihan dan kekurangan. Kelebihan dari observasi yaitu a)
observasi merupakan alat untuk mengamati berbagai macam fenomena, b)
observasi cocok untuk mengamati orang yang sedang melakukan suatu keadaan,
c) banyak hal yang tidak dapat diukur dengan tes, tetapi justru lebih tepat dengan
observasi, dan d) tidak terikat dengan laporan pribadi. Adapaun kelemahannya
yaitu a) pelaksanaan observasi sering tergangggu oleh keadaan cuaca, bahkan ada
kesan yang kurang menyenangkan dari observer ataupun dari observasi itu sendiri,
b) biasanya masalah pribadi sulit diamati, dan c) jika proses yang diamati
memakan waktu yang lama, maka observer sering menjadi jenuh.
d. Wawancara (interview)
Menurut Arifin (2011:233) Wawancara merupakan teknik pengumpulan
data yang dilakukan melalui percakapan dan Tanya-jawab, baik secara langsung
maupun tidak langsung dengan responden untuk mencapai tujuan tertentu. Ada
tiga bentuk pertanyaan wawancara yang dapat digunakan dalam penelitian, yaitu:
a) bentuk pertanyaan berstruktur, yaitu pertanyaannya menuntut jawaban agar
sesuai dengan apa yang terkandung dalam pertanyaan tersebut, biasanya
digunakan untuk permasalahan yang tidak terlalu kompleks dan jawabannya
sudah konkret, b) bentuk pertanyaan tak berstruktur, yaitu pertanyaan yang
bersifat terbuka dimana responden bebas menjawab pertanyaan tersebut. Biasanya
digunakan untuk mengungkapkan perasaan, fikiran dan tingkah lakunya, dan c)
bentuk pertanyaan campuran, yaitu yang menuntut jawaban campuran, ada yang
berstruktur ada pula yang bebas.
Untuk menyusun pedoman wawancara dapat mengikuti langkah-langkah
sebagai berikut: a) merumuskan tujuan wawancara, b) membuat kisi-kisi dan
pedoman wawancara, c) menyusun pertanyaan sesuai data yang diperlukan dan
bentuk pertanyaan yang diinginkan. Untuk itu perlu diperhatikan kata-kata yang
digunakan, cara bertanya, dan jangan membuat peserta didik bersikap defensive,
d) melaksanakan uji coba untuk melihat kelemahan-kelemahan pertanyaan yang
9
disusun, sehingga dapat diperbaiki lagi, dan e) melaksanakan wawancara dalam
situasi sebenarnya.
Dalam pelaksanaan wawancara, ada beberapa hal yang perlu diperhatikan,
yaitu a) hubungan baik antara pewawancara dan orang yang diwawancarai perlu
dipupuk dan dibina, sehingga akan tampak hubungan yang sehat dan harmonis, b)
dalam wawancara, jangan terlalu kaku, tunjukkan sikap yang bebas, ramah,
terbuka, dan adaptasikan diri dengannya, c) perlakukan responden itu sebagai
sesama manusia dengan jujur, d) hilangkan prasangka-prasangka yang kurang
baik, sehingga pertanyaan-pertanyaan yang diajukan bersifat netral, dan e)
pertanyaan hendaknya jelas, tepat dengan bahasa yang sederhana dan mudah
dimengerti.
e. Skala sikap
Menurut Arifin (2011:235) Secara umum, sikap adalah suatu kesiapan yang
kompleks dari seorang individual untuk memperlakukan suatu objek (orang,
benda,lingkungan, sekolah, dll) dengan cara, metode, teknik, dan pola tertentu.
Kesiapan itu mempunyai aspek-aspek kognitif, afektif, dan kecenderungan
bertindak yang dapat disimpulkan dari perilaku individu bersangkutan. Dalam
mengukur sikap, perlu diperhatikan tiga komponen sikap, yaitu kognisi
(pengetahuan), afeksi (perasaan) dan konasi (kecenderungan bertindak) seseorang
terhadap objek. Dalam skala likert, responden tidak hanya memilih pertanyaan-
pertanyaan positif, tetapi juga pertanyaan-pertanyaan negatif. Tiap item dibagi
kedalam lima skala, yaitu sangat setuju, setuju, tidak tentu, tidak setuju, dan
sangat tidak setuju. Setiap pertanyaan positif diberi bobot 4, 3, 2, 1 dan 0.
Sedangkan pertanyaan negatif diberi bobot sebaliknya, yaitu 0, 1, 2, 3, dan 4.
Model skala sikap yang dapat digunakan untuk mengukur sikap,
diantaranya, ; a) menggunakan bilangan untuk menunjukkan tingkat-tingkat dari
objek sikap yang dinilai, seperti 1,2,3,4 dan seterusnya, b) menggunakan frekuensi
terjadinya atau timbulnya sikap itu, seperti selalu, sering kali, kadang-kadang,
pernah dan tidak pernah, c) menggunakan ilstilah-istilah yang bersifat lialitatif,
seperti bagus sekali, baik, sedang, dan kurang. Ada juga istilah-istilah lain, seperti
sangat setuju, setuju, tidak tahu (tidak punya pendapat), tidak setuju dan sangat
tidak setuju, d) menggunakan istilah-istilah yang menunjukkan kedudukan, seperti
10
sangat rendah, dibawah rata-rata, dan sangat tinggi dan e) menggunakan kode
bilangan atau huruf, seperti : selalu (diberi kode), 5) kadang-kadang (4) jarang (3)
jarang sekali (2) dan tidak pernah (1)
Untuk menyusun pertanyaan sikap yang bermutu, likert memberi petunjuk
sebagai berikut: a) pertanyaan harus menggambarkan perilaku yang diinginkan
dan bukan menyatakan suatu fakta, b) pertanyaan harus jelas, singkat, terarah,
dan tidak mempunyai tafsiran ganda (ambiguity), c) diusahankan supaya
kecenderungan jawaban tidak terhimpun di satu ujung kontinu, tetapi sebagian
berada diujung lain, dan sebagian lagi terletak ditengah kontinu arah sikap itu, d)
keseluruhan perangkat skala sikap itu hendaknya menczkuo dus kelompok
pertanyaan, yaitu pertanyaan positif dan pertanyaan negatif. Tujuannya untuk
mneghindari jawaban yang strereotip dari responden, dan e) setiap pernyataan
harus mengandung satu variabel sikap dan tidak boleh lebih.
f. Skala minat
Menurut Arifin (2011:241) Minat adalah dorongan atau aktivitas mental
yang dapat merangsang perasaan senang tehadap sesuatu. Sesuatu itu bisa berupa
orang, benda, kegiatan, pengalaman, dan lain-lain yang dapat dijadikan sebagai
stimulus yang memerlukan respon terarah. Minat sangat berhubungan dengan
sikap, misalnya jika materi pelajaran diminati peserta didik, maka sikap peserta
didik cenderung memperhatikan pelajaran tesebut. Perlu diperhatikan faktor-
faktor yang dapat mempengaruhi munculnya minat, seperti motivasi, belajar,
materi pelajaran, keluarga, teman pergaulan, cita-cita, dan lain-lain. Berminat
tidaknya seseorang terhadap sesuatu dapat dilihat dari beberapa indikator, antara
lain perhatian, perasaan, motivasi, dan sikap. Minat dapat diukur dengan teknik
observasi, wawancara, angket, inventori dan skala minat.
Tabel.1 contoh skala minat
No Pertanyaan Ya Kadang-kadang Tidak
01 Mengikuti diskusi kelompok
02 Memperhatikan penjelasan guru
03 Menuruti perintah guru
04 Mengerjakan tugas di rumah
05 Menghafal materi pelajaran
06 Membeli buku-buku pelajaran
11
g. Daftar cek
Daftar cek adalah suatu daftar yang berisi subjek dan aspek-aspek yang akan
diamati. Melalui daftar cek memungkinkan seseorang mencatat tiap-tiap kejadian
(betapapun kecilnya), tetapi dianggap penting. Ada bermacam-macam aspek
perbuatan yang biasanya dicantumkan dalam daftar cek, kemudian peneliti
sebagai observer tinggal memberikan tanda cek (v) pada tiap-tiap aspek tersebut
sesuai dengan hasil pengamatannya. Daftar cek banyak manfaatnya, antara lain, a)
dapat membantu peneliti untuk mengingat-ingat apa yang harus diamati, b) dapat
memberikan informasi kepada stakeholder.
Table 2. daftar cek tentang keaktifan peserta didik dalam diskusi kelompok
No Nama SA A CA KA TA
01 Eliyanti V
02 Yulia v
03 Ida V
04 Nuraziza V
05 Ningratina v
Keterangan : SA= Sangat aktif, A = Aktif, CA = Cukup Aktif, KA = Kurang
aktif, dan TA = Tidak Aktif
h. Skala penilaian
Dalam daftar cek, peneliti hanya dapat mencatat ada atau tidaknya variabel
tertentu, sedangkan dalam skala penilaian, fenomena-fenomena yang akan
diobservasi itu disusun dalam tingkatan-tingkatan yang telah ditentukan. Jadi
untuk mengukur hal-hal tersebut baiknya digunakan skala penilaian.
Kelemahan dari skala penilaian yang akan timbul jika dalam pencatatan
observasi terpikat oleh kesan-kesan umum yang baik pada responden, sedangkan
peniliti tidak menyelidiki kesan-kesan umum yang baik pada responden, misalnya
terkesan akan kecantikan, sopan santun, cara komunikasi dan atau model
berpakaian. Sebaliknya peneliti mungkin memberikan nilai yang rendah, karena
responden tidak cantik, kurang sopan, cara komunikasi tidak etis, dan tidak
berpakaian rapih (Arifin 2011:242)
i. Studi dokumentasi
Dokumen adalah bahan-bahan tertulis. studi dokumentasi adalah teknik
untuk mempelajari dan menganalisis bahan-bahan tertulis kantor atau sekolah,
seperti: silabus, program tahunan,program bulanan, program mingguan, rencana
12
pelaksanaan pembelajaran (RPP), catatan pribadi peserta didik, buku raport, kisi-
kisi, daftar nilai, lembar soal/tugas, lembar jawaban, dan lain-lain. Selain itu,
dokumen mengenai kondisi lingkungan sekolah, data guru, data peserrta didik,
dan organisasi sekolah. Untuk menguji kredibilitas data penelitian yang sudah
diperoleh melalui studi dokumentasi ini, peneliti perlu mengkonfirmasikan
dengan sumber-sumber lain yang relevan guna memperoleh tanggapan, jika perlu
melengkapi dan mengurangi. (Arifin 2011:243)
13
there should be a low correlation between an instrument that measures
motivation and one that measures self efficacy
3. Predictive validity means that the instrument should have high
correlations with future criterions.
14
Menurut Sugiyono (2016: 348) instrument yang valid berarti alat ukur yang
ya untuk mendapatkan data (mengukur) itu valid. Valid berarti instrumen tersebut
dapat untuk mengukur apa yang hendak diukur. Meter yang valid dapat digunakan
untuk mengukur panjang dengan teliti, karena meteran memang alat untuk
mengukur panjang. Meter tersebut menjadi tiadak valid jika digunakan untuk
mengukur berat.
Namun bukan berarti bahwa dengan menggunakan instrumen yang telah
teruji validitasnya, otomatis hasil (data) peneliti menjadi valid. Hal ini masih akan
dipengaruhi oleh kondisi obyek yang diteliti, dan kemampuan orang yang
menggunakan isntrumen. Oleh karena itu peneliti harus mampu mengendalikan
obyek yang akan diteliti dan meningkatkan kemampuan dan menggunakan
isntrumen untuk mengukur variabel yang teliti.
Dalam Penelitian Borsboom (2004:1063) when claiming that a test is
valid, one is taking the ontological position that the attribute being measured
exists and affects the outcome of the measurement procedure. This is probably
one of the more serious scientific claims one can make, and it is often difficult
to prove or refute. This, however, does not mean that the validity concept itself
is complicated.
Validation is more like theory testing: the muddling around in the
data to find out which way to go. Now, most of the validity literature has not
dealt with the problem of validity but with the problem of validation. Although
there is nothing wrong with describing, classifying, and evaluating validation
strategies, such activities are not likely to elucidate the concept of validity
itself. In fact, if one concentrates on the epistemological problems long enough,
one will move away from the validity concept rather than toward it.
15
trasi pada masalah-masalah epistemologis cukup lama, seseorang akan menjauh
dari konsep validitas.
Menurut Sugiyono (2016: 350) Instrument yang valid harus mempunyai
validitas internal dan eksternal. Validitas yang mempunyai internal atau rasio, bila
kriteria yang adina dalam instrumen secara instumen secara rasional (teoritis)
telah mencerminkan apa yang diukur. Jadi kriterianya ada di dalam instrument itu.
Sedangkan instrumen yang mempunyai validitas eksternal bila kriteria di dalam
instmen disusun berdasarkan luar atau fakta-fakta empiris yang telah ada.
16
Misalnya akan mengukur kinerja (permormance) sekelompok pegawai, maka
tolak ukur yang telah ditetapkan di kepegawaian itu. Sedangkan validitas internal
dikembangkan dari teori-teori tentang kinerja. Untu itu penyusunan instrument
yang baik harus memperhatikan teori dan fakta di lapangan. Penelitian yang
mempunyai validitas inernal, bila data yang dihasilkan meupakan fugsi dari
rancangan dan instumen yang digunakan. Instrumen tentang kepemimpinan akan
menghasilkan data kepemimpinan, bukan motivasi. Penelitian yang mempunyai
vaiditas eksternal bila, hasil penelitian dapat diterapkan pada sampel yang lain,
atau hasil penelitian itu dapat digeneralisasikan.
Instrument yang harus mempunyai validitas ini adalah instrument yang
digunakan untuk mengukur prestasi belajar (achiement) dan mengukur efektivitas
pelaksanaan program dan tujuan. Untuk menyusun instrumen prestasi belajar yang
mempunyai validitas isi (content validity), maka instrument harus disusun
berdasarkan materi pelajaran yang telah diajarkan. Sedangkan instrumen yang
digunakan untuk mengetahui pelaksanaan program yang telah direncanakan.
Selanjtnya instrument yang digunakan untuk mengukur tingkat tercapainya tujuan
(efektivitas) maka instrument harus disusun berdasarkan tujuan yang telah
dirumuskan.
Menurut Franzen (2002:29) Discussions of the validity of a test may
be clarified by considering the conditions, populations, and types of
generalization that form the parameters of the inference. Instead of stating
that a given test is valid, we should state instead that it is valid (or invalid)
for drawing certain conclusions when it is administered to a certain
individual in a certain setting. Doing so helps to make it clear that validity
has as its central concern the evaluation of hypotheses formed by attempts to
generalize past the test situation.
17
Menurut Taylor (2013:2-3) validation in research involves close
scrutiny of logical arguments and the empirical evidence to determine
whether they support theoretical claims. Similarly, validation in assessment
involves evaluating logical arguments and empirical evidence to determine
whether they support proposed inferences from, as well as interpretations
and uses of, assessment results. As consumers of research reports or users of
assessment tools, scientists, educators, and psychologists have an obligation
to examine both logical arguments and empirical evidence to determine
whether the claims made by the researchers and the interpretations proposed
by assessment developers can be trusted.
18
3. Validitas empiris. Validitas ini biasanya menggunakan teknik statistik, yaitu
analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan
antara skor tes dan suatu kriteria tertentu yang merupakan suatu tolak ukur
di luar tes yang bersangkutan. Validitas empiris disebut juga validitas yang
dihubungkan dengan kriteria ( criterion-related validity) atau validitas
statistik (statistical validity). Ada tiga macam validitas empiris, yaitu :
a. Validitas prediktif ialah jika kriteria standar yang digunakan adalah
untuk meramalkan prestasi belajar murid dimasa yang akan datang.
Validitas prediktif bermaksud melihat hingga mana suatu tes dapat
memperkirakan perilaku peserta didik pada masa yang akan datang.
b. Validitas konkuren ialah jika kriteria standarnya berlainan. Misalnya,
skor tes dalam pelajaran bahasa Indonesia dikorelasikan dengan skor tes
bahasa inggris.
c. Validitas sejenis ialah jika kriteria standarnya sejenis. Misalnya, bahasa
Indonesia dengan bahasa inggris. Untuk menguji validitas empiris dapat
menggunkan analisis korelasi product-moment dengan angka
simpangan.
4. Validitas konstruk. Konstruk adalah konsep yang dapat diobservasi
(observable) dan dapat diukur (measurable). Validitas konstruk sering juga
disebut validitas logis (logical validity). Validitas konstrsuk berkenaan
dengan pertanyaan hingga mana suatu tes betula-betul dapat mengobservasi
dan mengukur fungsi psikologis yang merupakan deskripsi perilaku peserta
didik yang akan diukur oleh tes tersebut. Validitas konstruk banyak dikenal
dan digunakan dalam tes-tes psikologis untuk mengukur gejala perilaku
yang abstrak, seperti kesetiakawanan, kematangan emosi, sikap, motivasi,
minat, dan sebagainya. Untuk menguji validitas konstruk dapat dilakukan
dengan berbagai sumber, antara lain validitas isi, validitas prediksi, dan
validitas konkuren.
5. Validitas faktor. Dalam penelitian sering di gunakan skala pengukuran
tentang suatu variabel yang terdiri atas beberapa faktor. Faktor-faktor
tersebut diperoleh berdasarkan dimensi/indikator dari variabel yang diukur
sesuai dengan apa yang terungkap dalam konstruksi teoritisnya. Meskipun
19
variabel terdiri beberapa faktor, prinsip homogenitas untuk keseluruhan
faktor harus tetap dipertahankan, sehingga tidak terjadi tumpang tindih
antara satu faktor dan faktor lain. Kriterium yang digunakan dalam validitas
faktor ini dapat diketahui dengan menghitung homogenitas skor setiap
faktor dengan total skor, dan antara skor dari faktor yang satu dengan skor
dari faktor yang lain.
Dalam Penelitian Siswanto (2008:110) Face validity (validitas wajah)
adalah tingkat dimana nampak relevan, penting dan menarik bagi peserta ujian.
Guru ingin siswa menikmati dalam melakukan tes dan merasakan bahwa mereka
tidak menyia-nyiakan waktu mereka. Yang penting adalah apakah kenyataannya
siswa membuang-buang waktu mereka pada tes yang tidak valid dan reliabel -
tidak masalah bagaimana tes nampak relevan. Meskipun begitu, untuk memotivasi
dan hubungan yang baik adalah penting bagi siswa dan orang tua merasa tes
adalah penting. Keluhan untuk sekolah utama siswa dapat dikurangi jika tes tidak
nampak sepele dalam isi atau tidak menggunakan bahasa yang rendah kepada
siswa. Beberapa butir mungkin mempunyai face validity, tapi kurang validitas
empirik. Itu mungkin bagi siswa untuk menikmati pengambilan pengalaman tanpa
menggunakan tes. Mungkin juga mengukur validitas empiris, tapi mempunyai
face validity yang kecil. Sering menulis ulang butir-butir dapat membuat butir
nampak lebih relevan. Tes aritmatika dasar untuk siswa SMA yang lambat
sebaiknya menggunakan cara dewasa, contoh tes membaca untuk seleksi
sekretaris perlu menggunakan contoh praktis dan menghindari kepustakaan, tes
matematika dengan ilmu fisika kelas perlu menggunakan contoh dari ilmu fisika.
Harus jelas bahwa face validity adalah tidaklah penting ke bentuk validitas lain.
Jika mungkin bagaimanapun butir-butir perlu nampak relevan untuk peserta ujian
sebab jika tes nampak sepele dan kekanak-kanakan mungkin, validitas empiris
mungkin lemah.
Dalam penelitian Taherdoost (2016:29) Face validity is a subjective
judgment on the operationalization of a construct. Face validity is the degree
to which a measure appears to be related to a specific construct, in the
judgment of non-experts such as test takers and representatives of the legal
system. That is, a test has face validity if its content simply looks relevant to
the person taking the test. It evaluates the appearance of the questionnaire in
terms of feasibility, readability, consistency of style and formatting, and the
clarity of the language used.
20
Dalam penelitian Taherdoost (2016:29) validitas Wajah adalah penilaian
subyektif pada operasionalisasi membangun. Validitas wajah adalah sejauh mana
suatu ukuran tampaknya terkait dengan konstruksi tertentu, dalam penilaian non-
ahli seperti pengambil tes dan perwakilan dari sistem hukum. Artinya, tes telah
menghadapi validitas jika kontennya terlihat relevan dengan orang yang mengi-
kuti tes. Mengevaluasi penampilan kuesioner dalam hal kelayakan, keterbacaan,
konsistensi gaya dan format, dan kejelasan bahasa yang digunakan.
Dalam Penelitian Matondang (2009:96) Validitas isi mempermasalahkan
sejauh mana suatu tes mengukur tingkat penguasaan terhadap isi atau materi
tertentu yang seharusnya dikuasai sesuai dengan tujuan pengajaran dan validitas
isi tidak mempunyai besaran. Validitas konstruk mempermasalahkan seberapa
jauh butir-butir tes mampu mengukur apa yang benar-benar hendak diukur sesuai
dengan definisi konseptual yang telah ditetapkan. Validitas empiris (validitas
kriteria) yang berarti bahwa validitas ditentukan berdasarkan kriteria, baik kriteria
internal maupu kriteria eksternal.
21
pengujian validitas konstruk dilakukan dengan analisis faktor, yaitu dengan
mengkorelasikan antara skor instrumen. Untuk keperluan maka diperlukan
bantuan komputer.
2. Pengujian validitas isi (content validity)
Untuk instrumen yang berbentuk test, maka pengujian validitas isi
dapat dilakukan dengan membandingkan antara isi instrumen dengan materi
pelajaran yang telah diajarkan. Seorang dosen yang memberi ujian di luar
pelajaran yang telah ditetapkan, berarti instrumen ujian tersebut tidak
mempunyai validitas. Untuk instrumen yang akan mengukur efektifitas
pelaksanaan program, maka pengujian validitas isi dapat dilakukan dengan
membandingkan antara isi instrumen dengan isi atau rancangan yang telah
ditetapkan. Secara umum pengujian validitas konstruksi dan validitas isi
dapat dibantu dengan menggunakan kisi-kisi instrumen. Dalam kisi-kisi itu
terdapat variabel yang diteliti, indikator sebagai tolak dan nomor butir
(item) pertanyaan atau pernyataan yang telah dijabarkan dari indikator.
Dengan kisi-kisi instrumen itu maka pengujian validitas dapat dilakukan
dengan mudah dan sistematis.
Pada setiap instrumen baik tes maupun nontest terdapat butir-butir
(item) pertnyaan atau pernytaan. Untuk menguji validitas butir-butir
instrumen lebih lanjut, maka setelah dikonsultasikan dengan ahli, maka
selanjutnya diujicobakan, dan dianalisis dengan analisis item. Analisis item
dilakukan dengan menghitung korelasi antara skor butir butir instrumen
dengan skor total, atau dengan mencari daya pembeda skor tiap item dari
kelompok yang membrikan jawaban tinggi dan jawaban rendah. Jumlah
kelompok yang tinggi diambil 29% dan kelompok yang rendah diamb% dan
kelompok yang rendah diambil 27% dari sampel uji coba.
3. Pengujian validitas eksternal
Validitas eksternal instrmen diuji dengan cara membandingkan (untuk
mencari kesamaan) antara kriteria yang ada pada instrumen dengan fakta-
fakta empiris yang terjadi di lapangan. Misalnya instrumen untuk mengukur
kinerja sekelompok pegawai, maka kriteria kinerja pada instrumen itu
dibandingkan dengan catatan-catatan di lapangan (empiris) tentang kinerja
22
pegawai yang baik. Bila telah terdapat kesamaan antara kriteria dalam
instrumen dengan fakta di lapangan, maka dapat dinyatkan instrumen ter-
sebut mempunyai validitas eksternal yang tinggi.
Instrumen penelitian yang mempunyai validitas eksternal yang tinggi
akan mengakibatkan hasil penelitian mempunyai validitas eksternal yang
tinggi pula. Penelitian mempunyai validitas eksternal bila hasil penelitian
dapat digeneralisasikan atau diterapkan pada sampel lain dalam populasi
yang diteliti. Untuk meningkatkan validitas eksternal selain meningkatkan
validitas eksternal instrumen, maka dapa dilakukan dengan memperbesar
jumlah sampel.
23
Skala
Butir Pertanyaan TS S SS STS
1 2 3 4
4 Apakah karyawan di Hotel kami dapat
selalu memberikan keterangan dengan
jelas setiap pertanyaan konsumen yang
berhubungan dengan Hotel
5 Apakah anda sebagai tamu mendapat
pelayanan yang baik di hotel kami
Keterangan :
STS = Sangat Tidak Setuju (Nilaniya 1)
TS = Tidak Setuju(Nilanya 2)
S = Setuju (Nilainya 3)
SS = Sangat Setuju (Nilainya 4)
24
Jawaban Responden Atas Pertanyaan Pelayanan
P1 P2 P3 P4 P5
1 1 2 3 2
2 2 2 2 2
3 2 2 2 3
1 1 1 1 1
2 2 3 3 3
1 1 1 1 2
4 4 3 4 4
1 1 1 1 1
1 1 2 2 1
3 3 3 3 3
3 2 2 3 3
3 1 3 3 2
1 1 1 1 1
Langkah-langkahnya:
1. Mencari uji validitas masing-masing item pertanyaan
Jawaban Responden Atas Pertanyaan Pelayanan
Sampel Total
P1 P2 P3 P4 P5
1 4 4 1 4 4 17
2 1 1 2 4 4 12
3 1 1 2 4 4 12
4 2 2 3 4 2 13
5 4 1 2 1 2 10
6 3 3 2 2 2 12
7 4 4 4 4 4 20
8 3 2 2 3 2 12
8 2 2 3 2 2 11
10 2 1 3 4 3 13
11 1 1 1 3 2 8
12 1 1 1 2 2 7
13 1 1 1 2 2 7
25
Jawaban Responden Atas Pertanyaan Pelayanan
Sampel Total
P1 P2 P3 P4 P5
14 3 1 2 2 2 10
15 2 2 2 1 2 9
16 3 2 2 4 3 14
17 3 3 2 3 3 14
18 1 1 2 3 2 9
19 2 2 2 2 2 10
20 3 2 2 2 3 12
21 1 1 1 1 1 5
22 2 2 3 3 3 13
23 1 1 1 1 2 6
24 4 4 3 4 4 19
25 1 1 1 1 1 5
26 1 1 2 2 1 7
27 3 3 3 3 3 15
28 3 2 2 3 3 13
29 3 1 3 3 2 12
30 1 1 1 1 1 5
2. Mencari validitas P1
Diketahui:
Sampel X Y X.X Y.Y X.Y
30 66 332 180 4112 827
Maka:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
(30 × 827)(66 × 332)
𝑟= = 0,782
√[(30 × 180) − (66 × 66)][(30 × 4112)(332 × 332)]
3. Mencari validitas P2
Diketahui:
Sampel X Y X.X Y.Y X.Y
30 54 332 126 4112 689
26
Maka:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
(30 × 689)(54 × 332)
𝑟= = 0,814
√[(30 × 26) − (54 × 54)][(30 × 4112)(332 × 332)]
4. Mencari validitas P3
Diketahui:
Sampel X Y X.X Y.Y X.Y
30 61 332 143 4112 740
Maka:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
(30 × 740)(61 × 332)
𝑟= = 0,713
√[(30 × 143) − (61 × 61)][(30 × 4112)(332 × 332)]
5. Mencari validasi P4
Diketahui:
Sampel X Y X.X Y.Y X.Y
30 78 332 238 4112 960
Maka:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
(30 × 960)(78 × 332)
𝑟= = 0,780
√[(30 × 238) − (78 × 78)][(30 × 4112)(332 × 332)]
6. Mencari validasi P5
Diketahui:
Sampel X Y X.X Y.Y X.Y
30 73 332 203 4112 896
Maka:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
27
(30 × 896)(73 × 332)
𝑟= = 0,836
√[(30 × 203) − (73 × 73)][(30 × 4112)(332 × 332)]
28
dalam menimbang sebungkus gula putih, yang bila mana diulangi hasilnya sama.
Jika gula putih itu ditimbang ternyata beratnya 2kg, kemudian diulang-ulangi lagi
pada hari-hari berikutnya, ternyata timbangan tetap menunjukkan beratnya
2kg.Timbangan seperti itu termasuk alat pengukur berat yang reliable (tingkat
reliabilitasnya tinggi).
Dengan demikian berarti realibilitas mengandung pengertian pokok sebagai
berikut :
1. Gejala atau unsur-unsur di dalam gejala yang diungkapkan dalam
pengukuran pertama, ternyata tidak berubah atau sama (tetap bertahan) pada
pengukuran kedua dan seterusnya, jika pengukuran dilakukan dengan
mempergunakan instrument (alat) yang sama.
2. Hasil pengukuran sebagai data penelitian yang kedua dan seterusnya,
bersifat ekuivalen (memiliki variasi yang sama) dengan hasil pengukuran
sebelumnya atau yang pertama, jika pengukuran dilakukan dengan
mempergunakan instrument yang sama.
Reliabilitas instrument penelitian hanya dapat diukur dengan perhitungan
statistic, berbeda dengan validitas yang terdiri dari beberapa jenis. Perhitungan
statistic yang dipergunakan adalah rumus kolerasi, dengan mempergunakan data
dari hasil uji coba (try out) angket atau test, dalam bentuk data kuantitatif. Data itu
merupakan distribusi nilai yang bersifat data interval.
Dari uraian-uraian diatas jelas bahwa instrument penelitian dikatakan
reliable apabila dalam mengukur gejala sebagai data penelitian, mampu
memberikan hasil yang relative tetap setiap kali dipergunakan pada sekelompok
individu yang sama. Dengan kata lain instrumen penelitian yang memiliki tingkat
reabilitas yang tinggi, berarti memiliki ketetapan atau keajegan (consistency)
hasilnya, meskipun digunakan secara berulang.
Menurut Matondang (2009) Konsep reliabilitas dalam arti reliabilitas alat
ukur berkaitan erat dengan masalah kekeliruan pengukuran. Kekeliruan
pengukuran sendiri menunjukkan sejauh mana konsistensi hasil pengukuran
terjadi apabila dilakukan pengukuran ulang terhadap kelompok subyek yang
sama. Sedangkan konsep reliabilitas dalam arti reliabilitas hasil ukur berkaitan
erat dengan kekeliruan dalam pengambilan sampel yang mengacu pada
29
konsistensi hasil ukur apabila pengukuran dilakukan ulang pada kelompok yang
berbeda.
Menurut Kumar (1999:99) Konsep reliabilitas dalam kaitannya dengan
instrument penelian memiliki arti yang sama : jika alat penelitian konsisten dan
stabil, maka dapat diprediksi dan akurat, dikatakan dapat diandalkan. Besar
tingkat konsistensi dan stabilitas dalam instrument, yang hebat adalah reliabilitas.
Oleh karena itu skala atau tes dapat ditinjau kembali jika pengukuran berulang
yang dilakukan olehnya kondisi konstan akan memberikan hasil yang sama. Hal
ini dinyatakan dalam :
The concept of reliability in relation to a research instrument has a
similar meaning if a research tool is consistent and stable, hence predictable
and accurate, it is said to be reliable. The great the degree of consistency and
stability in an instrument, to great is reliability. Therefore a scale or test is
reable to the extent that repeat measurements made by it under constant
condition will give the result.
30
SUBYEK GANJIL(X) GENAP(Y) R(X) R(Y) D D2
A 21 38 3,00 14,00 -11,00 121,00
B 23 36 4,00 13,00 -9,00 81,00
C 24 17 5,00 2,50 2,50 6,25
D 31 25 11,00 6,50 4,50 20,25
E 30 27 9,50 8,50 1,00 1,00
F 35 33 14,00 12,00 2,00 4,00
G 28 30 7,00 11,00 -4,00 16,00
H 25 21 6,00 5,00 1,00 1,00
I 33 27 12,00 8,50 3,50 12,25
J 14 12 2,00 1,00 1,00 1,00
K 29 17 8,00 2,50 5,50 30,25
L 30 20 9,00 4,00 4,50 20,25
M 34 29 13,00 10,00 3,00 9,00
N 11 25 1,00 6,50 5,50 30,25
JUMLAH 353,50
31
instrument perlu direvisi (diperbaiki) dan setelah itu perlu pula diuji cobakan lagi,
karena hasil rekontruksi yang pertama instrument tidak dapat dipergunakan
(kurang baik sebagai alat pengumpul data).
32
TEST I TEST II
SUBYEK X2 Y2 XY
(X) (Y)
20 𝑋 22.659 − (638)(631)
𝑟𝑥𝑦 =
√{20 𝑋 23.854 − (638)2 }{20 𝑋 22.061 − (631)2 }
𝑟𝑥𝑦 = 0,91
Koefisien korelasi reliabilitas yang diperoleh (𝑟𝑋𝑌 ) adalah 0,91. Koefesien
korelasi ini cukup tinggi, dimungkinkan terjadi karena subyek uji coba yang sama,
mengerjakan satu test dua kali. Dengan demikian berarti test memiliki realibilitas
yang tinggi, mengingat koefisien korelasi yang diperoleh lebih besar dari indeks
tabel pada (N-1) = 20 – 1 = 19 yang menunjukkan angka 0, 456 (alpha = 0,05).
33
item pilihan berganda (multiple choice items), untuk test kedua harus sama
bentuknya. Demikan juga jika materi test pertama diambil dari buku A
karangan saudara ALI Bab I sampai Bab X (terakhir), maka untuk test yang
kedua bahannya harus sama. Jumlah item test pertama dan kedua, sebaiknya
sama, jika yang pertama sebanyak 100 item, maka yang kedua juga 100
item. Perbedaan antara kedua test tersebut, terletak pada rumusan itemnya
yang semuanya berbeda. Untuk item pertama, kedua, ketida dan seterusnya
pada test yang kedua tidak harus menanyakan hal yang sama seperti pada
item pertama, kedua, ketiga dan seterusnya pada test pertama. Akan tetapi
perlu diupayakan agar terdapat kesamaan dalam ranah yang diungkapkan.
jika item pertama bersifat mengungkapkan ranah penguasaan pengetahuan,
sebaiknya sama antar kedua test tersebut. Demikian juga item kedua, ketiga
dan seterusnya yang mungkin mengungkapkan ranah pemahaman
(pengertian) atau ranah analisis, sintesis dan sebagainya.
34
test-retest (stability), equivalent, dan gabungan keduanya. Secara internal
reliabilitas instrumen dapat diuji dengan menganalisis konsistensi butir-butir yang
ada pada instrumen dengan teknik tertentu.
1. Test-retest
Instrumen penelitian yang reliabilitas diuji dengan test-retest dilakukan
kegiatan dengan cara mencobakan instrumen beberapa kali pada responden.
Jadi dalam hal ini instrumennya sama, respondennya sama dan waktunya
berbeda. Reliabilitas diukur dari koefisien korelasi antara percobaan
pertama dengan yang berikutnya. Bila koefisien korelasi positif dan
signifikan maka instrumen tersebut sudah dinyatakan reliabel. Pengujian
cara ini sering juga disebut stability.
2. Pengujian reliabilitas instrumen yang kedua adalah dilakukan dengan
membuat dua instrument yang ekuivalen
Instrument yang ekuivalen adalah pertanyaan yang secara bahasa berbeda,
tetapi maksudnya sama. Sebagai contoh (untuk satu butir saja); Berapa
tahun pengalaman kerja Anda dilembaga ini ? Pernyataan tersebut dapat
ekuivalen dengan pernyataan berikut. Tahun berapa Anda mulai bekerja
dilembaga ini?
Pengujian reliabilitas instrument dengan cara ini cukup dilakukan sekali,
tetapi instrumennya dua, pada responden yang sama, waktu sama,
instrument berbeda. Reliabilitas instrument dihitung dengan cara
mengkorelasikan antara data instrument yang satu dengan data instrument
yang satu dengan data instrument yang dijadikan equivalen.Bila korelasi
positif dan signifikan, maka instrument dapat dinyatakan reliable.
3. Gabungan
Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrument
yang equivalen itu beberapa kali, ke responden yang sama. Jadi cara ini
merupakan gabungan pertama dan kedua. Reliabilitas instrument dilakukan
dengan mengkorelasikan dua instrument, setelah itu dikorelasikan pada
pengujian kedua, dan selanjutnya dikorelasikan secara silang. Hal ini dapat
digambarkan sebagai berikut :
35
Instrument Equivalen
Jika dengan dua kali pengujian dalam waktu yang berbeda, maka akan dapat
dianalisis keenam koefesien reliabilitas. Bila keenam koefesien korelasi itu
semuanya positif dan signifikan, maka dapat dinyatakan bahwa instrument
tersebut reliable.
4. Interval Consistency
Pengujian reliabilitas dengan interval consistency, dilakukan dengan cara
mencobakan instrument sekali saja, kemudian yang diperoleh dianalisis
dengan teknik tertentu. Hasil analisis dapat digunakan untuk memprediksi
reliabilitas instrument. Pengujian reliabilitas instrument dapat dilakukan
dengan teknik belah dua dari Spearman Brown (split half), KR 20, KR 21
dan Anova Hoyt.
Berikut diberikan rumus-rumus dan contoh perhitungannya.
a. Rumus Spearman Brown :
2𝑟𝑏
𝑟𝑖 =
1 + 𝑟𝑏
Dimana :
ri = reliabilitas internal seluruh instrument
rb= korelasi product moment antara belahan pertama dan kedua
36
Dimana :
k = jumlah item dalam instrument
pi = proposi banyaknya subyek yang menjawab pada item 1
qi = 1 - pi
st2= varians total
Contoh :
Suatu instrument yang akan digunakan untuk penelitian, akan diuji
reliabilitasnya, karena skor yang dipergunakan dalam instrument tersebut
menghasilkan skor dikotomi (1 dan 0), maka instrument akan dianalisis dengan
rumus KR 20. Dari percobaan kepada 10 orang responden menghasilkan data
sebagai berikut :
Tabel 3. Penolong untuk uji reliabilitas instrument KR 20
No. Item no. Xt Xt2
Res 1 2 3 4 5 6 7 8 9 10
1 1 1 0 0 0 1 0 0 1 0 4 16
2 1 1 1 0 0 1 0 0 0 0 4 16
3 1 0 0 1 0 1 0 0 0 0 3 9
4 1 1 1 0 0 1 0 1 0 0 5 25
5 1 1 1 1 1 1 1 1 1 0 9 81
6 1 1 1 1 1 0 1 1 1 1 8 64
7 1 1 1 1 1 0 1 1 1 0 8 64
8 1 0 1 0 1 0 1 0 0 1 5 25
9 1 1 1 1 0 0 1 0 0 1 6 36
10 0 1 0 1 1 0 1 0 0 1 5 25
Np 9 8 7 6 5 5 6 4 4 3 57 361
p 0,90 0,80 0,70 0,60 0,50 0,50 0,60 0,40 0,40 0,30
q 0,10 0,20 0,30 0,40 0,50 0,50 0,40 0,60 0,60 0,70
Pq 0,09 0,16 0,21 0,24 0,25 0,25 0,24 0,24 0,24 0,21 Σpq=
2,13
Sebelum harga-harga tersebut dimasukkan dalam rumus, maka harus kita
hitung varians totalnya terlebh dahulu.
𝑥2
𝑠𝑡2 =
𝑛
(∑ 𝑥𝑡 )2
𝑥𝑡2 = ∑ 𝑥𝑡2 −
𝑛
2 (57)2 2
𝑥𝑡 = 361 – 10 𝑥𝑡 = 361
𝑥2 36,1
st 2 = = = 3,61
𝑛 10
37
Selanjutnya harga tersebut kita masukkan dalam rumus KR 20 :
10 3,61 − 2,13
𝑟𝑖 = { } = 3,61
10 − 1 10
c. Rumus KR 20
𝑘 𝑀 (𝑘 − 𝑀)
𝑟𝑖 = {1 − }
(𝑘 − 1) 𝑘 𝑠𝑡2
Dimana :
K = jumlah item dalam instrument
M = mean skor total
St2 = varians total
Contoh :
Apabila data tabel contoh KR 20 akan diuji reliabilitasnya dengan KR 21,
maka kita tinggal menghitung M (mean skor total). Harga M dihitung dengan
rumus :
∑ 𝑥1 57
M= = 10 = 5,7
𝑛
Selanjutnya diperoleh harga M, dengan tabel analisis butir yang sudah ada
harga ri dapat dihitung :
𝑘 𝑀 (𝑘 − 𝑀)
𝑟𝑖 = {1 − }
(𝑘 − 1) 𝑘 𝑠𝑡2
10 5,7 (10 − 5,7)
𝑟𝑖 = {1 − }
(10 − 1) 10 (3,6)
𝑟𝑖 = 0,357
38
Dimana :
MKs = mean kuadrat antara subyek
Mke = mean kuadrat kesalahan
ri = reliabilitas
Contoh :
Jika data Tabel. 3 akan diuji reliabilitasnya dengan rumus Anova Hoyt,
diperlukan langkah-langkah perhitungan sebagai berikut :
1. Menghitung Jumlah Kuadrat Total
(∑ 𝑋𝑡𝑜𝑡 )
JKtot = ΣXtot - 𝑛,𝑘
Berdasarkan pada tabel analisis butir (Tabel 9.4 harga-harga tersebut dapat
dihitung).
(57)2
JKtot = 57 - = 24,51
100
92 +82 +72 +62 +52 +52 +62 +42 +42 +32 (57)2
JKite = - = 3,21
10 100
39
42 +42 +32 +52 +92 +82 +52 +62 +52 (57)2
JKsub = - = 3,21
10 100
e. Alfa Cronbach
Pengujian reliabilitas dengan teknik alfa Cronbah dilakukan untuk jenis data
interval/essay. Rumus koefisien reliabilitas Alfa Cronbah
𝑘 ∑ 𝑠𝑖2
𝑟𝑖 = {1 − 2 }
𝑘−1 𝑠𝑖
Dimana :
k = mean kuadrat antara subyek
∑ 𝑠𝑖2 = mean kuadrat kesalahan
𝑠𝑖2 = varians total
40
Dimana :
JKi = jumlah kuadrat seluruh skor item
JKs = jumlah kuadrat subyek
Contoh :
Misalnya hasil uji coba instrumen yang berupa angket dengan skala 1 s/d
menghailkan data sebagai berikut :
Tabel 4. Hasil uji coba instrument berupa angket
No Item no Xt Xt2
1 2 3 4 5 6 7 8 9 10
1 1 4 3 3 4 4 3 2 1 3 28 784
2 3 4 3 2 3 3 3 3 2 3 29 841
3 2 3 4 3 3 4 3 4 2 2 30 900
4 4 4 4 4 3 4 3 4 4 4 38 1.444
5 4 3 3 4 2 4 3 4 2 1 30 900
6 3 4 4 3 2 4 3 3 3 3 32 1.024
7 4 3 3 3 3 4 4 2 3 3 32 1.024
8 4 4 4 2 3 3 4 3 3 3 33 1.089
9 3 3 3 4 3 3 2 4 4 2 31 961
10 2 4 4 3 3 3 2 3 3 3 30 900
30 36 35 31 29 36 30 32 27 27 313 9.867
900 1296 1225 961 841 1296 900 1.24 729 729 9.901
Dengan harga-harga pada table 1, maka :
∑ 𝑋𝑡2 (∑ 𝑋𝑡 )2
𝑠𝑖2 = −
𝑛 𝑛2
9.867 (313)2
𝑠𝑖2 = − =7,01
10 𝑛2
𝐽𝐾𝑖 𝐽𝐾𝑠
𝑠𝑖2 = − 2
𝑛 𝑛
1.039 9.901
𝑠𝑖2 = − = 4,89
10 102
41
Menurut Matondang (2009), realibilitas mempermasalahkan sejauh mana
hasil atau suatu pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat
dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap
kelompok subyek yang sama, diperoleh hasil pengukuran yang relative sama.
Penentuan koefisien reabilitas instrument untuk skor butir dikotomi digunakan
rumus KR-20, sedang untuk skor politomi digunakan rumus alpha. Interpretasi
terhadap koefesien reabilitas merupakan interprestasi relative, artinya tidak ada
batasan mutlak yang menunjukkan berapa angka koefisien minimal yang harus
dicapai agar suatu pengukuran dapat disebut reliable. Namun memberikan
informasi tentang hubungan variasi skor teramati dengan varians skor sejati
kelompok individu.
2.2. Kajian kritis
Instrumen penelitian adalah alat bantu yang digunakan oleh peneliti untuk
mengumpulkan data penelitian. Instrument penelitian yang digunakan peneliti
bergantng pada jenis data yang dibutuhkan pada penelitiannya yang ditentukan
oleh rumusan masalah penelitian. Mutu istrumen akan menentukan mutu data
yang digunakan dalam penelitian. Instrumen yang akan digunakan pada penelitian
harus di sesuaikan dngan permasalahan penelitian dan variable penelitian.
Jenis–jenis instrumen penelitian hampir sama dengan jenis intrumen
evaluasi, yaitu instrumen tes dan nontes. Yang mana tes bersifat mengukur
mengukur dan nontes bersifat menghimpun. Jenis terdiri dari beberapa jenis, yaitu
tes tertulis, tes lisan dan tes tindakan. Sedangkan nontes terdiri dari angket,
observasi, wawancara, skala sikap, skala minat daftar cek, skala penilaian, dan
studi dokumentasi. Tes merupakan teknik pngukuran yang didalamya terdapat
berbagai pertanyaan, pernyataan, atau serangkaian tugas yang harus dikerjakan
oleh responden. Tes tertulis adalah tes yang menuntut jawaban responden dalam
bentuk tulisan responden. Tes tertulis ada dua bentuk yaitu, bentuk uraian dan
bentuk objektif. Setiap jenis atau bentuk tes mempunyai tujuan dan fungsi
masing-masing. Salah satu bentuk tes yang banyak digunakan dalam penelitian
adalah tes objektif, tes ini sering digunakan karena jawabannya antara benar dan
salah dan skornya antara 1 dan o. Mengapa disebut tes objektif karena
42
penilaiannya objektif. Siapapun yang mengkoreksi jawaban tes objektif hasilnya
kan tetap sama karena kunci jawabannya sudah jelas dan pasti.
Kelebihan saat peneliti menggunakan tes objektif ialah a) seluruh ruang
lingkup (scope) materi dapat dinyatakan pada item atau soal,lebih banyak materi
yang dapat diinyatakan dalam soal b) kemungkinan jawaban spekulatif dalam
ujian dapat dihindari, c) jawaban bersifat mutlak, jadi penilaian dapat dilakukan
secara objektif, d) pengoreksian dapat dilakukan siapa saja, sekalipun tidak
mengetahui dan mengusai materinya, e) pemberian skor dapat dilakukan dengan
mudah dan cepat, f) korektor tidak akan terpengaruh oleh baik-buruknya tulisan,
dan g) tidak mungkin terjadi dua orang responden yang jawabannya sama, tetapi
mendapat skor yang berbeda. Sedangkan kelemehannya saat menggunakan tes
objektif ialah , a) mengkontruksi soalnya sangat sulit, b) membutuhkan waktu
yang lama, c) ada kemungkinan responden mencontoh jawaban orang lain dan
berfikir pasif, dan d) umumnya hanya mampu mengukur proses mental yang
dangkal.
Instrumen penelitian nontes ialah angket, yaitu instrumen yang berisi
serangkaian pertanyaan dan penyataan untuk mendapat informasi terkalit
penelitian ynag dilakukan peneliti, responden harus menjawab ssecara bebas
sesuai dengan pendapat responden. Angket memiliki kesamaan degan wawancara
hanya saja angket dengan tulisan sedangkan wawancara dilakukan secara
langsung. Angket terdiri dari dua bentuk antara lain angket bentuk berstruktur dan
angket tidak berstuktur, angket berstruktur ialah angket yang sudah menyediakan
jawaban sehingga responden hanya menjawab dengan jawaban yang telah
disedakan atau tidak dapat menjawab perntanyaan atau pernyataan dngan bebas.
Sedangkan angket tidak berstruktur ialah angket yang memberikan jawaban secara
terbuka atau responden dapat menjawab pertanyaan secara bebas, hanya saja saat
pengkoreksian bentuk tidak berstuktur tidak dapat secara objektif karena
jawabannya tidak dapat dianalisis secara analisis.
Instrumen penelitian selanjutnya adalah observasi, yaitu teknik
pengumpulan data yang dilakukan dengan pengamatan dan pencatatan secara
sistematis, logis, objektif dan rasional mengenai berbagai fenomena, baik dalam
situasi yang sebenarnya maupun dalam situasi buatan untuk mencapai tujuan
43
tertentu. Teknik observasi sering digunakan dalam penelitian kualitatif. Tujuan
utama observasi yaitu a) untuk mengumpulkan data dan informasi mengenai suatu
fenomena, baik yang berupa peristiwa maupun tindakan, baik dalam situasi yang
sesungguhnya maupun dalam situasi buatan, b) untuk mengukur perilaku,
tindakan, dan proses atau kegiatan yang sedang dilakukan, interaksi antara
responden dan lingkungan, dan faktor-faktor yang dapat diamati lainnya, terutama
kecakapan sosial.
Wawancara ialah teknik pengambilan data yang dilakukan dengan cara
bertanya-jawab dengan responden yang dilakukan secara langsung maupun secara
tidak langsung.supaya saat wawancara kita mendapat data yang kita butuhkan dari
wawancara tersebut kita harus memperhatikan beberapa hal, yaitu harus
membangun hubungan baik antara pewawancara dan orang yang
diwawancarai,saat wawancara jangan terlalu kaku, tunjukkan sikap yang bebas,
ramah, terbuka, dan adaptasikan diri dengannya supaya responden dapat dnegan
rileks memberikan jawaban dari pertanyaan kita, hilangkan prasangka-prasangka
yang kurang baik, sehingga pertanyaan-pertanyaan yang diajukan bersifat netral,
dan pertanyaan hendaknya jelas, tepat dengan bahasa yang sederhana dan mudah
dimengerti.
Sikap merupakan kesiapan seseorang memperlakukan sesuatu, baik itu
orang lain benda ataupun lingkungannya, maka skala penilaian ialah skala untuk
menilai sikap seseorang terhadap suatu objek. Kesiapan itu mempunyai aspek-
aspek kognitif, afektif, dan kecenderungan bertindak yang dapat disimpulkan dari
perilaku individu tersebut. Dalam mengukur sikap, perlu diperhatikan tiga
komponen sikap, yaitu kognisi (pengetahuan), afeksi (perasaan) dan konasi
(kecenderungan bertindak) seseorang terhadap objek.
Minat adalah dorongan atau aktivitas mental yang dapat merangsang
perasaan senang tehadap sesuatu. bisa berupa orang, benda, kegiatan, pengalaman,
dan lain-lain yang dapat dijadikan sebagai stimulus yang memerlukan respon
terarah. Minat sangat berhubungan dengan sikap, misalnya jika materi pelajaran
diminati peserta didik, maka sikap peserta didik cenderung memperhatikan
pelajaran tesebut. Hal-hal yang dapat mempengaruhi munculnya minat,
diantaranya seperti motivasi, belajar, materi pelajaran, keluarga, teman pergaulan,
44
cita-cita, dan lain-lain. Berminat tidaknya seseorang terhadap sesuatu dapat dilihat
dari beberapa indicator, antara lain perhatian, perasaan, motivasi, dan sikap.
Daftar cek adalah suatu daftar yang berisi subjek dan aspek-aspek yang akan
diamati. Dengan daftar cek yang dibuat memungkinkan seseorang mencatat tiap-
tiap kejadian (betapapun kecilnya), tetapi dianggap penting. Ada bermacam-
macam aspek perbuatan yang biasanya dicantumkan dalam daftar cek, kemudian
peneliti sebagai observer tinggal memberikan tanda cek (v) pada tiap-tiap aspek
tersebut sesuai dengan hasil pengamatannya. Daftar cek banyak manfaatnya,
antara lain, a) dapat membantu peneliti untuk mengingat-ingat apa yang harus
diamati, b) dapat memberikan informasi kepada stakeholder.
Dalam skala penilaian, fenomena-fenomena yang akan diobservasi itu
disusun dalam tingkatan-tingkatan yang telah ditentukan. Jadi tidak hanya
mengukur secara mutlak ada atau tidaknya variable tertentu, tetapi lebih jauh
mengukur bagaimana intensitas fenomena yang ingin diukur. Kelemahan dari
skala penilaian yang akan timbul jika dalam pencatatan observasi terpikat oleh
kesan-kesan umum yang baik pada responden, sedangkan peniliti tidak
menyelidiki kesan-kesan umum yang baik pada responden, misalnya terkesan
akan kecantikan, sopan santun, cara komunikasi dan atau model berpakaian.
Sebaliknya peneliti mungkin memberikan nilai yang rendah, karena responden
tidak cantik, kurang sopan, cara komunikasi tidak etis, dan tidak berpakaian rapih.
Studi dokumentasi adalah teknik untuk mempelajari dan menganalisis
bahan-bahan tertulis kantor atau sekolah, seperti: silabus, program tahunan,
program bulannan, program mingguan, rencana pelaksanaan pembelajaran (RPP),
catatan pribadi peserta didik, buku raport, kisi-kisi, daftar nilai, lembar soal/tugas,
lembar jawaban, dan lain-lain. Untuk menguji kredibilitas data penelitian yang
sudah diperoleh melalui studi dokumentasi ini, peneliti perlu mengkonfirmasikan
dengan sumber-sumber lain yang relevan guna memperoleh tanggapan, jika perlu
melengkapi dan mengurangi.
Validitas merupakan suatu ukuran yang menunjukkan tingkat-tingkat
kevalidtan atau kesahihan suatu instrumen. Suatu instrumen yang valid atau sahih
mempunyai validitas tinggi. Sebaliknya, instrumen yang kurang valid bearti
memiliki validitas rendah.
45
Sebuah instrumen dikatakan valid apabila mampu mengukur apa yang
diinginkan. Sebuah instrumen dikatakan valid apabila dapat mengungkapkan data
dari variabel yang diteliti secara tepat. Tinggi rendahnya validitas instrumen
menunjukkan sejauh mana data yang terkumpul tidak menyimpang dari gambaran
tentang validitas yang dimaksud.
validasi dalam penelitian melibatkan pemeriksaan ketat atas argumen logis
dan bukti empiris untuk menentukan apakah mendukung teoretis. Demikian pula,
validasi dalam penilaian melibatkan evaluasi argumen logis dan bukti empiris
untuk menentukan apakah mendukung usulan kesimpulan, serta interpretasi dan
penggunaan, hasil penilaian.
Diskusi tentang validitas suatu tes dapat diklarifikasi dengan
mempertimbangkan kondisi, populasi, dan jenis generalisasi yang membentuk
parameter inferensi. Alih-alih menyatakan bahwa tes yang diberikan itu valid, kita
harus menyatakan bahwa itu sah (atau tidak valid) untuk menarik kesimpulan
tertentu ketika itu diberikan kepada individu tertentu dalam pengaturan tertentu.
Hal itu membantu untuk memperjelas bahwa validitas telah menjadi pusat
perhatiannya pada evaluasi hipotesis yang dibentuk oleh upaya untuk
menggeneralisasi melewati situasi ujian.
46
3. Validitas empiris. Validitas ini biasanya menggunakan teknik statistik, yaitu
analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan
antara skor tes dan suatu kriteria tertentu yang merupakan suatu tolak ukur di
luar tes yang bersangkutan. Validitas empiris disebut juga validitas yang
dihubungkan dengan kriteria ( criterion-related validity) atau validitas
statistik (statistical validity). Ada tiga macam validitas empiris, yaitu :
a. Validitas prediktif ialah jika kriteria standar yang digunakan adalah untuk
meramalkan prestasi belajar murid dimasa yang akan datang. Validitas
prediktif bermaksud melihat hingga mana suatu tes dapat memperkirakan
perilaku peserta didik pada masa yang akan datang.
b. Validitas konkuren ialah jika kriteria standarnya berlainan. Misalnya, skor
tes dalam pelajaran bahasa Indonesia dikorelasikan dengan skor tes bahasa
inggris.
c. Validitas sejenis ialah jika kriteria standarnya sejenis. Misalnya, bahasa
Indonesia dengan bahasa inggris. Untuk menguji validitas empiris dapat
menggunkan analisis korelasi product-moment dengan angka simpangan.
4. Validitas konstruk. Konstruk adalah konsep yang dapat diobservasi
(observable) dan dapat diukur (measurable). Validitas konstruk sering juga
disebut validitas logis (logical validity). Validitas konstrsuk berkenaan
dengan pertanyaan hingga mana suatu tes betula-betul dapat mengobservasi
dan mengukur fungsi psikologis yang merupakan deskripsi perilaku peserta
didik yang akan diukur oleh tes tersebut. Validitas konstruk banyak dikenal
dan digunakan dalam tes-tes psikologis untuk mengukur gejala perilaku yang
abstrak, seperti kesetiakawanan, kematangan emosi, sikap, motivasi, minat,
dan sebagainya. Untuk menguji validitas konstruk dapat dilakukan dengan
berbagai sumber, antara lain validitas isi, validitas prediksi, dan validitas
konkuren.
5. Validitas faktor. Dalam penelitian sering di gunakan skala pengukuran
tentang suatu variabel yang terdiri atas beberapa faktor. Faktor-faktor tersebut
diperoleh berdasarkan dimensi/indikator dari variabel yang diukur sesuai
dengan apa yang terungkap dalam konstruksi teoritisnya. Meskipun variabel
terdiri beberapa faktor, prinsip homogenitas untuk keseluruhan faktor harus
47
tetap dipertahankan, sehingga tidak terjadi tumpang tindih antara satu faktor
dan faktor lain. Kriterium yang digunakan dalam validitas faktor ini dapat
diketahui dengan menghitung homogenitas skor setiap faktor dengan total
skor, dan antara skor dari faktor yang satu dengan skor dari faktor yang lain.
6. Validitas wajah adalah sejauh mana suatu ukuran tampaknya terkait dengan
konstruksi tertentu, dalam penilaian non-ahli seperti pengambil tes dan
perwakilan dari sistem hukum. Artinya, tes telah menghadapi validitas jika
kontennya terlihat relevan dengan orang yang mengi-kuti tes. Mengevaluasi
penampilan kuesioner dalam hal kelayakan, keterbacaan, konsistensi gaya
dan format, dan kejelasan bahasa yang digunakan.
Uji validitas
1. Pengujian validitas kontruk (contruct validity)
Untuk menguji validitas kontruk, maka dapat digunkan pendapat para
ahli (judgment experts). Para ahli diminta pendapatnya tentang instrument
yang telah disusun itu. Mungkin para ahli akan mem-berikan pendapat:
instrumen dapat digunkan tanpa perbaikan, ada perbaikan, dan mungkin
dirombak total.
Setelah pengujian dari ahli selesai, maka diteruskan uji coba instrument.
Instrument yang telah disetujui para ahli tersebut dicobakan pada sampel dari
mana populasi diambil. Setelah data ditabulasikan, maka pengujian validitas
konstruk dilakukan dengan analisis faktor, yaitu dengan mengkorelasikan
antara skor instrumen. Untuk keperluan maka diperlukan bantuan komputer.
2. Pengujian validitas isi (content validity)
Untuk instrumen yang berbentuk test, maka pengujian validitas isi
dapat dilakukan dengan membandingkan antara isi instrumen dengan materi
pelajaran yang telah diajarkan. Seorang dosen yang memberi ujian di luar
pelajaran yang telah ditetapkan, berarti instrumen ujian tersebut tidak
mempunyai validitas.
Secara umum pengujian validitas konstruksi dan validitas isi dapat
dibantu dengan menggunakan kisi-kisi instrumen. Dalam kisi-kisi itu terdapat
variabel yang diteliti, indikator sebagai tolak dan nomor butir (item)
48
pertanyaan atau pernyataan yang telah dijabarkan dari indikator. Dengan kisi-
kisi instrumen itu maka pengujian validitas dapat dilakukan dengan mudah
dan sistematis.
3. Pengujian validitas eksternal
Validitas eksternal instrmen diuji dengan cara membandingkan (untuk
mencari kesamaan) antara kriteria yang ada pada instrumen dengan fakta-
fakta empiris yang terjadi di lapangan. Misalnya instrumen untuk mengukur
kinerja sekelompok pegawai, maka kriteria kinerja pada instrumen itu
dibandingkan dengan catatan-catatan di lapangan (empiris) tentang kinerja
pegawai yang baik. Bila telah terdapat kesamaan antara kriteria dalam
instrumen dengan fakta di lapangan, maka dapat dinyatkan instrumen ter-
sebut mempunyai validitas eksternal yang tinggi.
Instrumen penelitian yang mempunyai validitas eksternal yang tinggi
akan mengakibatkan hasil penelitian mempunyai validitas eksternal yang
tinggi pula. Penelitian mempunyai validitas eksternal bila hasil penelitian
dapat digeneralisasikan atau diterapkan pada sampel lain dalam populasi yang
diteliti. Untuk meningkatkan validitas eksternal selain meningkatkan validitas
eksternal instrumen, maka dapa dilakukan dengan memperbesar jumlah
sampel.
Ujii validitas juga bisa dihitung dengan memperhitungkan pada setiap butir
pertanyaaan di uji validitasnya. Hasil r hitung kita bandingkan dengan r tabel di
mana df= n-2 dengan sig 5%. Jika r tabel < r hitung maka valid. Uji validitas
menggunakan teknik korelasi product moment dengan menggunakan rumus
sebagai berikut:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
49
Reabilitas merupakan serangkaian alat ukur yang memiliki konsistensi bila
pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang.
Reliabilitas tes adalah tingkat keajegan (konsistensi) suatu tes, yakni sejauh mana
suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg, relative tidak
berubah meskipun diteskan pada situasi yang berbeda-beda. Reliabilitas
dinyatakan dalam bentuk angka, biasanya sebagai koefesien. Koefesiennya tinggi
akan menghasilkan reliabilitas yang tinggi pula.
Reliabilitas instrument penelitian hanya dapat diukur dengan perhitungan
statistic, berbeda dengan validitas yang terdiri dari beberapa jenis. Perhitungan
statistic yang dipergunakan adalah rumus kolerasi, dengan mempergunakan data
dari hasil uji coba (try out) angket atau test, dalam bentuk data kuantitatif. Data itu
merupakan distribusi nilai yang bersifat data interval.
Adapun konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat
dengan masalah kekeliruan pengukuran. Kekeliruan pengukuran sendiri
menunjukkan sejauh mana konsistensi hasil pengukuran terjadi apabila dilakukan
pengukuran ulang terhadap kelompok subyek yang sama. Sedangkan konsep
reliabilitas dalam arti reliabilitas hasil ukur berkaitan erat dengan kekeliruan
dalam pengambilan sampel yang mengacu pada inkonsistensi hasil ukur apabila
pengukuran dilakukan ulang pada kelompok yang berbeda.
Untuk menghitung reliabilitas instrument kita dapat menggunakan
perhitungan korelasi , dimana terdapat 3 cara pada perhitungan koralasi ini.
Pertama, korelasi belah dua dimana diperoleh dari uji coba angket atau tes soal ,
nilai pertama didapat dari soal genap dan nilai kedua dari soal ganjil. Rumus yang
digunakan sebagai berikut :
2
6∑𝐷
𝑟𝑔𝑔 =1−
𝑁 (𝑁 2 − 1)
Kedua dalam uji coba, test yang sama dikerjakan dua kali atau secara
berulang pada waktu yang berbeda. Pengulangan dimaksudkan untuk memperoleh
dua distribusi nilai dari test yang variasinya sama, yang dilakukan pada waktu
yang berbeda meskipun tidak terlalu lama jaraknya. Rumus yang digunakan
sebagai berikut :
50
𝑁𝛴𝑋𝑌 − (𝛴𝑋)(ΣY)
𝑟𝑥𝑦 =
√{𝑁𝛴𝑋 2 − (ΣX)2 }{𝑁𝛴𝑌 2 − (ΣY)2 }
Ketiga, Untuk item pertama, kedua, ketida dan seterusnya pada test yang
kedua tidak harus menanyakan hal yang sama seperti pada item pertama, kedua,
ketiga dan seterusnya pada test pertama. Akan tetapi perlu diupayakan agar
terdapat kesamaan dalam ranah yang diungkapkan. jika item pertama bersifat
mengungkapkan ranah penguasaan pengetahuan, sebaiknya sama antar kedua test
tersebut. Demikian juga item kedua, ketiga dan seterusnya yang mungkin
mengungkapkan ranah pemahaman (pengertian) atau ranah analisis, sintesis dan
sebagainya.
Koefisien reliabilitas konsistensi gabungan butir untuk skor butir dikotomi
dapat dihitung dengan menggunakan rumus Kuder-Richardson yang dikenal
dengan nama KR-20 dengan rumus:
𝐾 𝛴𝑝𝐼 𝑞𝑖
KR-20 = 𝐾−1 (1 − )
𝑠𝑡 2
51
BAB III
PENUTUP
3.1. Kesimpulan
Instrumen penelitian adalah alat yang telah memenuhi persyaratan akademis
maka dapat digunakan sebagai alat untuk mengukur suatu objek dan
mengumpulkan informas dari suatu variable tertentu. Instrumen penelitian sangat
berpengaruhi pada data yang kita dapatkan dari penelitian kita. Maka saat memilih
instrumen harus dilakukan sebaik-baiknya. ada 3 hal yang harus diperhatikan
dalam memilih instrument penelitian, yaitu masalah penilitian, tujuan penelitian
dan jenis instrumen yang akan kita gunakan.
Jenis instrumen penelitian ada 9 yaitu, tes, angket, observasi, wawancara,
skala sikap, skala minat, dafatr cek, skala penilaian dan studi dokemuntasi. Tes
adalah teknik pengukuran yang berisi serangkaian pertanyaan, pernyataan ataupun
tugas-tugas yang harus diselesaikan oleh responden. Salah satu tes yang sering
digunakan ialah tes objektif, dikatakan tes objektif karena penilaian tes objektif
hanya 0 dan 1.
Angket atau questioner adalah instrumen penelitian yang berisi serangkaian
pernyataan atau pertanyaan untuk menjaring data atau informasi yang harus
dijawab oleh responden. Angket memiliki dua bentuk, yaitu angket bentuk
berstruktur dan angket bentuk tidak berstruktur. Angket bentuk berstruktur adalah
angket yang menyediakan beberapa kemungkinan yang harus dipulih oleh
responden. Sedangkan angket bentuk tidak berstruktur adalah angket yang
membrikan kebebasan untuk responden dalam menjawab pertanyaan tersebut.
Observasi adalah teknik pengumpulan data yang dilakukan dengan jalan
pengamatan dan pencatatan secara sistematis, logis, obsjektif dan rasional
mengenai beberapa fenomena. Observasi sering digunakan untuk instrument
penelitian kulalitatif. Digunkaan juga untuk mengukur perilaku, tindakan, dan
proses atau kegiatan yang sering berlangsung.
Wawancara adalah teknik pengumpulan data yang dilakukan melalui
perckapan dan Tanya-jawab. Ada 3 bentuk pertanyaan wawancara, yaitu
pertanyaan berstruktur, pertanyaan tak berstruktur, dan jenis pertanyaan
campuran.
52
Sikap adalah suatu kesiapan yang kompleks dengan individual untuk
memperlakukan suatu objek(orang, benda dan lingkungan) dengan cara tertentu.
Dalam mengukur sikap perlu diperhatikan kognisi(pengetahuan),
afeksi(perasaan), dan konasi (kecenderungan bertindak). Seseorang terhadap
objek.
Skala minat adalah dorongan yang dpat merangsakng perasaan senag
terhadap sesuatu. Sesuatu itu dapat orang, benda, dankegiatan. Minat sangat
berhubungan erat dengan sikap . misalnya jika satu mata pelajaran diminati
seorang peserta didik maka sikapnya cenderung memperhatikan mata pelajaran
tersebut.
Daftar cek adalah daftar yang berisi subjek dan aspek-aspek yang akan
diamati. Dengan daftar cek peneliti lebih mudah mencatat tiap-tiap hal dan
kejadian penting. Ada bermacam-macam aspek yang dapat dicantumkan dalam
daftar cek, kemudian peneliti tinggal memberikan tanda √ pada tiap aspek sesuai
hasil pengamatan.
Dalam skala penilaian, fenomena yang akan di observasi disusun dalam
tingkatan-tingkatan yang telah ditentukan. Tidak hanya mengukur satu variabel
tetapi lebih pada bagaimana intensitas fenomena yang ingin diukur.
Studi dokumentasi adalah teknik untuk mempelajari dan menganalsiis
bahan-bahan tertulis sekolah. Seperti silabus,program tahunan, program bulanan,
program mingguan, rencana pelaksanaan pembelajaran(RPP), catatan pribadi
peserta didik dan raport.
53
Jenis-jenis validitas
1. Validitas permukaan. Validitas ini menggunakan kriteria yang sangat
sederhana, karena hanya melihat dari sisi muka atau tampang dari instrument
itu sendiri.
2. Validitas isi. Validitas ini sering digunakan dalam pengukuran hasil belajar.
Tujuan utamanya adalah untuk mengetahui sejauh mana peserta didik
menguasai materi pelajaran yang telah disampaikan, dan perubahan-
perubahan psokologis apa yang timbul pada peserta didik tersebut setelah
mengalami proses pembelajaran tertentu.
3. Validitas empiris. Validitas ini biasanya menggunakan teknik statistik, yaitu
analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan
antara skor tes dan suatu kriteria tertentu yang merupakan suatu tolak ukur di
luar tes yang bersangkutan.
a. Validitas prediktif ialah jika kriteria standar yang digunakan adalah untuk
meramalkan prestasi belajar murid dimasa yang akan datang. Validitas
prediktif bermaksud melihat hingga mana suatu tes dapat memperkirakan
perilaku peserta didik pada masa yang akan datang.
b. Validitas konkuren ialah jika kriteria standarnya berlainan. Misalnya, skor
tes dalam pelajaran bahasa Indonesia dikorelasikan dengan skor tes bahasa
inggris.
c. Validitas sejenis ialah jika kriteria standarnya sejenis. Misalnya, bahasa
Indonesia dengan bahasa inggris. Untuk menguji validitas empiris dapat
menggunkan analisis korelasi product-moment dengan angka simpangan.
4. Validitas konstruk. Konstruk adalah konsep yang dapat diobservasi
(observable) dan dapat diukur (measurable). Validitas konstrsuk berkenaan
dengan pertanyaan hingga mana suatu tes betula-betul dapat mengobservasi
dan mengukur fungsi psikologis yang merupakan deskripsi perilaku peserta
didik yang akan diukur oleh tes tersebut
5. Validitas faktor. Dalam penelitian sering di gunakan skala pengukuran
tentang suatu variabel yang terdiri atas beberapa faktor. Faktor-faktor tersebut
diperoleh berdasarkan dimensi/indikator dari variabel yang diukur sesuai
dengan apa yang terungkap dalam konstruksi teoritisnya. Meskipun variabel
54
terdiri beberapa faktor, prinsip homogenitas untuk keseluruhan faktor harus
tetap dipertahankan, sehingga tidak terjadi tumpang tindih antara satu faktor
dan faktor lain.
6. Face validity adalah sejauh mana suatu ukuran tampaknya terkait dengan
konstruksi tertentu, dalam penilaian non-ahli seperti pengambil tes dan
perwakilan dari sistem hukum. Artinya, tes telah menghadapi validitas jika
kontennya terlihat relevan dengan orang yang mengi-kuti tes. Mengevaluasi
penampilan kuesioner dalam hal kelayakan, keterbacaan, konsistensi gaya
dan format, dan kejelasan bahasa yang digunakan.
Uji validitas
1. Pengujian validitas kontruk (contruct validity)
Untuk menguji validitas kontruk, maka dapat digunkan pendapat para ahli
(judgment experts). Para ahli diminta pendapatnya tentang instrument yang
telah disusun itu. Mungkin para ahli akan mem-berikan pendapat: instrumen
dapat digunkan tanpa perbaikan, ada perbaikan, dan mungkin dirombak total.
2. Pengujian validitas isi (content validity)
Untuk instrumen yang berbentuk test, maka pengujian validitas isi dapat
dilakukan dengan membandingkan antara isi instrumen dengan materi
pelajaran yang telah diajarkan. Seorang dosen yang memberi ujian di luar
pelajaran yang telah ditetapkan, berarti instrumen ujian tersebut tidak
mempunyai validitas.
3. Pengujian validitas eksternal
Validitas eksternal instrmen diuji dengan cara membandingkan (untuk
mencari kesamaan) antara kriteria yang ada pada instrumen dengan fakta-
fakta empiris yang terjadi di lapangan. Instrumen penelitian yang mempunyai
validitas eksternal yang tinggi akan mengakibatkan hasil penelitian
mempunyai validitas eksternal yang tinggi pula. Untuk meningkatkan
validitas eksternal selain meningkatkan validitas internal instrumen, maka
dapa dilakukan dengan memperbesar jumlah sampel.
55
Ujii validitas juga bisa dihitung dengan menggunakan teknik korelasi
product moment dengan menggunakan rumus sebagai berikut:
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√[𝑛 ∑ 𝑥 2 − (𝑥)2 [𝑛 ∑ 𝑦 − (∑ 𝑦)2
3.2. Saran
Dari penjelasan baik dalam kajian pustaka maupun dalam hasil didkusi,
diharapkan pembaca dapat lebih memahami mengenai konsep monitoring,
evaluasi, asesmen di dunia pendidikan. Masih banyak lagi materi-materi yang
belum terangkum secara mendetail dan berpotensi untuk mengembangkan lebih
lanjut. Selain dari makalah ini kami menyarankan agar pembaca dapat menambah
wawasan melalui berbagai sumber lainnya.
56
DAFTAR PUSTAKA