PENDAHULUAN
Dalam masalah sosial, persoalan penentuan alat ukur yang dibuat dengan
asal jadi, tanpa memperhitungkan validitas dan reliabilitasnya, akan menyebabkan
interpretasi yang bermacam-macam dan bisa memberikan alternatif jawaban yang
berbeda-beda sesuai dengan kondisi, kapan dan dimana suatu alat ukur itu akan
digunakan. Jika salah dalam penerapan, jawaban yang diperoleh bukan akan
memberikan informasi yang baik dan benar, akan tetapi justru akan memberikan
informasi yang keliru dan akan berdampak terhadap kesimpulan yang dibuat.
Jika kualitas instrumen yang digunakan tidak baik dalam arti mempunyai
validitas dan reliabilitas yang rendah, maka data yang diperoleh juga tidak valid
atau tidak sesuai dengan fakta di lapangan sehingga dapat menghasilkan
kesimpulan yang keliru. Untuk mengumpulkan data dalam suatu penelitian kita
dapat menggunakan instrumen yang telah tersedia dan dapat pula menggunakan
instrumen yang dibuat sendiri, instrumen yang telah tersedia pada umumnya adalah
1
instrumen yang sudah dianggap baku untuk mengumpulkan data variabel-variabel
tertentu.
2
3. Apakah maksud dari validitas isi?
4. Apakah maksud dari validitas eksternal?
5. Bagaimana uji reliabilitas berdasarkan nilai alpha cronbach dilakukan?
3
BAB II
TINJAUAN PUSTAKA
2.1 Literatur
Rasa ingin tahu merupakan salah satu sifat dasar yang dimiliki manusia.
Sifat tersebut akan mendorong manusia bertanya untuk mendapatkan pengetahuan.
Secara universal, terdapat tiga jenis pengetahuan yang selama ini mendasari
kehidupan manusia, yaitu logika yang dapat membedakan yang benar dan yang
salah, etika yang dapat membedakan antara yang baik dan yang buruk, serta estetika
yang dapat membedakan yang indah dan yang jelek (Darma.2008:4).
4
Instrument penelitian akan digunakan untuk melakuakan pengukuran
dengan menghasilkan data kuantitatif yang akurat, maka setiap instrument harus
mempunyai skala (Anggito dan Setiawan.2018:193).
Pada dasarnya instrumen dapat dibagi menjadi dua yaitu tes dan non tes.
Yang termasuk kelompok tes adalah tes prestasi belajar, tes intelegensi tes bakat,
dan tes kemampuan akademik, sedangkan yang termasuk kedalam kelompok non
tes ialah skala sikap, skala penilaian, pedoman observasi, pedoman wawancara,
angket, pemeriksaan dokumen dan sebagainya (Djali dan Muljono.2007:6).
Tes dapat berupa serentetan pertanyaan, lembar kerja atau sejenisnya yang dapat
digunakan untuk mengukur pengetahuan, keterampilan, bakat dan kemampuan dari
subjek penelitian. Lembatr instrument yang bergisi berupa tes ini berisi soal soal
tes yang terdiri atas butir-butir soal mewakili variabel yang diukur. Berdasarkan
sasaran dan objek yang diteliti, terdapat berbagai macam tes yaitu tes kepribadian
(personality test), tes bakat (aptitude test), tes intelegensi (intellegnce test), tes
sikap (attitude test), tes minat (measures of interest) dan tes prestasi (achievement
test). (Siyoto dan Sodik.2015.78-79).
5
Kuisioner (angket) adalah suatu daftar yang berisikan pertanyaan-
pertanyaan dan pilihan jawaban menngenai variabel penelitianan atau objek yang
diteliti. Pertanyaan-pertanyaan di dalam kuisioner didasarkan pada indikator-
indikator yang merupakan definisi operasional dari suatu variabel penelitian.
(Muchson.2017:105).
6
Contoh:
“Coba jelaskan secara singkat, bagaimana pendapat anda tentang peristiwa
pemogokan yang dilakukan oleh karyawan pabrik sepatu di perusahaan saudara?”
………………………………………………………………………………………
………………………………………………………………………………………
………………………………………………………………
d. Angket tak langsung terbuka
Bentuknya dikonstruksi dengan ciri-ciri yang sama dengan angket langsung terbuka
serta disediakan kemungkinan atau alternative jawaban, sehingga responden harus
memformulasikan sendiri jawaban yang dipandang sesuai.
Contih:
“sebutkan keistimewaan yang paling menonjol dari sifat-sifat yang dimiliki oleh
pimpinan saudara, sehingga perusahaan saudara menjadi maju”
………………………………………………………………………………………
………………………………………………………………………………………
………………………………………………………………
3. Bentuk Instrumen Interview
7
Informal rating scale can be incorporated into the initial assessment of
clients. For example, clients could be asked to rate one a 5- or a 7- point scale the
severity of the presenting problem (Whiston.2009:131).
a. Skala Nominal
Digunakan untuk mengklasifikasikan objek, individual, atau kelompok.
Contoh: jenis kelamin, agama, pekerjaan, dan area geografis. Dalam
mengidentifikasi hal ini digunakan angka-angka sebagai symbol atau label.
b. Skala Ordinal
Memberikan informasi tentang jumlah relative karakteristik berbeda oleh
objek atau individu tertentu. Tingkat pengukuran ini mempunyai informasi skala
nominal sitambah dengan skala peringkat relative tertentu. Contoh: Bagaimana
menurut pendapat saudara mengenai penjulan tiket pesawat terbang Garuda?
Jawban “sangat lambat” diberi nilai 1, “lambat” diberi nilai 2, dan seterusnya.
8
c. Skala Interval
Memiliki karakteristik seperti yang dimiliki oleh skala nominal dan ordinal
dengan ditambah karekteristik lain yaitu berupa interval yang tetap. Contoh:
Nilailah layanan kami dengan menggunakan skala sebagai berikut:
Kurang 12345 678910 Baik
d. Skala Linkert Summated Ratings
Merupakan salah satu teknik pengukuran sikap dimana subjek diminta
untuk mengindikasikan tingkat kesetujuan atau ketidaksetujuan mereka terhadap
masing-masing pernyataan.
e. Skala Semantic Differential
Dimana subjek diminta memilih satu kata sifat atau frasa dari sekelompok
pasangan kata sifat atau frasa yang disediakan paling mampu menggambarkan
perasaan mereka terhadap suatu objek.
f. Skala Numrik
Numerical mirip dengan skala differential semantic, dengan perbedaan
dalam nomor skala lima titik atau tujuh titik disediakan.
Butir Rendah Tinggi
Nomor
Pertanyaan 1 2 3 4 5
9
Menurut Cohen dan Swerdlik dalam Hepi Wahyuningsih (2009:199-120),
Bukti-bukti validitas konstruk dapat diperoleh dari: bukti homogenitas, bukti bahwa
hasil tes menurun atau meningkat karena faktor umur, bukti adanya perubahan dari
skor pretest ke postest, bukti adanya perbedaan skor pada kelompok yang berbeda,
bukti konvergen, bukti destriminan, dan faktor analisis.
10
teori atau pendapat para responden. Yaitu merupakan tehnik untuk menanyakan
pendapat para ahli atau sering disebut dengan Teknik Delphi.
Segi empiris dari validitas konstruk ini diarahkan pada segi internal yaitu
imbangan dalam instrumen tersebut harus sesuai dengan apa yang diramalkan oleh
konstruk tersebut. Pengujian validitas konstruk dilakukan setelah proses validasi
isi. Dalam hal ini setelah instrumen divalidasi oleh ahli, dan direvisi, dilanjut
dengan ujicoba terhadap sejumlah responden (disarankan minimal 30 orang).
Analisis hasil uji coba tersebut akan menentukan kualitas masing-masing butir valid
ataukah tidak.
11
2.1.3 Uji Validitas Isi
Menurut Burhan Bungin (2008) dalam Fitrah, Luthfiyah (2017) alat ukur
adalah akurasi alat ukur terhadap yang diukur walaupun dilakukan berkali-kali dan
dimana-mana. Sedangkan realibilitas alat ukur itu dapat dipercaya atau dapat
diandalkan.
Untuk instrumen yang berbentuk tes, maka pengujian validitas isi dapat
dilakukan dengan membandingkan antara isi instrumen dengan materi pelajaran
yang telah diajarkan. Jika dosen memberikan ujian diluar pelajaran yang telah
ditetapkan, berarti instrumen ujian tersebut tidak mempunyai validitas isi.
Secara teknis, pengujian validitas konstruksi dan validitas isi dapat dibantu
dengan menggunakan kisi-kisi instrumen. Dalam kisi-kisi itu terdapat variabel yang
diteliti, indiktor sebagai tolok ukur, dan nomor pernyataan yang telah dijabarkan
dari indikator. Dengan kisi-kisi instrumen itu, maka pengujian validitas dapat
dilakukan dengan mudah dan sistematis (Fitrah, Luthfiyah.2017:64).
12
Menurut Tuckman 1972 dan Issac 1981 dalam Wagiran (2019:282) validitas
isi merujuk kepada sejauh mana instrumen tersebut mencerminkan isi yang
dikehendaki. Validitas isi berarti juga menunjukkan seberapa baik isi dari tes
mewakili situasi dari subyek dimana kesimpulan akan dibuat. Pertanyaan yang
harus dijawab adalah seberapa jauh isi instrumen mencerminkan seluruh universum
isi yang diukur dalam instrumen berbentuk tes, sebuah tes dinyatakan valid bila tes
tersebut dapat mengukur kompetensi yang dikembangkan dan materi pelajaran
yang telah diajarkan.
Validitas isi dapat diklasifikasikan menjadi dua yaitu validitas tampang dan
validitas logis. Validitas tampang diperoleh melalui pemeriksaan terhadap butir-
butir instrumen/tes untuk membuat kesimpulan bahwa instrumen/tes tersebut
mengukur aspek yang relevan. Validitas logis yang disebut juga validitas
pencuplikan (samping validity) mencerminkan batasan yang saksama terhadap
kawasan perilaku yang diukur dan suatu desain logis yang dapat mencakup bagian
dari kawasan perilaku yang diukur. Sejauh mana tipe validitas logis telah terpenuhi
dapat dilihat dari cakupan butir-butir soal/instrumen apakah keseluruhan butir
tersebut merupakan sampel yang representatif bagi yang mungkin dibuat (Wagiran
2019:282).
13
pengujian validitas terlebih dahulu. Berdasarkan pendapat para ahli tentang definisi
dari validitas , pengujian validitas dapat dibedakan menjadikan tiga jenis, yaitu
validitas isi (content related validity), validitas berdasarkan kriteria (criterium-
related evidence of validity), dan validitas konstruk (construct evidence of validity).
Menurut Prof. Dr. Budiyono, M.Sc. Mahasiswa starata-1 dan starata-2 hanya
diperkenankan untuk melakukan pengujian validitas isi, sehingga mahasiswa
diploma farmasi juga hanya diperkenankan untuk melakukan pengujian validitas
isi. Hal ini dikarenakan, dua jenis validitas yang lain jika dilaksanakan
membutuhkan waktu lama, biayanya mahal, dan menggunakan uji statistik
parametrik.
14
Validitas isi merupakan validitas yang diestimasi lewat pengujian terhadap
kelayakan atau relevansi isi tes melalui analisis rasional oleh panel yang
berkompeten atau melalui expert judgement (penilaian ahli). Validitas isi atau
content validity memastikan bahwa pengukuran memasukkan sekumpulan item
yang memadai dan mewakili yang mengungkap konsep. Semakin item skala
mencerminkan kawasan atau keseluruh konsep yang diukur, semakin besar
validitas isi. Atau dengan kata lain, validitas isi merupakan fungsi seberapa baik
dimensi dan elemen sebuah konsep yang telah digambarkan (Sekaran, 2006 dalam
Hendrayadi.2017:169).
Validitas isi dilakukan untuk memastikan apakah isi kuesioner sudah sesuai
dan relevan dengan tujuan study. Validitas isi menunjukkan isi mencerminkan
rangkaian lengkap atribut yang diteliti dan biasanya dilakukan oleh tujuh atau lebih
ahli (DeVon, et.al:2007). Perkiraan validitas isi dari tes diperoleh dengan
menyeluruh dan sistematis dalam memeriksa item tes untuk menentukan sejauh
mana mereka mencerminkan dan tidak mencerminkan domain konten (Kowsalya,
Venkat Lakshmi, dan Suresh, 2012 dalam Hendrayadi, 2017)
15
penjelasan sebelumnya, Groth-Marnat, (2010) menjelaskan bahwa validitas isi
(content validity) dengan validitas muka (face validity) memiliki perbedaan dan
tidak sinonim. Validitas isi menyangkut judgement yang dibuat oleh para ahli,
sedangkan validitas muka/tampang menyangkut judgement dari pengguna tes.
Formula yang diajukan oleh Aiken adalah sebagai berikut (dalam Azwar,
2012)
𝑠
V = ∑𝑛(𝐶−1)
S = r – lo
16
Lo = angka penilaian terendah (misalnya 1)
1. Tidak Relevan
2. Kurang Relevan
3. Cukup
4. Relevan
5. Sangat Relevan
17
2.1.4 Uji Validitas Eksternal
Sebuah alat ukur dikatakan valid apabila mampu mengukur apa yang
diinginkan. Tinggi rendahnya validitas alat ukur menunjukkan sejauh mana data
yang terkumpul tidak menyimpang dari gambaran tentang variabel yang dimaksud.
Ada 2 cara pengujian validitas, yaitu uji validitas eksternal dan uji validitas
internal.
Adalah validitas yang dicapai apabila data yang di hasilkan dari alat ukur
tersebut sesuai dengan data atau informasi lain dalam kaitannya dengan variabel
penelitian. Validitas eksternal menggunakan rumus korelasi pearson.
Pada dasarnya, instrumen yang baik harus valid dan dapat di andalkan.
Instrumen valid harus punya validitas internala dan eksternal. Instrumen punya
validitas internal (sering disebut rasional) bila kriteria yang ada dalam instrumen
secara rasional (teoritis) telah mencerminkan apa yang di ukur. Jadi, kriterianya ada
di dalam instrumen itu. Instrumen yang punya validitias eksternal/empiris
memerlukan data di lapangan dari hasil uji coba (sampel) yang berwujud data
kuantitatif dan untuk pengelohannya di perlukan jasa statistik. Jumlah sampel dapat
di perbesar untuk meningkatkan validitas eksternal/empirisnya.
18
Setiap instrumen penelitian haruslah memenuhi persyaratan validitas
rasional/internal, tetapi tidak ada tuntutan keharusan untuk memenuhi validitas
empiris/eksternal. Oleh karena itu, fokus perhatian uji validitas pada dasarnya
adalah pada analisis rasional, bukan pada analisis kuantitatif yang menggunakan
jasa statistik (Nevizond, 2007:253).
Validitas empiris sama dengan validitas kriteria yang berarti bahwa validitas
di tentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal.
Validitas empiris diperoleh melalui hasil uji coba tes kepada responden yang setara
dengan responden yang akan di evaluasi atau di teliti. Kriteria eksternal adalah hasil
ukur instrumen atau tes lain di luar instrumen itu sendiri yang menjadi kriteria.
Ukuran lain yang sudah di anggap baku atau dapat di percaya dapat pula di jadikan
sebagai kriteria eksternal. Validitas yang di tentukan berdasarkan kriteria internal
disebut validitas internal sedangkan validitas yang di tentukan berdasarkan kriteria
eksternal disebut validitas eksternal (Zulkifli, 2009:91).
Jika kita menggunakan hasil ukur instrumen yang sudah baku sebagai
kriteria eksternal, maka besaran validitas eksternal dari instrumen yang kita
kembangkan di dapat dengan jalan mengkorelasikan skor hasil ukur instrumen yang
di kembangkan dengan skor hasil ukur instrumen baku yang di jadikan kriteria.
Makin tinggi koefisien korelasi yang di dapat, maka validitas instrumen yang di
kembangkan juga makin baik. Kriteria yang digunakan untuk menguji validitas
eksternal adalah nilai tabel r (r-tabel).
Jika koefisien korelasi antara skor hasil ukur tes yang di kembangkan
dengan skor hasil ukur tes baku lebih besar daripada r-tabel maka tes yang di
kembangkan adalah valid berdasarkan kriteria eksternal yang di pilih (hasil ukur
19
instrumen baku). Jadi keputusan uji validitas dalam hal ini adalah mengenai valid
atau tidaknya tes sebagai suatu kesatuan, bukan valid atau tidaknya butir tes seperti
pada validitas internal (Djali, 2000 : 54).
External validity is about theory, not about method. Some methods are
better than others, howe ever, at goving one a chance to detect unanticipated
interactions designed (John, 1999 : 369).
In 1951, Cronbach came up with the symbol α for the first time. He even
used the term "Kuder-Richardson formula α", and noted that according to another,
forecoming article on the subject, "α is the mean of all possible split-half
coefficients" (Cronbach and Warrington in Vehkalathi, 2000:12).
20
reliability was also used (i.e., the correlation of one half of the items to the other
half). Cronbach’s alpha is conceptually, although not technically, the average of
all possible split halves.
21
karena pengujian reliabilitasnya relative lebih baik dibandingkan yang lainnya
dengan melibatkan semua bitur dalam pengujiannya.
𝑛 ∑ 𝑠𝑖 2
𝑟𝑖 = ( ) (1 − )
𝑛−1 𝑠𝑡 2
Keterangan :
𝑟𝑖 = Reliabilitas instrumen
𝑠𝑡 = Varian total
22
Menurut Sekaran dalam Adriani (2018:220-221) untuk pengambilan
keputusan dalam uji reliabilitas dapat menggunakan atau mengacu pada tabel
interpretasi berikut :
Tabel 1
a. Hipotesis
𝐻𝑂 : Skor butir berkorelasi positif dengan skor faktor (item reliabel)
𝐻1 : Skor butir tidak berkorelasi positif dengan skor faktor (item tidak reliabel)
b. Pengambilan keputusan berdasarkan perbandingan 𝑟𝑎𝑙𝑝ℎ𝑎 dan 𝑟𝑡𝑎𝑏𝑒𝑙
Syarat :
1. 𝐻𝑂 diterima : jika 𝑟𝑎𝑙𝑝ℎ𝑎 positif dan 𝑟𝑎𝑙𝑝ℎ𝑎 > 𝑟𝑡𝑎𝑏𝑒𝑙
2. 𝐻𝑂 ditolak : jika 𝑟𝑎𝑙𝑝ℎ𝑎 negatif dan 𝑟𝑎𝑙𝑝ℎ𝑎 < 𝑟𝑡𝑎𝑏𝑒𝑙
a. Jika α positif dan α lebih besar dari r tabel maka instrumen reliable.
b. Jika α positif dan α lebih kecil dari r tabel maka instrumen tidak reliable.
c. Jika α negatif dan α lebih besar dari r tabel maka instrumen tidak reliable.
d. Jika α negatif dan α lebih kecil dari r tabel maka instrumen tidak reliable.
23
However, coefficient alpha can also be used to assess the reliability of other types
of total scores. For example, if three letters of reference are solicited when
evaluating applicants, coefficient alpha can be used to assesess the reliability of
total scores from those three letters. Alternatively, in a diary study, respondents
may answer the same question every day for a month. The reliability of the total of
those scores can be estimated with coefficient alpha. This formula works equally
well whether the researcher calculates the sum of measurements: The formula will
result in the exact same number.
Menurut Allen & Yen dalam Arifin (2017:30-31) tes dikatakan reliabel jika
skor amatan mempunyai korelasi yang tinggi dengan skor yang sebenarnya.
Selanjutnya dinyatakan bahwa reliabilitas merupakan koefisien korelasi antara dua
skor amatan yang diperoleh dari hasil pengukuran menggunakan tes yang paralel.
Dengan demikian, pengertian yang dapat diperoleh dari pernyatan tersebut adalah
suatu tes itu reliabel jika hasil pengukuran mendekati keadaan peserta tes yang
sebenarnya.
24
correlation and subtracting from 1.00 produces the index of measurement error.
For example, if a test has a reliability of 0.80, there is 0.36 error variance (random
error) in the scores (0.80×0.80 = 0.64; 1.00 – 0.64 = 0.36).
c. Pilih Analyze dari menu utama, lalu pilih Correlate. Pilih Bivariate seperti
tampak pada layar berikut :
25
d. Pada Reliability Analysis, masukkan “no1, no2 sampai no10” ke dalam kolom
Items dengan cara blok semua nama kemudian klik anak panah ke kanan seperti
pada gambar berikut :
e. Setelah semua nama masuk ke kolom Items, klik menu Statistics. Pada menu
Descriptives for, centang Scale dan centang Scale if item deleted seperti gambar
berikut ini :
26
f. Klik Continue, klik OK. Output sebagai berikut :
27
coefficient alpha ranges from 0 to 1, and the values closer to 0 imply that the items
do not measure the same construct and values closer to 1 provides an opposite
implication. Cronbach and Shavelson (2004) use the following rules of thumb to
describe Cronbach’s alpha α ≥ 0.9 is excellent, 0.8 ≤ α ≤ 0.9 is good, 0.7 ≤ α ≤ 0.8
is acceptable, 0.6 ≤ α ≤ 0.7 is questionable, 0.5 ≤ α ≤ 0.6 is poor and α ≤ 0.5 as
unacceptable.
28
According to Taber (2018:2) an educational research, it may be quite
difficult to test the reliability of an instrument such as an attitude scale or a
knowledge test by simply undertaking repeated readings because human beings are
constantly changing due to experiences between instrument administrations,
andalsobecause they may undergo changes due tothe experience of the
measurementprocess itself. So, a student may answer a set of questions, and that
very activity may set in chain thinking processes that lead to new insights or further
integration of knowledge. A day, week, or month later, the student may answer the
same questions differently for no other reason than that responding to the original
test provided a learning experience.
Pada dasarnya semua manusia selalu memiliki rasa ingin tahu yang kuat.
Sejak lahir manusia sudah belajar untuk melihat orang lain, melihat permasalahan
dan selalu belajar menghadapi permasalahan yang ada. Dengan adanya
permasalahan tersebut membuat manusia menjadi lebih berkembang dan menjadi
diri yang tangguh.
Dengan banyaknya permasalahan yang ada, tak jarang manusia pun ingin
selalu menggali dan mencari solusi dari masalah yang tengah dihadapinya.
Penelitian merupakan suatu kegiatan yang dilakukan untuk membuktikan sekaligus
mencari solusi dari permasalahan yang ada. Penelitian bukan hanya difokuskan
pada apa yang tengah dialami oleh peneliti saja, namun juga hal-hal lain yang
sifatnya bermanfaat untuk orang banyak.
29
Validitas suatu instrument penelitian merupakan hal yang sangat
diutamakan ketika seorang peneliti hendak mengambil data di lapangan. Suatu
instrument dikatakan valid jika sudah memenuhi syarat-syarat yang telah
ditentukan. Jenis validitas yang pertama yaitu validitas konstruk. Validitas konstruk
digunakan untuk mengetahui sejauh mana instrument yang digunakan saat
penelitian dpat mengukur apa yang hendak di ukur. Dengan kata lain, jika validitas
konstruk suatu instrument penelitian telah tercapai, maka secara pasti dapat dilihat
bahwa tujuan dilakukannya penelitian sudah pasti tercapai.
Selain validitas isi dan juga konstruk, terdapat validitas eksternal dan juga
internal. Jenis validitas ini berkaitan dengan kesesuaian atau keserasian. Pada
validitas internal, harus terdapat keseusaian antara instrument penelitian yang satu
dengan yang lain. Sedangkan pada validitas eksternal yaitu adanya kesesuaian hasil
penelitian dengan penelitian lain yang telah dilakukan sebelumnya. Mneurut
sejumlah literature, tidak diharuskan suatu instrument penelitian itu memiliki
kesesuaian dengan hasil penelitian sebelumnya karena hasil dari suatu penelitian
memang pada dasarnya selalu dapat berubah-ubah. Namun instrument penelitian
harus memiliki kesesuaian dengan isntrumen yang lain agar apa yang di teliti dapat
diamati secara maksimal.
30
Selain uji validitas ternyata terdapat juga uji reliabilitas. Reliabilitas dapat
diartikan sebagai tahan lama atau tidak berubah-ubah. Maksudnya disini adalah stau
instrument penelitian dikatakan memiliki reliabilitas yang tinggi jika instrument
tersebut dapat digunakan untuk melakukan penelitian dalam jangka waktu yang
lama namun tetap dengan responden yang sama. Meskipun tidak dilakukan di
waktu yang sama namun hasil penelitian yang diperoleh akan sama.
Namun suatu instrument yang baik hendaknya selain valid juga harus
reliabel. Dengan digunakannya instrument yang valid dan reliabel maka selain
dapat tercapainya tujuan penelitian, isi dari isntrumen juga sesuai dengan apa yang
hendak diteliti. Selain itu Intrumen tersebut juga dapat digunakan berulang kali
dalam jangka waktu yang berbeda.
31
BAB III
PENUTUP
3.1 Kesimpulan
Pada dasarnya instrumen dapat dibagi menjadi dua yaitu tes dan non tes.
Yang termasuk kelompok tes adalah tes prestasi belajar, tes intelegensi tes bakat,
dan tes kemampuan akademik, sedangkan yang termasuk kedalam kelompok non
tes ialah skala sikap, skala penilaian, pedoman observasi, pedoman wawancara,
angket, pemeriksaan dokumen dan sebagainya.
32
Validitas instrumen didefinisikan sebagai sejauh mana instrumen itu
merekam/mengukur apa yang dimaksudkan untuk direkam/diukur. Sedangkan
reliabilitas instrumen merujuk kepada konsistensi hasil perekaman data
(pengukuran) kalau instrumen itu digunakan oleh orang atau kelompok orang yang
sama dalam waktu berlainan.
Untuk instrumen yang berbentuk tes, maka pengujian validitas isi dapat
dilakukan dengan membandingkan antara isi instrumen dengan materi pelajaran
yang telah diajarkan. Jika dosen memberikan ujian diluar pelajaran yang telah
ditetapkan, berarti instrumen ujian tersebut tidak mempunyai validitas isi.
Pada dasarnya, instrumen yang baik harus valid dan dapat di andalkan.
Instrumen valid harus punya validitas internala dan eksternal. Instrumen punya
validitas internal (sering disebut rasional) bila kriteria yang ada dalam instrumen
secara rasional (teoritis) telah mencerminkan apa yang di ukur. Jadi, kriterianya ada
di dalam instrumen itu. Instrumen yang punya validitias eksternal/empiris
memerlukan data di lapangan dari hasil uji coba (sampel) yang berwujud data
kuantitatif dan untuk pengelohannya di perlukan jasa statistik. Jumlah sampel dapat
di perbesar untuk meningkatkan validitas eksternal/empirisnya.
Sebuah tes dikatakan mempunyai reliabilitas yang tinggi jika tes tersebut
memberikan data dengan hasil yang ajeg (tetap) walaupun diberikan pada waktu
yang berbeda kepada responden yang sama. Oleh karena itu, alat ukur yang
baik adalah alat ukur yang valid dan reliabel. Hubungan antara validitas dengan
reliabilitas dapat digambarkan sebagaimana tembakan yang selalu tepat mengenai
sasaran yang diinginkan. Sebuah alat ukur yang valid selalu reliabel. Akan tetapi
alat ukur yang reliabel belum tentu valid.
33
3.2 Saran
34
DAFTAR PUSTAKA
35
__________. 2018. Statistical Analysis: Internal-Consistency Reliability And
Construct Validity. International Journal of Quantitative and Qualitative Research
Methods. 6(1): 27-38.
Hamdi dan Bahruddin. 2014. Metodologi Penelitian Kuantitatif Aplikasi Dalam
Pendidikan. Yogyakarta: Depublish.
Hendrayadi. 2017. Validitas isi tahap awal pengembangan kuesioner. Jurnal Riset
Manajemen Dan Bisnis (JRMB). ISSN 2527-7502. 2(2): 169-178.
Inal, H., Kogar, E., Y., Demirduzen, E., & Gelbal, S. 2017. Cronbach's Coefficient
Alpha: A Meta-Analysis Study. Hacettepe Üniversitesi Eğitim Fakültesi Dergisi
(H.U. Journal of Education). 32(1): 18-32.
Indrayan, A., dan Holt, M., P. 2017. Concise Encyclopedia Of Biostatistics For
Medical Professionals. London : CRC Press Taylor And Francis Group.
Janti, Suhar. 2014. Analisis Validitas Dan Reliabilitas Dengan Skala Likert
Terhadap Pengembangan SI/TI Dalam Penentuan Pengambilan Keputusan
Penerapan Strategic Planning Pada Industri Garmen. Prosiding Seminar Nasional
Aplikasi Sains & Teknologi (SNAST). ISSN: 1979-911X: 155-160.
Jumailiyah. 2017. Pengaruh Kualitas Item Terhadap Reliabilitas Alpha Cronbach
Pada Tes Bakat Numerikal Dan Tes Potensi Akademik. Jurnal Ilmiah IKIP
Mataram. Vol. 4, No.1: 18-21.
Kristanto, vigih hery. 2018. Metodologi Penelitian Pedoman Penulisan Karya Tulis
Ilmiah. Yogyakarta : Deepublish.
Koonce, G., L., & Kelly, M., D. 2013. Analysis of the Reliability and Validity of a
Mentor’s Assessment for Principal Internships. NCPEA Education Leadership
Review. 15(2): 33-48.
Lynch, J. 1999. Theory and External Validity. Journal Of The Academy Of
Marketing Science. Vol 27, No.3.
Lyons, John. 2009. Coomunimetrics : A Communication Theory Of Measurement
In Human Service Settings. New York : Springer Dordrecht Heidelberg London.
Matondang, Z. 2009. Validitas dan Reliabilitas suatu Instrumen Penelitian. Jurnal
Tabularasa PPS UNIMED. Vol 6. No.1.
Montshiwa, Volition. 2014. Assessment of the Reliability and Validity of Student-
Lecturer Evaluation Questionnaire: A Case of North West University.
Mediterranean Journal of Social Sciences. Vol. 5, No. 14: 352-364.
Muaja, J., R., T., Setiawan, A., & Mahatma, T. 2013. Uji Validitas Dan Uji
Reliabilitas Menggunakan Metode Bootstrap Pada Data Kuisioner Tipe Yes/No
Questions. Prosiding Seminar Nasional Sains Dan Pendidikan Sains VIII UKSW.
Universitas Kristen Satya Wacana: 452-458.
Muchson. 2017. Statistik Deskriptif. Jakarta: Guepedia.
36
Muljono, P dan Djaali. 2000. Pengukuran dalam Bidang Pendidikan. Jakarta :
Bumi Aksara.
Noor. 2011. Metodologi Penelitian: Skripsi, Tesis, Disertasi, dan karya Ilmiah.
Jakarta: Kencana.
Pribadi. 2014. Desain dan Pengembangan Program Pelatihan Berbasis
Kompetensi dan Implementasi. Jakarta: Kencana.
Purwoto, Agus. 2007. Panduan Laboratorium Statistik Inferensial. Jakarta :
Grasindo.
Rangkuti, Freddy. 2002. The Power Of Brands. Jakarta : PT Gramedia Pustaka
Utama.
Rosaroso, Rufina. 2015. Using Reliability Measures In Test Validation. European
Scientific Journal. 11(18): 369-377.
Salkind, N., J., & Rasmussen, K. 2007. Encyclopedia Measurement And Statistics
Volume 1. New Delhi : SAGE Publication.
Sanjaya. 2016. Penelitian Tindakan. Jakarta: Kelas Kencana.
Sanusi, R. Sri. 2013. Beberapa Uji Validitas Dan Reliabilitas Pada Instrumen
Penelitian. Medan : Universitas Sumatera Utara.
Siyoto dan Sodik. 2015. Dasar Metodologi Penelitian.Yogyakarta: Literasi Media
Publishing.
Sujono dan Santoso, H. B. 2017. Analisis Kualitas E-Learning Dalam Pemanfaatan
Web Cenference Metode Webqual. SAINTEKBU: Jurnal Sains dan Teknologi.
Volume 9, No.2: 27-37.
Taber, K., S. 2018. The Use of Cronbach’s Alpha When Developing and Reporting
Research Instruments in Science Education. Science Education Centre. 48:1273–
1296.
Taufan. 2016. Sosiologi Hukum Islam Kajian Empirik Komunitas
Sempalan.Yogyakarta: Depublish.
Tavakol, M., & Denick, R. 2011. Making Sense Of Cronbach’s Alpha.
International Journal of Medical Education. 2: 53-55.
Tim Penyusun. 2015. Metode Riset untuk Bisnis dan Manajemen. Bandung :
Universitas Widyatama.
Trigueros and Sandoval. 2017. Quantitative and Qualitative Research Instrument.
Universedad de Elsalvador.
Umar, Husein. 2005. Riset Pemasaran dan Perilaku Konsumen. Jakarta: Gramedia.
Ursachi, G., Horodnic, I., A., & Zait, A. 2015. How Reliable Are Measurement
Scales? External Factors With Indirect Influence On Reliability Estimators.
Procedia Economics and Finance. Vol. 20: 679–686.
37
Vehkalahti, Kimmo. 2000. Reliability Of Measurement Scales : Tarkkonen’s
general method supersedes Cronbach’s alpha. Finland: University Of Helsinki.
Wagiran. 2019. Metodologi penelitian pendidikan: teori dan implementasi.
Yogyakarta : Deepublish.
Wahyuningsih, Hepi. 2009. Validitas Konstruk Alat Ukur Spirituality Orientations
Inventory (SOI). Jurnal Psikologi. Vol. 36, No 2.
Whiston. 2009. Principles and Applications of Assessment in Conseling. USA:
Brooks/Cole, Cengage Learning.
Wilkinson and Birmingham. 2003. Using Research Instrument A Guide For
Researchers.USA and Canada: Taylor and Francis e-Library.
Winarno. 2011. Metodologi penelitian dalam pendidikan jasamani. Malang: UM
Press.
Yuniarti, B., & Soenarto. 2016. Validitas Konstrak Instrumen Evaluasi Outcome
Lembaga Pendidikan Guru Vokasional. Jurnal Penelitian dan Evaluasi
Pendidikan. 20(2): 221-233.
Yusuf. 2014.Metode Penelitian Kuantitatif, Kualitatif, dan Penelitian Gabungan.
Jakarta: Kencana.
Yusup, Febrinawati. 2018. Uji Validitas Dan Reliabilitas Instrumen Penelitian
Kuantitatif. Jurnal Tarbiyah: Jurnal Ilmiah Kependidikan. 7(1): 17-23.
38