Anda di halaman 1dari 16

Pertanyaan dan Pembahasan Seputar Validitas

dan Reliabilitas
Posted: November 12, 2014 in Uncategorized

3 Votes

Pertanyaan yang diajukan:


1. Apa yang dimaksud dengan validitas dan reliabilitas?
2. Jenis validitas dan reliabilitas? Validitas untuk proses riset dan alat ukurnya!
3. Bagaimana cara mengukur validitas dan reliabilitas?
4. How to develop? Bagaimana mengembangkan validitas dan reliabilitas?
5. Mengapa perlu ada validitas dan reliabilitas?
6. Kapan validitas dan reliabilitas tidak berlaku?
7. Apa beda validitas untuk alat tes dengan validitas untuk kegiatan observasi dan
wawancara?
8. Bagaimana menentukan validitas untuk kegiatan observasi?
9. Kapan sebuah observasi membutuhkan validitas?
10. Kapan sebuah wawancara perlu ditentukan validasinya?
11. Teori apa yang mendasari penggunaan validitas untuk kegiatan observasi dan
wawancara?
12. Bagaimana cara menggunakan validitas?
13. Apakah perlu mencari reliabilitas kegiatan observasi?
14. Apakah perlu mencari reliabilitas kegiatan wawancara?
15. Bagaimana menghitung reliabilitas dalam observasi?
16. Bagaimana meningkatkan reliabilitas observasi?

17. Kapan observasi perlu ditentukan reliabilitasnya?


18. Apa beda reliabilitas alat tes dengan reliabilitas untuk kegiatan observasi dan wawancara?
19. Bagaimana cara menggunakan reliabilitas?
20. Jika sebuah alat tes mencapai validitas namun tidak reliabel, bagaimana kualitas alat tes
tersebut? Dan bagaimana jika terjadi kebalikannya?
PEMBAHASAN
1. Apa yang dimaksud dengan validitas dan reliabilitas?
Validitas berasal dari kata validity yang mempunyai arti sejauhmana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen
pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan
fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukan
pengukuran tersebut. Tes yang menghasilkan data yang tidak relevan dengan tujuan
pengukuran dikatakan sebagai tes yang memiliki validitas rendah (Azwar, 1997).
Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai asal kata rely dan
ability. Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang
reliabel (reliabele). Walaupun reliabilitas mempunyai berbagai nama lain seperti
keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi, dan sebagainya, namun ide
pokok yang terkandung dalam konsep reliabilitas adalah sejauh mana hasil suatu pengukuran
dapat dipercaya.
2. Jenis validitas dan reliabilitas? Validitas untuk proses riset dan alat ukurnya!
a. Jenis Validitas
Menurut Sudijono (2009) terdapat berbagai jenis validitas, berikut ini jenis validitas ditinjau
dari pengujiannya validitasnya yaitu pengujian validitas secara rasional dan secara konten.
Penhelasan untuk masing masing validititas itu adalah sebagai berikut:
Pengujian Validitas Tes Secara Rasional
Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang
diperoleh dengan berpikir secara logis.
a. Validitas Isi (Content Validity)
Valditas isi berkaitan dengan kemampuan suatu instrumen mengukur isi (konsep) yang harus
diukur. Ini berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau variabel
yang hendak diukur.
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan

penganalisisan, penelususran atau pengujian terhadap isi yang terkandung dalam tes hasil
belajar tersebut. Validitas isi adalah yang ditilik dari segi isi tes itu sendiri sebagai alat
pengukur hasil belajar yaitu: sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar
peserta didik, isisnya telah dapat mewakili secara representatif terhadap keseluruhan materi
atau bahkan pelajaran yang seharusnya diteskan (diujikan).
Misalnya test bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut,
pengukuran motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan konsep
motivasi, dan demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan
validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar ini Dia berpendapat
bahwa validitas isi berbeda dengan validitas rupa yang kurang menggunakan analisis logis
yang sistematis, lebih lanjut dia menyatakan bahwa sebuah instrumen yang punya validitas isi
biasanya juga mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
b. Validitas konstruksi (Construct Validity)
Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang
berkaitan dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang
diukurnya. Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas konstruk)
merupakan yang terluas cakupannya dibanding dengan validasi lainnya, karena melibatkan
banyak prosedur termasuk validasi isi dan validasi kriteria.
Validitas konstruksi juga dapat diartikan sebagai validitas yang ditilik dari segi susunan,
kerangka atau rekaannya. Adapun secara terminologis, suatu tes hasil belajar dapat
dinyatakan sebagai tes yang telah memiliki validitas konstruksi, apabila tes hasil belajar
tersebut telalh dapat dengan secara tepat mencerminkan suatu konstruksi dalam teori
psikologis.
Pengujian Validitas Tes Secara Empirik
Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang
bersifat empirik. Dengan kata lain, validitas empirik adalah validitas yang bersumber pada
atau diperoleh atas dasar pengamatan di lapangan.
a. Validitas ramalan (Predictive validity)
Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah
dapat dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal
terjadi pada masa mendatang. Contohnya apakah test masuk sekolah mempunyai validitas
ramalan atau tidak ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan antara
hasil test masuk dengan prestasi belajar sesudah menjadi siswa, bila ada, berarti test tersebut
mempunyai validitas ramalan.

b. Validitas bandingan (Concurrent Validity)


Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes
tersebut dalam kurun waktu yang sama dengan secara tepat mampu menunjukkan adanya
hubungan yang searah, antara tes pertama dengan tes berikutnya.
b. Jenis-jenis Reliabilitas
1. Reliabiltas Tes Berulang (Test-retest reliability) Reliabiltas tes berulang adalah ukuran
reliabilitas yang diperoleh dengan pemberian dua kali tes yang sama selama periode waktu
tertentu untuk sekelompok individu. Contoh: Sebuah tes bahasa diberikan kepada siswa. Satu
bulan kemudian tes yang sama diberikan pada siswa yang sama. Jika skor keduanya
menghasilkan koefisien korelasi tinggi maka tes tersebut memiliki reliabilitas tinggi.
2. Reliabilitas Antar Penilai (Inter-rater atau Inter-observer Reliability) Reliabilitas antar
penilai adalah ukuran reliabilitas berdasarkan konsistensi penilaian dua responden berbeda
terhadap suatu konstruk, karena belum tentu pengamat manusia menafsirkan jawaban dengan
cara yang sama. Contoh: Peneliti meminta tanggapan dua hakim berbeda untuk memutuskan
kasus yang sama. Jika kedua hakim memberi tanggapan yang seragam maka instrumen
dinyatakan reliabel.
3. Reliabilitas Konsistensi Internal (Internal consistency reliability) Reliabilitas konsistensi
internal adalah ukuran reliabilitas berdasarkan evaluasi item-item tes terhadap konstruk yang
sama. Ada dua jenis untuk reliabilitas ini yaitu:
o Rata-rata Korelasi Antar Item (Average inter-item correlation) Rata-rata korelasi antar item
diperoleh dengan mengambil semua item pada tes dan akhirnya menggunakan rata -rata
semua koefisien korelasi tersebut. Dengan kata lain instrumen dibelah sebanyak jumlah item
kemudian hasil koefisien korelasi digabung untuk mendapatkan rata-rata. Teknik ini populer
dengan Alpha Cronbach.
o Reliabilitas Belah Setengah (Split-half reliability) Reliabilitas belah setengah adalah teknik
dengan membelah item tes menjadi dua bagian untuk membentuk dua set item, kemudian
skor total masing-masing set item dikorelasikan. Jika koefisien korelasi tinggi maka
reliabilitas tinggi.
3. Bagaimana cara mengukurnya validitas dan reliabilitas?
Pekerjaan untuk mencari validitas suatu alat ukur disebut validation. Prinsip dari validation
adalah membandingkan hasil-hasil dari pengukuran faktor dengan suatu kriterium, )suatu
ukuran yang telah dipandang valid untuk menunjukkan faktor yang dimaksud). Jadi misalnya
suatu alat pengukur hendak menyelidiki faktor ketelitian kerja, maka harus diambil lebih

dahulu suatu kriterium yang telah dipandang mencerminkan suatu ketelitian kerja. Melalui
kriterium itulah kemudian hasil dari pengukuran faktor ketelitian kerja disoroti, Jika hasil
pengukuran faktor ketelitian kerja menunjukkan besarnya ketelitian kerja yang sesuai dengan
kriterium, maka alat pengukur itu dipandang valid.
Ada dua jenis kriterium ang digunakan untuk menguji kejituan alat pengukur, yaitu :
a. Kriterium luar (external criterion)
Yaitu suatu kriterium yang diambil dari luar (external) alat itu sendiri. Misalnya : suatu tes
tentang ketelitian kerja, diuji validitasnya dengan prestasi kerja yang sesungguhnya
sebagaimana ditunjukkan oleh catatan-catatan hasil kerja atau penilaian pimpinan unit.
b. Kriterium dalam alat (internal criterion)
Yaitu suatu kriterium yang diambil dari dalam (internal)alat itu sendiri. Biasanya diambil
hasil keseluruhan pengukuran atau total score sebagai kriteriumnya. Misalnya, kita ingin
mengukur intelegensi (yang terdiri dari faktor-faktorl; daya analisa, daya klarifikasi, daya
ingatan, daya pemahaman, daya kritik dan sebagainya), maka untuk menguji apakah
sekelompk item benar-benar mengukur daya analisa, misalnya, jawaban-jawaban terhadap
item daya analisa dicocokkan dengan hasil tes secara keseluruhan atau total score-nya. Antara
nilai total harus terdapat korelasi yang positif (tinggi dan cukup meyakinkan). Kecocokkan
antara hasil-hasil dari item yang disangka mengukur suatu faktor dengan suatu kriterium yang
dipandang telah valid disebut factorial validity atau validitas faktor, di mana besar kecilnya
validitas faktor tergantung kepada besar kecilnya kecocokan itu.
Cara pengukuran reliabilitas
Tiga tehnik pengujian realibilitas instrument antara lain :
a. Teknik Paralel (Paralel Form atau Alternate Form)
Teknik paralel disebut juga tenik double test double trial. Sejak awal peneliti harus sudah
menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument
yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu
selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut
diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut
dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).
b. Teknik Ulang (Test Re-test)
Disebut juga teknik single test double trial. Menggunakan sebuah instrument, namun dites
dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui
besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang
digunakan pada teknik pertama yaitu rumus korelasi Pearson. Menurut Saifuddin Azwar,

realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu.
Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama
kepada kelompok yang sama, pada waktu yang berbeda.
4. How to develop? Bagaimana mengembangkan validitas dan reliabilitas?
Cara meningkatkan atau mengembangkan validitas dan reliabilitas
1. Mencatat bebas hal-hal penting serinci mungkin (setting,partisipan ataupun hal-hal terkait).
2. Mendokumentasikan secara lengkap dan rapi data yang terkumpul, proses pengumpulan
data maupun strategi analisisnya.
3. Menyertakan partner saat observasi untkmenghindari subyektifitas
4. Melakukan pengecekan dan pengecekan kembalidata,menguji kemungkinan dugaandugaan yg berbeda.
Cara meningkatkan reliabilitas
1. Mengonsep satu variabel dengan jelas.
2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah
variabel harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.
3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu level
pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki
semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level paling
tepat yang mungkin diperoleh.
4. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yang spesifik,
peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi
konseptual.
5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah
pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies,
prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari
literatur-literatur yang berkaitan. Selanjutnya , pengukuran terdahulu dapat dipergunakan
sebagai patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat
ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh
peneliti kemudian tetap sama.
5. Mengapa perlu ada validitas dan reliabilitas?
Jika kita kembali ke definisi validitas, maka dapat disimpulkan bahwa validitas mutlak
diperlukan oleh sebuah alat ukur atau alat tes agar tujuan pengukuran relevan dengan data
yang diperlukan atau diperoleh. Sebagai contoh, sebuah timbangan badan, dikatakan
memiliki validitas jika dapat mengukur berat badan manusia secara akurat. Keakuratan

timbangan badan tersebut sebelumnya harus diuji terlebih dahulu, melalui proses terra
timbangan oleh Badan Metrologi. Uji validitas tersebut mutlak diperlukan oleh timbangan
agar orang yang menggunakan merasa yakin bahwa ukuran 1 kg pada timbangan benar-benar
valid mengukur 1 kg berat benda.
Sedangkan reliabilitas diperlukan untuk mengetahui sejauhmana hasil suatu pengukuran
dapat dipercaya. Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif
sama, selama aspek yang diukur dalam diri subjek memang belum berubah. Relatif sama,
berarti tetap adanya toleransi terhadap perbedaan-perbedaan kecil diantara hasil beberapa kali
pengukuran. Bila perbedaan itu sangat besar dari waktu ke waktu maka hasil pengukuran
tidak dapat dipercaya dan dapat dikatakan tidak reliabel.(Azwar, 1997) Jika kita kembali
menggunakan contoh timbangan badan, maka reliabilitas timbangan dapat diketahui dengan
cara menggunakan timbangan badan tersebut pada beberapa orang dan beberapa kali
percobaan untuk satu orang. Kalau hasil timbangan tersebut sama atau hanya memiliki
perbedaan kecil saat pengukuran, maka timbangan tersebut dapat dinyatakan reliabel.
6. Kapan validitas dan reliabilitas tidak berlaku?
Validitas menjadi tidak berlaku ketika validitas sebuah alat ukur digunakan untuk melihat
validitas alat ukur lainnya, maka validitas tersebut menjadi tidak berlaku. Hal ini disebabkan
tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur
biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Sedangkan
reliabilitas menjadi tidak berlaku pada dua kondisi. Yang pertama, alat ukur tersebut
digunakan untuk mengukur populasi atau sampel yang berbeda dengan rancangan alat ukur
itu. Ini disebut sampling error, mengacu kepada inkonsistensi hasil ukur karena digunakan
ulang pada kelompok individu yang berbeda. Contoh timbangan badan tadi, menjadi tidak
reliabel jika yang ditimbang adalah monyet, bukan manusia. Sedangkan yang kedua,
reliabilitas menjadi tidak berlaku jika terjadi kesalahan pengukuran atau error of
measurement. Alat ukur yang dipakai tidak konsisten dalam mengukur. Timbangan badan,
menjadi tidak reliabel ketika mengukur berat badan orang yang sama beberapa kali namun
menunjukkan hasil yang berbeda-beda dan perbedaan tersebut cukup besar. Misalkan: hasil
timbangan pertama pada si A, 60 kg. Timbangan kedua, 58 kg dan timbangan ketiga 60,5 kg.
Dari hasil timbangan tersebut, dapat kita simpulkan bahwa alat timbangan badan itu tidak
reliabel.
7. Apa beda validitas untuk alat tes dengan validitas untuk kegiatan observasi dan
wawancara?

Validitas untuk alat tes berkaitan dengan ketepatan dan kecermatan alat tes tersebut dalam
melakukan fungsi tes atau fungsi ukurnya. Menurut buku Standards, yang ditulis oleh
Asosiasi Psikolog Amerika (APA), validitas mengacu pada derajat dimana bukti dan teori
menyokong interpretasi dari skor tes dan mengacu pada tujuan tes. Validitas adalah hal yang
paling mendasar dalam pengembangan dan evaluasi tes. Proses validasi meliputi akumulasi,
membuktikan tujuan dari evaluasi tersebut, bukan terhadap test itu sendiri. Pada alat tes
biasanya validitas akan dihitung secara statistik dan dalam bentuk rumusan angka.
Sedangkan validitas untuk kegiatan observasi dan wawancara berkaitan dengan konsep yang
digunakan untuk mendasari tujuan observasi dan wawancara itu sendiri. Sebelum seseorang
melakukan kegiatan observasi dan wawancara, ia harus mendefinisikan konsep atau teori
yang akan dipakai sebagai acuan kerangka konsepnya sehingga kegiatan observasi dan
wawancara yang dilakukan memiliki acuan yang jelas. Hasil dari observasi dan wawancara
dapat dijadikan referensi yang akurat untuk membuat deskripsi tentang orang, situasi atau
kejadian. Validitas observasi dan wawancara tidak dihitung secara statistik, namun cukup
dengan menguraikan konsep atau teori menjadi beberapa indikator.
8. Bagaimana menentukan validitas untuk kegiatan observasi?
Ada 2 cara menentukan validitas observasi, yaitu: menggunakan dasar teori atau konsep
kemudian di turunkan menjadi beberapa aspek atau indikator konsep. Yang kedua,
menggunakan perbandingan antar perilaku. Pada cara pertama, observer harus menentukan
teori atau konsep apa yang akan digunakan sebagai acuan observasi. Konsep atau teori itu
kemudian diturunkan menjadi beberapa indikator yang dipakai untuk menjadi tolok ukur
operasional konsep tersebut. Sedangkan cara kedua adalah membandingkan perilaku subjek
pada berbagai situasi. Apakah perilaku inatensi, misalnya, muncul di kelas, apakah muncul
juga saat ia berada di rumah, apakah muncul juga saat ia sedang mengerjakan tugas di tempat
les. Dengan membandingkan kemunculan perilaku dari hasil observasi tersebut akan
didapatkan validitas observasi yang disebut concurrent validity.
9. Kapan sebuah observasi membutuhkan validitas?
Pada setiap kegiatan observasi atau pengamatan sangat perlu untuk memiliki instrumen
observasi yang valid. Hal ini dikarenakan indera yang digunakan dalam pengamatan yakni
mata dan telinga memiliki keterbatasan. Rahayu dan Ardani (2004) menyatakan bahwa
keterbatasan indera timbul terutama dari objek yang dihadapi. Kebanyakan objek-objek
penyelidikan adalah objek-objek yang kompleks, memiliki unsur yang banyak, segi yang
berliku-liku atau dimensi yang majemuk. Oleh karena itu kegiatan observasi membutuhkan
instrumen yang valid agar instrumen tesebut benar-benar dapat mengukur target perilaku

dalam kegiatan observasi. Sattler (2002) menjelaskan bahwa dalam pelaksanaan observasi
sering ditemui berbagai masalah. Pertama, sulitnya untuk mendapatkan sampel dan
representatif perilaku yang tepat dalam waktu singkat. memperoleh sampel dan representatif
perilaku yang tepat akan memerlukan pengambilan sampel dalam berbagai jenis situasi, dan
ini jarang dilakukan. Kriteria validasi meliputi penilaian dari orang lain yang akrab dengan
subjek penelitian dan observasi dalam situasi eksperimental. Tapi kriteria ini tidak mutlak
dan tidak menawarkan bukti keabsahan. kesulitan lebih lanjut muncul ketika dua indeks yang
dimaksudkan untuk mengukur perilaku yang sama bukanlah kesepakatan. ukuran mana yang
valid atau representatif? karena perilaku adalah variabel, sangat mungkin kedua ukuran ini
adalah akurat, meskipun langkah-langkah kriteria menunjukkan kesepakatan yang buruk.
10. Kapan sebuah wawancara perlu ditentukan validasinya?
Instrumen yang digunakan dalam sebuah wawancara seharusnya memiliki validitas yang
baik. Rahayu dan Ardani (2004) mengungkapkan bahwa validitas yang baik merujuk pada
objektivitas. Artinya, variabel-variabel dalam wawancara yang telah ditetapkan oleh peneliti
harus berdasarkan teori-teori yang telah mapan. Namun objektivitas dalam kegiatan
wawancara bersifat objectivied subjectivities. Artinya subjektif menurut peneliti (teori yang
ada), tetapi objektif menurut subjek yang diteliti. Hal ini dimungkinkan karena realitas sosial
dalam penelitian naturalistik berada di alam imajinasi pikiran kebanyakan manusia yang
merupakan gugusan subjektivitas awam yang tidak pernah diuji kebenarannya, dan objektif
menurut kaidah-kaidah keilmuan atau logika. Namun betapapun subjektifnya, hal tersebut
sesungguhnya adalah subjektivitas unik yang justru harus ditempatkan sebagai objek kajian
ilmu-ilmu sosial yang utama.
11. Teori apa yang mendasari penggunaan validitas untuk kegiatan observasi dan
wawancara?
Validitas dalam kegiatan observasi dan wawancara pada pengukuran psikologi perlu untuk
dilakukan karena subjek pengukurannya adalah manusia. Untuk mengungkap aspek-aspek
atau variabel-variabel dari keadaan psikologis manusia, diperlukan instrumen observasi dan
wawancara yang reliabel dan valid agar kesimpulan penelitian tidak keliru dan dapat
memberikan gambaran yang tepat mengenai subjek penelitian (Azwar, 1992).
12. Bagaimana cara menggunakan validitas?
Rahayu dan Ardani (2004) menjelaskan bahwa validitas menunjukkan sejauh mana suatu alat
ukur dapat mengukur apa yang hendak diukur. Dalam kegiatan observasi ada beberapa jenis
validitas yang dapat digunakan, yaitu
a. Face validity adalah bagaimana kelihatannya suatu alat pengukur benar-benar menukur apa

yang hendak diukur. Misalnya untuk mengukur kemampuan sebagai seorang supir, seorang
observee harus disuruh mengendarai mobi. Tetapi, bila pengukuran kemampuan mengendarai
mobil dilakukan dengan ujian tertulis tentang teknik mengendarai mobil, maka alat pengukur
tesebut kurang memiliki face validity.
b. Content validity adalah sejauh mana isi alat ukur tersebut mewakili semua aspek yang
dianggap sebagai aspek kerangka konsep. Data harus mencerminkan cir-ciri yang telah
ditentukan yaitu apa saja yang akan diungkap/diukur. Contohnya bila seorang penelitia infin
mengukur keikutsertaan dalam program KB dengan menanyakan metode kontrasepsi yang
dipakai. Bila aspek yang diamati tidak mencakup semua metode kontrasepsi, maka alat ukur
tersebut tidak memiliki validitas isi.
c. Predicty validity adalah alat pengukur yang dibuat oleh peneliti seringkali dimaksudkan
untuk memprediksi apa yang akan terjadi di masa yang akan datang. Contonya ujian seleksi
masuk perguruan tinggi. Ujian tersebut merupakan upaya untuk memprediksi apa yang aan
terjadi di masa yang akan datang. Peserta yang lulus ujian dengan nilai baik diprediksikan
akan mengikuti pelajaran di perguruan tinggi dengan sukses. Soal ujian masuk tersebut
dikatakan memiliki validitas prediktif, apabila ada korelasi yang tinggi antara nilai ujian
masuk dengan prestasi belajar setelah menjadi mahasiswa.
d. Construct validity adalah kerangka suatu konsep. Misalnya, untuk mengukur status
ekonomi responen dengan menggunakan lima komponen status ekonomi, yakni penghasilan
perbulan, pengeluaran perbulan, pemilikan barang, porsi penghasilan yang digunakan untuk
rekreasi, dan kualitas rumah. Apabila ada konsistensi antara komponen-komponen konstruk
yang satu dengan yang lain maka konstruk tersebut memiliki validitas.
e. Concurrent validity dilakukan dengan mengobservasi perilaku dan membandingkannya
dengan perilaku lain. Misalnya perilaku di sekolah sama dengan perilaku di luar kelas
(menunjukkan agresivitas).
Selanjutnya validitas dalam kegiatan wawancara
a. Validitas konstruk. penelitian kualitatif dengan metode observasi dan wawancara tidak
terlepas dari aktivitas melakukan konstruksi sosial. Misalnya, orang yang selalu memakai
peci dikonstruk peneliti sebagai orang yang alim. Konstruksi semacam itu memiliki banyak
kelemahan. Oleh karena itu, perlu diperhatikan beberapa hal, yaitu:
Dalam pengumpulan data, peneliti harus menggunakan multi sumber bukti.
Peneliti harus membangun rangkaian bukti antara satu data dengan data lain.
Agar peneliti meminta orang yang diwawancarai meninjau ulang draft laporan yang
disusun.

b. Validitas internal. Hal ini dilakukan pada tahap analisis data. Validitas internal ini meliputi
hal-hal berikut:
Membuat pola penjodohan dengan analisis sebab-akibat atau aksi reaksi atau pengaruhmempengaruhi.
Peneliti hendaknya mengerjakan penyusunan kesplanasi; maksudnya apakah konstruksi
yang dibuat berdasarkan data yang diterima itu dapat dipertanggungjawabkan.
Peneliti hendaknya membuat analisis deret waktu dari peristiwa-peristiwa atau fenomenafenomena yang terjadi.
c. Validitas eksternal. Dalam melakukan validitas ini, hendaknya peneliti menggunakan
logika replikasi. Artinya seandainya penelitian yang sama dilakukan oleh orang lain dengan
menggunakan pendekatan yang sama, niscaya hasilnya akan sama atau hampir sama.
13. Apakah perlu mencari reliabilitas kegiatan observasi?
Mencari reliabilitas dalam kegiatan observasi itu perlu, dimana reliabilitas observasi adalah
keajegan apa yang diobservasi. Agar suatu pengukuran observasi dapat dipercaya, maka
idealnya hasil observasi bila diuji kembali oleh orang lain baik di lain waktu maupun
sekarang maka hasilnya relatif sama.
14. Apakah perlu mencari reliabilitas kegiatan wawancara?
Menurut Neuman (2007), metode wawancara menjadi ciri khas dari penelitan kualitatif.
reliabilitas dengan pendekatan kualitatif lebih menekankan kepada keajegan hasil jawaban
yang dimunculkan oleh subjek. Namun berbeda dengan pendekatan kuantitatif, reliabilitas
pada kualitatif lebih bersifat fleksibel dan berkembang. Sehingga jika pada pendekatan
kualitatif didapatkan data yang berbeda, tidak serta merta disimpulkan bahwa reliabilitasnya
rendah tapi justru menjadi salah satu bentuk memperoleh data yang kaya atau lengkap.
15. Bagaimana menghitung reliabilitas dalam observasi?
Cara mendapatkan reliabilitas observasi adalah berdasarkan kesepakatan observer,
Reliabilitas berarti, apabila dua observer sepakat dalam hasil observasi (Sukadji, 2000).
Rumus kesepakatan juga bisa untuk menghitung hasil dua kali observasi yang dilakukan
oleh satu orang observer (Sukadji, 2000).
Rumus Persentase Kesepakatan sebagai berikut :
Interval Recording
-Agreement of total observation (A tot) total ke dua observer sama-sama setuju baik X
maupun O

Agreement of occurence observation (A occ) sama-sama setuju ada peristiwa observasi


(X)
Agreement of nonoccurence observation (A non) sama-sama setuju tidak ada peristiwa
observasi (O)
Event Recording
Adalah kejadian yang tegas mulai dan berakhirnya kegiatan obesrvasi. Pencatatan bisa
dengan check list, mechanical devices, dan lain-lain. Dalam observasi kelas, rincian perilaku
dapat ditulis dalam bentuk daftar event yang dapat dihitung bila terjadi perilaku yang
diinginkan.
Dalam observasi, reliabilitas dan validitas dipengaruhi oleh faktor-faktor antara lain :
a. Observer
Banyak sekali kesalahan yang bersumber dari kualitas pribadi observer yang dapat
digolongkan sebagai kecondongan (bias).
1) Kesalahan yang berkaitan dengan kualitas pribadi observer, antara lain :
a) Central tendency
Observer lebih sering menggunakan kategori yang di tengah dalam skala rating daripada
kategori tepi, sehingga dalam prosesnya cenderung underestimasi perilaku yang intens dan
overestimasi perilaku yang lemah.
b) Leniency (kemurahan)
Observer cenderung membuat penilain yang cenderung ke arah baik terhadap subjek.
c) Efek primacy (kesan pertama)
Observer membiarkan kesan pertama mendistorsikan kesan atau penilaiannya kemudian.
d) Halo effect
Observer membuat penilaian berdasar kesan umum subjek atau berdasar perilaku subjek yang
paling mencolok.
e) Teori pribadi
Observer menyesuaiakn observasi ke asumsi teori pribadi.
f) Nilai pribadi
Observer menyesuaikan observasi ke harapan, nilai, dan minat pribadi.
g) Overestimasi perilaku yang hampir-hampir tidak dikenali ada pada diri observer sendiri.
Misalnya, observer overestimasi volume suara subjek sebab observer sendiri tidak mengenali
bahwa suaranya terlalu rendah volumenya.
h) Kesalahan logika
Observer membuat penilaian yang serupa terhadap sifat-sifat subjek yang kelihatannya secara

logika saling terkait.


i) Kesalahan kontras
Pada sifat khusus, observer menilai subjek jauh lebih berbeda dengan diri observer sendiri
daripada kenyataannya.
j) Kesalahan proksimitas
Observer menilai serupa sifat-sifat tertentu karena bentuk penilaian membuat sifat-sifat itu
berdekatan dalam waktu atau letak.
k) Pengaruh pribadi
Tanpa diketahui oleh observer sendiri, karakteristik diri observer (usia, jenis, kelamin, ras,
dan status sosial) mempengaruhi penilaian perilaku subjek.
l) Ketidakstabilan penilaian observer
Kriteria penilaian yang dipakai oleh observer berubah bersama waktu, akibat ada dan
tidaknya perilaku karena kelelahan, atau belajar, atau penyebab lainnya.
m) Terlewat
Observer alpa mencatat perilaku yang muncul.
n) Commision
Observer keliru kode suatu perilaku.
o) Efek harapan
Harapan observer mempengaruhi pencatatan, atau observer mengharapkan sesuatu terjadi dan
mengkomunikasikan harapan ini kepada subjek.
p) Reaktivitas observer
Observer berubah pencatatan perilakunya karena ia sadar diamati.
q) Isyarat nonverbal
Observer dengan tidak sengaja memberi isyarat kepada subjek sehingga mendukung perilaku
tertentu pada subjek.
2) Ketidakstabilan Penilaian Observer
Bila observasi berlangsung lama, observer mungkin menunjukkan tanda-tanda kelelahan,
lupa dan motivasinya menurun. Misalnya, pada saat permulaan menggunakan standar tertentu
untuk menilai suara bisikan atau vokalisasi singkat, tetapi kemudian berubah standarnya,
ketidakstabilan hal ini mungkin saja terjadi, walaupun telah ada persetujuan mengenai
definisi oprasional perilaku yang diamati.
3) Kesulitan dalam Mengkodekan Perilaku
Kategori global, seperti perilaku off-task atau perilaku tidak patut (innappropriate
behavior) membutuhkan penyimpulan tingkat tinggi dibanding kategori spesifik, seperti

memukul, atau meninggalkan tempat duduk. Meskipun diusahakan sebaik-baiknya


mendefinisikan perilaku dengan cermat, beberapa perilaku memang sulit dikategorikan. Jadi,
kode observasi menuntut pertimbangan yang masak di pihak observer.
4) Memilih Waktu dan Saat yang Tepat
Menentukan waktu yang tepat munculnya suatu kejadian bukanlah semudah yang
dibayangkan. Misalnya, untuk mengobservasi perilaku menolak dan memulai makan pada
anak. Sulit untuk menentukan waktu kapan saat yang tepat anak mulai menolak memulai
makan. Selain itu, unit waktu yang dipilih oleh observer mungkin tidak dapat
menggambarkan dengan tepat peta kejadian perilaku.
16. Bagaimana meningkatkan reliabilitas Observasi?
Adanya kelemahan-kelemahan yang menyebabkan reliabilitas pengukuran menurun
(sehingga validitasnya juga menurun), membuat kita waspada untuk menghindarinya.
Beberapa petunjuk praktis, antara lain :
a. Observer hendaknya memahami benar-benar teknik-teknik pencatatan, manual maupun
instrumental. Pastikanlah dalam rancangannya perilaku-perilaku kritis didefinisikan dengan
jelas, tegas dan cermat.
b. Sebelum melaksanakan observasi, periksalah dulu peralatan-peralatan pengumpul data.
c. Observer perlu latihan sampai mahir sebelum turum ke lapangan.
d. Kumpulkan data dengan mengobservasi subjek dalam berbagai situasi dan waktu, terutama
bila yang diobersevasi kelompok, atau untuk mendapatkan norma.
e. Temukan kecondongan (bias), kelemahan-kelemahan, yang kita miliki sebagai observer,
dan kembangkan ketrampilan pemahaman diri dan evaluasi diri yang kritis.
f. Kembangkan skeptisisme yang sehat terhadap laporan yang telah ada mengenai perilaku
subjek, agar observasi yang kita lakukan dapat seobjektif mungkin.
g. Menunda asumsi dan spekulasi mengenai arti dan implikasi perilaku subjek yang diamati
selagi pengambilan data.
h. Bila pengamatan telah selesai, pertimbangkanlah faktor-faktor yang meyulut dan
memelihara perilaku subjek, serta tanggapan-tanggapan orang lain yang ada di dalam setting
subjek atas perilaku subjek tersebut.
i. Secara periodik bandingkan hasil pengamatan dengan pengamat lain yang menggunakan
sistem penyekoran yang sama.
j. Secara teratur pencatatan harus dikalibrasi yaitu dengan mencocokkan lagi dengan
potokol standar.
k. Ikuti teori-teori dan test-retest mutakhir dalam bidang observasi.

l. Hindari kekeliruan-kekeliruan umum berkenaan dengan observasi sebagaimana telah


disebut terlebih dahulu.
17. Kapan observasi perlu ditentukan reliabilitasnya?
Reliabilitas observasi perlu dilakukan bila data yang dihasilkan berbentuk data kuantitatif.
Pengukuran reliabilitas dapat dilakukan untuk melihat hasil observasi antar observer 1
dengan observer yang lain (reliabilitas interrater). .
18. Apa beda reliabilitas alat tes dengan reliabilitas untuk kegiatan observasi dan wawancara?
Perbedaan penerapan reliabilitas dalam alat tes dan obserasi/wawancara dapat dijelaskan
dengan perbedaan pendekatan kuantitatif (untuk alat tes) dan pendekatan kualitatif
(observasi/wawancara). Secara sederhana dapat dikatakan bahwa reliabilitas pada pendekatan
kuantitatif bersifat tetap dan statis sedangkan reliabilitas pengukuran dengan pendekatan
kualitatif bersifat berkembang dan tumbuh bersama kedekatan antara observer dengan
observee (Neuman, 2007).
19. Bagaimana cara menggunakan reliabilitas?
Kita dapat menggunakan nilai reliabilitas untuk menunjukkan tingkat kepercayaan terhadap
alat ukur yang sudah kita buat. Nilai reliabilitas berkisar pada nilai 0-1, dimana semakin
mendekati 1 maka dapat dikatakan alat ukur tersebut semakin dapat dipercaya. Dipercaya
disini dimaksudkan bahwa suatu alat tes apabila dilakukan tes ulang atau diadministrasikan
oleh tester lain maka akan keluar nilai yang relatif tetap (ajeg).
20. Jika sebuah alat tes mencapai validitas namun tidak reliabel, bagaimana kualitas alat tes
tersebut? Dan bagaimana jika terjadi kebalikannya?
Validitas dan reliabilitas bersifat saling melengkapi namun terkadang juga dapat bersifat
bertolak belakang (Neuman, 2007). Dalam suatu contoh misalnya ada suatu alat ukur yang
memiliki validitas tinggi namun memiliki reliabilitas rendah, hal ini dapat terjadi dalam
pengukuran dengan pendekatan kualitatif. Misalnya konstrak yang diukur merupakan suatu
konstrak yang sangat abstrak yaitu alienasi yang digali melalui metode wawancara, hal ini
mungkin dapat dikatakan memiliki validitas yang tinggi namun reliabilitas yang rendah
karena tergantung pada bagaimana peneliti menggunakan instrumen penelitian.
Contoh lain misalnya suatu alat ukur yang memiliki reliabilitas yang tinggi namun
validitasnya rendah. Berdasarkan pernyataan tersebut dapat dikatan bahwa suatu alat ukur
memiliki keajegan dalam mengukur namun kurang tepat dalam mengukur apa yang hendak
diukur. untuk memudahkan pembahasan ini penulis mengutip gambar dari Neuman (2007)
sebagai berikut:

Berdasarkan gambar diatas dapat dilihat bahwa ketika ketika suatu alat tes memiliki
reliabilitas yang tinggi namun validitas rendah tidak dapat mengenai sasaran terhadap apa
yang ingin diukur. Berdasarkan penjabaran tersebut maka dapat dikatakan bahwa ketika suatu
alat tes memiliki reliabilitas yang tinggi namun validitas yang rendah maka alat ukur itu
memiliki kualitas yang rendah. Namun sebaliknya, jika suatu alat ukur valid maka
kemungkinan besar reliabilitasnya akan dapat mengikuti menjadi baik juga. Secara sederhana
dapat diakatakan bahwa suatu alat ukur yang valid akan cenderung memiliki reliabilitas yang
tinggi namun alat ukur yang memiliki reliabilitas yang tinggi belum tentu valid.
DAFTAR PUSTAKA
Azwar, S. (1992). Reliabilitas dan Validitas. Yogyakarta: Penerbit Sigma Alpha.
Azwar, S. (1997). Reliabilitas dan Validitas(Ed. 3). Yogyakarta: Pustaka Pelajar.
Louis, J. (2011). Validitas dan reliabilitas. Diakses pada tanggal 11 November 2014 dari
http://jeffy-louis.blogspot.com/2011/02/validitas-dan-reliabilitas.html
Neuman, W. L., (2007). Basic Social Research Methods: Qualitative & Quantitative
Approachs (2ed). Boston: Allyn & Bacon.
Rahayu, I.T. dan Ardani, T.A. (2004). Observasi dan Wawancara. Malang: Bayumedia
publishing.
Sattler, J.M. (2002). Assessment of Children. California: Penerbit Sattler.
Sudijono, A. (2009). Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press.
Sukadji, S. (2000). Psikologi pendidikan dan psikologi sekolah (Direvisi dan Dilengkapi).
Depok: Universitas Indonesia.

Anda mungkin juga menyukai