Anda di halaman 1dari 16

Pertanyaan yang diajukan:

1. Apa yang dimaksud dengan validitas dan reliabilitas?

2. Jenis validitas dan reliabilitas? Validitas untuk proses riset dan alat ukurnya!

3. Bagaimana cara mengukur validitas dan reliabilitas?

4. How to develop? Bagaimana mengembangkan validitas dan reliabilitas?

5. Mengapa perlu ada validitas dan reliabilitas?

6. Kapan validitas dan reliabilitas tidak berlaku?

7. Apa beda validitas untuk alat tes dengan validitas untuk kegiatan observasi dan wawancara?

8. Bagaimana menentukan validitas untuk kegiatan observasi?

9. Kapan sebuah observasi membutuhkan validitas?

10. Kapan sebuah wawancara perlu ditentukan validasinya?

11. Teori apa yang mendasari penggunaan validitas untuk kegiatan observasi dan wawancara?

12. Bagaimana cara menggunakan validitas?

13. Apakah perlu mencari reliabilitas kegiatan observasi?

14. Apakah perlu mencari reliabilitas kegiatan wawancara?

15. Bagaimana menghitung reliabilitas dalam observasi?

16. Bagaimana meningkatkan reliabilitas observasi?

17. Kapan observasi perlu ditentukan reliabilitasnya?

18. Apa beda reliabilitas alat tes dengan reliabilitas untuk kegiatan observasi dan wawancara?

19. Bagaimana cara menggunakan reliabilitas?

20. Jika sebuah alat tes mencapai validitas namun tidak reliabel, bagaimana kualitas alat tes
tersebut? Dan bagaimana jika terjadi kebalikannya?
PEMBAHASAN

1. Apa yang dimaksud dengan validitas dan reliabilitas?

Validitas berasal dari kata validity yang mempunyai arti sejauhmana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur
dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi
ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran
tersebut. Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan
sebagai tes yang memiliki validitas rendah (Azwar, 1997).

Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai asal kata rely
dan ability. Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang
reliabel (reliabele). Walaupun reliabilitas mempunyai berbagai nama lain seperti keterpercayaan,
keterandalan, keajegan, kestabilan, konsistensi, dan sebagainya, namun ide pokok yang
terkandung dalam konsep reliabilitas adalah sejauh mana hasil suatu pengukuran dapat
dipercaya.

2. Jenis validitas dan reliabilitas? Validitas untuk proses riset dan alat ukurnya!

a. Jenis Validitas

Menurut Sudijono (2009) terdapat berbagai jenis validitas, berikut ini jenis validitas
ditinjau dari pengujiannya validitasnya yaitu pengujian validitas secara rasional dan secara
konten. Penhelasan untuk masing masing validititas itu adalah sebagai berikut:

Pengujian Validitas Tes Secara Rasional

Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang
diperoleh dengan berpikir secara logis.

a. Validitas Isi (Content Validity)

Valditas isi berkaitan dengan kemampuan suatu instrumen mengukur isi (konsep) yang
harus diukur. Ini berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau
variabel yang hendak diukur. Validitas isi dari suatu tes hasil belajar adalah validitas yang
diperoleh setelah dilakukan penganalisisan, penelususran atau pengujian terhadap isi yang
terkandung dalam tes hasil belajar tersebut. Validitas isi adalah yang ditilik dari segi isi tes itu
sendiri sebagai alat pengukur hasil belajar yaitu: sejauh mana tes hasil belajar sebagai alat
pengukur hasil belajar peserta didik, isisnya telah dapat mewakili secara representatif terhadap
keseluruhan materi atau bahkan pelajaran yang seharusnya diteskan (diujikan).
Misalnya test bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut, pengukuran
motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan
demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan validitas isi terutama
berkaitan dengan proses analisis logis, dengan dasar ini Dia berpendapat bahwa validitas isi
berbeda dengan validitas rupa yang kurang menggunakan analisis logis yang sistematis, lebih
lanjut dia menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga
mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.

b. Validitas konstruksi (Construct Validity)

Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang
berkaitan dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang
diukurnya. Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas konstruk)
merupakan yang terluas cakupannya dibanding dengan validasi lainnya, karena melibatkan
banyak prosedur termasuk validasi isi dan validasi kriteria.

Validitas konstruksi juga dapat diartikan sebagai validitas yang ditilik dari segi susunan,
kerangka atau rekaannya. Adapun secara terminologis, suatu tes hasil belajar dapat dinyatakan
sebagai tes yang telah memiliki validitas konstruksi, apabila tes hasil belajar tersebut telalh dapat
dengan secara tepat mencerminkan suatu konstruksi dalam teori psikologis.

Pengujian Validitas Tes Secara Empirik

Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang
bersifat empirik. Dengan kata lain, validitas empirik adalah validitas yang bersumber pada atau
diperoleh atas dasar pengamatan di lapangan.

a. Validitas ramalan (Predictive validity)

Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes
telah dapat dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal
terjadi pada masa mendatang. Contohnya apakah test masuk sekolah mempunyai validitas
ramalan atau tidak ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan antara
hasil test masuk dengan prestasi belajar sesudah menjadi siswa, bila ada, berarti test tersebut
mempunyai validitas ramalan.

b. Validitas bandingan (Concurrent Validity)

Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes
tersebut dalam kurun waktu yang sama dengan secara tepat mampu menunjukkan adanya
hubungan yang searah, antara tes pertama dengan tes berikutnya.

b. Jenis-jenis Reliabilitas

1. Reliabiltas Tes Berulang (Test-retest reliability) Reliabiltas tes berulang adalah ukuran
reliabilitas yang diperoleh dengan pemberian dua kali tes yang sama selama periode waktu
tertentu untuk sekelompok individu. Contoh: Sebuah tes bahasa diberikan kepada siswa. Satu
bulan kemudian tes yang sama diberikan pada siswa yang sama. Jika skor keduanya
menghasilkan koefisien korelasi tinggi maka tes tersebut memiliki reliabilitas tinggi.
2. Reliabilitas Antar Penilai (Inter-rater atau Inter-observer Reliability) Reliabilitas antar
penilai adalah ukuran reliabilitas berdasarkan konsistensi penilaian dua responden berbeda
terhadap suatu konstruk, karena belum tentu pengamat manusia menafsirkan jawaban dengan
cara yang sama. Contoh: Peneliti meminta tanggapan dua hakim berbeda untuk memutuskan
kasus yang sama. Jika kedua hakim memberi tanggapan yang seragam maka instrumen
dinyatakan reliabel.

3. Reliabilitas Konsistensi Internal (Internal consistency reliability) Reliabilitas konsistensi


internal adalah ukuran reliabilitas berdasarkan evaluasi item-item tes terhadap konstruk yang
sama. Ada dua jenis untuk reliabilitas ini yaitu:

o Rata-rata Korelasi Antar Item (Average inter-item correlation) Rata-rata korelasi antar
item diperoleh dengan mengambil semua item pada tes dan akhirnya menggunakan rata -rata
semua koefisien korelasi tersebut. Dengan kata lain instrumen dibelah sebanyak jumlah item
kemudian hasil koefisien korelasi digabung untuk mendapatkan rata-rata. Teknik ini populer
dengan Alpha Cronbach.

o Reliabilitas Belah Setengah (Split-half reliability) Reliabilitas belah setengah adalah


teknik dengan membelah item tes menjadi dua bagian untuk membentuk dua set item, kemudian
skor total masing-masing set item dikorelasikan. Jika koefisien korelasi tinggi maka reliabilitas
tinggi.

3. Bagaimana cara mengukurnya validitas dan reliabilitas?

Pekerjaan untuk mencari validitas suatu alat ukur disebut validation. Prinsip dari validation
adalah membandingkan hasil-hasil dari pengukuran faktor dengan suatu kriterium, )suatu ukuran
yang telah dipandang valid untuk menunjukkan faktor yang dimaksud). Jadi misalnya suatu alat
pengukur hendak menyelidiki faktor ketelitian kerja, maka harus diambil lebih dahulu suatu
kriterium yang telah dipandang mencerminkan suatu ketelitian kerja. Melalui kriterium itulah
kemudian hasil dari pengukuran faktor ketelitian kerja disoroti, Jika hasil pengukuran faktor
ketelitian kerja menunjukkan besarnya ketelitian kerja yang sesuai dengan kriterium, maka alat
pengukur itu dipandang valid.
Ada dua jenis kriterium ang digunakan untuk menguji kejituan alat pengukur, yaitu :

a. Kriterium luar (external criterion)

Yaitu suatu kriterium yang diambil dari luar (external) alat itu sendiri. Misalnya : suatu tes
tentang ketelitian kerja, diuji validitasnya dengan prestasi kerja yang sesungguhnya sebagaimana
ditunjukkan oleh catatan-catatan hasil kerja atau penilaian pimpinan unit.

b. Kriterium dalam alat (internal criterion)

Yaitu suatu kriterium yang diambil dari dalam (internal)alat itu sendiri. Biasanya diambil
hasil keseluruhan pengukuran atau total score sebagai kriteriumnya. Misalnya, kita ingin
mengukur intelegensi (yang terdiri dari faktor-faktorl; daya analisa, daya klarifikasi, daya
ingatan, daya pemahaman, daya kritik dan sebagainya), maka untuk menguji apakah sekelompk
item benar-benar mengukur daya analisa, misalnya, jawaban-jawaban terhadap item daya analisa
dicocokkan dengan hasil tes secara keseluruhan atau total score-nya. Antara nilai total harus
terdapat korelasi yang positif (tinggi dan cukup meyakinkan). Kecocokkan antara hasil-hasil dari
item yang disangka mengukur suatu faktor dengan suatu kriterium yang dipandang telah valid
disebut factorial validity atau validitas faktor, di mana besar kecilnya validitas faktor tergantung
kepada besar kecilnya kecocokan itu.
Cara pengukuran reliabilitas
Tiga tehnik pengujian realibilitas instrument antara lain :

a. Teknik Paralel (Paralel Form atau Alternate Form)

Teknik paralel disebut juga tenik double test double trial. Sejak awal peneliti harus sudah
menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang
disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus
dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan
semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya
dengan menggunakan rumus product moment (korelasi Pearson).

b. Teknik Ulang (Test Re-test)

Disebut juga teknik single test double trial. Menggunakan sebuah instrument, namun
dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui
besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan
pada teknik pertama yaitu rumus korelasi Pearson. Menurut Saifuddin Azwar, realibilitas tes-
retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur
dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang
sama, pada waktu yang berbeda.

4. How to develop? Bagaimana mengembangkan validitas dan reliabilitas?

Cara meningkatkan atau mengembangkan validitas dan reliabilitas

1. Mencatat bebas hal-hal penting serinci mungkin (setting,partisipan ataupun hal-hal


terkait).

2. Mendokumentasikan secara lengkap dan rapi data yang terkumpul, proses pengumpulan
data maupun strategi analisisnya.

3. Menyertakan partner saat observasi untkmenghindari subyektifitas

4. Melakukan pengecekan dan pengecekan kembalidata,menguji kemungkinan dugaan-


dugaan yg berbeda.

Cara meningkatkan reliabilitas

1. Mengonsep satu variabel dengan jelas.


2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah
variabel harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.

3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu
level pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang
dimiliki semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level
paling tepat yang mungkin diperoleh.

4. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yang spesifik,
peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi
konseptual.

5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah
pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies,
prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari
literatur-literatur yang berkaitan. Selanjutnya , pengukuran terdahulu dapat dipergunakan sebagai
patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat
ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti
kemudian tetap sama.

5. Mengapa perlu ada validitas dan reliabilitas?

Jika kita kembali ke definisi validitas, maka dapat disimpulkan bahwa validitas mutlak
diperlukan oleh sebuah alat ukur atau alat tes agar tujuan pengukuran relevan dengan data yang
diperlukan atau diperoleh. Sebagai contoh, sebuah timbangan badan, dikatakan memiliki
validitas jika dapat mengukur berat badan manusia secara akurat. Keakuratan timbangan badan
tersebut sebelumnya harus diuji terlebih dahulu, melalui proses terra timbangan oleh Badan
Metrologi. Uji validitas tersebut mutlak diperlukan oleh timbangan agar orang yang
menggunakan merasa yakin bahwa ukuran 1 kg pada timbangan benar-benar valid mengukur 1
kg berat benda.

Sedangkan reliabilitas diperlukan untuk mengetahui sejauhmana hasil suatu pengukuran


dapat dipercaya. Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama,
selama aspek yang diukur dalam diri subjek memang belum berubah. Relatif sama, berarti tetap
adanya toleransi terhadap perbedaan-perbedaan kecil diantara hasil beberapa kali pengukuran.
Bila perbedaan itu sangat besar dari waktu ke waktu maka hasil pengukuran tidak dapat
dipercaya dan dapat dikatakan tidak reliabel.(Azwar, 1997) Jika kita kembali menggunakan
contoh timbangan badan, maka reliabilitas timbangan dapat diketahui dengan cara menggunakan
timbangan badan tersebut pada beberapa orang dan beberapa kali percobaan untuk satu orang.
Kalau hasil timbangan tersebut sama atau hanya memiliki perbedaan kecil saat pengukuran,
maka timbangan tersebut dapat dinyatakan reliabel.
6. Kapan validitas dan reliabilitas tidak berlaku?

Validitas menjadi tidak berlaku ketika validitas sebuah alat ukur digunakan untuk melihat
validitas alat ukur lainnya, maka validitas tersebut menjadi tidak berlaku. Hal ini disebabkan
tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya
hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Sedangkan reliabilitas
menjadi tidak berlaku pada dua kondisi. Yang pertama, alat ukur tersebut digunakan untuk
mengukur populasi atau sampel yang berbeda dengan rancangan alat ukur itu. Ini disebut
sampling error, mengacu kepada inkonsistensi hasil ukur karena digunakan ulang pada kelompok
individu yang berbeda. Contoh timbangan badan tadi, menjadi tidak reliabel jika yang ditimbang
adalah monyet, bukan manusia. Sedangkan yang kedua, reliabilitas menjadi tidak berlaku jika
terjadi kesalahan pengukuran atau error of measurement. Alat ukur yang dipakai tidak konsisten
dalam mengukur. Timbangan badan, menjadi tidak reliabel ketika mengukur berat badan orang
yang sama beberapa kali namun menunjukkan hasil yang berbeda-beda dan perbedaan tersebut
cukup besar. Misalkan: hasil timbangan pertama pada si A, 60 kg. Timbangan kedua, 58 kg dan
timbangan ketiga 60,5 kg. Dari hasil timbangan tersebut, dapat kita simpulkan bahwa alat
timbangan badan itu tidak reliabel.

7. Apa beda validitas untuk alat tes dengan validitas untuk kegiatan observasi dan
wawancara?

Validitas untuk alat tes berkaitan dengan ketepatan dan kecermatan alat tes tersebut dalam
melakukan fungsi tes atau fungsi ukurnya. Menurut buku Standards, yang ditulis oleh Asosiasi
Psikolog Amerika (APA), validitas mengacu pada derajat dimana bukti dan teori menyokong
interpretasi dari skor tes dan mengacu pada tujuan tes. Validitas adalah hal yang paling mendasar
dalam pengembangan dan evaluasi tes. Proses validasi meliputi akumulasi, membuktikan tujuan
dari evaluasi tersebut, bukan terhadap test itu sendiri. Pada alat tes biasanya validitas akan
dihitung secara statistik dan dalam bentuk rumusan angka.

Sedangkan validitas untuk kegiatan observasi dan wawancara berkaitan dengan konsep
yang digunakan untuk mendasari tujuan observasi dan wawancara itu sendiri. Sebelum seseorang
melakukan kegiatan observasi dan wawancara, ia harus mendefinisikan konsep atau teori yang
akan dipakai sebagai acuan kerangka konsepnya sehingga kegiatan observasi dan wawancara
yang dilakukan memiliki acuan yang jelas. Hasil dari observasi dan wawancara dapat dijadikan
referensi yang akurat untuk membuat deskripsi tentang orang, situasi atau kejadian. Validitas
observasi dan wawancara tidak dihitung secara statistik, namun cukup dengan menguraikan
konsep atau teori menjadi beberapa indikator.

8. Bagaimana menentukan validitas untuk kegiatan observasi?

Ada 2 cara menentukan validitas observasi, yaitu: menggunakan dasar teori atau konsep
kemudian di turunkan menjadi beberapa aspek atau indikator konsep. Yang kedua, menggunakan
perbandingan antar perilaku. Pada cara pertama, observer harus menentukan teori atau konsep
apa yang akan digunakan sebagai acuan observasi. Konsep atau teori itu kemudian diturunkan
menjadi beberapa indikator yang dipakai untuk menjadi tolok ukur operasional konsep tersebut.
Sedangkan cara kedua adalah membandingkan perilaku subjek pada berbagai situasi. Apakah
perilaku inatensi, misalnya, muncul di kelas, apakah muncul juga saat ia berada di rumah, apakah
muncul juga saat ia sedang mengerjakan tugas di tempat les. Dengan membandingkan
kemunculan perilaku dari hasil observasi tersebut akan didapatkan validitas observasi yang
disebut concurrent validity.

9. Kapan sebuah observasi membutuhkan validitas?

Pada setiap kegiatan observasi atau pengamatan sangat perlu untuk memiliki instrumen
observasi yang valid. Hal ini dikarenakan indera yang digunakan dalam pengamatan yakni mata
dan telinga memiliki keterbatasan. Rahayu dan Ardani (2004) menyatakan bahwa keterbatasan
indera timbul terutama dari objek yang dihadapi. Kebanyakan objek-objek penyelidikan adalah
objek-objek yang kompleks, memiliki unsur yang banyak, segi yang berliku-liku atau dimensi
yang majemuk. Oleh karena itu kegiatan observasi membutuhkan instrumen yang valid agar
instrumen tesebut benar-benar dapat mengukur target perilaku dalam kegiatan observasi. Sattler
(2002) menjelaskan bahwa dalam pelaksanaan observasi sering ditemui berbagai masalah.
Pertama, sulitnya untuk mendapatkan sampel dan representatif perilaku yang tepat dalam waktu
singkat. memperoleh sampel dan representatif perilaku yang tepat akan memerlukan
pengambilan sampel dalam berbagai jenis situasi, dan ini jarang dilakukan. Kriteria validasi
meliputi penilaian dari orang lain yang akrab dengan subjek penelitian dan observasi dalam
situasi eksperimental. Tapi kriteria ini tidak mutlak dan tidak menawarkan bukti keabsahan.
kesulitan lebih lanjut muncul ketika dua indeks yang dimaksudkan untuk mengukur perilaku
yang sama bukanlah kesepakatan. ukuran mana yang valid atau representatif? karena perilaku
adalah variabel, sangat mungkin kedua ukuran ini adalah akurat, meskipun langkah-langkah
kriteria menunjukkan kesepakatan yang buruk.

10. Kapan sebuah wawancara perlu ditentukan validasinya?

Instrumen yang digunakan dalam sebuah wawancara seharusnya memiliki validitas yang
baik. Rahayu dan Ardani (2004) mengungkapkan bahwa validitas yang baik merujuk pada
objektivitas. Artinya, variabel-variabel dalam wawancara yang telah ditetapkan oleh peneliti
harus berdasarkan teori-teori yang telah mapan. Namun objektivitas dalam kegiatan wawancara
bersifat objectivied subjectivities. Artinya subjektif menurut peneliti (teori yang ada), tetapi
objektif menurut subjek yang diteliti. Hal ini dimungkinkan karena realitas sosial dalam
penelitian naturalistik berada di alam imajinasi pikiran kebanyakan manusia yang merupakan
gugusan subjektivitas awam yang tidak pernah diuji kebenarannya, dan objektif menurut kaidah-
kaidah keilmuan atau logika. Namun betapapun subjektifnya, hal tersebut sesungguhnya adalah
subjektivitas unik yang justru harus ditempatkan sebagai objek kajian ilmu-ilmu sosial yang
utama.

11. Teori apa yang mendasari penggunaan validitas untuk kegiatan observasi dan
wawancara?

Validitas dalam kegiatan observasi dan wawancara pada pengukuran psikologi perlu untuk
dilakukan karena subjek pengukurannya adalah manusia. Untuk mengungkap aspek-aspek atau
variabel-variabel dari keadaan psikologis manusia, diperlukan instrumen observasi dan
wawancara yang reliabel dan valid agar kesimpulan penelitian tidak keliru dan dapat
memberikan gambaran yang tepat mengenai subjek penelitian (Azwar, 1992).

12. Bagaimana cara menggunakan validitas?

Rahayu dan Ardani (2004) menjelaskan bahwa validitas menunjukkan sejauh mana suatu
alat ukur dapat mengukur apa yang hendak diukur. Dalam kegiatan observasi ada beberapa jenis
validitas yang dapat digunakan, yaitu

a. Face validity adalah bagaimana kelihatannya suatu alat pengukur benar-benar menukur
apa yang hendak diukur. Misalnya untuk mengukur kemampuan sebagai seorang supir, seorang
observee harus disuruh mengendarai mobi. Tetapi, bila pengukuran kemampuan mengendarai
mobil dilakukan dengan ujian tertulis tentang teknik mengendarai mobil, maka alat pengukur
tesebut kurang memiliki face validity.

b. Content validity adalah sejauh mana isi alat ukur tersebut mewakili semua aspek yang
dianggap sebagai aspek kerangka konsep. Data harus mencerminkan cir-ciri yang telah
ditentukan yaitu apa saja yang akan diungkap/diukur. Contohnya bila seorang penelitia infin
mengukur keikutsertaan dalam program KB dengan menanyakan metode kontrasepsi yang
dipakai. Bila aspek yang diamati tidak mencakup semua metode kontrasepsi, maka alat ukur
tersebut tidak memiliki validitas isi.

c. Predicty validity adalah alat pengukur yang dibuat oleh peneliti seringkali dimaksudkan
untuk memprediksi apa yang akan terjadi di masa yang akan datang. Contonya ujian seleksi
masuk perguruan tinggi. Ujian tersebut merupakan upaya untuk memprediksi apa yang aan
terjadi di masa yang akan datang. Peserta yang lulus ujian dengan nilai baik diprediksikan akan
mengikuti pelajaran di perguruan tinggi dengan sukses. Soal ujian masuk tersebut dikatakan
memiliki validitas prediktif, apabila ada korelasi yang tinggi antara nilai ujian masuk dengan
prestasi belajar setelah menjadi mahasiswa.

d. Construct validity adalah kerangka suatu konsep. Misalnya, untuk mengukur status
ekonomi responen dengan menggunakan lima komponen status ekonomi, yakni penghasilan
perbulan, pengeluaran perbulan, pemilikan barang, porsi penghasilan yang digunakan untuk
rekreasi, dan kualitas rumah. Apabila ada konsistensi antara komponen-komponen konstruk yang
satu dengan yang lain maka konstruk tersebut memiliki validitas.

e. Concurrent validity dilakukan dengan mengobservasi perilaku dan membandingkannya


dengan perilaku lain. Misalnya perilaku di sekolah sama dengan perilaku di luar kelas
(menunjukkan agresivitas).

Selanjutnya validitas dalam kegiatan wawancara

a. Validitas konstruk. penelitian kualitatif dengan metode observasi dan wawancara tidak
terlepas dari aktivitas melakukan konstruksi sosial. Misalnya, orang yang selalu memakai peci
dikonstruk peneliti sebagai orang yang alim. Konstruksi semacam itu memiliki banyak
kelemahan. Oleh karena itu, perlu diperhatikan beberapa hal, yaitu:
Dalam pengumpulan data, peneliti harus menggunakan multi sumber bukti.

Peneliti harus membangun rangkaian bukti antara satu data dengan data lain.

Agar peneliti meminta orang yang diwawancarai meninjau ulang draft laporan yang
disusun.

b. Validitas internal. Hal ini dilakukan pada tahap analisis data. Validitas internal ini
meliputi hal-hal berikut:

Membuat pola penjodohan dengan analisis sebab-akibat atau aksi reaksi atau pengaruh-
mempengaruhi.

Peneliti hendaknya mengerjakan penyusunan kesplanasi; maksudnya apakah konstruksi


yang dibuat berdasarkan data yang diterima itu dapat dipertanggungjawabkan.

Peneliti hendaknya membuat analisis deret waktu dari peristiwa-peristiwa atau fenomena-
fenomena yang terjadi.

c. Validitas eksternal. Dalam melakukan validitas ini, hendaknya peneliti menggunakan


logika replikasi. Artinya seandainya penelitian yang sama dilakukan oleh orang lain dengan
menggunakan pendekatan yang sama, niscaya hasilnya akan sama atau hampir sama.

13. Apakah perlu mencari reliabilitas kegiatan observasi?

Mencari reliabilitas dalam kegiatan observasi itu perlu, dimana reliabilitas observasi adalah
keajegan apa yang diobservasi. Agar suatu pengukuran observasi dapat dipercaya, maka idealnya
hasil observasi bila diuji kembali oleh orang lain baik di lain waktu maupun sekarang maka
hasilnya relatif sama.

14. Apakah perlu mencari reliabilitas kegiatan wawancara?

Menurut Neuman (2007), metode wawancara menjadi ciri khas dari penelitan kualitatif.
reliabilitas dengan pendekatan kualitatif lebih menekankan kepada keajegan hasil jawaban yang
dimunculkan oleh subjek. Namun berbeda dengan pendekatan kuantitatif, reliabilitas pada
kualitatif lebih bersifat fleksibel dan berkembang. Sehingga jika pada pendekatan kualitatif
didapatkan data yang berbeda, tidak serta merta disimpulkan bahwa reliabilitasnya rendah tapi
justru menjadi salah satu bentuk memperoleh data yang kaya atau lengkap.

15. Bagaimana menghitung reliabilitas dalam observasi?

Cara mendapatkan reliabilitas observasi adalah berdasarkan kesepakatan observer,


Reliabilitas berarti, apabila dua observer sepakat dalam hasil observasi (Sukadji, 2000). Rumus
kesepakatan juga bisa untuk menghitung hasil dua kali observasi yang dilakukan oleh satu
orang observer (Sukadji, 2000).
Rumus Persentase Kesepakatan sebagai berikut :
Interval Recording

-Agreement of total observation (A tot) total ke dua observer sama-sama setuju baik X
maupun O

Agreement of occurence observation (A occ) sama-sama setuju ada peristiwa


observasi (X)

Agreement of nonoccurence observation (A non) sama-sama setuju tidak ada


peristiwa observasi (O)

Event Recording

Adalah kejadian yang tegas mulai dan berakhirnya kegiatan obesrvasi. Pencatatan bisa
dengan check list, mechanical devices, dan lain-lain. Dalam observasi kelas, rincian perilaku
dapat ditulis dalam bentuk daftar event yang dapat dihitung bila terjadi perilaku yang diinginkan.
Dalam observasi, reliabilitas dan validitas dipengaruhi oleh faktor-faktor antara lain :

a. Observer

Banyak sekali kesalahan yang bersumber dari kualitas pribadi observer yang dapat
digolongkan sebagai kecondongan (bias).

1) Kesalahan yang berkaitan dengan kualitas pribadi observer, antara lain :

a) Central tendency

Observer lebih sering menggunakan kategori yang di tengah dalam skala rating daripada
kategori tepi, sehingga dalam prosesnya cenderung underestimasi perilaku yang intens dan
overestimasi perilaku yang lemah.

b) Leniency (kemurahan)

Observer cenderung membuat penilain yang cenderung ke arah baik terhadap subjek.

c) Efek primacy (kesan pertama)

Observer membiarkan kesan pertama mendistorsikan kesan atau penilaiannya kemudian.

d) Halo effect

Observer membuat penilaian berdasar kesan umum subjek atau berdasar perilaku subjek
yang aling mencolok.

e) Teori pribadi
Observer menyesuaiakn observasi ke asumsi teori pribadi.

f) Nilai pribadi

Observer menyesuaikan observasi ke harapan, nilai, dan minat pribadi.

g) Overestimasi perilaku yang hampir-hampir tidak dikenali ada pada diri observer sendiri.
Misalnya, observer overestimasi volume suara subjek sebab observer sendiri tidak mengenali
bahwa suaranya terlalu rendah volumenya.

h) Kesalahan logika

Observer membuat penilaian yang serupa terhadap sifat-sifat subjek yang kelihatannya
secara logika saling terkait.

i) Kesalahan kontras

Pada sifat khusus, observer menilai subjek jauh lebih berbeda dengan diri observer sendiri
daripada kenyataannya.

j) Kesalahan proksimitas

Observer menilai serupa sifat-sifat tertentu karena bentuk penilaian membuat sifat-sifat itu
berdekatan dalam waktu atau letak.

k) Pengaruh pribadi

Tanpa diketahui oleh observer sendiri, karakteristik diri observer (usia, jenis, kelamin, ras,
dan status sosial) mempengaruhi penilaian perilaku subjek.

l) Ketidakstabilan penilaian observer

Kriteria penilaian yang dipakai oleh observer berubah bersama waktu, akibat ada dan
tidaknya perilaku karena kelelahan, atau belajar, atau penyebab lainnya.

m) Terlewat

Observer alpa mencatat perilaku yang muncul.

n) Commision

Observer keliru kode suatu perilaku.

o) Efek harapan
Harapan observer mempengaruhi pencatatan, atau observer mengharapkan sesuatu terjadi
dan mengkomunikasikan harapan ini kepada subjek.

p) Reaktivitas observer

Observer berubah pencatatan perilakunya karena ia sadar diamati.

q) Isyarat nonverbal

Observer dengan tidak sengaja memberi isyarat kepada subjek sehingga mendukung
perilaku tertentu pada subjek.

2) Ketidakstabilan Penilaian Observer

Bila observasi berlangsung lama, observer mungkin menunjukkan tanda-tanda kelelahan,


lupa dan motivasinya menurun. Misalnya, pada saat permulaan menggunakan standar tertentu
untuk menilai suara bisikan atau vokalisasi singkat, tetapi kemudian berubah standarnya,
ketidakstabilan hal ini mungkin saja terjadi, walaupun telah ada persetujuan mengenai definisi
oprasional perilaku yang diamati.

3) Kesulitan dalam Mengkodekan Perilaku

Kategori global, seperti perilaku off-task atau perilaku tidak patut (innappropriate
behavior) membutuhkan penyimpulan tingkat tinggi dibanding kategori spesifik, seperti
memukul, atau meninggalkan tempat duduk. Meskipun diusahakan sebaik-baiknya
mendefinisikan perilaku dengan cermat, beberapa perilaku memang sulit dikategorikan. Jadi,
kode observasi menuntut pertimbangan yang masak di pihak observer.

4) Memilih Waktu dan Saat yang Tepat

Menentukan waktu yang tepat munculnya suatu kejadian bukanlah semudah yang
dibayangkan. Misalnya, untuk mengobservasi perilaku menolak dan memulai makan pada anak.
Sulit untuk menentukan waktu kapan saat yang tepat anak mulai menolak memulai makan.
Selain itu, unit waktu yang dipilih oleh observer mungkin tidak dapat menggambarkan dengan
tepat peta kejadian perilaku.

16. Bagaimana meningkatkan reliabilitas Observasi?

Adanya kelemahan-kelemahan yang menyebabkan reliabilitas pengukuran menurun


(sehingga validitasnya juga menurun), membuat kita waspada untuk menghindarinya. Beberapa
petunjuk praktis, antara lain :

a. Observer hendaknya memahami benar-benar teknik-teknik pencatatan, manual maupun


instrumental. Pastikanlah dalam rancangannya perilaku-perilaku kritis didefinisikan dengan jelas,
tegas dan cermat.
b. Sebelum melaksanakan observasi, periksalah dulu peralatan-peralatan pengumpul data.

c. Observer perlu latihan sampai mahir sebelum turum ke lapangan.

d. Kumpulkan data dengan mengobservasi subjek dalam berbagai situasi dan waktu,
terutama bila yang diobersevasi kelompok, atau untuk mendapatkan norma.

e. Temukan kecondongan (bias), kelemahan-kelemahan, yang kita miliki sebagai observer,


dan kembangkan ketrampilan pemahaman diri dan evaluasi diri yang kritis.

f. Kembangkan skeptisisme yang sehat terhadap laporan yang telah ada mengenai perilaku
subjek, agar observasi yang kita lakukan dapat seobjektif mungkin.

g. Menunda asumsi dan spekulasi mengenai arti dan implikasi perilaku subjek yang
diamati selagi pengambilan data.

h. Bila pengamatan telah selesai, pertimbangkanlah faktor-faktor yang meyulut dan


memelihara perilaku subjek, serta tanggapan-tanggapan orang lain yang ada di dalam setting
subjek atas perilaku subjek tersebut.

i. Secara periodik bandingkan hasil pengamatan dengan pengamat lain yang menggunakan
sistem penyekoran yang sama.

j. Secara teratur pencatatan harus dikalibrasi yaitu dengan mencocokkan lagi dengan
potokol standar.

k. Ikuti teori-teori dan test-retest mutakhir dalam bidang observasi.


l. Hindari kekeliruan-kekeliruan umum berkenaan dengan observasi sebagaimana telah disebut
terlebih dahulu.

17. Kapan observasi perlu ditentukan reliabilitasnya?

Reliabilitas observasi perlu dilakukan bila data yang dihasilkan berbentuk data kuantitatif.
Pengukuran reliabilitas dapat dilakukan untuk melihat hasil observasi antar observer 1 dengan
observer yang lain (reliabilitas interrater). .

18. Apa beda reliabilitas alat tes dengan reliabilitas untuk kegiatan observasi dan
wawancara?

Perbedaan penerapan reliabilitas dalam alat tes dan obserasi/wawancara dapat dijelaskan
dengan perbedaan pendekatan kuantitatif (untuk alat tes) dan pendekatan kualitatif
(observasi/wawancara). Secara sederhana dapat dikatakan bahwa reliabilitas pada pendekatan
kuantitatif bersifat tetap dan statis sedangkan reliabilitas pengukuran dengan pendekatan
kualitatif bersifat berkembang dan tumbuh bersama kedekatan antara observer dengan observee
(Neuman, 2007).
19. Bagaimana cara menggunakan reliabilitas?

Kita dapat menggunakan nilai reliabilitas untuk menunjukkan tingkat kepercayaan


terhadap alat ukur yang sudah kita buat. Nilai reliabilitas berkisar pada nilai 0-1, dimana semakin
mendekati 1 maka dapat dikatakan alat ukur tersebut semakin dapat dipercaya. Dipercaya disini
dimaksudkan bahwa suatu alat tes apabila dilakukan tes ulang atau diadministrasikan oleh tester
lain maka akan keluar nilai yang relatif tetap (ajeg).

20. Jika sebuah alat tes mencapai validitas namun tidak reliabel, bagaimana kualitas alat
tes tersebut? Dan bagaimana jika terjadi kebalikannya?

Validitas dan reliabilitas bersifat saling melengkapi namun terkadang juga dapat bersifat
bertolak belakang (Neuman, 2007). Dalam suatu contoh misalnya ada suatu alat ukur yang
memiliki validitas tinggi namun memiliki reliabilitas rendah, hal ini dapat terjadi dalam
pengukuran dengan pendekatan kualitatif. Misalnya konstrak yang diukur merupakan suatu
konstrak yang sangat abstrak yaitu alienasi yang digali melalui metode wawancara, hal ini
mungkin dapat dikatakan memiliki validitas yang tinggi namun reliabilitas yang rendah karena
tergantung pada bagaimana peneliti menggunakan instrumen penelitian.
Contoh lain misalnya suatu alat ukur yang memiliki reliabilitas yang tinggi namun validitasnya
rendah. Berdasarkan pernyataan tersebut dapat dikatan bahwa suatu alat ukur memiliki keajegan
dalam mengukur namun kurang tepat dalam mengukur apa yang hendak diukur. untuk
memudahkan pembahasan ini penulis mengutip gambar dari Neuman (2007) sebagai berikut:

Berdasarkan gambar diatas dapat dilihat bahwa ketika ketika suatu alat tes memiliki
reliabilitas yang tinggi namun validitas rendah tidak dapat mengenai sasaran terhadap apa yang
ingin diukur. Berdasarkan penjabaran tersebut maka dapat dikatakan bahwa ketika suatu alat tes
memiliki reliabilitas yang tinggi namun validitas yang rendah maka alat ukur itu memiliki
kualitas yang rendah. Namun sebaliknya, jika suatu alat ukur valid maka kemungkinan besar
reliabilitasnya akan dapat mengikuti menjadi baik juga. Secara sederhana dapat diakatakan
bahwa suatu alat ukur yang valid akan cenderung memiliki reliabilitas yang tinggi namun alat
ukur yang memiliki reliabilitas yang tinggi belum tentu valid.
DAFTAR PUSTAKA

Azwar, S. (1992). Reliabilitas dan Validitas. Yogyakarta: Penerbit Sigma Alpha.


Azwar, S. (1997). Reliabilitas dan Validitas(Ed. 3). Yogyakarta: Pustaka Pelajar.
Louis, J. (2011). Validitas dan reliabilitas. Diakses pada tanggal 11 November 2014 dari
http://jeffy-louis.blogspot.com/2011/02/validitas-dan-reliabilitas.html
Neuman, W. L., (2007). Basic Social Research Methods: Qualitative & Quantitative Approachs
(2ed). Boston: Allyn & Bacon.
Rahayu, I.T. dan Ardani, T.A. (2004). Observasi dan Wawancara. Malang: Bayumedia
publishing.
Sattler, J.M. (2002). Assessment of Children. California: Penerbit Sattler.
Sudijono, A. (2009). Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press.
Sukadji, S. (2000). Psikologi pendidikan dan psikologi sekolah (Direvisi dan Dilengkapi).
Depok: Universitas Indonesia.

Anda mungkin juga menyukai