Atau
mengelompokkan
siswa
ke
program
yang
khusus
tertentu.
Fungsi deskripsi, yaitu menyuguhkan hasil pengukuran psikologis yang
telah dilkukan tanpa kalsifikasi tertentu. Misalnya melaporkan profile minat
atau
sangat
mirip.
Reliabilitas
dalam
penelitian
kuantitatif
menunjukkan bahwa hasil numerik yang dihasilkan oleh suatu indikator tidak
berbeda karena karakteristik dari proses pengukuran atau instrumen
pengukuran itu sendiri. Kebalikan dari reliabilitas adalah pengukuran yang
memberikan hasil yang tidak menentu, tidak stabil, atau tidak konsisten
(Neuman, 2007).
Reliabilitas berasal dari kata reliability yang berarti sejauh mana hasil suatu
pengukuran memiliki keterpercayaan, keterandalan, keajegan, konsistensi,
kestabilan yang dapat dipercaya. Hasil ukur dapat dipercaya apabiladalam
antara
konstruk,
atau
cara
seorang
peneliti
Validitas yaitu mengenai apa dan seberapa baik suatu alat tes dapat
mengukur, sedangkan reliabilitas merujuk pada konsistensi skor yang dicapai
oleh orang yang sama ketika diuji berulang kali dengan tes yang sama pada
kesempatan yang berbeda, atau dengan seperangkat butir-butir ekuivalen
(equivalent items) yang berbeda, atau dibawa kondisi pengujian yang
berbeda (Anastasi & Urbina, 1998).
Azwar (1987, dalam Widodo, 2006) menyatakan bahwa validitas berasal dari
kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan
suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes
dikatakan memiliki validitas yang tinggi apabila alat tersebut menjalankan
fungsi ukur secara tepat atau memberikan hasil ukur yang sesuai dengan
maksud
dilakukannya
pengukuran
tersebut.
Artinya
hasil
ukur
dari
kecermatan
ukurnya
sesuatu
tes.
Validitas
suatu
tes
Validitas berasal dari kata validity yang berarti sejauhmana ketepatan dan
kecermatan pengukur (tes) dalam melakukan fungsi ukurnya (Azwar, 2011).
b.
c.
d.
Reliabilitas
Kuder-Richardson
dan
Koefisien
Alpha;
yaitu
dengan
sudah baik atau konsisten. Dalam hal ini apabila suatu tes atau instrumen
digunakan untuk melakukan pengukuran terhadap obyek ukur kemudian
dilakukan pengukuran kembali terhadap obyek ukur yang sama, apakah
-
Validitas
eksternal;
dengan
cara
membandingkanguna
mencari
Face validity. Ini merupakan validitas yang paling mudah untuk dicapai
dan sebagian besar jenis dasar dari validitas adalah face validity. Hal ini
memerlukan pertimbangan dari komunitas ilmiah bahwa indikator benarbenar dapat digunakan untuk mengukur suatu konstruk. Kesesuaian antara
definisi
dan
metode
pengukuran
yang
digunakan
merujuk
pada
adanya
diukur.
Disini
perlu
dilihat
definisi,
tujuan
alat
ukur,
proses
dalam
responden.
Hal
ini
bermanfaat
apabila
responden
secara
variabel
yang
lain:
melihat
hubungan
skor
tes
dengan
consistency.
Hal
ini
dilakukan
dengan
cara
mengujicobakan
instrumen sekali saja, kemudian data yang diperoleh dianalisis dengan teknik
belah dua dari Spearman Brown (Split Half), KR-20, KR-21, dan Anova Hyot
(Analisis Varians).
Secara eksternal, pengujian dapat dilakukan dengan cara berikut:
a.
c.
mengukur
menunjukkan
dua
konsistensi
sumber
jawaban
kesalahan,
terhadap
yaitu:
semua
aitem
dan
pemilihan
aitem
dan
butir instrumen dalam satu variabel dapat juga dilakukan dengan cara
mencari daya pembeda skor tiap aitem dari kelompok yang memberikan
jawaban tinggi dan jawaban rendah. Pengujian analisis daya pembeda dapat
menggunakan t-test.
b. Pengujian validitas isi
Untuk instrumen yang berbentuk tes, pengujian validitas isi dilakukan
dengan membandingkan antara isi instrumen dengan materi pelajaran yang
telah diajarkan. Di sisi lain, pengujian validitas isi dari instrumen yang akan
mengukur
efektivitas
pelaksanaan
program,
dapat
dilakukan
dengan
membandingkan antara isi instrumen dengan isi atau rancangan yang telah
ditetapkan. Untuk menguji validitas butir-butir instrumen lebih lanjut, maka
setelah dikonsultasikan kepada para ahli, selanjutnya diujicobakan, dan
dilakukan analisis aitem atau uji beda.
c. Pengujian validitas eksternal
Penngujian ini dilakukan dengan cara membandingkan (untuk mencari
kesamaan) antara kriteria yang ada pada instrumen dengan fakta-fakta
empiris yang terjadi di lapangan. Bila terdapat kesamaan, maka dapat
dinyatakan instrumen tersebut memiliki validitas eksternal yang tinggi.
7.
diketahui
pengukuran
yang
akan
digunakan
sehingga
dapat
Jika terhadap bagian obyek ukur yang sama, hasil ukur melalui butir yang
satu tidak konsisten dengan hasil ukur melalui butir yang lain maka
pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu tidak dapat
dipercaya. Dengan kata lain, alat ukur tidak reliabel dan tidak dapat
digunakan untuk mengungkap ciri atau keadaan yang sesungguhnya dari
obyek ukur. Kalau hasil pengukuran pada bagian obyek ukur yang sama
antara butir yang satu dengan butir yang lain saling kontradiksi atau tidak
konsisten maka kita tidak bisa menyalahkan obyek ukur, melainkan alat ukur
(tes) yang dipersalahkan dengan mengatakan bahwa tes tersebut tidak
reliabel terhadap obyek yang diukur (Sugiyono, 2010).
Validitas
Ketika peneliti mengatakan bahwa suatu indikator itu valid, maka itu valid
untuk tujuan dan definisi tertentu. Indikator yang sama bisa valid untuk satu
tujuan (misal pertanyaan penelitian dengan unit analisis atau secara umum),
tetapi bisa kurang valid atau tidak valid untuk hal yang lainnya. Misalnya
dalam mengukur prejudice, bisa valid untuk mengukur prejudice para guru,
tapi bisa jadi tidak valid untuk digunakan dalam mengukur prejudice dari
para polisi. Tidak adanya validitas terjadi jika tidak terdapat kesesuaian atau
kesesuaian
yang
rendah
antara
konstruk
yang
digunakan
untuk
terdapat
memperjelas
40
maksud
soal,
dari
berhati-hati
dalam
pertanyaan,
menyusun
perencanaan
aitem
waktu
yaitu
dalam
10. Apa perbedaan hasil penelitian yang valid dan reliabel dengan
instrumen yang valid dan reliabel?
Hasil penelitian yang valid bila terdapat kesamaan antara data yang
terkumpul dengan data yang sesungguhnya terjadi pada objek yang diteliti,
sedangkan hasil penelitian yang reliabel bila terdapat kesamaan data dalam
waktu yang berbeda.
Di sisi lain, instrumen yang valid berarti instrumen yang digunakan untuk
mendapatkan data bisa mengukur apa yang seharusnya diukur, sedangkan
instrumen yang reliabel adalah instrumen yang bila digunakan beberapa kali
untuk mengukur objek yang sama dapat menghasilkan data yang sama
(Sugiyono, 2010).
11. Bagaimana cara meningkatkan reliabilitas pengukuran?
Ada
empat
cara
untuk
meningkatkan
reliabilitas
pengukuran:
(1)
cara
meningkatkan
validitas
eksternal
dari
instrumen
dan
namun reliabilitas lebih sulit dicapai, atau sebaliknya. Hal ini terjadi ketika
memiliki definisi konstruk yang sangat abstrak dan tidak mudah diamati.
Reliabilitas paling mudah dicapai ketika ukuran secara tepat dan dapat
diamati. Dengan demikian, ada pertentangan antara esensi sebenarnya dari
konstruk yang sangat abstrak dan mengukurnya secara konkret (Neuman,
2007).
14. Faktor-faktor apa saja yang mempengaruhi reliabilitas?
a) Pemilihan aitem. Tes merupakan pemilihan aitem-aitem yang digunakan
untuk mengukur suatu konstrak, dengan demikian pemilihan aitem tersebut
dapat
menjadi
sumber
kesalahan
dalam
pelaksanaan
tes.
Untuk
asal
tebak
dalam
menjawab.
Namun
aitem
ini
juga
harus
variabilitas
kemampuan
kelompok,
instruksi
tes
yang
ambigu,
Validitas konstruksi juga dapat diartikan sebagai validitas yang ditilik dari
segi susunan, kerangka atau rekaannya. Adapun secara terminologis, suatu
tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas
konstruksi, apabila tes hasil belajar tersebut telalh dapat dengan secara
tepat mencerminkan suatu konstruksi dalam teori psikologis.
2. Pengujian Validitas Tes Secara Empirik
Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil
analisis yang bersifat empirik. Dengan kata lain, validitas empirik adalah
validitas yang bersumber pada atau diperoleh atas dasar pengamatan di
lapangan.
a. Validitas ramalan (Predictive validity)
Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah
sebuah tes telah dapat dengan secara tepat menunjukkan kemampuannya
untuk meramalkan apa yang bakal terjadi pada masa mendatang.
Contohnya apakah test masuk sekolah mempunyai validitas ramalan atau
tidak ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan
antara hasil test masuk dengan prestasi belajar sesudah menjadi siswa, bila
ada, berarti test tersebut mempunyai validitas ramalan.
b. Validitas bandingan (Concurrent Validity)
Tes
sebagai
alat
pengukur
dapat
dikatakan
telah
memiliki
validitas
bandingan apabila tes tersebut dalam kurun waktu yang sama dengan
secara tepat mampu menunjukkan adanya hubungan yang searah, antara
tes pertama dengan tes berikutnya.
Reliabilitas instrumen dapat diuji dengan dua cara, yaitu uji reliabilitas
eksternal
dan
internal.
Dengan
pengertian
bahwa
jika
ukuran
atau
kriterianya berada di luar instrumen, maka dari hasil pengujian ini diperoleh
reliabilitas eksternal, sedangkan reliabilitas internal diperoleh berdasarkan
data dari instrumen saja.Untuk menguji reliabilitas eksternal : teknik paralel
(double test double trial). Dengan menggunakan teknik ini peneliti menyusun
dua perangkat instrumen. Kedua instrumen tersebut sama-sama diuji
cobakan kepada sekelompok responden saja (responden mengerjakan dua
kali) kemudian hasil dua kali tes uji coba tersebut dikorelasikan dengan
korelasi Pearson.
19. Bagaimana cara pengujian reliabilitas hasil ukur skala psikologi?
Pengujian reliabilitas terhadap hasil ukur skala psikologi dapat dilakukan
bilamana item-item yang terpilih lewat prosedur analisis item telah
dikompilasikan menjadi satu (Azwar, 2008).
20. Bagaimana aplikasi dalam menyatakan reliabiltas?
Reliabilitas dinyatakan oleh koefisien reliabilitas (rxx) yang angkanya berada
dalam rentang dari 0 sampai dengan 1,00, dimana koefisien reliabiltas
semakin mendekati 1,00 maka semakin tinggi reliabilitasnya, begitu pun
sebaliknya (Azwar, 2008).
21. Apakah Koefiisien validitas dan koefisien reliabilitas
a. Validitas: hasil estimasi validitas suatu pengukuran yang dinyatakan secara
empirik biasanya dinyatakan dengan korelasi antara distribusi skor tes
dengan distribusi skor kriteria. Contoh apabila distribusi skor tes x dan skor
kriteria adalah y, sehingga koefisien validitasnya adalah rxy. Koefisien
validitas hanya memiliki makna apabila mempunyai nilai positif. Semakin
mendekati 1,00 maka hasil tes semakin valid.
b. Reliabilitas: Koefisien reliabilitas adalah tinggi-rendahnya reliabilitas yang
dapat dilihat melalui korelasi antara dua dsitribusi skor dari dua alat ukur
yang paralel yang dikenakan pada sekelompok individu yang sama. Semakin
tinggi korelasi antara hasil ukur dari dua tes yang paralel, maka akan
semakin konsisten dan dapat dikatakan sebagai alat ukur yang reliabel.
Lambang dari korelasi paralel tersebut adalah rxx, dimana skor x adalah tes
pertama dan x untuk tes yang kedua. (Azwar, 2011).
22. Jelaskan makna dari koefisien validitas dan reliabilitas!
a)
dapat
dianggap
memuaskan
apabila
bersama-sama
dengan
tes
lain
dalam
suatu
perangkat
besaran
yang
menggunakan
tes
sebagai
suatu
kesatuan
(keseluruhan butir) sebagai kriteria untuk menentukan validitas butir dari tes
itu. Dengan demikian validitas internal mempermasalahkan validitas butir
dengan menggunakan hasil ukur tes tersebut sebagai suatu kesatuan
sebagai kriteria, sehingga biasa juga disebut validitas butir. Validitas internal
diperlihatkan oleh seberapa jauh hasil ukur butir tersebut konsisten dengan
hasil ukur tes secara keseluruhan. Oleh karena itu validitas butir tercermin
pada besaran koefisien korelasi antara skor butir dengan skor total tes. Jika
koefisien korelasi skor butir dengan skor total tes positif dan signifikan maka
butir tersebut valid berdasarkan ukuran validitas internal. Koefisien korelasi
yang tinggi antara skor butir dengan skor total mencerminkan tingginya
konsistensi antara hasil ukur keseluruhan tes dengan hasil ukur butir tes atau
dapat dikatakan bahwa butir tes tersebut konvergen dengan butir-butir lain
dalam mengukur suatu konsep atau konstruk yang hendak diukur. Validitas
internal untuk skor butir dikotomi digunakan koefisien korelasi biserial (rbis).
Validitas eksternal dapat berupa hasil ukur tes baku atau tes yang
dianggap baku dapat pula berupa hasil ukur lain yang sudah tersedia dan
dapat dipercaya sebagai ukuran dari suatu konsep atau variabel yang
hendak diukur. Validitas eksternal diperlihatkan oleh suatu besaran yang
merupakan hasil perhitungan statistika. Jika kita menggunakan basil ukur tes
yang sudah baku sebagai kriteria eksternal, maka besaran validitas eksternal
dari tes yang kita kembangkan didapat dengan jalan mengkorelasikan skor
hasil ukur tes yang dikembangkan dengan skor hasil ukur tes baku yang
dijadikan kriteria. Makin tinggi koefisien korelasi yang didapat, maka validitas
tes yang dikembangkan juga makin baik. Kriteria yang digunakan untuk
menguji validitas eksternal digunakan nilai r-tabel. Jika koefisien korelasi
antara skor hasil ukur tes yang dikembangkan dengan skor hasil ukur tes
baku lebih besar daripada r-tabel maka tes yang dikembangkan adalah valid
berdasarkan kriteria eksternal yang dipilih (hasil ukur instrumen baku). Jadi
keputusan uji- validitas dalam hal ini adalah mengenai valid atau tidaknya
tes sebagai suatu kesatuan, bukan valid atau tidaknya butir tes seperti pada
validitas internal.
ini apabila suatu tes atau instrumen digunakan untuk melakukan pengukuran
terhadap obyek ukur kemudian dilakukan pengukuran kembali terhadap
obyek ukur yang sama, apakah hasilnya masih tetap sama dengan
pengukuran
sebelumnya.
Jika
hasil
pengukuran
kedua
menunjukkan
Bagaimana
menghasilkan
validitas
yang
baik
dan
dapat
digunakan ?
Validitas: apabila tes tersebut memiliki kecermatan yang tinggi, yaitu
mampu mendeteksi perbedaan-perbedaan kecil yang ada pada atribut yang
sedang diukur (Azwar, 2011).
29. Mengapa validitas dan reliabilitas terkadang berbeda antara di
lapangan dengan teori ?
Reliabilitas: Secara teori reliabilitas menunjukkan nilai tes yang bebas dari
kesalahan pengukuran (error measurement), namun dalam kenyataannya
tidak ada reliabilitas yang sempurna. Hal ini disebabkan adanya kesalahan
acak (random errors) dimana terdapat variasi nilai yang tidak konsisten dari
waktu ke waktu atau antar situasi (Jacobs, 1991).
30. Bagaimanakah
validitas
dan
reliabilitas
mempengaruhi
hasil
penelitian?
Instrumen yang valid dan reliabel merupakan syarat untuk memperoleh
data-data yang valid. Data-data inilah yang kemudian dianalisis dalam
rangka mencari kesimpulan penelitian. Apabila sebuah instrumen memiliki
validitas dan reliabilitas yang tinggi dan sudah teruji maka akan diperoleh
data-data yang mendukung hasil penelitian. Semakin valid dan reliabel
instrumen yang digunakan, maka hasil penelitian akan semakin valid dan
reliabel.
31. Bagaimana ketika validitas tinggi, reliabilitas rendah?
Validitas tinggi menandakan bahwa item atau alat ukur tersebut benar-benar
sudah mengukur konstruk yang ditetapkan untuk diukur. Sedangkan
reliabilitas rendah dalah ketika alat ukur tersebut tidak mampu menghasilkan
nilai yang konsisten (ajeg) ketika di ukur pada situasi yang berbeda dari
sebelumnya.
Pada tes-tes yang bermaksud memprediksi sebuah kriteria tertentu,
(predictive-criterion
related)
reliabilitas.
nilai
Ketika
validitas
validitas
menjadi
memuaskan,
lebih
maka
penting
daripada
rendahnya
nilai
Apabila reliabilitas tinggi dan validitas rendah, maka instrumen atau alat
ukur tersebut terbukti mampu menghasilkan nilai yang konsisten pada
berbagai situasi, namun belum dapat memperlihatkan ketajaman
pengukuran atas konstruk atau sesuatu yang ingin diukur
33. Bagaimana cara meningkatkan validitas?
Ada beberapa cara yang dapat ditempuh untuk meningkatkan validitas paras
suatu instrumen:
1. Pemanfaatan Soal
Naskah awal dari instrumen diperiksa oleh suatu kelompok evaluator,
misalnya pembimbing tesis, ahli pembuat tes, dan para tenaga profesional
yang berpengalaman dalam bidangnya.
2. Konsistensi Antarpenilai
Naskah awal yang telah diperiksa oleh para ahli tersebut diberi tanda, mana
yang layak dan tidak layak. Kemudian, dipilah dan diseleksi mana yang
paling cocok untuk dijadikan alat ukur atau instrumen. Tentu saja, layak atau
tidak layaknya instrumen tersebut dilihat dari hasil penilaian para ahli secara
konsisten dan objektif.
Selanjutnya, validitas dalam kaitannya dengan pengujian (testing) dan
penilaian (assessment), Linn dan Gronlund (1985: 49) menegaskan ada
sejumlah pertimbangan yang perlu diperhatikan: pertama, validitas mengacu
kepada ketepatan interpretasi hasil dari suatu prosedur penilaian terhadap
sekelompok individu; bukan kepada prosedur itu sendiri. Kedua, validitas
memiliki perihal derajat tertentu dengan kategori-kategori: validitas tinggi
(high validity), validitas sedang (moderate validity), dan validitas rendah
(low validity). Ketiga, validitas senantiasa mengacu kepada kegunaan atau
interpretasi yang spesifik; tidak ada penilaian yang valid untuk semua
kegunaan. Keempat, validitas adalah kesatuan konsep yang didasarkan atas
berbagai macam bukti yang muncul. Kelima, validitas merupakan sistem
evaluasi secara terpadu dan menyeluruh (overall evaluative judgement). Di
samping itu, Linn dan Gronlund menyarankan agar dalam membuat
interpretasi
dan
menggunakan
hasil
penilaian
memperhatikan
yang
mempengaruhi
hasil
atau
prestasi
(performance).
dan
DAFTAR PUSTAKA
Imam.
(2011)
Diktat
Psikometri.
Universitas
Diponegoro:
Tidak
Dipublikasikan
Sujarwadi, Sri (2011). Valditas dan Reliabilitas Instrumen Penelitian. Universitas
Negeri Jakarta: Tidak dipublikasikan
Sugiyono. (2004). Statistika untuk Penelitian. Bandung: CV. Alfabeta.
Sugiyono. (2010). Metode penelitian pendidikan: Pendekatan kuantitatif, kualitatif,
dan R&D. Bandung: Alfabeta.
Widodo, P. B. (2006). Reliabilitas dan validitas konstruk skala konsep diri untuk
mahasiswa Indonesia. Jurnal Psikologi Universitas Diponegoro, 3 (1), 1-9.
Menurut Sudijono (2009) terdapat berbagai jenis validitas, berikut ini jenis validitas ditinjau dari
pengujiannya validitasnya yaitu pengujian validitas secara rasional dan secara konten.
Penhelasan untuk masing masing validititas itu adalah sebagai berikut:
Pengujian Validitas Tes Secara Rasional
Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang
diperoleh dengan berpikir secara logis.
a. Validitas Isi (Content Validity)
Valditas isi berkaitan dengan kemampuan suatu instrumen mengukur isi (konsep) yang harus
diukur. Ini berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau variabel yang
hendak diukur.
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan
penganalisisan, penelususran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar
tersebut. Validitas isi adalah yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil
belajar yaitu: sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar peserta didik,
isisnya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahkan
pelajaran yang seharusnya diteskan (diujikan).
Misalnya test bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut, pengukuran
motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan
demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan validitas isi terutama
berkaitan dengan proses analisis logis, dengan dasar ini Dia berpendapat bahwa validitas isi
berbeda dengan validitas rupa yang kurang menggunakan analisis logis yang sistematis, lebih
lanjut dia menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga
mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
b. Validitas konstruksi (Construct Validity)
Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang berkaitan
dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang diukurnya.
Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas konstruk) merupakan yang
terluas cakupannya dibanding dengan validasi lainnya, karena melibatkan banyak prosedur
termasuk validasi isi dan validasi kriteria.
Validitas konstruksi juga dapat diartikan sebagai validitas yang ditilik dari segi susunan,
kerangka atau rekaannya. Adapun secara terminologis, suatu tes hasil belajar dapat dinyatakan
sebagai tes yang telah memiliki validitas konstruksi, apabila tes hasil belajar tersebut telah dapat
dengan secara tepat mencerminkan suatu konstruksi dalam teori psikologis.
Pengujian Validitas Tes Secara Empirik
Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat
empirik. Dengan kata lain, validitas empirik adalah validitas yang bersumber pada atau diperoleh
atas dasar pengamatan di lapangan.
a. Validitas ramalan (Predictive validity)
Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah
dapat dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal
terjadi pada masa mendatang. Contohnya apakah test masuk sekolah mempunyai validitas
ramalan atau tidak ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan antara
hasil test masuk dengan prestasi belajar sesudah menjadi siswa, bila ada, berarti test tersebut
mempunyai validitas ramalan.
b. Validitas bandingan (Concurrent Validity)
Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes tersebut
dalam kurun waktu yang sama dengan secara tepat mampu menunjukkan adanya hubungan yang
searah, antara tes pertama dengan tes berikutnya.
b. Jenis-jenis Reliabilitas
1. Reliabiltas Tes Berulang (Test-retest reliability) Reliabiltas tes berulang adalah ukuran
reliabilitas yang diperoleh dengan pemberian dua kali tes yang sama selama periode waktu
tertentu untuk sekelompok individu. Contoh: Sebuah tes bahasa diberikan kepada siswa. Satu
bulan kemudian tes yang sama diberikan pada siswa yang sama. Jika skor keduanya
menghasilkan koefisien korelasi tinggi maka tes tersebut memiliki reliabilitas tinggi.
2. Reliabilitas Antar Penilai (Inter-rater atau Inter-observer Reliability) Reliabilitas antar penilai
adalah ukuran reliabilitas berdasarkan konsistensi penilaian dua responden berbeda terhadap
suatu konstruk, karena belum tentu pengamat manusia menafsirkan jawaban dengan cara yang
sama. Contoh: Peneliti meminta tanggapan dua hakim berbeda untuk memutuskan kasus yang
sama. Jika kedua hakim memberi tanggapan yang seragam maka instrumen dinyatakan reliabel.
3. Reliabilitas Konsistensi Internal (Internal consistency reliability) Reliabilitas konsistensi
internal adalah ukuran reliabilitas berdasarkan evaluasi item-item tes terhadap konstruk yang
sama. Ada dua jenis untuk reliabilitas ini yaitu:
o Rata-rata Korelasi Antar Item (Average inter-item correlation) Rata-rata korelasi antar item
diperoleh dengan mengambil semua item pada tes dan akhirnya menggunakan rata -rata semua
koefisien korelasi tersebut. Dengan kata lain instrumen dibelah sebanyak jumlah item kemudian
hasil koefisien korelasi digabung untuk mendapatkan rata-rata. Teknik ini populer dengan Alpha
Cronbach.
o Reliabilitas Belah Setengah (Split-half reliability) Reliabilitas belah setengah adalah teknik
dengan membelah item tes menjadi dua bagian untuk membentuk dua set item, kemudian skor
total masing-masing set item dikorelasikan. Jika koefisien korelasi tinggi maka reliabilitas tinggi.
3. Bagaimana cara mengukurnya validitas dan reliabilitas?
Pekerjaan untuk mencari validitas suatu alat ukur disebut validation. Prinsip dari validation
adalah membandingkan hasil-hasil dari pengukuran faktor dengan suatu kriterium, )suatu ukuran
yang telah dipandang valid untuk menunjukkan faktor yang dimaksud). Jadi misalnya suatu alat
pengukur hendak menyelidiki faktor ketelitian kerja, maka harus diambil lebih dahulu suatu
kriterium yang telah dipandang mencerminkan suatu ketelitian kerja. Melalui kriterium itulah
kemudian hasil dari pengukuran faktor ketelitian kerja disoroti, Jika hasil pengukuran faktor
ketelitian kerja menunjukkan besarnya ketelitian kerja yang sesuai dengan kriterium, maka alat
pengukur itu dipandang valid.
Ada dua jenis kriterium yang digunakan untuk menguji kejituan alat pengukur, yaitu :
a. Kriterium luar (external criterion)
Yaitu suatu kriterium yang diambil dari luar (external) alat itu sendiri. Misalnya : suatu tes
tentang ketelitian kerja, diuji validitasnya dengan prestasi kerja yang sesungguhnya sebagaimana
ditunjukkan oleh catatan-catatan hasil kerja atau penilaian pimpinan unit.
b. Kriterium dalam alat (internal criterion)
Yaitu suatu kriterium yang diambil dari dalam (internal)alat itu sendiri. Biasanya diambil hasil
keseluruhan pengukuran atau total score sebagai kriteriumnya. Misalnya, kita ingin mengukur
intelegensi (yang terdiri dari faktor-faktorl; daya analisa, daya klarifikasi, daya ingatan, daya
pemahaman, daya kritik dan sebagainya), maka untuk menguji apakah sekelompk item benarbenar mengukur daya analisa, misalnya, jawaban-jawaban terhadap item daya analisa
dicocokkan dengan hasil tes secara keseluruhan atau total score-nya. Antara nilai total harus
terdapat korelasi yang positif (tinggi dan cukup meyakinkan). Kecocokkan antara hasil-hasil dari
item yang disangka mengukur suatu faktor dengan suatu kriterium yang dipandang telah valid
disebut factorial validity atau validitas faktor, di mana besar kecilnya validitas faktor tergantung
kepada besar kecilnya kecocokan itu.
Cara pengukuran reliabilitas
Tiga tehnik pengujian realibilitas instrument antara lain :
a. Teknik Paralel (Paralel Form atau Alternate Form)
Teknik paralel disebut juga tenik double test double trial. Sejak awal peneliti harus sudah
menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang
disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus
dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan
semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya
dengan menggunakan rumus product moment (korelasi Pearson).
b. Teknik Ulang (Test Re-test)
Disebut juga teknik single test double trial. Menggunakan sebuah instrument, namun dites dua
kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya
indeks reliabilitas.Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik
pertama yaitu rumus korelasi Pearson. Menurut Saifuddin Azwar, realibilitas tes-retest adalah
seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan
menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama,
pada waktu yang berbeda.
4. How to develop? Bagaimana mengembangkan validitas dan reliabilitas?
Cara meningkatkan atau mengembangkan validitas dan reliabilitas
1. Mencatat bebas hal-hal penting serinci mungkin (setting,partisipan ataupun hal-hal terkait).
2. Mendokumentasikan secara lengkap dan rapi data yang terkumpul, proses pengumpulan data
maupun strategi analisisnya.
3. Menyertakan partner saat observasi untkmenghindari subyektifitas
4. Melakukan pengecekan dan pengecekan kembalidata,menguji kemungkinan dugaan-dugaan
yg berbeda.
Cara meningkatkan reliabilitas
1. Mengonsep satu variabel dengan jelas.
2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel
harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.
3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu level
pengukuran, maka variabel yang dibuat akan semakin reliabel karena informasi yang dimiliki
semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level paling
tepat yang mungkin diperoleh.
4. Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yang spesifik,
peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi
konseptual.
5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah pengukuran
sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies, prinsipnya adalah
mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literatur-literatur
yang berkaitan. Selanjutnya , pengukuran terdahulu dapat dipergunakan sebagai patokan dari
pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan
berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.
5. Mengapa perlu ada validitas dan reliabilitas?
Jika kita kembali ke definisi validitas, maka dapat disimpulkan bahwa validitas mutlak
diperlukan oleh sebuah alat ukur atau alat tes agar tujuan pengukuran relevan dengan data yang
diperlukan atau diperoleh. Sebagai contoh, sebuah timbangan badan, dikatakan memiliki
validitas jika dapat mengukur berat badan manusia secara akurat. Keakuratan timbangan badan
tersebut sebelumnya harus diuji terlebih dahulu, melalui proses terra timbangan oleh Badan
Metrologi. Uji validitas tersebut mutlak diperlukan oleh timbangan agar orang yang
menggunakan merasa yakin bahwa ukuran 1 kg pada timbangan benar-benar valid mengukur 1
kg berat benda.
Sedangkan reliabilitas diperlukan untuk mengetahui sejauhmana hasil suatu pengukuran dapat
dipercaya. Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan
pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama, selama
aspek yang diukur dalam diri subjek memang belum berubah. Relatif sama, berarti tetap adanya
toleransi terhadap perbedaan-perbedaan kecil diantara hasil beberapa kali pengukuran. Bila
perbedaan itu sangat besar dari waktu ke waktu maka hasil pengukuran tidak dapat dipercaya dan
dapat dikatakan tidak reliabel.(Azwar, 1997) Jika kita kembali menggunakan contoh timbangan
badan, maka reliabilitas timbangan dapat diketahui dengan cara menggunakan timbangan badan
tersebut pada beberapa orang dan beberapa kali percobaan untuk satu orang. Kalau hasil
timbangan tersebut sama atau hanya memiliki perbedaan kecil saat pengukuran, maka timbangan
tersebut dapat dinyatakan reliabel.
6. Kapan validitas dan reliabilitas tidak berlaku?
Validitas menjadi tidak berlaku ketika validitas sebuah alat ukur digunakan untuk melihat
validitas alat ukur lainnya, maka validitas tersebut menjadi tidak berlaku. Hal ini disebabkan
tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya
hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Sedangkan reliabilitas
menjadi tidak berlaku pada dua kondisi. Yang pertama, alat ukur tersebut digunakan untuk
mengukur populasi atau sampel yang berbeda dengan rancangan alat ukur itu. Ini disebut
sampling error, mengacu kepada inkonsistensi hasil ukur karena digunakan ulang pada kelompok
individu yang berbeda. Contoh timbangan badan tadi, menjadi tidak reliabel jika yang ditimbang
adalah monyet, bukan manusia. Sedangkan yang kedua, reliabilitas menjadi tidak berlaku jika
terjadi kesalahan pengukuran atau error of measurement. Alat ukur yang dipakai tidak konsisten
dalam mengukur. Timbangan badan, menjadi tidak reliabel ketika mengukur berat badan orang
yang sama beberapa kali namun menunjukkan hasil yang berbeda-beda dan perbedaan tersebut
cukup besar. Misalkan: hasil timbangan pertama pada si A, 60 kg. Timbangan kedua, 58 kg dan
timbangan ketiga 60,5 kg. Dari hasil timbangan tersebut, dapat kita simpulkan bahwa alat
timbangan badan itu tidak reliabel.
7. Apa beda validitas untuk alat tes dengan validitas untuk kegiatan observasi dan
wawancara?
Validitas untuk alat tes berkaitan dengan ketepatan dan kecermatan alat tes tersebut dalam
melakukan fungsi tes atau fungsi ukurnya. Menurut buku Standards, yang ditulis oleh Asosiasi
Psikolog Amerika (APA), validitas mengacu pada derajat dimana bukti dan teori menyokong
interpretasi dari skor tes dan mengacu pada tujuan tes. Validitas adalah hal yang paling mendasar
dalam pengembangan dan evaluasi tes. Proses validasi meliputi akumulasi, membuktikan tujuan
dari evaluasi tersebut, bukan terhadap test itu sendiri. Pada alat tes biasanya validitas akan
dihitung secara statistik dan dalam bentuk rumusan angka.
Sedangkan validitas untuk kegiatan observasi dan wawancara berkaitan dengan konsep yang
digunakan untuk mendasari tujuan observasi dan wawancara itu sendiri. Sebelum seseorang
melakukan kegiatan observasi dan wawancara, ia harus mendefinisikan konsep atau teori yang
akan dipakai sebagai acuan kerangka konsepnya sehingga kegiatan observasi dan wawancara
yang dilakukan memiliki acuan yang jelas. Hasil dari observasi dan wawancara dapat dijadikan
referensi yang akurat untuk membuat deskripsi tentang orang, situasi atau kejadian. Validitas
observasi dan wawancara tidak dihitung secara statistik, namun cukup dengan menguraikan
konsep atau teori menjadi beberapa indikator.
8. Bagaimana menentukan validitas untuk kegiatan observasi?
Ada 2 cara menentukan validitas observasi, yaitu: menggunakan dasar teori atau konsep
kemudian di turunkan menjadi beberapa aspek atau indikator konsep. Yang kedua, menggunakan
perbandingan antar perilaku. Pada cara pertama, observer harus menentukan teori atau konsep
apa yang akan digunakan sebagai acuan observasi. Konsep atau teori itu kemudian diturunkan
menjadi beberapa indikator yang dipakai untuk menjadi tolok ukur operasional konsep tersebut.
Sedangkan cara kedua adalah membandingkan perilaku subjek pada berbagai situasi. Apakah
perilaku inatensi, misalnya, muncul di kelas, apakah muncul juga saat ia berada di rumah, apakah
muncul juga saat ia sedang mengerjakan tugas di tempat les. Dengan membandingkan
kemunculan perilaku dari hasil observasi tersebut akan didapatkan validitas observasi yang
disebut concurrent validity.
9. Kapan sebuah observasi membutuhkan validitas?
Pada setiap kegiatan observasi atau pengamatan sangat perlu untuk memiliki instrumen observasi
yang valid. Hal ini dikarenakan indera yang digunakan dalam pengamatan yakni mata dan
telinga memiliki keterbatasan. Rahayu dan Ardani (2004) menyatakan bahwa keterbatasan indera
timbul terutama dari objek yang dihadapi. Kebanyakan objek-objek penyelidikan adalah objekobjek yang kompleks, memiliki unsur yang banyak, segi yang berliku-liku atau dimensi yang
majemuk. Oleh karena itu kegiatan observasi membutuhkan instrumen yang valid agar instrumen
tesebut benar-benar dapat mengukur target perilaku dalam kegiatan observasi. Sattler (2002)
menjelaskan bahwa dalam pelaksanaan observasi sering ditemui berbagai masalah. Pertama,
sulitnya untuk mendapatkan sampel dan representatif perilaku yang tepat dalam waktu singkat.
memperoleh sampel dan representatif perilaku yang tepat akan memerlukan pengambilan sampel
dalam berbagai jenis situasi, dan ini jarang dilakukan. Kriteria validasi meliputi penilaian dari
orang lain yang akrab dengan subjek penelitian dan observasi dalam situasi eksperimental. Tapi
kriteria ini tidak mutlak dan tidak menawarkan bukti keabsahan. kesulitan lebih lanjut muncul
ketika dua indeks yang dimaksudkan untuk mengukur perilaku yang sama bukanlah kesepakatan.
ukuran mana yang valid atau representatif? karena perilaku adalah variabel, sangat mungkin
kedua ukuran ini adalah akurat, meskipun langkah-langkah kriteria menunjukkan kesepakatan
yang buruk.
10. Kapan sebuah wawancara perlu ditentukan validasinya?
Instrumen yang digunakan dalam sebuah wawancara seharusnya memiliki validitas yang baik.
Rahayu dan Ardani (2004) mengungkapkan bahwa validitas yang baik merujuk pada
objektivitas. Artinya, variabel-variabel dalam wawancara yang telah ditetapkan oleh peneliti
harus berdasarkan teori-teori yang telah mapan. Namun objektivitas dalam kegiatan wawancara
bersifat objectivied subjectivities. Artinya subjektif menurut peneliti (teori yang ada), tetapi
objektif menurut subjek yang diteliti. Hal ini dimungkinkan karena realitas sosial dalam
penelitian naturalistik berada di alam imajinasi pikiran kebanyakan manusia yang merupakan
gugusan subjektivitas awam yang tidak pernah diuji kebenarannya, dan objektif menurut kaidahkaidah keilmuan atau logika. Namun betapapun subjektifnya, hal tersebut sesungguhnya adalah
subjektivitas unik yang justru harus ditempatkan sebagai objek kajian ilmu-ilmu sosial yang
utama.
11. Teori apa yang mendasari penggunaan validitas untuk kegiatan observasi dan
wawancara?
Validitas dalam kegiatan observasi dan wawancara pada pengukuran psikologi perlu untuk
dilakukan karena subjek pengukurannya adalah manusia. Untuk mengungkap aspek-aspek atau
variabel-variabel dari keadaan psikologis manusia, diperlukan instrumen observasi dan
wawancara yang reliabel dan valid agar kesimpulan penelitian tidak keliru dan dapat
memberikan gambaran yang tepat mengenai subjek penelitian (Azwar, 1992).
12. Bagaimana cara menggunakan validitas?
Rahayu dan Ardani (2004) menjelaskan bahwa validitas menunjukkan sejauh mana suatu alat
ukur dapat mengukur apa yang hendak diukur. Dalam kegiatan observasi ada beberapa jenis
validitas yang dapat digunakan, yaitu
a. Face validity adalah bagaimana kelihatannya suatu alat pengukur benar-benar menukur apa
yang hendak diukur. Misalnya untuk mengukur kemampuan sebagai seorang supir, seorang
observee harus disuruh mengendarai mobi. Tetapi, bila pengukuran kemampuan mengendarai
mobil dilakukan dengan ujian tertulis tentang teknik mengendarai mobil, maka alat pengukur
tesebut kurang memiliki face validity.
b. Content validity adalah sejauh mana isi alat ukur tersebut mewakili semua aspek yang
dianggap sebagai aspek kerangka konsep. Data harus mencerminkan cir-ciri yang telah
ditentukan yaitu apa saja yang akan diungkap/diukur. Contohnya bila seorang penelitia infin
mengukur keikutsertaan dalam program KB dengan menanyakan metode kontrasepsi yang
dipakai. Bila aspek yang diamati tidak mencakup semua metode kontrasepsi, maka alat ukur
tersebut tidak memiliki validitas isi.
c. Predicty validity adalah alat pengukur yang dibuat oleh peneliti seringkali dimaksudkan untuk
memprediksi apa yang akan terjadi di masa yang akan datang. Contonya ujian seleksi masuk
perguruan tinggi. Ujian tersebut merupakan upaya untuk memprediksi apa yang aan terjadi di
masa yang akan datang. Peserta yang lulus ujian dengan nilai baik diprediksikan akan mengikuti
pelajaran di perguruan tinggi dengan sukses. Soal ujian masuk tersebut dikatakan memiliki
validitas prediktif, apabila ada korelasi yang tinggi antara nilai ujian masuk dengan prestasi
belajar setelah menjadi mahasiswa.
d. Construct validity adalah kerangka suatu konsep. Misalnya, untuk mengukur status ekonomi
responen dengan menggunakan lima komponen status ekonomi, yakni penghasilan perbulan,
pengeluaran perbulan, pemilikan barang, porsi penghasilan yang digunakan untuk rekreasi, dan
kualitas rumah. Apabila ada konsistensi antara komponen-komponen konstruk yang satu dengan
yang lain maka konstruk tersebut memiliki validitas.
e. Concurrent validity dilakukan dengan mengobservasi perilaku dan membandingkannya
dengan perilaku lain. Misalnya perilaku di sekolah sama dengan perilaku di luar kelas
(menunjukkan agresivitas).
Selanjutnya validitas dalam kegiatan wawancara
a. Validitas konstruk. penelitian kualitatif dengan metode observasi dan wawancara tidak terlepas
dari aktivitas melakukan konstruksi sosial. Misalnya, orang yang selalu memakai peci dikonstruk
peneliti sebagai orang yang alim. Konstruksi semacam itu memiliki banyak kelemahan. Oleh
karena itu, perlu diperhatikan beberapa hal, yaitu:
Dalam pengumpulan data, peneliti harus menggunakan multi sumber bukti.
Peneliti harus membangun rangkaian bukti antara satu data dengan data lain.
Agar peneliti meminta orang yang diwawancarai meninjau ulang draft laporan yang disusun.
b. Validitas internal. Hal ini dilakukan pada tahap analisis data. Validitas internal ini meliputi halhal berikut:
Membuat pola penjodohan dengan analisis sebab-akibat atau aksi reaksi atau pengaruhmempengaruhi.
Peneliti hendaknya mengerjakan penyusunan kesplanasi; maksudnya apakah konstruksi yang
dibuat berdasarkan data yang diterima itu dapat dipertanggungjawabkan.
Peneliti hendaknya membuat analisis deret waktu dari peristiwa-peristiwa atau fenomenafenomena yang terjadi.
c. Validitas eksternal. Dalam melakukan validitas ini, hendaknya peneliti menggunakan logika
replikasi. Artinya seandainya penelitian yang sama dilakukan oleh orang lain dengan
menggunakan pendekatan yang sama, niscaya hasilnya akan sama atau hampir sama.
13. Apakah perlu mencari reliabilitas kegiatan observasi?
Mencari reliabilitas dalam kegiatan observasi itu perlu, dimana reliabilitas observasi adalah
keajegan apa yang diobservasi. Agar suatu pengukuran observasi dapat dipercaya, maka idealnya
hasil observasi bila diuji kembali oleh orang lain baik di lain waktu maupun sekarang maka
hasilnya relatif sama.
14. Apakah perlu mencari reliabilitas kegiatan wawancara?
Menurut Neuman (2007), metode wawancara menjadi ciri khas dari penelitan kualitatif.
reliabilitas dengan pendekatan kualitatif lebih menekankan kepada keajegan hasil jawaban yang
dimunculkan oleh subjek. Namun berbeda dengan pendekatan kuantitatif, reliabilitas pada
kualitatif lebih bersifat fleksibel dan berkembang. Sehingga jika pada pendekatan kualitatif
didapatkan data yang berbeda, tidak serta merta disimpulkan bahwa reliabilitasnya rendah tapi
justru menjadi salah satu bentuk memperoleh data yang kaya atau lengkap.
j) Kesalahan proksimitas
Observer menilai serupa sifat-sifat tertentu karena bentuk penilaian membuat sifat-sifat itu
berdekatan dalam waktu atau letak.
k) Pengaruh pribadi
Tanpa diketahui oleh observer sendiri, karakteristik diri observer (usia, jenis, kelamin, ras, dan
status sosial) mempengaruhi penilaian perilaku subjek.
l) Ketidakstabilan penilaian observer
Kriteria penilaian yang dipakai oleh observer berubah bersama waktu, akibat ada dan tidaknya
perilaku karena kelelahan, atau belajar, atau penyebab lainnya.
m) Terlewat
Observer alpa mencatat perilaku yang muncul.
n) Commision
Observer keliru kode suatu perilaku.
o) Efek harapan
Harapan observer mempengaruhi pencatatan, atau observer mengharapkan sesuatu terjadi dan
mengkomunikasikan harapan ini kepada subjek.
p) Reaktivitas observer
Observer berubah pencatatan perilakunya karena ia sadar diamati.
q) Isyarat nonverbal
Observer dengan tidak sengaja memberi isyarat kepada subjek sehingga mendukung perilaku
tertentu pada subjek.
2) Ketidakstabilan Penilaian Observer
Bila observasi berlangsung lama, observer mungkin menunjukkan tanda-tanda kelelahan, lupa
dan motivasinya menurun. Misalnya, pada saat permulaan menggunakan standar tertentu untuk
menilai suara bisikan atau vokalisasi singkat, tetapi kemudian berubah standarnya,
ketidakstabilan hal ini mungkin saja terjadi, walaupun telah ada persetujuan mengenai definisi
oprasional perilaku yang diamati.
3) Kesulitan dalam Mengkodekan Perilaku
Kategori global, seperti perilaku off-task atau perilaku tidak patut (innappropriate behavior)
membutuhkan penyimpulan tingkat tinggi dibanding kategori spesifik, seperti memukul, atau
meninggalkan tempat duduk. Meskipun diusahakan sebaik-baiknya mendefinisikan perilaku
dengan cermat, beberapa perilaku memang sulit dikategorikan. Jadi, kode observasi menuntut
pertimbangan yang masak di pihak observer.
4) Memilih Waktu dan Saat yang Tepat
Menentukan waktu yang tepat munculnya suatu kejadian bukanlah semudah yang dibayangkan.
Misalnya, untuk mengobservasi perilaku menolak dan memulai makan pada anak. Sulit untuk
menentukan waktu kapan saat yang tepat anak mulai menolak memulai makan. Selain itu, unit
waktu yang dipilih oleh observer mungkin tidak dapat menggambarkan dengan tepat peta
kejadian perilaku.
16. Bagaimana meningkatkan reliabilitas Observasi?
Adanya kelemahan-kelemahan yang menyebabkan reliabilitas pengukuran menurun (sehingga
validitasnya juga menurun), membuat kita waspada untuk menghindarinya. Beberapa petunjuk
praktis, antara lain :
a. Observer hendaknya memahami benar-benar teknik-teknik pencatatan, manual maupun
instrumental. Pastikanlah dalam rancangannya perilaku-perilaku kritis didefinisikan dengan jelas,
20. Jika sebuah alat tes mencapai validitas namun tidak reliabel, bagaimana kualitas alat
tes tersebut? Dan bagaimana jika terjadi kebalikannya?
Validitas dan reliabilitas bersifat saling melengkapi namun terkadang juga dapat bersifat bertolak
belakang (Neuman, 2007). Dalam suatu contoh misalnya ada suatu alat ukur yang memiliki
validitas tinggi namun memiliki reliabilitas rendah, hal ini dapat terjadi dalam pengukuran
dengan pendekatan kualitatif. Misalnya konstrak yang diukur merupakan suatu konstrak yang
sangat abstrak yaitu alienasi yang digali melalui metode wawancara, hal ini mungkin dapat
dikatakan memiliki validitas yang tinggi namun reliabilitas yang rendah karena tergantung pada
bagaimana peneliti menggunakan instrumen penelitian.
Contoh lain misalnya suatu alat ukur yang memiliki reliabilitas yang tinggi namun validitasnya
rendah. Berdasarkan pernyataan tersebut dapat dikatan bahwa suatu alat ukur memiliki keajegan
dalam mengukur namun kurang tepat dalam mengukur apa yang hendak diukur. untuk
memudahkan pembahasan ini penulis mengutip gambar dari Neuman (2007) sebagai berikut:
Berdasarkan gambar diatas dapat dilihat bahwa ketika ketika suatu alat tes memiliki reliabilitas
yang tinggi namun validitas rendah tidak dapat mengenai sasaran terhadap apa yang ingin diukur.
Berdasarkan penjabaran tersebut maka dapat dikatakan bahwa ketika suatu alat tes memiliki
reliabilitas yang tinggi namun validitas yang rendah maka alat ukur itu memiliki kualitas yang
rendah. Namun sebaliknya, jika suatu alat ukur valid maka kemungkinan besar reliabilitasnya
akan dapat mengikuti menjadi baik juga. Secara sederhana dapat diakatakan bahwa suatu alat
ukur yang valid akan cenderung memiliki reliabilitas yang tinggi namun alat ukur yang memiliki
reliabilitas yang tinggi belum tentu valid.
DAFTAR PUSTAKA
Azwar, S. (1992). Reliabilitas dan Validitas. Yogyakarta: Penerbit Sigma Alpha.
Azwar, S. (1997). Reliabilitas dan Validitas(Ed. 3). Yogyakarta: Pustaka Pelajar.
Louis, J. (2011). Validitas dan reliabilitas. Diakses pada tanggal 11 November 2014 dari
http://jeffy-louis.blogspot.com/2011/02/validitas-dan-reliabilitas.html
Neuman, W. L., (2007). Basic Social Research Methods: Qualitative & Quantitative Approachs
(2ed). Boston: Allyn & Bacon.
Rahayu, I.T. dan Ardani, T.A. (2004). Observasi dan Wawancara. Malang: Bayumedia
publishing.
Sattler, J.M. (2002). Assessment of Children. California: Penerbit Sattler.
Sudijono, A. (2009). Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press.
Sukadji, S. (2000). Psikologi pendidikan dan psikologi sekolah (Direvisi dan Dilengkapi).
Depok: Universitas Indonesia.