Anda di halaman 1dari 15

PERTEMUAN 11 C

SKALA INSTRUMEN, TEKNIK DAN UJI COBA INSTRUMEN


A. Skala Pengukuran dan Intrumen Penelitian
1. Skala Pengukuran
Untuk bisa bekerja dengan statistika, semua data dinyatakan dalam
bentuk angka atau bilangan, termasuk data kualitatif. Pekerjaan
mengkuantitatifkan data adalah suatu proses pengukuran. Hasil
pengukuran dapat dibedakan atas empat macam skala, yaitu skala
nominal, skala ordinal, skala interval, dan skala rasio.
a. Skala Nominal
Skala nominal merupakan skala yang hanya membedakan kategori
berdasarkan jenisnya. Untuk contohnya adalah jenis kelamin yakni dapat
dibedakan menjadi laki-laki dan perempuan, dengan kode laki-laki = 1
sedangkan perempuan = 2. Dalam hal ini tidak berarti perempuan yang
berkode 2 ini lebih besar atau lebih baik daripada laki-laki yang berkode 1.
Selain itu, kita dapat mengkodekan kategori agama, yakni 1 = Islam, 2 =
Kristen, 3 = Katholik, 4 = Hindu, dan 5 = Budha. Dapat juga kita
menentukan kode lain seperti Budha = 1, Hindu = 2, Katholik = 3, Kristen
= 4, dan Islam = 5. Dari hal tersebut dapat kita ketahui bahwa tidak ada
sistem kodifikasi yang baku dalam skala jenis nominal ini. Sehingga kode-
kode tersebut dapat ditentukan secara bebas oleh peneliti karena tidak
mempengaruhi apapun. Skala nominal hanya membedakan jenis, dari
jenis yang satu dan jenis yang lain dengan pemberian angka atau simbol.
Pemberian angka atau simbol ini tidak memiliki arti kuantitatif melainkan
hanya membedakan antar jenisnya. Skala pengukuran nominal ini yang
terpenting adalah kodefikasi yang berbeda antara jenis yang satu dengan
jenis lainnya. Dikarenakan skala nominal ini tidak memiliki nilai (kuantitatif)
maka tidak dapat diterapkan pada operasi hitung dengan ilmu matematika
seperti penjumlahan, pengurangan, pembagian, atau perkalian. Untuk itu,
peralatan statistik yang sesuai dengan skala jenis ini adalah modus, Chi
Square, distribusi frekuensi, median test, Friedman test, Korelasi Kendall,
Korelasi Rank Spearman, dan beberapa peralatan statistik non-parametrik
lainnya.
b. Skala Ordinal
Skala ordinal menunjukkan urutan (peringkat, tingkatan, atau
ranking) di samping berfungsi sebagai pengelompokan (skala nominal).
Contohnya untuk memberi tingkatan pada kepuasan konsumen, yakni
angka 1 = sangat puas, 2 = puas, 3 = kurang puas, 4 = tidak puas, 5 =
sangat tidak puas. Atau bisa juga diurutkan seperti 5 = sangat puas, 4 =
puas, 3 = kurang puas, 2 = tidak puas, dan 1 = sangat tidak puas. Dalam
contoh ini tidak berarti kriteria sangat puas memiliki nilai 5 kali lebih
banyak dari kriteria sangat tidak puas yang bernilai 1. Dalam skala ordinal
ini penyusunan haruslah secara berurutan, misalnya dari besar ke kecil,
atau dari kecil ke besar. Sehingga tidak boleh bila memberi kode seperti
contoh berikut 1 = sangat puas, 2 = sangat tidak puas, 3 = kurang puas,
dan seterusnya. Hal ini dikarenakan penyusunan kategori tersebut tidak
berurutan.
Dari penjelasan tersebut di atas dapat kita ketahui bahwa dalam
skala ordinal kode angka yang diberikan tidak dapat diterapkan dalam
operasi hitung matematika seperti perkalian, pembagian, penjumlahan,
dan pengurangan. Sehingga peralatan yang sesuai adalah statistik non
parametrik seperti pada skala jenis nominal yakni modus, Chi Square,
distribusi frekuensi, median test, Friedman test, Korelasi Kendall, Korelasi
Rank Spearman, dan lain sebagainya.
c. Skala Interval
Skala interval merupakan skala pengukuran yang memiliki jarak
yang sama antara satu objek dengan yang lainnya dan jarak tersebut
dapat diketahui dengan pasti. Dapat kita ambil contoh dari suhu kota A =
40oC, B = 45oC, dan C = 50oC. Sehingga dapat kita ketahui bahwa suhu
kota B lebih panas 5oC dibandingkan suhu kota A, sedangkan suhu kota C
lebih panas 5oC daripada suhu kota B. Dapat diketahui jarak interval dari
A-B-C adalah 5oC. Perlu diketahui bahwa interval bukan sebagai kelipatan
melainkan jarak antar kedua objek adalah sama. Untuk contohnya dapat
dilihat pada tabel berikut :

Data Nilai Ujian IPA Skor Nilai


Fandy A 4
Riska B 3
Lusi C 2
Mega D 1

Dari contoh tabel tersebut dapat diketahui nilai A=4, B=3, C=2, dan D=1.
Selisih nilai antara A dan B mempunyai selisih yang sama dengan nilai B
dan C serta selisih nilai antara C dan D. Tetapi tidak bisa dikatakan bila
Fandy yang memiliki nilai A berarti lebih pintar 4 kali dibandingkan dengan
Mega yang mempunyai nilai D. Atau Lusi lebih pintar daripada Mega,
meskipun selisihnya sama, tetapi tidak mempunyai nilai nol mutlak.
d. Skala Rasio
Variabel rasio sangat mirip dengan variabel interval; di samping
sudah memiliki semua sifat-sifat variabel interval, juga sudah bisa
diidentifikasi titik nol mutlak, sehingga memungkinkan
menyatakan rasio atau perbandingandi antara kedua nilai, misalnya x
adalah dua kali lebih y. Contohnya adalah berat, tinggi, panjang, usia,
suhu dalam skala kelvin. Sebagai contoh, berat A = 70 kg, berat B =35 kg,
Berat C = 0 kg. Di sini kita bisa membandingkan rasio, misalnya kita bisa
mengatakan bahwa berat A dua kali berat B. Berat C = 0 kg, artinya C
tidak mempunyai bobot. Angka 0 di sini jelas dan berarti dan angka 0
menunjukkan nilai 0 mutlak.
Membedakan antara skala interval dengan rasio adalah di angka 0,
apakah nilai nol tersebut mutlak (berarti) atau tidak? Sebagai contoh, suhu
bisa berupa skala interval tapi bisa juga skala rasio, tergantung pada skala
pengukuran yang digunakan. Apabila kita menggunakan skala Celcius
atau Fahrenheit, termasuk skala interval, sedangkan apabila Kelvin yang
digunakan, suhu termasuk skala rasio. Mengapa? Karena suhu 0 derajat
Kelvin adalah mutlak! Kita tidak saja dapat mengatakan bahwa suhu 200
derajat lebih tinggi daripada suhu 100 derajat, tetapi kita juga sudah dapat
menyatakan dengan pasti bahwa rasionya benar dua kali lebih tinggi.

2. Instrumen Penelitian
Instrumen penelitian yang menggunakan metoda kuantitatif,
kualitas pengumpulan data sangat ditentukan oleh kualitas instrumen atau
alat pengumpul data yang digunakan. Suatu instrumen penelitian
dikatakan berkualitas dan dapat dipertanggungjawabkan jika sudah
terbukti validitas dan reliabilitasnya. Pengujian validitas dan reliabilitas
instrumen, tentunya harus disesuaikan dengan bentuk instrumen yang
akan digunakan dalam penelitian.
Penggolongan Instrumen Penelitian
Secara garis besar, instrumen penelitian digolongkan menjadi dua,
yaitu:
(1) tes
Instrumen Penelitian Berbentuk Tes Ditinjau dari proses
pemeriksaannya, suatu tes dapat dikelompokkan menjadi dua, yaitu:
(a) Tes tipe subjektif; Tes tipe subjektif Dalam pemeriksaan tes tipe
subjektif, ada factor lain di luar kemampuan testi yang
mempengaruhi proses pemeriksaan dan hasil akhir berupa skor.
Faktor di luar kemampuan testi, misalnya: emosi/perasaan,
kelelahan, kecermatan; tulisan, kerapihan. Macam-macam tes tipe
subjektif: Tes lisan, Tes uraian.
(b) Tes tipe objektif. Data hasil tes biasanya dikatagorikan sebagai data
yang berbentuk interval/rasio. Tes tipe objektif Dalam pemeriksaan
tes tipe objektif tidak ada factor lain yang mempengaruhi proses
pemeriksaan dan hasil akhir berupa skor yang akan diperoleh testi.
Macam-macam tes tipe objektif: benar-Salah (True-False), pilihan
berganda (Multiple choice), pilihan ganda biasa, hubungan antar hal
(sebab-akibat), pilihan ganda kompleks, menjodohkan.
(c)Tes perbuatan/keterampilan. Tes untuk mengukur kinerja atau hasil
kerja.
(2)Non Tes
Instrumen penelitian berbentuk non tes digunakan untuk
memperoleh data tentang aspek afektif atau psikomotorik dari subjek yang
diteliti. Instrumen penelitian bentuk non tes dapat berupa:
(a) Wawancara (interview), dilakukan dengan cara menentukan tanya
jawab langsung antara pewawancara dengan yang diwawancara
tentang segala sesuatu yang diketahui oleh pewawancara. Agar hasil
wawancara sesuai dengan apa yang diinginkan oleh pewawancara,
maka pewawancara harus: (b) Obsevasi/pengamatan (observation),
dilakukan dengan cara orang yang melakukan pengamatan
(observer) mengadakan pengamatan langsung ke lapangan tentang
segala sesuatu yang ingin diketahui tentang objek yang diteliti. Agar
hasil observasi sesuai dengan apa yang diinginkan, observer harus
membuat pedoman obervasi, yaitu berupa daftar informasi yang
ingin diketahui oleh observer.
(c) Angket (questionnaire), adalah daftar pertanyaan/pernyataan yang
harus dijawab atau diisi oleh responden. Berdasarkan kebebasan
responden dalam menjawab setiap pertanyaan, angket dibagi
menjadi dua, yaitu: Angket terbuka, jawaban-Jawaban untuk setiap
pertanyaan/ pernyataan telah disediakan,

Angket tertutup Responden bebas memberikan jawaban untuk


setiap pertanyaan sesuai alternatib jawaban yang telah disiapkan.
Angket tertutup, berdasarkan skalanya dapat dikelompokkan menjadi:
(1) Skala Likert, untuk mengukur sikap, pendapat, persepsi seseorang
atau sekelompok orang tentang fenomena tertentu yang ingin diketahui.
Dalam angket skala Likert biasanya disediakan lima alternative jawaban,
misalnya: SS, S, N, TS, dan STS. Agar peneliti dapat dengan mudah
mengetahui apakah seorang responden menjawab dengan sungguh-
sungguh atau asal-asalan, sebaiknya angket disusun berdasarkan
pernyataan positif dan pernyataan negative. Untuk pernyataan positif,
penskoran jawaban biasanya sebagai berikut: SS = 5; S = 4; N = 3, TS =
2, dan STS = 1. Sedangkan untuk pernyataan negatif sebaliknya, contoh:

No. Pernyataan Jawaban

1 Kemampuan mengajar dosen sudah SS S N TS ST


sesuai dengan harapan dan S
keinginan saya
2 Dst
3
SS = Sangat setuju; S = setuju; N = netral; TS = tidak setuju; STS = sangat tidak setuju

No. Pernyataan Jawaban


1 Dosen terlambat datang untuk SS S K J TP
mengajar di kelas
2 Dst
3
SS = Sangat sering; S = sering; K = kadang-kadang; J = jarang; TP = tidak pernah

(2) Skala Guttman, untuk mengukur secara tegas dan konsisten tentang
sikap, pendapat, persepsi seseorang atau sekelompok orang tentang
fenomena tertentu yang ingin diketahui. Dalam skala Guttman hanya
disediakan dua alternative jawaban (dikotomi), misalnya: Ya - tidak; setuju
- tidak setuju; pernah - tidak pernah. Sehingga jika datanya
dikuantitatifkan, nilainya hanya 0 atau 1 saja, atau hanya 1 atau 2 saja.
Data yang diperoleh dari angket skala Guttman dapat dikategorikan skala
nominal atau ordinal. Contoh:

No. Pernyataan Jawaban

1 Apakah tempat tinggal anda jauh YA TIDAK


dari kampus
2

No. Pernyataan Jawaban

1 Bila ada seorang mahasiswa yang setuj Tidak


datang terlambat lebih dari 10 u setuju
menit, maka dosen harus melarang
mahasiswa tersebut untuk
mengikuti perkuliahan
2

(3) Skala Thurstone, untuk mengukur tentang sikap, persepsi seseorang


atau sekelompok orang tentang fenomena tertentu yang ingin diketahui.
Cara membuatnya adalah sebagai berikut: 1) Peneliti menyusun
sebanyak-banyaknya pernyataan yang berhubungan dengan masalah
yang diteliti. 2) Kemudian setiap peryataan dinilai oleh beberapa orang
ahli (paling sedikit tiga orang) yang independen. 3) Kepada setiap ahli
tersebut diminta untuk mengelompokkan pernyataan-pernyataan tersebut
dalam 11 kelompok dan memberi skor 1 sampai dengan 11. Yang paling
relevan diberi skor 1 dan yang paling tidak relevan diberi skor 11. Dalam
kelompok pertama dikumpulkan pernyataan yang sangat baik, kelompok
kedua yang baik, dan seterusnya, tumpukan keenam netral, dan
seterusnya tumpukan ke-11 yang tidak baik. 4) Pernyataan yang sangat
menyebar dibuang, sedangkan pernyataan pernyataan yang mempunyai
nilai agak bersamaan dari para penilai (ahli) digunakan dalam skala. Nilai
skala dari setiap pernyataan berupa median dari nilai-nilai yang telah
diberikan oleh para ahli.
Hasil dari angket skala Thurstone adalah sejumlah pernyataan
yang biasanya sekitar 20 buah dimana posisi pernyataan-pernyataan telah
diketahui berdasarkan penilaian para ahli. Kepada responden diminta
untuk memilih sebuah pernyataan yang paling disetujuinya atau disuruh
mengecek memilih 2 atau 3 pernyataan yang paling disukai responden.
Data yang diperoleh dari angket skala Thurstone termasuk skala interval.
(4) Rating Scale atau skala penilaian, responden memberikan penilaian
terhadap pernyataan yang diberikan dengan cara memilih skor yang telah
disediakan sehingga hasil dari jawaban responden akan berbentuk data
kuantitatif (berupa angka) yang selanjutnya akan diubah menjadi data
kualitatif oleh peneliti. Contoh:
Sebelum mengikuti Pengetahuan dan Setelah Mengikuti Diklat
Diklat wawasan tentang
0 1 2 3 Komunikasi 0 1 2 3
0 1 2 3 Strategi belajar 0 1 2 3
mengajar
0 1 2 3 Membuat 0 1 2 3
rancangan
pembelajaran
0 1 2 3 Melakukan 0 1 2 3
evaluasi

(5) Semantic Diferential atau skala perbedaan semantic digunakan untuk


mengukur sikap yang tidak berbentuk pilihan ganda maupun checklist,
akan tetapi disusun suatu garis kontinum yang jawabannya sangat positif
terletak pada bagian paling kanan dari garis sedangkan jawaban negatif
terletak pada bagian paling kiri dari garis atau sebaliknya. Responden
dapat memberi jawaban pada rentang yang positif sampai dengan negatif.
Contoh:

No. Penilaian tentang gaya kepemimpinan ketua program studi


1 Otoriter 5 4 3 2 1 Tidak otoriter
2 Demokratis 5 4 3 2 1 Tidak
demokratis
3 Permisif 5 4 3 2 1 Tidak permisif

B. Teknik Pengumpulan Data penelitian kuantitatif


1. Data Penelitian
Data adalah fakta empirik yang dikumpulkan oleh peneliti untuk
kepentingan memecahkan masalah atau menjawab pertanyaan penelitian.
Data penelitian dapat berasal dari berbagai sumber yang dikumpulkan
dengan menggunakan berbagai teknik selama kegiatan penelitian
berlangsung.
Jenis-jenis data
a. Berdasarkan sumbernya (primer, sekunder)
(1) Data yang diperoleh atau dikumpulkan oleh peneliti secara langsung
dari sumber datanya. Data primer disebut juga sebagai data asli atau data
baru yang memiliki sifat up to date. Untuk mendapatkan data primer,
peneliti harus mengumpulkannya secara langsung. Teknik yang dapat
digunakan peneliti untuk mengumpulkan data primer antara lain observasi,
wawancara, diskusi terfokus (focus grup discussion – FGD) dan
penyebaran kuesioner Data Sekunder yang diperoleh atau dikumpulkan
peneliti dari berbagai sumber yang telah ada (peneliti sebagai tangan
kedua). Data sekunder dapat diperoleh dari berbagai sumber seperti Biro
Pusat Statistik (BPS), buku, laporan, jurnal, dan lain-lain.
(2) Berdasarkan sifatnya (kualitatif, kuantitatif)
Data kualitatif adalah data yang berbentuk kata-kata, bukan dalam
bentuk angka. Data kualitatif diperoleh melalui berbagai macam teknik
pengumpulan data misalnya wawancara, analisis dokumen, diskusi
terfokus, atau observasi yang telah dituangkan dalam catatan lapangan
(transkrip). Bentuk lain data kualitatif adalah gambar yang diperoleh
melalui pemotretan atau rekaman video. Data Kuantitatif adalah data yang
berbentuk angka atau bilangan. Sesuai dengan bentuknya, data kuantitatif
dapat diolah atau dianalisis menggunakan teknik perhitungan matematika
atau statistika.
(3) Berdasarkan proses/cara mendapatkannya (diskrit, kontinum)
Data Diskrit adalah data dalam bentuk angka (bilangan) yang diperoleh
dengan cara membilang. Contoh data diskrit misalnya: Jumlah Sekolah
Dasar Negeri di Kecamatan Rawalumbu sebanyak 20, Jumlah siswa laki-
laki di SD Bumi Bekasi Baru sebanyak 67 orang, Jumlah penduduk di
Kabupaten Bekasi sebanyak 946.867 orang. Karena diperoleh dengan
cara membilang, data diskrit akan berbentuk bilangan bulat (bukan
bilangan pecahan). Data kontinum data dalam bentuk angka/bilangan
yang diperoleh berdasarkan hasil pengukuran. Data kontinum dapat
berbentuk bilangan bulat atau pecahan tergantung jenis skala pengukuran
yang digunakan. Contoh data kontinum misalnya: Tinggi badan Budi
adalah 150,5 centimeter. IQ Budi adalah 120. Suhu udara di ruang kelas
24o Celcius.
(4) Berdasarkan skala pengukuran (nominal, ordinal, interval, rasio)

2. Teknik Pengumpulan Data


a. Teknik observasi
Observasi diartikan sebagai pengamatan dan pencatatan secara
sistematis terhadap gejala yang tampak pada objek penelitian.
Pengamatan dan pencatatan ini dilakukan terhadap objek di tempat
terjadi/berlangsungnya peristiwa.Berdasarkan jenisnya observasi dibagi
menjadi:
(1).Observasi partisipan dan nonpartisipan
Observasi partisipan; suatu proses observasi bagian dalam yang
dilakukan oleh observer dengan ikut mengambil bagian dalam kehidupan
orang-orang yang diobservasi. Observasi nonpartisipan; observer tidak
ikut dalam kehidupan orang yang diobservasi dan secara terpisah
berkedudukan sebagai pelaku pengamat.
(2).Observasi sistematis dan non sistematis
Observasi sistematis; observasi yang diselenggarakan dengan
menentukans ecara sistematis faktor-faktor yang akan diobservasi
lengkap dengan kategorinya. Observasi nonsistematis; observasi yang
dilakukan tanpa mempersiapkan/membatasi kerangka yang akan diamati
b. Teknik komunikasi (Wawancara, Angket/kuesioner)
Suatu proses interaksi dan komunikasi verbal dengan tujuan untuk
mendapatkan informasi penting yang diinginkan. Merupakan alat
pengumpul informasi dengan cara mengajukan pertanyaan secara lisan
dan dijawab secara lisan pula melalui kontak langsung dengan tatap
muka.
Angket/ kuesioner: alat pengumpul informasi dengan cara
menyampaikan sejumlah pertanyaan tertulis untuk dijawab secara tertulis
oleh responden.
c. Teknik pengukuran
Seperangkat rangsangan (stimulus) yang diberikan kepada
seseorang dengan maksud untuk mendapat jawaban yang dapat dijadikan
dasar penetapan skor angka
d. Teknik sosiometris
Dipakai untuk mempelajari organisasi kelompok-kelompok kecil.
Prosedur dasarnya dapat berupa permintaan para anggota untuk
mengurutkan teman pilihannya menurut kriteria tertentu. Dengan teknik ini
akan diketahui kelompok popular atau terkucilkan.
e. Teknik dokumenter
Cara mengumpulkan data melalui peninggalan tertulis seperti arsip,
termasuk juga buku tentang teori, pendapat, dalil, hukum. Merupakan alat
pengumpul data utama pada penelitian kualitatif karena pembuktian
hipoteisnya diajukan secara logis dan rasional melalui pendapat dan teori.
C. Uji Validitas dan Reliabilitas Instrument
1. Validitas
Definisi Validitas tercermin dalam pertanyaan: Apakah kita sungguh-
sungguh mengukur ihwal yang memang ingin kita ukur? Dengan kata lain,
yang ditekankan adalah apa yang sedang diukur. Djaali dan Pudji
Muldjono (2008): Sejauh mana ketepatan dan kecermatan suatu alat ukur
dalam melakukan fungsi ukurnya. Dengan kata lain, suatu instrument
pengukuran dikatakan memiliki validitas yang tinggi apabila alat tersebut
menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai
dengan maksud dilakukannya pengukuran tersebut. Validitas atau
kesahihan menunjuk pada derajat bukti dan teori mendukung penafsiran
skor tes sebagai tujuan penggunaan tes. Dengan kata lain, validitas
adalah penafsiran skor tes seperti tercantum pada penggunaan tes buka
tes itu sendiri. Pendapat lain validitas berasal dari kata validity yang
mempunyai arti sejauh mana akurasi suatu tes atau skala dalam
menjalankan fungsi pengukurannya. Dengan kata lain, pengukuran
dikatakan mempunyai validitas yang tinggi apabila menghasilkan data
yang secara akurat memberikan gambaran mengenai variabel yang diukur
seperti yang dikehendaki oleh tujuan pengukuran tersebut.
Dari definisi di atas jelas bahwa validitas instrumen berhubungan
dengan tingkat atau derajat yang menunjukkan kemampuan suatu
instrumen menghasilkan data yang mampu memberikan informasi secara
akurat tentang karakteristik variabel yang diukur.
2. Jenis Validitas
a. Validitas Isi (Content Validity)
Validitas isi menunjukkan sejauhmana pertanyaan, tugas atau butir
dalam suatu tes atau instrument mampu mewakili secara keseluruhan dan
proporsional perilaku sampel yang dikenai tes tersebut. Tes atau
instrument itu valid apabila soal-soal atau butir-butir tes itu mencerminkan
keseluruhan isi atau materi yang diujikan atau yang seharusnya dikuasai
secara proporsional. Penentuan proporsi itu dapat didasarkan pada
pendapat/ judgement para ahli dalam bidang yang bersangkutan.
Wiersma dan Jurs menyatakan bahwa validitas isi sebenarnya
mendasarkan pada analisis logika, jadi tidak merupakan suatu koefisien
validitas yang dihitung secara statistika.
b. Validitas Konstruk
Validitas konstruk (construct validity) adalah validitas yang
mempermasalahkan seberapa jauh item-item tes mampu mengukur apa
yang benar-benar hendak diukur sesuai dengan konsep khusus atau
definisi konseptual yang telah ditetapkan. Validitas konstruk biasa
digunakan untuk instrument-instrumen yang dimaksudkan mengukur
variable-variabel konsep, baik yang sifatnya performansi tipikal seperti
instrument untuk mengukur sikap, minat, konsep diri, lokus kontrol, gaya
kepemimpinan, motivasi berprestasi, dan lain-lain, maupun yang sifatnya
performansi maksimum seperti instrumen untuk mengukur bakat (tes
bakat), inteligansi (kecerdasan intelektual), kecerdasan emosional, dan
lain-lain.
Untuk menentukan validitas konstruk suatu instrumen harus
dilakukan proses penelaahan teoretis dari suatu konsep dari variabel yang
hendak diukur, mulai dari perumusan konstruk, penentuan dimensi dan
indikator, samapi kepada penjabaran dan penulisan butir-butir item
instrument. Perumusan konstruk harus dilakukan berdasarkan sintesis
dari teori-teori mengenai konsep variabel yang hendak diukur melalui
proses analisis dan komparasi yang logic dan cermat.
Dimensi dan indikator dijabarkan dari konstruk yang telah
dirumuskan dengan memperhatikan hal-hal sebagai berikut: (a) Seberapa
jauh indikator tersebut merupakan indikator yang tepat dari konstruk yang
telah dirumuskan, (b) Indikator-indikator dari suatu konstruk harus
homogen, konsisten, dan kovergen untuk mengukur konstruk dari variabel
yang hendak diukur. (c) Indikator-indikator tersebut harus lengkap untuk
mengukur suatu konstruk secara utuh.
Butir-butir instrumen yang ditulis untuk masing-masing indikator
harus benar-benar dapat mengukur secara tepat indikator yang hendak
diukur. Jumalah butir untuk mengukur setiap indikator harus disesuaikan
dengan bobot atau pentingnya masing-masing indikator sebagai penanda
konsep variabel yang hendak diukur.
Menyimak proses telah teoretis seperti telah dikemukakan, maka
proses validasi konstruk sebuah instrumen harus dilakukan melalui
penelaahan atau justifikasi pakar atau melalui penilaian sekelompok panel
yang terdiri dari orang-orang yang menguasai substansi atau konten dari
variabel yang hendak diukur.
c. Validitas Empiris
Validitas empiris sama dengan validitas kriteria yang berarti bahwa
validitas ditentukan berdasarkan kriteria, baik kriteria internal maupun
kriteria eksternal. Kriteria internal adalah tes atau instrumen itu sendiri
yang menjadi kriteria sedangkan kriteria eksternal adalah hasil ukur
instrumen atau tes lain diluar instrumen itu sendiri yang menjadi kriteria.
Ukuran lain yang sudah dianggap baku atau dapat dipercaya dapat pula
dijadikan sebagai kriteria eksternal.
Validitas yang ditentukan berdasarkan kriteria internal disebut
validitas internal sedangkan validitas yang ditentukan berdasarkan kriteria
eksternal disebut validitas eksternal. Validitas ksternal dapat dibedakan
lagi atas dua macam yaitu: (a) validitas kongkuren (concurrent validity),
dan (b) validitas prediktif (predictive validity).
(1) Validitas Internal
Validitas internal termasuk kelompok validitas kriteria yang
merupakan validitas yang diukur dengan besaran yang menggunakan
instrumen sebagai suatu kesatuan (keseluruhan butir) sebagai kriteria
untuk menentukan validitas item atau butir dari instrumen itu. Dengan
demikian validitas internal mempermasalahkan validitas butir atau item
suatu instrumen dengan menggunakan hasil ukur instrumen tersebut
sebagai suatu kesatuan sebagai kriteria, sehingga biasa juga disebut
validitas butir.
Validitas butir (validitas internal) diperlihatkan oleh seberapa jauh
hasil ukur butir tersebut konsisten dengan hasil ukur instrumen secara
keseluruhan. Oleh karena itu validitas butir tercermin pada besaran
koefisien korelasi antara skor butir dengan skor total instrumen. Jika
koefisien korelasi antara skor butir dengan skor total instrumen positif dan
signifikan maka butir tersebut dapat dianggap valid berdasarkan ukuran
validitas internal.
Apabila besaran koefisien korelasi antara skor butir dengan skor
total bernilai positif, makin besar koefisien korelasi maka validitas butir
juga makin tinggi. Koefisien korelasi yang tinggi antara skor butir dengan
skor total mencerminkan tingginya konsistensi antara hasil ukur
keseluruhan instrumen, atau dapat dikatakan bahwa butir instrumen
tersebut konvergen dengan butir-butir lain dalam mengukur suatu konsep
atau konstruk yang hendak diukur.
Untuk menghitung koefisien koreladi antara skor butir dengan skor
total instrumen digunakan rumus statistika yang sesuai dengan jenis skor
butir dari instrumen tersebut. Jika skor butir kontinum maka untuk
menghitung koefisien korelasi antara skor butir dengan skor total
instrumen digunakan koefisien korelasi product moment (r) yang
menggunakan rumus:
n XY   XY
r
  X    X  n Y    Y  
 n 2
2
2
2
Jika skor butir dikotomi (misalnya 0, 1) maka untuk menghitung
koefisien korelasi antara skor butir dengan skor total instrumen digunakan
koefisien korelasi biserial (rbis) yang menggunakan rumus:

rbis  X  X

i t p
S i
t q
i
Keterangan:
r bis = koefisien korelasi biserial antara skor butir soal nomor i
dengan skor total
X i = rata-rata skor total responden yang menjawab benar butir
soal nomor i
X t = rata-rata skor total semua responden
St = standar deviasi skor total semua responden
Pi = proporsi jawaban yang benar untuk butir soal nomor i
Qi = proporsi jawaban yang salah untuk butir soal nomor i
Nilai koefisien korelasi yang didapat untuk masing-masing butir, baik
butir yang mempunyai skor kontinum maupun butir yang mempunyai skor
dikotomi dibandingkan dengan nilai koefisien korelasi yang ada di tabel r
(rt) pada alpha tertentu misalnya α = 0,05. Jika koefisien korelasi skor
butir dengan skor total lebih besar dari koefisien korelasi dari tabel r,
koefisien korelasi butir signifikan dan butir tersebut dianggap valid secara
empiris.
(2) Validitas Eksternal
Kriteria eksternal itu dapat berupa hasil ukur instrument baku
(standar) atau instrument yang sudah dianggap baku. Validitas eksternal
diperlihatkan
oleh suatu besaran yang merupakan hasil perhitungan statistika.
Jika kita menggunakan hasil ukur instrument yang sudah baku sebagai
kriteria eksternal, maka validitas eksternal dari instrument yang kita
kembangkan diperoleh dengan jalan mengkorelasikan skor hasil ukur
instrument yang dikembangkan dengan hasil skor hasil ukur instrument
baku yang dijadikan kriteria. Makin tinggi koefisien korelasi yang
diperoleh, maka validitas instrument yang dikembangkan juga makin baik.
Kriteria yang digunakan untuk menguji valditas eksternal adalah nilai tabel
r (r tabel). Jika koefisien korelasi antara skor hasil ukur instrument yang
dikembangkan dengan skor hasil ukur instrument baku lebih besar
daripada r tabel maka instrument yang dikembangkan dapat dianggap
valid.
Validitas eksternal dapat dibedakan atas dua macam, yaitu validitas
prediktif dan validitas kongkuren. Contoh validitas prediktif : Jika kita
hendak menguji validitas tes masuk perguruan tinggi dengan
menggunakan indeks prestasi semester I sebagai kriteria eksternal,
karena indeks prestasi semester I merupakan performance masa yang
akan datang pada saat tes masuk. Jika koefisien korelasi antara tes
masuk dengan indeks prestasi semester I signifikan, maka tes masuk
tersebut dapat dikatakan valid berdasarkan ukuran validitas prediktif.
Contoh validitas kongkuren: Jika kita hendak menguji validitas tes
sumatif yang dimaksudkan untuk mengukur penguasaan materi
penguasaan materi pelajaran selama satu semester dengan
menggunakan hasil ulangan-ulangan harian semester yang bersamaan
sebagai kriteria eksternal. Karena nilai ulangan-ulangan harian tersebut
merupakan penampilan pada saat yang bersamaan dengan penampilan
yang akan diukur dengan tes sumatif yang hendak diuji validitasnya. Jika
koefisien korelasi antara skor tes sumatif (sebagai instrumen yang akan
diuji validitasnya) dengan nilai ulangan-ulangan harian (sebagai kriteria
eksternal) signifikan, maka tes sumatif tersebut dapat dikatakan valid
berdasarkan ukuran validitas kongkuren.
3. Reliabilitas
Suatu hasil pengukuran hanya dapat dipercaya apabila dalam
beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang
sama, diperoleh hasil pengukuran yang relative sama, selama aspek yang
diatur dalam diri subyek memang belum berubah.
Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat
dengan masalah eror pengukuran. Eror pengukuran sendiri menunjukkan
sejauh mana inkonsistensi hasil pengukuran terjadi apabila dilakukan
pengukuran ulang terhadap kelompok subyek yang sama. Sedangkan
konsep reliabilitas dalam arti reliabilitas hasil ukur berkaitan erat dengan
eror dalam pengambilan sampel yang mengacu pada inkonsistensi hasil
ukur apabila pengukuran dilakukan ulang pada kelompok yang berbeda.
Salah satu syarat agar hasil ukur suatu tes atau instrument dapat
dipercaya adalah tes tersebut harus mempunyai reliabilitas yang
memadai. Dalam buku ini reliabilitas dibedakan atas dua macam, yaitu:
Reliabilitas kosistensi tanggapan, dan Reliabilitas konsistensi gabungan
item.
a. Reliabilitas Konsistensi Tanggapan
Reliabilitas konsistensi tanggapan responden mempersoalkan
apakah tanggapan responden atau obyek ukur terhadap tes atau
instrumen tersebut sudah baik atau konsisten. Dalam hal ini apabila suatu
tes atau instrumen digunakan untuk melakukan pengukuran terhadap
obyek ukur kemudian dilakukan pengukuran kembali terhadap obyek ukur
yang sama, apakah hasilnya masih tetap sama dengan pengukuran
sebelumnya. Dengan kata lain apakah respons terhadap item-item itu
tetap mantap, konsisten atau tidak plin-plan.
Jika hasil pengukuran kedua menunjukkan ketidak konsistenan atau
plin-plan maka jelas hasil pengukuran itu tidak mencerminkan keadaan
obyek ukur yang sesungguhnya. Dengan sendirinya hal itu akan
menunjukkan bahwa hasil ukur tes atau instrumen tersebut tidak dapat
dipercaya atau dengan kata lain tidak reliable serta tidak dapat digunakan
sebagai ukuran untuk mengungkapakan ciri atau keadaan sesungguhnya
dan obyek pengukuran. Jika ternyata tanggapan itu tidak mantap atau
tidak konsisten, maka bukan berarti obyek ukurannya yang salah tetapi
kita menyalahkan alat ukur (tes atau instrumen) dengan mengatakan
bahwa alat ukurnya yang tidak reliable untuk mengukur obyek ukur
tersebut. Dengan kata lain bahwa tes memiliki reliabilitas rendah.
Untuk mengetahui apakah tanggapan terhadap tes atau instrumen
itu mantap, konsisten atau tidak plin-plan, dapat dilakukan dengan cara
memberikan tes yang sama secara berulang kali (dua kali) kepada obyek
ukur atau responden yang sama. Pengetesan dua kali merupakan syarat
minimal untuk mengetahui apakah tanggapan obyek ukur terhadap tes
tersebut konsisten atau tidak. Dalam pelaksanaan pengetesan dua kali ini
dapat ditempuh berbagai cara yaitu kita melakukan pengetesan dua kali
dengan tes sama terhadap obyek ukur yang sama, atau dengan
melakukan pengetesan sekali dengan menggunakan dua tes yang item-
itemnya setara. Jika kita menggunakan pengetesan sekali maka
kesamaan atau kesetaraan tes yang digunakan merupakan syarat mutlak
yang harus dipenuhi, karena kemantapan atau konsitensi tanggapan
terhadap item-tem itulah yang akan diperiksa.
Jika item-item dalam dua kali pengukuran itu tidak sama atau tidak
setara, maka kita akan menemukan konsistensi tanggapan terhadap dua
hal yang jelas berbeda. Dan ini bukan merupakan tujuan atau tugas
pemeriksaan reliabilitas.
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan
responden terhadap tes yaitu:
(1) Teknik test-retest.
Test-retest adalah pengetesan dua kali dengan menggunakan suatu
tes yang sama pada waktu yang berbeda.
(2) Teknik belah dua.
Pada teknik belah dua ini pengukuran dilakukan dengan dua
kelompok item yang setara pada saat yang sama. Karena setiap
kelompok item merupaka separuh dari seluruh tes, maka biasanya
kelompok item pertama diambil dari item-item tes yang bernomor ganjil,
sedangkan kelompok item yang kedua diambil dari item-item tes yang
bernomor genap. Perlu diketahui bahwa reliabilitas dengan teknik ini
sangat relative, karena reliabilitas akan tergantung pada cara penomoran
dan pengelompokkan item yang diambil.
(3) Bentuk ekivalen.
Disini pengukuran dilakukan dengan menggunakan dua tes yang
dibuat setara kemudian diberikan kepada responden atau obyek tes
dalam waktu yang bersamaan. Skor dari kedua kelompok item tes
tersebut dikorelasikan untuk mendapatkan reliabilitas tes.
4. Reliabilitas Konsistensi Gabungan Item
Reliabilitas konsistensi gabungan item berkaitan dengan
kemantapan atau konsistensi antara item-item suatu tes. Hal ini dapat
diungkapakan dengan pertanyaan, apakah terhadap obyek ukur yang
sama, item yang satu menunjukkan hasil ukur yang sama dengan item
yang lainnya? Dengan kata lain bahawa terhadap bagian obyek ukur yang
sama, apakah hasil ukur item yang satu tidak kontradiksi dengan hasil
ukur item yang lain. Jika terhadap bagian obyek ukur yang sama, hasil
ukur melalui item yang satu kontradiksi atau tidak konsisten dengan hasil
ukur melalui item yang lain maka pengukuran dengan tes (alat ukur
sebagai suatu kesatuan itu tidak dapat dipercaya). Dengan kata lain tidak
reliabel dan tidak dapat digunakan untuk mengungkap ciri atau keadaan
yang sesungguhnya dari obyek ukur.
Hasil pengukuran pada bagian obyek ukur yang sama antara item
yang satu dengan item yang lain saling kontradiksi atau tidak konsisten
maka kita jangan menyalahkan obyek ukur, melainkan alat ukur (tes) yang
diperslahkan, dengan mengatakan bahwa tes tersebut tidak reliabel
terhadap obyek yang diukur, atau dengan kata lain tes tersebut memiliki
reliabilitas yang rendah.
Koefisien reliabilitas konsistensi gabungan item dapat dihitung
dengan menggunakan: Rumus Kuder-Richardson, yang dikenal dengan
nama KR-20 dan KR-21
KR – 20 :

r

 1  pq
 k 1  S 2 
k =banyaknya item
p = proporsi subjek yang menjawab item dengan benar
q = proporsi subjek yang menjawab item dengan salah (q = 1 – p)
S2 = varians dari tes

KR – 21 :

 k X (k  X 

r 1 k.S 2 
k 1
  
k =banyaknya item
X = Mean (rata-rata total skor)
S2 = varians dari tes
(a) Rumus koefisien Alpha atau Alpha Cronbach
 k
  S 2
r
1  2 
i

 k 1  S t 
k =banyaknya item
Si 2 = varians butir
St2 = varians total skor

(b) Rumus reliabilitas Hoyt, yang menggunakan analisis


variansi.
 Vs 
r  1 V 
 r
VR = Varians responden
VS = Varians sisa

Anda mungkin juga menyukai