Evaluasi
pembelajaran
suwahono
aa
[Pick the date]
Suwahono dokumen 2
Meskipun seorang peneliti berusaha secermat mungkin, namun
terjadinya kesalahan dalam pengukuran masih mungkin, sehingga diperlukan
pemahaman tentang kesalahan-kesalahan yang mungkin terjadi dalam
pengukuran. Terdapat dua tipe kesalahan dalam pengukuran yaitu Random
error yakni ketidak ajegan (unreliability) pengukuran dimana pengulangan
pengukuran menghasilkan hasil yang berbeda, hal ini terjadi apabila
pengacakan sampel kurang representatif atau karena ukuran sampel yang
terlalu kecil dan Non-random error yakni ketidak validan (invalidity) atau bias
dalam pengukuran dimana instrumen pengukuran tidak mengukur apa yang
seharusnya diukur. Penelitian yang baik adalah penelitian yang
menggunakan pengukuran dengan menghilangkan atau paling tidak
mengurangi kedua tipe kesalahan tersebut.
Dalam analisa data yang menggunakan statistik pengukuran adalah
hal yang sangat penting karena merupakan sumber angka-angka yang
dipakai dalam analisa statistik, disamping sebagai pedoman dalam
penentuan teknik analisis statistik yang dapat dipergunakan. Secara umum
pengukuran diartikan sebagai proses membedakan sesuatu (The process by
which things are differentiated), sedang secara operasional, Pengukuran
adalah penerapan aturan bilangan pada obyek atau fenomena tertentu,
dalam suatu penelitian Kuantitatif pengukuran dikenakan pada variabel yang
kita teliti. Dengan kata lain pengukuran bermakna menandai nilai-nilai suatu
variabel dengan tanda bilangan tertentu secara sistematis.
Memang diakui bahwa apabila hasil suatu pengukuran dapat
dikuantifikasikan serta dinyatakan dalam bentuk angka, ambiguitas bahasa
akan sangat berkurang (seperti “saya tinggi” dengan “Saya 1,62 cm tinggi),
namun demikian dalam proses pengukuran tidak selamanya harus
menggunakan penandaan dalam bentuk angka (Kuantifikasi), yang penting
tergambar suatu perbedaan posisi yang satu dengan yang lain dalam suatu
kontinum nilai. ketentuan penerapan nilai suatu variabel dengan tanda
bilangan atau lambang disebut skala (Levels of Measurement). Dalam
Suwahono dokumen 3
hubungan ini terdapat beberapa skala pengukuran (Terkadang disebut jenis
data atau tipe variabel berdasarkan tingkat pengukuran) yang perlu dipahami
oleh seorang peneliti
Skala Nominal. Adalah skala yang hanya mendasarkan pada
pengelompokan atau pengkategorian peristiwa atau fakta dan apabila
menggunakan notasi angka hal itu sama sekali tidak menunjukan perbedaan
kuantitatif melainkan hanya menunjukan perbedaan kualitatif. Banyak
variabel dalam penelitian sosial menggunakan skala nominal seperti Agama,
Jenis kelamin, Tempat lahir, asal sekolah dsb. Adapun ciri dari skala nominal
adalah : (1) kategori data bersifat mutually exclusive (saling memisah), (2)
Kategori data tidak mempunyai aturan yang logis (bisa sembarang).
Skala Ordinal. Adalah pengukuran dimana skala yang dipergunakan
disusun secara terurut dari yang rendah sampai yang tinggi menurut suatu
ciri tertentu, namun antara urutan (ranking) yang satu dengan yang lainnya
tidak mempunyai jarak yang sama, skala ordinal banyak dipergunakan dalam
penelitian sosial dan pendidikan terutama berkaitan dengan pengukuran
kepentingan, persepsi, motivasi serta sikap, apabila mengukur sikap
responden terhadap suatu Kebijakan pendidikan , responden dapat diurutkan
dari mulai Sangat setuju (1), Setuju (2), Tidak berpendapat (3), Kurang Setuju
(4), dan Tidak setuju (5), maka angka-angka tersebut hanya sekedar
menunjukan urutan responden, bukan nilai untuk variabel tersebut. Adapun
ciri dari skala ordinal adalah : (1) kategori data bersifat saling memisah, (2)
kkategori data mempunyai aturan yang logis, (3) kategori data ditentukan
skalanya berdasarkan jumlah karakteristik khusus yang dimilikinya.
Skala Interval. Adalah skala pengukuran dimana jarak satu tingkat
dengan tingkat lainnya sama, oleh karena itu skala interval dapat juga disebut
skala unit yang sama (equal unit scale), contoh yang sangat dikenal adalah
temperatur. Adapun ciri-ciri skala interval adalah : (1) kategori data bersifat
saling memisah, (2) kategori data mempunyai aturan yang logis, (3) kategori
data ditentukan skalanya berdasarkan jumlah karakteristik khusus yang
Suwahono dokumen 4
dimilikinya, (4) perbedaan karakteristik yang sama tergambar dalam
perbedaan yang sama dalam jumlah yang dikenakan pada kategori, (5)
angka nol hanya menggambarkan suatu titik dalam skala (tidak punya nilai
Nol absolut).
Skala Rasio. Skala interval yang benar-benar memiliki nilai nol mutlak
disebut skala rasio, dengan demikian skala rasio menunjukan jenis
pengukuran yang sangat jelas dan akurat (precise). Jika kita memiliki skala
rasio, kita dapat menyatakan tidak hanya jarak yang sama antara satu nilai
dengan nilai lainnya dalam skala, tapi juga tentang jumlah proporsional
karakteristik yang dimiliki dua obyek atau lebih, dan contoh untuk skala ini
adalah uang. Adapun ciri-ciri dari skala rasio adalah : (1) kategori data
bersifat saling memisah, (2) kategori data mempunyai aturan yang logis, (3)
kategori data ditentukan skalanya berdasarkan jumlah karakteristik khusus
yang dimilikinya, (4) perbedaan karakteristik yang sama tergambar dalam
perbedaan yang sama dalam jumlah yang dikenakan pada kategori, (5)
angka nol menggambarkan suatu titik dalam skala yang menunjukan
ketiadaan karakteristik (punya nilai Nol absolut).
Bagi seorang peneliti pemahaman secara tepat tentang skala
pengukuran sangat penting karena dua alasan : Pertama, tiap skala
pengukuran memberikan jumlah informamsi yang berbeda, skala rasio
memberi informasi lebih banyak dibanding interval, interval lebih banyak
dibanding ordinal, dan ordinal memberi informasi lebih banyak dibanding
skala pengukuran nominal, oleh karena itu, jika memungkinkan peneliti
sebaiknya menggunakan skala pengukuran yang dapat memberikan
informasi paling maksimum yang diperlukan untuk menjawab permasalahan
penelitian. Kedua, beberapa jenis prosedur analisa statistik tidak tepat untuk
dipergunakan pada skala pengukuran yang berbeda, untuk itu kejelasan
penentuan skala pengukuran akan menentukan jenis analisis statistik yang
bagaimana yang akan dipergunakan.
Suwahono dokumen 5
Gambar 2.1. Empat jenis Skala Pengukuran
SKALA CONTOH
Jenis Kelamin
(Karakteristik : hanya data
Nominal Kelompok dan Label,
melaporkan frekuensi atau
prosentase)
Uang
(Karakteristik : mencakup
Rasio seluruh karakteristik di atas
ditambah nilai nol
mutlak/yang sebenarnya)
0 Rp. 10 Rp.20 Rp.30 Rp.40
Suwahono dokumen 6
memerlukan upaya mengempiriskan konsep-konsep tersebut agar dapat
dilakukan pengukuran.
Dengan demikian agar suatu konsep dapat diukur maka diperlukan
pengetahuan tentang unsur-unsur yang dapat dijadikan petunjuk (indikator)
terhadap suatu konsep, oleh karena itu konsep dan indikator merupakan dua
hal yang penting dalam suatu penelitian, keduanya harus menunjukan
validasi konsep yaitu penyimpulan yang valid atas suatu konsep (yang tidak
dapat diobservasi) atas dasar indikator (yang dapat diobservasi).
Seorang peneliti tidak meneliti konsep secara langsung melainkan
secara tidak langsung melalui pengumpulan data sesuai dengan indikator-
indikator yang telah ditentukan, untuk itu indikator harus benar-benar dapat
menggambarkan konsepnya, dalam hubungan ini langkah penting dalam
penentuan indikator adalah dengan pengkajian definisi dan teori yang
berkaitan dengan konsep tersebut . Penentuan indikator dapat dilakukan
melalui : 1). penelusuran akibat-akibat dari suatu konsep, hasilnya disebut
Reflective Indicator/Reflector/Effect indicator ; dan 2). Penelusuran sebab-
sebab dari suatu konsep, hasilnya disebut Formative indicator/Cause
indicator. Cara mana saja yang dipergunakan tidaklah menjadi soal yang
penting indikator-indikator yang dipilih/ditentukan harus merupakan
representasi dari konsep-konsep yang menjadi fokus penelitian.
Karena konsep/variabel tidak dapat diukur langsung, maka langkah
penentuan satuan-satuan yang bisa diobservasi menjadi sangat penting
dalam suatu penelitian, dalam hubungan ini terdapat dua cara dalam proses
tersebut yaitu :
1. melalui penjabaran konsep dari mulai Konsep Teori, Konsep
Empiris, Konsep Analitis, dan Konsep Operasional.
2. melalui penelusuran dari Konsep, Dimensi, Indikator, dan item
pertanyaan/pernyataan.
Kedua cara tersebut pada prinsipnya akan menghasilkan output yang sama,
untuk lebih jelasnya berikut ini akan dikemukakan suatu contoh :
Suwahono dokumen 7
Penjabaran Konsep
kedua cara tersebut akhirnya menghasilkan satuan yang sama dalam hal
obyek yang dapat diukur untuk suatu penelitian, kalau melalui cara
penjabaran konsep diistilahkan dengan konsep empiris, sedangkan kalau
dengan cara Penelusuran konsep disebut indikator. Semua ini jelas sangat
diperlukan agar suatu penelitian dapat memperoleh suatu data untuk
dianalisa sampai diperoleh suatu kesimpulan yang berlaku atau dapat
diterapkan pada konsep-konsep yang menjadi fokus penelitian.
Suwahono dokumen 8
A. Pengertian Sikap
Sikap (attitude) merupakan kecenderungan seseorang untuk bertindak
terhadap obyek tertentu, para akhli telah memberikan definisi yang bervariasi
terhadap konsep sikap, Thurstone sebagai pelopor dalam pengukuran sikap
mendefinisikan sikap sebagai berikut :
o attitude… “the sum total of man’s inclinations and feelings,
prejudice and bias, preconceived notion, ideas, fears, threats, and
conviction about any specified topic” (definisi tahun 1928)
o attitude is the affect for or against a psychological object (definisi
tahun 1931)
o attitude…”the intensity of positive or negative affect for or against a
psychological object” (definisi tahun 1946)
definisi-definisi tersebut oleh Daniel J. Mueller dirumuskan kembali sebagai
berikut :
o Attitude is :
1. affect for or against
2. evaluation of
3. like or dislike
4. positiveness or negativeness toward a psychological object.
pengertian di atas menunjukan bahwa suatu sikap merupakan suatu
perasaan,penilaian, kesukaan atau ketidak sukaan, kepositipan atau
kenegatipan terhadap suatu obyek psikologis tertentu. Sementara itu
Bogardus mendefinisikan Sikap sebagai a tendency to act toward or
against some environmental factor.
B. Karakteristik Sikap
Dalam bukunya Principles of Educational and Psychological
Measurement and Evaluation, sebagaimana dikutip oleh Saifuddin Azwar
G. Sax menyatakan bahwa terdapat beberapa karakteristik dari sikap yaitu :
Suwahono dokumen 9
o Arah. Artinya sikap terpilah pada dua arah (kesetujuan atau
ketidaksetujuan; mendukung atau tidak mendukung; memihak atau
tidak memihak)
o Intensitas. Artinya kedalaman atau kekuatan sikap , kesamaan
arah bisa menunjukan intensitas yang berbeda.
o Keluasan. Artinya kesetujuan atau ketidaksejuan dapan mencakup
aspek keseluruhan atau hanya aspek bagian yang sangat spesifik
dari suatu obyek sikap
o Konsistensi. Yaitu kesesuaian antara pernyataan sikap yang
dikemukakan dengan responsnya terhadap obyek sikap dimaksud.
C. Dimensi Sikap
o Dimensi Kognitif (Keyakinan). Ekspresi keyakinan terhadap suatu
obyek sikap tertentu
o Dimensi Afektif (perasaan). Ekspresi perasaan secara langsung
terhadap obyek sikap tertentu
o Dimensi Konatif (kecenderungan prilaku). Pernyataan maksud atau
preferensi prilaku berkaitan dengan obyek tertentu, baik prilaku
personal maupun preferensi prilaku untuk kegiatan sosial.
Contoh Item pernyataan :
Keyakinan : Biaya pendidikan di SD A tidak memberatkan
Perasaan : Saya menyukai Lingkungan di SD A
Konatif : Individu – Saya akan menyekolahkan anak saya ke SD
A jika sudah waktunga
sosial -- Pemerintah harus memberikan beasiswa
bagi Siswa yang kurang mampu
Suwahono dokumen 10
1. menolak pernyataan yang dihubungkan dengan masa lalu daripada
saat sekarang
2. menolak pernyataan yang faktual atau yang baik untuk
diinterpretasikan sebagai faktual
3. menolak pernyataan yang dapat diinterpretasikan lebih dari satu
4. menolak pernyataan yang tidak relevan kepada obyek psikologi
5. menolak pernyataan yang dapat diterima oleh hampir semua orang
atau bahkan tidak satupun yang menerima
6. memilih pernyataan yang dianggap memiliki pilihan dari skala efek
mengenai minat
7. menjaga bahasa yang sederhana dari pernyataan untuk jelas dan
langsung (tidak berbelit-belit)
8. pernyataan haruslah pendek kurang lebih dua puluh kata
9. pernyataan haruslah memiliki suatu pemikiran
10. menolak pernyataan yang mengandung kata-kata : semua; selalu;
tidak satupun; tidak pernah; yang sering menimbulkan
ketidakjelasan
11. kata-kata : hanya, benar/tepat, hampir, dan kata-kata lain yang
hampir sama artinya harus digunakan dengan hati-hati dalam
menulis pernyataan
12. bila mungkin pernyataan harus dalam bentuk kalimat yang
sederhana sehingga tidak merupakan bentuk yang kompleks dan
berlebihan
13. menolak penggunaan kata-kata yang tidak mempunyai arti
14. menolak penggunaan negatif rangkap.
Suwahono dokumen 11
1. Method of equal appearing Interval (Thurstone)
Metode ini dikemukakan oleh Edward pengarang Buku Technique of
attitude scale construction. Menurut Mar’at cara ini biasanya digunakan bila
pernyataan yang akan diskala adalah cukup banyak, sehingga sukar untuk
dilakukan penilaian secara perbandingan, sementara itu Saifuddin Azwar
menyatakan bahwa cara penskalaan ini mengacu pada model skala
Thurstone yang mengacu pada pendekatan penskalaan Stimulus serta
penilaiannnya dilakukan oleh kelompok penilai tertentu yang diberi tugas
membaca dengan seksama setiap pernyataan untuk kemudian memberikan
penilaian atau perkiraan tingkat favorable atau tidaknya suatu pernyataan
dalam suatu Psychological Continuum.
Psychological Continuum tersebut disusun dalam bentuk abjad
dengan asumsi bahwa jarak/interval antara hurup dengan huruf setara mulai
dari yang tidak Favorable sampai yang Favorable dimulai dari abjad A
sampai K, dimana abjad F merupakan bagian yang netral, dalam prakteknya
yang tidak Favorable bernilai 1 dan yang Favorable bernilai 11, akan tetapi
pilihan terhadap suatu nilai tertentu tidak lantas dijadikan nilai skala suatu
item tertentu melainkan sebagai bahan untuk diolah kembali, adapun
kontinum skala tersebut nampak sebagai berikut
A B C D E F G H I J K
1 2 3 4 5 6 7 8 9 10 11
Tak Favorable Netral Favorable
Suwahono dokumen 12
Alternatif Pilihan
No Item A B C D E F G H I J K
1 2 3 4 5 6 7 8 9 10 11
F 4 5 6 8 10 12 30 6 8 9 2
1 P 0.04 0.05 0.06 0.08 0.10 0.12 0.30 0.06 0.08 0.09 0.02
Pk 0.04 0.09 0.15 0.23 0.33 0.45 0.75 0.81 0.89 0.98 1.00
Keterangan :
F = Frekuensi, jumlah penilai yang memilih tiap-tiap alternatif
P = Proporsi tiap Frekuensi pilihan dengan jumlah penilai/penjawab
F dibagi N (F : N)
Pk = Proporsi Kumulatif yaitu penambahan besarnya proporsi dengan
proporsi sebelumnya, misal 0.09 = 0.04 + 0.05
Keterangan :
S = Skala nilai dari pernyataan (Median)
pkb = Proporsi kumulatif di bawah posisi median
pm = proporsi pada posisi Median
i = interval (dalam hal ini sama dengan 1)
apabila diterapkan pada contoh dalam tabel 2.1 akan nampak sebagai
berikut :
Suwahono dokumen 13
Nilai 6.67 ini merupakan nilai skala untuk item nomor 1 tersebut, pencarian
nilai ini dilakukan sebanyak item-item yang tertuang dalam Skala sikap yang
akan dipergunakan dalam penelitian. Disamping itu untuk mengetahui variasi
distribusi dapat dilakukan perhitungan rentang antar kuartil (K 75 - k25) dengan
rumus :
Suwahono dokumen 14
bersangkutan (responden/kelompok penilai). Adapun nilai Q lebih
dimaksudkan untuk memilih Item-item, dimana sebaiknya dipilih yang punya
nilai Q kecil sebab ini menunjukan tingkat kesepakatan yang tinggi di antara
kelompok penilai.
Suwahono dokumen 15
Contoh Skala Sikap yang dibuat Thurstone tahun 1931
Skala model Likert, kategori respon terdiri dari lima, mulai dari Sangat
setuju, Setuju, Tidak pasti/tidak memutuskan, tidak setuju, sangat tidak
setuju, bila pernyataan itu sifatnya posistif diberi skor 5,4,3,2,1, dan bila
pernyataan negatif diberi skor 1,2,3,4,5. Adapun prosedur konstruksi skala
model Likert adalah :
e. Korelasikan skor tiap item dengan skor total untuk tiap responden
Suwahono dokumen 17
Contoh Skala Sikap Model Likert
Attitude About Marijuana
Indicate on the line to the the left of each statement how much you agree
or disagree with it. Please mark every item. Use the following response
category
A = Strongly agree.
B = Agree.
C = Uncertain.
D = Disagree.
E = Strongly disagree
Suwahono dokumen 19
Contoh Pengkonversian nilai skala.
Penjelasan
1. Hitung frekuensi setiap alternatif respon untuk seluruh responden. Dalam
contoh 2.1 : yang menjawab STS = 6 orang; TS = 29; R = 42; S = 103;
SS = 20; jumlah total 200 (banyaknya responden). Dalam contoh 2.2.
yang menjawab SS = 6; S = 15; TS = 20; STS = 9; jumlah total 50
(banyaknya responden)
2. hitung proporsi tiap alternatif. Dalam contoh 2.2 untuk alternatif SS
dengan f = 6, proporsinya (p) adalah 6 : 50 = 0.120, perhitungan ini
dilakukan untuk setiap alternatif respon.
3. setelah proporsi untuk setiap alternatif dihitung, kemudian dilanjutkan
dengan penghitungan proporsi kumulatif (pk) dengan cara menjumlahkan
proporsi alternatif dengan proporsi sebelumnya, misalnya untuk pk 0.420
diperoleh dengan cara menjumlahkan 0.300 dengan 0.120, demikian juga
untuk alternatif lainnya.
Suwahono dokumen 20
4. kemudian dihitung pk tengahnya (pkt) dengan cara menjumlahkan ½ p
alternatif yang sedang dicari pkt-nya dengan pk alternatif sebelumnya.
Misalnya untuk pkt = 0.620 (contoh 2.2) diperoleh dari ½ x 400 + 420.
5. selanjutnya untuk tiap-tiap pkt dicari nilai z nya dengan menggunakan
Tabel Deviasi Normal (terlampir), contoh nilai z = - 2.170 (contoh 2.1)
untuk pkt = 0.015, diperoleh dengan cara melihat pertemuan antara baris
yang bernilai 0.01 dengan kolom yang bernilai 5.
6. sesudah diperoleh nilai z untuk masing-masing alternatif respon (pkt),
maka untuk memperoleh nilai skala, nilai z yang pertama (alternatif
dengan nilai skala terkecil) angka mutlaknya ditambahkan pada nilai z tiap
alternatif sedangkan untuk nilai skala yang paling kecil langsung
ditetapkan sesuai judgment yang telah ditentukan (nilai 0 untuk contoh
2.1. ; dan 1 untuk contoh 2.2.), apabila nilai skala dimulai dari 0, nilai z
yang diperoleh langsung ditambahkan, sedangkan jika nilai skala terkecil
sama dengan 1, maka nilai z harus ditambah nilai 1 dahulu baru
kemudian ditambahkan pada masing-masing nilai z berikutnya. Misal
(contoh 2.2.) nilai 3.896 merupakan hasil dari 1.341 + 2.555. sesudah tiap
alternatif respon memperoleh nilainya kemudian dibulatkan seperti terlihat
dalam Nilai Skala Konversi. Dari nilai inilah seluruh analisa data
dilakukan.
Langkah pengkonversian nilai skala dengan memberikan bobot dalam
suatu deviasi normal akan menghasilkan suatu nilai interval yang tepat dalam
memposisikan masing-masing kategori/alternatif respon dalam suatu
kontinum, namun demikian penggunaan cara penentuan nilai tanpa konversi
pun dapat saja dilakukan dengan alasan kepraktisan, disamping Likert sendiri
pada tahun 1932 telah menunjukan penemuannya bahwa skor kelompok
responden yang menggunakan cara konversi berkorelasi sebesar 0.99
dengan penentuan skor cara biasa (cara sederhana), namun demikian untuk
kemantapan analisa terutama analisis statistik, pengkonversian nilai skala
nampaknya diperlukan. Sementara itu Saifuddin Azwar menyatakan bahwa
Suwahono dokumen 21
apabila skala sikap yang disusun tidak untuk digunakan sebagai instrumen
pengukuran yang menyangkut keputusan yang penting sekali, seperti
penelitian pendahuluan atau studi kelompok secara kecil-kecilan, kadang-
kadang demi kepraktisan, penyusun skala sikap dapat menempuh cara
sederhana untuk menentukan nilai skala (tanpa konversi dengan deviasi
normal)
UNTUK DIDISKUSIKAN
No Item A B C D E F G
1 4 6 12 20 18 7 3
F
Suwahono dokumen 22
2.2. Instrumen Penelitian
Suwahono dokumen 24
Kuesioner. Instrumen penelitian dalam bentuk pertanyaan yang
biasanya dimaksudkan untuk mendapatkan informasi berkaitan dengan
pendapat, aspirasi, persepsi, keinginan, keyakinan dan lain-lain secara
tertulis, dan apabila pertanyaan dan jawaban dilakukan secara lisan disebut
Wawancara. Dalam suatu penelitian kedua instrumen ini sering
dikombinasikan dengan maksud untuk lebih meyakinkan.
Skala. Merupakan alat untuk mengukur nilai/keyakinan, sikap dan hal-
hal yang berkaitan dengan personological Variable, instrumen bentuk skala
biasanya disusun dalam bentuk pernyataan pada suatu kontinum nilai
tertentu, umumnya bentuk skala dipakai untuk mengukur sikap (skala sikap),
atau skala lainnya (tergantung pada konsep yang ingin diukur sesuai dengan
fokus/masalah penelitian).
Instrumen-instrumen penelitian di atas merupakan sebagian dari jenis-
jenis instrumen lainnya, namun dalam penelitian kuantitatif (dengan obyek
penelitian yang cukup besar) instrumen tersebut sangat sering dipergunakan
dan sangat aplikabel untuk penerapan teknik analisis dengan statistik.
Adapun instrumen lainnya yang bisa dipergunakan dalam suatu penelitian
dapat dilihat dalam tabel berikut :
Suwahono dokumen 25
sebagaimana diketahui bahwa instrumen merupakan alat ukur yang
digunakan untuk mendapatkan informasi tentang variasi karakteristik variabel
secara obyektif. Instrumen mempunyai peranan yang sangat penting dalam
suatu penelitian karena kualitas data (berarti juga kualitas hasil penelitian)
sangat ditentukan/dipengaruhi oleh kualitas instrumen yang digunakan. Oleh
karena itu untuk mendapatkan hasil penelitian yang dapat dipertanggung
jawabkan diperlukan instrumen yang dapat dipertanggungjawabkan pula,
dalam hubungan ini Instrumen penelitian harus memenuhi kriteria Validitas
dan Reliabilitas agar penggunaannya dalam suatu penelitian dapat
menghasilkan data/informasi yang akurat dan obyektif.
2.3.1. Validitas
Validitas atau kesahihan menunjukan pada kemampuan suatu
instrumen (alat pengukur) mengukur apa yang harus diukur (…. a valid
measure if it succesfully measure the phenomenon), seseorang yang ingin
mengukur tinggi harus memakai meteran, mengukur berat dengan
timbangan, meteran, timbangan merupakan alat ukur yang valid dalah kasus
tersebut. Dalam suatu penelitian yang melibatkan variabel/konsep yang tidak
bisa diukur secara langsung, maslah validitas menjadi tidak sederhana, di
dalamnya juga menyangkut penjabaran konsep dari tingkat teoritis sampai
tingkat empiris (indikator), namun bagaimanapun tidak sederhananya suatu
instrumen penelitian harus valid agar hasilnya dapat dipercaya.
Mengingat pentingnya masalah validitas. Maka tidak mengherankan
apabila Para Pakar telah banyak berupaya untuk mengkaji masalah validitas
serta membagi validitas ke dalam beberapa jenis, terdapat perbedaan
pengelompokan jenis-jenis validitas, Elazar Pedhazur menyatakan bahwa
validitas yang umum dipakai tripartite classification yakni Content, Criterion
dan Construct, sementara Kenneth Bailey mengelompokan tiga jenis utama
validitas yaitu : Face validity, Criterion Validity, dan construct validity, dengan
catatan face validity cenderung dianggap sama dengan content validity.
Berikut ini akan dikemukakan beberapa jenis validitas yaitu :
Suwahono dokumen 26
Validitas Rupa (Face validity). Adalah validitas yang menunjukan
apakah alat pengukur/instrumen penelitian dari segi rupanya nampak
mengukur apa yang ingin diukur, validitas ini lebih mengacu pada bentuk dan
penampilan instrumen. Menurut Djamaludin Ancok validitas rupa amat
penting dalam pengukuran kemampuan individu seperti pengukuran
kejujuran, kecerdasan, bakat dan keterampilan.
Validitas isi (Content Validity). Valditas isi berkaitan dengan
kemampuan suatu instrumen mengukur isi (konsep) yang harus diukur. Ini
berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau
variabel yang hendak diukur. Misalnya test bidang studi IPS, harus mampu
mengungkap isi bidang studi tersebut, pengukuran motivasi harus mampu
mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan
demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan
validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar ini
Dia berpendapat bahwa validitas isi berbeda dengan validitas rupa yang
kurang menggunakan analisis logis yang sistematis, lebih lanjut dia
menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga
mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
Validitas kriteria (Criterion validity). Adalah validasi suatu instrumen
dengan membandingkannya dengan instrumen-pengukuran lainnya yang
sudah valid dan reliabel dengan cara mengkorelasikannya, bila korelasinya
signifikan maka instrumen tersebut mempunyai validitas kriteria. Terdapat
dua bentuk Validitas kriteria yaitu : Validitas konkuren (Concurrent validity),
Validitas ramalan (Predictive validity). Validitas konkuren adalah
kemampuan suatu instrumen pengukuran untuk mengukur gejala tertentu
pada saat sekarang kemudian dibandingkan dengan instrumen pengukuran
lain untuk konstruk yang sama. Validitas ramalan adalah kemampuan suatu
instrumen pengukuran memprediksi secara tepat dengan apa yang akan
terjadi di masa datang. Contohnya apakah test masuk sekolah mempunyai
validitas ramalan atau tidak ditentukan oleh kenyataan apakah terdapat
Suwahono dokumen 27
korelasi yang signifikan antara hasil test masuk dengan prestasi belajar
sesudah menjadi siswa, bila ada, berarti test tersebut mempunyai validitas
ramalan.
Validitas konstruk (Construct Validity). Konstruk adalah kerangka dari
suatu konsep, validitas konstruk adalah validitas yang berkaitan dengan
kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang
diukurnya. Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas
konstruk) merupakan yang terluas cakupannya dibanding dengan validasi
lainnya, karena melibatkan banyak prosedur termasuk validasi isi dan validasi
kriteria.
Lebih jauh Jack R. FraenkelI meneyatakan bahwa untuk mendapatkan
validitas konstruk ada tiga langkah di dalamnya yaitu :
1. Variabel yang akan diukur harus didefinisikan dengan jelas
2. Hipotesis, yang mengacu pada teori yang mendasari variabel
penelitian harus dapat membedakan orang dengan tingkat gradasi
yang berbeda pada situasi tertentu
3. Hipotesis tersebut diuji secara logis dan empiris.
Dalam upaya memperoleh validitas konstruk, maka seorang peneliti
perlu mencari apa saja yang menjadi suatu kerangka konsep agar dapat
menyusun tolok ukur operasional konsep tersebut. Pencarian kerangka
konsep menurut Djamaludin Ancok dapat ditempuh beberapa cara :
1. Mencari definisi-definisi konsep yang dikemukakan oleh para akhli
yang tertulis dalam buku-buku literatur.
2. Mendefinisikan sendiri konsep yang akan diukur, jika tidak
diperoleh dalam buku-buku literatur
3. Menanyakan definisi konsep yang akan diukur kepada calon
responden atau orang-orang yang memiliki karakteristik yang sama
dengan responden.
Mengingat pentingnya pendefinisian suatu konsep yang ingin diukur,
maka seorang peneliti perlu mencermatinya, sebab definisi suatu konsep
Suwahono dokumen 28
perlu dikembangkan dari mulai definisi teoritis, definisi empiris, sampai
definisi operasional (dapat dipadankan dengan konsep teori, konsep empiris,
konsep analitis/operasional, atau dengan konsep, dimensi, dan indikator)
pemahaman definisi tersebut dapat dijadikan awal yang strategis untuk
penjabaran konsep sampai diperoleh indikator, untuk kemudian disusun item-
item yang diperlukan untuk sebuah instrumen penelitian.
Sementara itu Elazar J. Pedhazur mengemukakan tiga pendekatan
dalam Validasi konstruk yaitu : 1). Logical analysis; 2). Internal structure
analysis; 3). Cross-structure analysis. Analisis logis dalam konteks validasi
konstruk dimaksudkan untuk membentuk hipotesis pembanding sebagai
alternatif penjelasan berkaitan dengan konstruk/konsep yang akan diukur,
hubungan antar konsep dan yang sejenisnya. Dalam pendekatan ini langkah
yang diperlukan adalah pendefinisian konstruk/konsep, penentuan
kesesuaian isi item dengan indikator, serta penentuan prosedur pengukuran.
Analisis struktur internal merupakan pendekatan kedua dalam validasi
konstruk, analisis ini berkaitan dengan validitas indikator dari suatu
konsep/konstruk, artinya indikator-indikator yang digunakan bersifat homogin
(dalam tingkatan minimum) serta mengukur konsep yang sama (terdapatnya
kesesuaian antara indikator-indikator dengan konsepnya).Sementara itu analisis
struktur silang berkaitan dengan pengkajian analisis internal dari masing-
masing konsep terhubung (yang unobservable) yang dihubungkan pada
tataran empirisnya (indikator), sebab pada tataran inilah suatu hipotesis diuji.
2.3.1.1. Perhitungan/pengujian Validitas Instrumen
Apabila langkah-langkah tersebut di atas telah dilakukan, paling tidak
langkah penjabaran konsep yang kemudian diikuti dengan penyusunan item-
item instrumen, maka perhitungan statistik dapat dilakukan untuk
perhitungan/pengujian validitas instrumen pengukuran. Perhitungan ini
dimaksudkan untuk mengetahui konsistensi internal (sering juga disebut
validitas item atau discriminating power/daya diskriminasi item), dalam arti
sampai sejauh mana item-item mampu membedakan antara individu yang
Suwahono dokumen 29
memiliki dan tidak memiliki sifat dari item pengukuran, hal ini berarti juga
bahwa item-item dalam instrumen mengukur aspek yang sama. Dalam
hubungan ini langkah yang dilakukan adalah dengan cara mengkorelasikan
antara skor tiap item dengan skor total.
Dalam melakukan perhitungan korelasi antara skor item dengan skor
total dapat menggunakan rumus korelasi Product moment apabila nilai-nilai
skala telah dilakukan konversi menjadi interval (atau secara langsung
dianggap interval dengan mengacu pada pendapat bahwa nilai skala dapat
diperlakukan sebagai data interval), atau menggunakan rumus korelasi tata
jenjang (Rank-Spearman). Untuk memperjelas cara perhitungannya berikut
ini akan dikemukakan contoh perhitungan korelasi Product momen (cara
perhitungan dengan berbagai variasi dapat dilihat dalam Bab 4) dan korelasi
tata jenjang Spearman.
Sebuah instrumen penelitian/pengukuran terdiri dari 10 item dan
disebarkan pada 10 orang responden dengan hasil skor seperti dalam tabel
2.2. perhitungan korelasi dilakukan untuk tiap item dari item nomor 1 sampai
item no 10, untuk contoh perhitungan akan diambil item no 2
Tabel 2.2.
Nomor Item
Resp Jml
1 2 3 4 5 6 7 8 9 10
A 4 2 2 4 2 3 2 3 3 3 28
B 2 2 2 3 2 2 2 3 2 2 22
C 3 2 2 3 2 3 2 3 3 3 26
D 3 4 3 3 3 3 3 4 3 3 32
E 3 4 4 4 4 4 3 4 4 4 38
F 2 4 4 4 4 4 2 4 4 4 36
G 2 2 2 2 2 3 2 2 2 2 21
H 4 2 2 4 2 3 2 3 3 3 28
I 3 2 2 3 2 3 2 3 2 2 24
J 4 4 4 4 3 4 2 4 3 4 36
I .289 .900 .925 .743 .892 .856 .508 .907 .889 .956
II .362 .870 .879 .789 .872 .830 .525 .910 .904 .950
Contoh Perhitungan Validitas menggunakan Korelasi Product Moment
adalah sebagai berikut :
Suwahono dokumen 30
Responden Item no 2 (X) Jumlah (Y) X2 Y2 XY
A 2 28 4 784 56
B 2 22 4 484 44
C 2 26 4 676 52
D 4 32 16 1024 128
E 4 38 16 1444 152
F 4 36 16 1296 144
G 2 21 4 441 42
H 2 28 4 784 56
I 2 24 4 576 48
J 4 36 16 1296 144
Jumlah 28 291 88 8805 866
N Σ XY - (Σ X) (Σ Y)
r = ---------------------------------------------------
N Σ X2 – (Σ X)2 N Σ Y2– (Σ
Y)2
10 x 866 - 28 x 291
r = --------------------------------------------
10 x 88 – (28)2 10 x 8805 – (291)2
512
r = ------------------- = 0.900
9.8 x 58.04
Suwahono dokumen 31
Tabel perhitungan Korelasi Tata Jenjang
Responden Item no 2 (X)) Jumlah (Y) Rani X Rank Y b b2
A 2 28 7.5 5.5 2 4
B 2 22 7.5 9 -1.5 2.25
C 2 26 7.5 7 0.5 0.25
D 4 32 2.5 4 -1.5 2.25
E 4 38 2.5 1 1.5 2.25
F 4 36 2.5 2.5 0 0
G 2 21 7.5 10 -2.5 6.25
H 2 28 7.5 5.5 2 4
I 2 24 7.5 8 -0.5 0.25
J 4 36 2.5 2.5 0 0
Jumlah 28 291 0 21.5
6 x Σ b2
rho = 1 - --------------
n (n2 - 1)
6 x 21.5
rho = 1 - --------------
10 (99)
rho = 1 - 0.13
rho = 0.870
Suwahono dokumen 32
Dengan memperhatikan hasil kedua perhitungan tersebut nampak
bahwa baik skor item-item tersebut diperlakukan sebagai data interval
maupun ordinal hasilnya tidak menunjukan perbedaan.
2.3.2. Reliabilitas
Reliabilitas berarti kedapat dipercayaan atau keajegan, suatu
instrumen pengukuran dikatakan reliabel apabila instrumen tersebut
dipergunakan secara berulang memberikan hasil ukur yang sama, menurut
Elazar J. Pedhazur “reliability refers to the degree to which test score are free
from errors of measurement”, kesalahan pengukuran akan berakibat pada
hasil yang berbeda dalam mengukur sesuatu yang sama. Dalam ilmu
sosial/pendidikan masalah reliabilitas terutama dalam presisi hasil ukur
cukup sulit apalagi bila dikaitkan dengan pengulangan, hal ini tidak lain
karena obyek yang diteliti cenderung berubah dari waktu kewaktu apalagi jika
rentang waktu pengulangan cukup lama, untuk itu upaya-upaya untuk
menghitung/menguji reliabilitas suatu instrumen merupakan estimasi nilai
pengukuran yang diteliti dengan nilai pengukuran yang sebenarnya. Dalam
upaya tersebut terdapat beberapa pandangan/cara untuk menilai/menghitung
reliabilitas suatu instrument sebagaimana akan terlihat dalam uraian berikut.
2.3.2.1. Teori pengujian klasik
teori pengujian klasik mengacu pada The true-score model dari
Spearman. Menurut model ini skor/nilai hasil observasi terdiri dari dua
komponen yaitu komponen nilai yang benar ditambah kekeliruan acak, yang
dalam bentuk simbul nampak sebagai berikut :
M = T + E
Suwahono dokumen 33
pengukuran merupakan perbandingan antara varians nilai/skor yang
sebenarnya dengan varians nilai/skor yang diobservasi, dan akar pangkat
duanya adalah korelasi antara nilai/skor yang sebenarnya dengan nilai/skor
yang diobservasi dan hasil korelasinya disebut indeks reliabilitas. Indeks ini
menurut Pedhazur disebut juga validitas pengukuran teoritis (Theoritical
validity of a measure) atau korelasi epistemik (epistemic correlation).
Secara teoritis cara tersebut cukup bermakna, namun sulit bahkan
tidak dapat dipergunakan untuk memperkirakan tingkat kesalahan yang
terdapat dalam suatu instrumen pengukuran karena tidak diketahuinya nilai
yang benar (T) dan tingkat kesalahan (E), sehingga diperlukan asumsi-
asumsi berkaitan dengan konstannya substansi yang diukur serta kesalahan
yang terjadi bersifat acak, dan berdasar asumsi tersebut jika pengukuran
dilakukan pada seseorang secara berulang-ulang, maka akan diperoleh
sejumlah persamaan yang masing-masingnya akan mengandung nilai T dan
rata-rata dari E akan (diharapkan) sama dengan Nol, sehingga nilai yang
diobservasi akan sama dengan nilai yang sebenarnya (M = T).
2.3.2.2. Test-retest (Repeated measure)
Pengukuran ulang dimaksudkan untuk melihat konsistensi dari waktu
ke waktu. Cara pelaksanaannya adalah dengan meminta responden untuk
menjawab pertanyaan atau merespon pernyataan yang sama sebanyak dua
kali sesudah selang waktu tertentu. Sesudah diperoleh jawaban/respon
responden untuk dua kali pelaksanaan kemudian nilai/skor dari hasil
pengukuran yang pertama dikorelasikan dengan nilai/skor hasil pengukuran
yang ke dua dengan menggunakan formula korelasi product momen atau
korelasi tata jenjang sesuai dengan karakteristik data yang diperoleh.
Sebagai ilustrasi berikut ini akan diberikan contoh. Misalkan sebuah
instrumen pengukuran dibuat untuk mengetahui persepsi Guru terhadap
kepemimpinan kepala sekolah kepada 10 responden dengan hasil sebagai
mana terlihat dalam tabel berikut :
Tabel nilai skor hasil dua kali pengukuran
Suwahono dokumen 34
Resp Skor pada Pengukuran Skor pada pengukuran
Pertama Kedua
A 20 20
B 25 24
C 21 21
D 23 23
E 22 21
F 21 21
G 24 24
H 26 26
I 21 20
J 22 22
Suwahono dokumen 35
instrumen pengukuran motivasi yaitu instrumen A dan instrumen B, kedua
instrumen tersebut dikenakan pada sepuluh responden dengan hasil sbb :
Tabel nilai skor hasil dua Instrumen Pengukuran
Resp Skor Instrumen A Skor Instrumen B
A 20 20
B 25 24
C 21 21
D 23 23
E 22 21
F 21 21
G 24 24
H 26 26
I 21 20
J 22 22
Suwahono dokumen 36
Metode atau teknik belah dua menggunakan formula Spearman-
Brown, cara ini hanya dapat dikenakan pada instrumen pengukuran dengan
jumlah item genap (pengelompokan dilakukan pada item-item yang
valid),adapun langkah-langkahnya adalah sbb :
Kelompokan item-item menjadi dua kelompok didasarkan pada
kelompok ganjil (nomor item ganjil) dan kelompok genap (nomor
item genap), atau secara random.
Jumlahkan skor pada setiap kelompok sehingga diperoleh skor
total untuk tiap kelompok.
Korelasikan skor total antar kelompok dengan formula korelasi
Product moment atau tata jenjang.
Masukan nilai koefisien korelasi tersebut ke dalam rumus
Sperman-Brown untuk mencari koefisien reliabilitas
2 . r
ri = b
1 + r
b
Suwahono dokumen 37
ri = 2 x 0.970
1 + 0.970
ri = 1.940
1.970
ri = 0.985
2. Formula Rulon
Cara ini juga hanya berlaku pada pengelompokan seperti treknik belah dua,
namun estimasi reliabilitas tidak didasarkan pada perhitungan korelasi
melainkan pada varians perbedaan skor dengan varians total, adapun
rumusnya adalah sebagai berikut :
SDb2
rxx’ = 1 --
SDt2
2 2
rxx’ = Koefisien reliabilitas ; SDb = Varians perbedaan skor belahan ; SDt = Varians skor Total
Contoh perhitungan :
Tabel nilai skor total kelompok ganjil dan genap
Resp Skor total Skor total kelompok Skor b (selisih Skor total
kelompok ganjil genap ganjil genap)
A 20 20 0 40
B 25 24 1 49
C 21 21 0 42
D 23 23 0 46
E 22 21 1 43
F 21 21 0 42
G 24 24 0 48
H 26 26 0 52
I 21 20 1 41
J 22 22 0 44
Hasil perhitungan varians menunjukan :
Rumus mencari Varians :
3. Formula Flanagan
Formula Flanagan merupakan estimasi nilai/angka reliabilitas yang tidak
mengacu pada perhitungan korelasi, melainkan sama seperti formula Rulon
yang mengacu pada veriansi tiap-tiap kelompok hasil belah dua, bedanya
dalam formula ini ada nilai konstanta 2 serta varians kelompok dijumlahkan
dan bukan varians beda, sementara pembaginya sama yaitu varians total.
Rumus :
S12 + S22
rxx’ = 2 (1 -- )
St2
Contoh perhitungan :
Suwahono dokumen 39
S12 = 3.833
S22 = 3.956
St2 = 15.344
Bila nilai-nilai tersebut dimasukan dalam rumus, akan nampak sebagai
berikut :
3.833 + 3.956
rxx’ = 2 (1 -- )
15.344
Rumus :
k M (k – M)
rxx’ = ( ) (1 -- )
k - 1 kSDt2
Nomor Item
Resp Jml
1 2 3 4 5 6 7 8 9 10
A 4 2 2 4 2 3 2 3 3 3 28
B 2 2 2 3 2 2 2 3 2 2 22
C 3 2 2 3 2 3 2 3 3 3 26
D 3 4 3 3 3 3 3 4 3 3 32
E 3 4 4 4 4 4 3 4 4 4 38
F 2 4 4 4 4 4 2 4 4 4 36
Suwahono dokumen 40
G 2 2 2 2 2 3 2 2 2 2 21
H 4 2 2 4 2 3 2 3 3 3 28
I 3 2 2 3 2 3 2 3 2 2 24
J 4 4 4 4 3 4 2 4 3 4 36
M = 2.91
SDt2 = 37.433
k = 10
10 2.91(10 – 2.91)
rxx’ = ( ) (1 -- )
9 37.433
rxx’ = 0.498
bisa juga diterapkan pada teknik belah dua), sehingga bisa diterapkan pada
instrumen yang jumlah itemnya tidak genap. Namun hal yang perlu diingat
Rumus :
K ΣSDb2
α = ( ) (1
-- )
K- 1 SDt2
Suwahono dokumen 41
SDb2 = Varians skor kelompok ; SDt2 = Varians skor Total; K = Kelompok/jumlah item
Sebagai contoh terdapat 10 item yang ingin dibelah menjadi lima
rumus Alpha.
Contoh perhitungan :
9.055
α = ( 1.25 ) (1 -- )
37.433
Suwahono dokumen 42
reliabilitas, semakin baik, namun permasalahannya terletak pada berapa
besarnya nilai yang memadai. Dalam hubungan ini banyak pengarang yang
memberikan patokan umum tentang standar minimum tingkat nilai koefisien
reliabilitas. Nunnally dalam bukunya Psychometric Theory
sebagaimana dikutif oleh Elazar J. Pedhazur menyatakan bahwa koefisien
yang relatif rendah dapat ditoleransi dalam tingkatan penelitian awal,
reliabilitas yang lebih tinggi diperlukan jika pengukuran dipakai untuk
menentukan perbedaan antar kelompok, dan reliabilitas yang sangat tinggi
menjadi esensil jika skor-skor dipakai untuk membuat keputusan penting
tentang seseorang (misalnya keputusan dalam seleksi dan penempatan).
Lebih jauh Nunnally menyatakan bahwa untuk penelitian awal koefisien
reliabilitas 0.60 atau 0.50 sudah cukup, sementara itu Caplan, Naidu dan
Tripathi dalam tulisannya pada Journal of health and social behaviour (1984)
menyatakan bahwa koefisien alpha 0.50 atau lebih dianggap cukup untuk
suatu tujuan penelitian. Disamping pendapat tersebut ada juga akhli yang
menggunakan harga kritik nilai tabel korelasi Product Moment (seperti
Chabib Thaha dalam bukunya Teknik Evaluasi Pendidikan), sehingga nilai
reliabilitas yang diperoleh dibandingkan dengan r tabel, bila lebih besar
UNTUK DIDISKUSIKAN
berarti instrumen pengukuran tersebut reliabel, sedang bila lebih kecil dari r
Skor item-item suatu skala sikap
tabel berarti instrumen pengukuran tersebut tidak reliabel.
Res Nomor item
1 2 3 4 5 6 7 8
A 5 4 3 3 2 3 4 3
B 4 3 4 5 1 4 5 3
C 3 3 3 2 3 4 3 4
D 4 2 2 4 2 3 3 5
E 2 5 5 3 4 2 5 4
F 3 4 1 2 4 2 2 2
G 4 4 3 4 3 4 4 3
H 3 4 4 3 4 4 3 4
I 3 3 3 3 3 3 3 3
J 2 2 2 2 2 2 2 2
K 5 2 5 5 5 2 5 5
L 4 3 1 4 1 4 4 1
Dari data tersebut :
1. hitung validitas Item
Suwahono dokumen 43
2. hitung reliabilitas dengan teknik belah dua menggunakan
seluruh formula
3. hitung reliabilitas dengan teknik membagi empat dengan
menggunakan formula formula yang sesuai