Anda di halaman 1dari 42

BAB II

PENGUKURAN DAN INSTRUMEN

Ilmu Pendidikan berkomunikasi dengan realitas melalui konsepkonsep, sehingga apabila konsep, baik tunggal maupun yang berhubungan,
mau diteliti maka diperlukan operasionalisasi agar konsep/variabel yang
menjadi fokus perhatian dapat diamati dan diobservasi, sesuatu yang dapat
diobservasi, baik secara langsung ataupun tidak langsung, juga bermakna
dapat diukur (Measurable), oleh karena itu pengukuran menjadi penting
dalam kaitannya dengan penelitian khususnya penelitian kuantitatif.
Pengukuran tidak bisa dilakukan secara sembarangan, sebab
memerlukan keterkaitan/keselarasan antara konsep dengan pelaksanaan
penelitian serta kehati-hatian terhadap kesalahan pengukuran (Measurement
error) yang dapat menjadi ancaman bagi keabsahan suatu penelitian. Dalam
suatu penelitian sosial, menurut Sofian Effendi, proses pengukuran adalah
rangkaian dari empat aktivitas, yakni :
1. menentukan dimensi konsep penelitian
2. rumusan ukuran untuk masing-masing dimensi (pertanyaanpertanyaan yang relevan dengan dimensi)
3. tentukan tingkat ukuran yang akan digunakan (Nominal, Ordinal,
Interval, Rasio)
4. tentukan tingkat kesahihan dan keajegan dari alat pengukur
secara sederhana dapat juga dikatakan bahwa untuk melakukan pengukuran,
maka peneliti perlu menentukan konsep/variabel yang

akan diteliti,

menentukan indikator-indikator dari variabel tersebut, menentukan item-item


untuk pengukuran sesuai dengan indikator masing-masing, dan kemudian
melakukan pengujian atas kesahihan (validitas) dan keajegan (reliabilitas)
alat ukur tersebut (Instrumen Penelitian).

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

27

Meskipun seorang peneliti berusaha secermat mungkin, namun


terjadinya kesalahan dalam pengukuran masih mungkin, sehingga diperlukan
pemahaman tentang kesalahan-kesalahan yang mungkin terjadi dalam
pengukuran. Terdapat dua tipe kesalahan dalam pengukuran yaitu Random
error yakni ketidak ajegan (unreliability) pengukuran dimana pengulangan
pengukuran menghasilkan hasil yang berbeda, hal ini terjadi apabila
pengacakan sampel kurang representatif atau karena ukuran sampel yang
terlalu kecil dan Non-random error yakni ketidak validan (invalidity) atau bias
dalam pengukuran dimana instrumen pengukuran tidak mengukur apa yang
seharusnya
menggunakan

diukur.

Penelitian

pengukuran

yang

dengan

baik

adalah

menghilangkan

penelitian
atau

paling

yang
tidak

mengurangi kedua tipe kesalahan tersebut.


Dalam analisa data yang menggunakan statistik pengukuran adalah
hal yang sangat penting karena merupakan sumber angka-angka yang
dipakai dalam analisa statistik, disamping sebagai pedoman dalam
penentuan teknik analisis statistik yang dapat dipergunakan. Secara umum
pengukuran diartikan sebagai proses membedakan sesuatu (The process by
which things are differentiated), sedang secara operasional, Pengukuran
adalah penerapan aturan bilangan pada obyek atau fenomena tertentu,
dalam suatu penelitian Kuantitatif pengukuran dikenakan pada variabel yang
kita teliti. Dengan kata lain pengukuran bermakna menandai nilai-nilai suatu
variabel dengan tanda bilangan tertentu secara sistematis.
Memang diakui bahwa apabila hasil suatu pengukuran dapat
dikuantifikasikan serta dinyatakan dalam bentuk angka, ambiguitas bahasa
akan sangat berkurang (seperti saya tinggi dengan Saya 1,62 cm tinggi),
namun demikian dalam proses pengukuran tidak selamanya

harus

menggunakan penandaan dalam bentuk angka (Kuantifikasi), yang penting


tergambar suatu perbedaan posisi yang satu dengan yang lain dalam suatu
kontinum nilai. ketentuan penerapan nilai suatu variabel
bilangan atau lambang disebut skala

dengan tanda

(Levels of Measurement). Dalam

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

28

hubungan ini terdapat beberapa skala pengukuran (Terkadang disebut jenis


data atau tipe variabel berdasarkan tingkat pengukuran) yang perlu dipahami
oleh seorang peneliti
Skala Nominal. Adalah skala yang hanya mendasarkan pada
pengelompokan atau pengkategorian peristiwa atau fakta dan apabila
menggunakan notasi angka hal itu sama sekali tidak menunjukan perbedaan
kuantitatif melainkan hanya menunjukan perbedaan kualitatif. Banyak
variabel dalam penelitian sosial menggunakan skala nominal seperti Agama,
Jenis kelamin, Tempat lahir, asal sekolah dsb. Adapun ciri dari skala nominal
adalah : (1) kategori data bersifat mutually exclusive (saling memisah), (2)
Kategori data tidak mempunyai aturan yang logis (bisa sembarang).
Skala Ordinal. Adalah pengukuran dimana skala yang dipergunakan
disusun secara terurut dari yang rendah sampai yang tinggi menurut suatu
ciri tertentu, namun antara urutan (ranking) yang satu dengan yang lainnya
tidak mempunyai jarak yang sama, skala ordinal banyak dipergunakan dalam
penelitian sosial dan pendidikan terutama berkaitan dengan pengukuran
kepentingan, persepsi, motivasi serta sikap, apabila mengukur sikap
responden terhadap suatu Kebijakan pendidikan , responden dapat diurutkan
dari mulai Sangat setuju (1), Setuju (2), Tidak berpendapat (3), Kurang Setuju
(4), dan Tidak setuju (5), maka angka-angka tersebut hanya sekedar
menunjukan urutan responden, bukan nilai untuk variabel tersebut. Adapun
ciri dari skala ordinal adalah : (1) kategori data bersifat saling memisah, (2)
kkategori data mempunyai aturan yang logis, (3) kategori data ditentukan
skalanya berdasarkan jumlah karakteristik khusus yang dimilikinya.
Skala Interval. Adalah skala pengukuran dimana jarak satu tingkat
dengan tingkat lainnya sama, oleh karena itu skala interval dapat juga disebut
skala unit yang sama (equal unit scale), contoh yang sangat dikenal adalah
temperatur. Adapun ciri-ciri skala interval adalah : (1) kategori data bersifat
saling memisah, (2) kategori data mempunyai aturan yang logis, (3) kategori
data ditentukan skalanya berdasarkan

jumlah karakteristik khusus yang

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

29

dimilikinya, (4) perbedaan karakteristik yang sama tergambar dalam


perbedaan yang sama dalam jumlah yang dikenakan pada kategori, (5)
angka nol hanya menggambarkan suatu titik dalam skala (tidak punya nilai
Nol absolut).
Skala Rasio. Skala interval yang benar-benar memiliki nilai nol mutlak
disebut skala rasio, dengan demikian skala rasio menunjukan jenis
pengukuran yang sangat jelas dan akurat (precise). Jika kita memiliki skala
rasio, kita dapat menyatakan tidak hanya jarak yang sama antara satu nilai
dengan nilai lainnya dalam skala, tapi juga tentang jumlah proporsional
karakteristik yang dimiliki dua obyek atau lebih, dan contoh untuk skala ini
adalah uang. Adapun ciri-ciri dari skala rasio adalah : (1) kategori data
bersifat saling memisah, (2) kategori data mempunyai aturan yang logis, (3)
kategori data ditentukan skalanya berdasarkan jumlah karakteristik khusus
yang dimilikinya, (4) perbedaan karakteristik yang sama tergambar dalam
perbedaan yang sama dalam jumlah yang dikenakan pada kategori, (5)
angka nol menggambarkan suatu titik dalam skala yang menunjukan
ketiadaan karakteristik (punya nilai Nol absolut).
Bagi seorang peneliti pemahaman secara tepat tentang skala
pengukuran sangat penting karena dua alasan : Pertama, tiap skala
pengukuran memberikan jumlah informamsi yang berbeda, skala rasio
memberi informasi lebih banyak dibanding interval, interval lebih banyak
dibanding ordinal, dan ordinal memberi informasi lebih banyak dibanding
skala pengukuran nominal, oleh karena itu, jika memungkinkan peneliti
sebaiknya menggunakan skala pengukuran yang dapat memberikan
informasi paling maksimum yang diperlukan untuk menjawab permasalahan
penelitian. Kedua, beberapa jenis prosedur analisa statistik tidak tepat untuk
dipergunakan pada skala pengukuran yang berbeda, untuk itu kejelasan
penentuan skala pengukuran akan menentukan jenis analisis statistik yang
bagaimana yang akan dipergunakan.

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

30

Gambar 2.1. Empat jenis Skala Pengukuran


SKALA

CONTOH
Jenis Kelamin
(Karakteristik : hanya data
Kelompok dan Label,
melaporkan frekuensi atau
prosentase)

Nominal

Peringkat dalam suatu


Lomba

Ordinal

(Karakteristik : data urutan,


menggunakan angka hanya
untuk menunjukan peringkat)

Ke-4

Ke-3

Ke-2

Ke-1
Temperatur

Interval
10

20

30

(Karakteristik : Menganganggap bahwa perbedaan


antar skor benar-benar menunjukan perbedaan yang
sama dalam variabel yang
diukur)

Uang
(Karakteristik : mencakup
seluruh karakteristik di atas
ditambah nilai nol
mutlak/yang sebenarnya)

Rasio
0

Rp. 10

Rp.20

Rp.30

Rp.40

2.1. Penentuan Indikator/Konsep Empiris


Konsep merupakan konstruksi teoritis yang dimaksudkan untuk
mengorganisasikan realitas dan bukan sesuatu yang punya gambaran visual,
konsep mempunyai gradasi yang berbeda-beda dalam hal kesulitan dan
kemudahannya untuk diukur tergantung pada tingkatan abstraksi, konsep
Tinggi, berat merupakan contoh yang mudah diukur, namun bagaimana
halnya mengukur konsep yang punya tingkat abstraksi tinggi seperti :
Motivasi, Minat , IQ, EQ, dan konsep lain yang sejenis, sudah barang tentu
untuk konsep-konsep seperti itu pengukurannya tidak sederhana karena

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

31

memerlukan upaya mengempiriskan konsep-konsep tersebut agar dapat


dilakukan pengukuran.
Dengan demikian agar suatu konsep dapat diukur maka diperlukan
pengetahuan tentang unsur-unsur yang dapat dijadikan petunjuk (indikator)
terhadap suatu konsep, oleh karena itu konsep dan indikator merupakan dua
hal yang penting dalam suatu penelitian, keduanya harus menunjukan
validasi konsep yaitu penyimpulan yang valid atas suatu konsep (yang tidak
dapat diobservasi) atas dasar indikator (yang dapat diobservasi).
Seorang peneliti tidak meneliti konsep secara langsung melainkan
secara tidak langsung melalui pengumpulan data sesuai dengan indikatorindikator yang telah ditentukan, untuk itu indikator harus benar-benar dapat
menggambarkan konsepnya, dalam hubungan ini langkah penting dalam
penentuan indikator adalah dengan pengkajian definisi dan teori yang
berkaitan dengan konsep tersebut . Penentuan indikator dapat dilakukan
melalui : 1). penelusuran akibat-akibat dari suatu konsep, hasilnya disebut
Reflective Indicator/Reflector/Effect indicator ; dan 2). Penelusuran sebabsebab dari suatu konsep, hasilnya disebut Formative indicator/Cause
indicator. Cara mana saja yang dipergunakan tidaklah menjadi soal yang
penting

indikator-indikator

yang

dipilih/ditentukan

harus

merupakan

representasi dari konsep-konsep yang menjadi fokus penelitian.


Karena konsep/variabel tidak dapat diukur langsung, maka langkah
penentuan satuan-satuan yang bisa diobservasi menjadi sangat penting
dalam suatu penelitian, dalam hubungan ini terdapat dua cara dalam proses
tersebut yaitu :
1. melalui penjabaran konsep dari mulai Konsep Teori, Konsep
Empiris, Konsep Analitis, dan Konsep Operasional.
2. melalui penelusuran dari Konsep, Dimensi, Indikator, dan item
pertanyaan/pernyataan.
Kedua cara tersebut pada prinsipnya akan menghasilkan output yang sama,
untuk lebih jelasnya berikut ini akan dikemukakan suatu contoh :
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

32

Penjabaran Konsep
Teoritis

Empiris
Ijazah Terakhir

Pendidikan
Sertifikat Kursus

Analitis
Jawaban responden
Tentang ijazah terakhir
yang dimiliki
Jawaban responden
Tentang sertifikat kursus
yang dimiliki

Operasional (bisa hanya contoh


dan yang lain terpisah)

Apakah ijazah terakhir


Saudara miliki.

yang

Apakah sdr pernah mengikuti


Kursus
Bila Ya sertifikat kursus apa yang
sdr miliki

Penelusuran Konsep sampai Item


Konsep

Pendidikan

Dimensi

Indikator

Pendidikan
Formal/Sekolah

Ijazah terakhir yang


dimiliki

Pendidikan non
formal/Luar sekolah

Sertifikat kursus yang


dimiliki

Item (bisa hanya no Item dengan


item-item lengkap terpisah)

Apakah ijazah terakhir yang


Saudara miliki.
Apakah sdr pernah mengikuti
Kursus
Bila Ya sertifikat kursus apa yang
sdr miliki

kedua cara tersebut akhirnya menghasilkan satuan yang sama dalam hal
obyek yang dapat diukur untuk suatu penelitian, kalau melalui cara
penjabaran konsep diistilahkan dengan konsep empiris, sedangkan kalau
dengan cara Penelusuran konsep disebut indikator. Semua ini jelas sangat
diperlukan agar suatu penelitian dapat memperoleh suatu data untuk
dianalisa sampai diperoleh suatu kesimpulan yang berlaku atau dapat
diterapkan pada konsep-konsep yang menjadi fokus penelitian.
2.2. Pengukuran sikap
Di dalam penelitian Sosial dan Pendidikan dengan pendekatan
Kuantitatif, disamping pengukuran dengan menggunakan bentuk Test,
seorang peneliti akan banyak menghadapi penggunaan pengukuran
berbentuk Skala, baik dengan metode Thurstone, Bogardus ataupun Likert
yang umumnya dikenal dengan Skala Sikap, hal ini tidak lain karena dalam
bidang pendidikan banyak sekali Personological variable yang sulit, bahkan
tidak dapat diobservasi secara langsung melainkan melalui penyimpulan dari
indikasi tidak langsung (seperti Konsep diri, bakat, motivasi belajar).

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

33

A. Pengertian Sikap
Sikap (attitude) merupakan kecenderungan seseorang untuk bertindak
terhadap obyek tertentu, para akhli telah memberikan definisi yang bervariasi
terhadap konsep sikap, Thurstone sebagai pelopor dalam pengukuran sikap
mendefinisikan sikap sebagai berikut :
o attitude the sum total of mans inclinations and feelings,
prejudice and bias, preconceived notion, ideas, fears, threats, and
conviction about any specified topic (definisi tahun 1928)
o attitude is the affect for or against a psychological object (definisi
tahun 1931)
o attitudethe intensity of positive or negative affect for or against a
psychological object (definisi tahun 1946)
definisi-definisi tersebut oleh Daniel J. Mueller dirumuskan kembali sebagai
berikut :
o Attitude is :
1. affect for or against
2. evaluation of
3. like or dislike
4. positiveness or negativeness toward a psychological object.
pengertian di atas menunjukan bahwa suatu sikap merupakan suatu
perasaan,penilaian, kesukaan atau ketidak sukaan, kepositipan atau
kenegatipan terhadap suatu obyek psikologis tertentu. Sementara itu
Bogardus mendefinisikan Sikap

sebagai

a tendency to act toward

or

against some environmental factor.


B. Karakteristik Sikap
Dalam

bukunya

Principles

of

Educational

and

Psychological

Measurement and Evaluation, sebagaimana dikutip oleh Saifuddin Azwar


G. Sax menyatakan bahwa terdapat beberapa karakteristik dari sikap yaitu :

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

34

o Arah. Artinya sikap terpilah pada dua arah (kesetujuan atau


ketidaksetujuan; mendukung atau tidak mendukung; memihak atau
tidak memihak)
o Intensitas. Artinya kedalaman atau kekuatan sikap , kesamaan
arah bisa menunjukan intensitas yang berbeda.
o Keluasan. Artinya kesetujuan atau ketidaksejuan dapan mencakup
aspek keseluruhan atau hanya aspek bagian yang sangat spesifik
dari suatu obyek sikap
o Konsistensi. Yaitu kesesuaian antara pernyataan sikap yang
dikemukakan dengan responsnya terhadap obyek sikap dimaksud.
C. Dimensi Sikap
o Dimensi Kognitif (Keyakinan). Ekspresi keyakinan terhadap suatu
obyek sikap tertentu
o Dimensi Afektif (perasaan). Ekspresi perasaan secara langsung
terhadap obyek sikap tertentu
o Dimensi Konatif (kecenderungan prilaku). Pernyataan maksud atau
preferensi prilaku berkaitan dengan obyek tertentu, baik prilaku
personal maupun preferensi prilaku untuk kegiatan sosial.
Contoh Item pernyataan :
Keyakinan

: Biaya pendidikan di SD A tidak memberatkan

Perasaan

: Saya menyukai Lingkungan di SD A

Konatif

: Individu Saya akan menyekolahkan anak saya ke SD


A jika sudah waktunga
sosial

-- Pemerintah harus memberikan beasiswa


bagi Siswa yang kurang mampu

D. Kriteria Penyusunan Pernyataan Skala Sikap


Menurut Prof. Marat dalam bukunya Sikap Manusia, Perubahan dan
Pengukurannya,

kriteria informal

untuk mengedit pernyataan yang

digunakan untuk mengkonstruksikan skala sikap adalah :


stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

35

1. menolak pernyataan yang dihubungkan dengan masa lalu daripada


saat sekarang
2. menolak

pernyataan

yang

faktual

atau

yang

baik

untuk

diinterpretasikan sebagai faktual


3. menolak pernyataan yang dapat diinterpretasikan lebih dari satu
4. menolak pernyataan yang tidak relevan kepada obyek psikologi
5. menolak pernyataan yang dapat diterima oleh hampir semua orang
atau bahkan tidak satupun yang menerima
6. memilih pernyataan yang dianggap memiliki pilihan dari skala efek
mengenai minat
7. menjaga bahasa yang sederhana dari pernyataan untuk jelas dan
langsung (tidak berbelit-belit)
8. pernyataan haruslah pendek kurang lebih dua puluh kata
9. pernyataan haruslah memiliki suatu pemikiran
10. menolak pernyataan yang mengandung kata-kata : semua; selalu;
tidak

satupun;

tidak

pernah;

yang

sering

menimbulkan

ketidakjelasan
11. kata-kata : hanya, benar/tepat, hampir, dan kata-kata lain yang
hampir sama artinya harus digunakan dengan hati-hati dalam
menulis pernyataan
12. bila mungkin pernyataan harus dalam bentuk kalimat yang
sederhana sehingga tidak merupakan bentuk yang kompleks dan
berlebihan
13. menolak penggunaan kata-kata yang tidak mempunyai arti
14. menolak penggunaan negatif rangkap.
E. Contoh Skala Sikap
Untuk lebih memperoleh gambaran tentang bagaimana pakar
membuat Skala Sikap, berikut ini akan dikemukakan dua cara masing-masing
mengacu pada Skala Thurstone dan Likert

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

36

1. Method of equal appearing Interval (Thurstone)


Metode ini dikemukakan oleh Edward pengarang Buku Technique of
attitude scale construction. Menurut Marat cara ini biasanya digunakan bila
pernyataan yang akan diskala adalah cukup banyak, sehingga sukar untuk
dilakukan penilaian secara perbandingan, sementara itu Saifuddin Azwar
menyatakan bahwa cara penskalaan ini mengacu pada model skala
Thurstone yang mengacu pada pendekatan penskalaan Stimulus serta
penilaiannnya dilakukan oleh kelompok penilai tertentu yang diberi tugas
membaca dengan seksama setiap pernyataan untuk kemudian memberikan
penilaian atau perkiraan tingkat favorable atau tidaknya suatu pernyataan
dalam suatu Psychological Continuum.
Psychological Continuum tersebut disusun dalam bentuk abjad
dengan asumsi bahwa jarak/interval antara hurup dengan huruf setara mulai
dari

yang tidak Favorable sampai yang Favorable dimulai dari abjad A

sampai K, dimana abjad F merupakan bagian yang netral, dalam prakteknya


yang tidak Favorable bernilai 1 dan yang Favorable bernilai 11, akan tetapi
pilihan terhadap suatu nilai tertentu tidak lantas dijadikan nilai skala suatu
item tertentu melainkan sebagai bahan untuk diolah kembali, adapun
kontinum skala tersebut nampak sebagai berikut
A
1

B
2

C
3

D
4

Tak Favorable

E
5

F
6

G
7

H
8

I
9

Netral

J
10

K
11

Favorable

Apabila pernyataan-pernyataan Skala Sikap telah dinilai/dijawab oleh


kelompok kemudian dihitung frekuensi untuk masing-masing pilihan alternatif
per item pernyataan, sebagai contoh : misalkan skala sikap model tersebut
diberikan pada 100 orang (N = 100) penilai dengan 30 item pernyataan,
kemudian kita ambil satu item nomor 1 untuk ditentukan nilainya, dengan
deskripsi sebagai berikut :
Tabel 2.1
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

37

No Item
1

F
P
Pk

A
1
4

B
2
5

C
3
6

D
4
8

0.04
0.04

0.05
0.09

0.06
0.15

0.08
0.23

Alternatif Pilihan
E
F
G
5
6
7
10
12
30
0.10
0.33

0.12
0.45

0.30
0.75

H
8
6

I
9
8

J
10
9

K
11
2

0.06
0.81

0.08
0.89

0.09
0.98

0.02
1.00

Keterangan :
F

= Frekuensi, jumlah penilai yang memilih tiap-tiap alternatif

= Proporsi tiap Frekuensi pilihan dengan jumlah penilai/penjawab


F dibagi N (F : N)

Pk

= Proporsi Kumulatif yaitu penambahan besarnya proporsi dengan


proporsi sebelumnya, misal 0.09 = 0.04 + 0.05

karena penentuan nilai/skor skala menggunakan ukuran tendendi sentral


Median, maka setiap item

perlu dicari mediannya dengan menggunakan

Rumus Median yang diberi lambang S sebagai berikut :

S = bb+ 0.5 pkb


pm

Keterangan :
S

= Skala nilai dari pernyataan (Median)

pkb

= Proporsi kumulatif di bawah posisi median

pm

= proporsi pada posisi Median

= interval (dalam hal ini sama dengan 1)

apabila diterapkan pada contoh dalam

tabel 2.1 akan nampak sebagai

berikut :
S = 6.5+

0.5 0.45
0.30

S = 6.67

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

38

Nilai 6.67 ini merupakan nilai skala untuk item nomor 1 tersebut, pencarian
nilai ini dilakukan sebanyak item-item yang tertuang dalam Skala sikap yang
akan dipergunakan dalam penelitian. Disamping itu untuk mengetahui variasi
distribusi dapat dilakukan perhitungan rentang antar kuartil (K 75 - k25) dengan
rumus :

K25 = bb + 0.25 pkb


Pk25

K75 = bb + 0.75 pkb


Pk 75

Bila diterapkan pada item tersebut di atas diperoleh nilai


K25

= 4.7

K75

= 7

= 2.3 (Rentang antar Kuartil)


Setelah dilakukan perhitungan nilai S bagi tiap Item pernyataan maka

akan diperoleh nilai/skor skala untuk setuap item yang menggambarkan


posisi sikap responden dalam suatu kontinum psikologis, dan apabila bentuk
pernyataannya Ya dan Tidak, maka jawaban Ya saja yang diberi skor untuk
kemudian dijumlahkan atau dicari Median/Mean untuk tiap responden,
semakin tinggi skor responden semakin menunjukan sikap Favorable
terhadap masalah yang diungkapkan dalam Item pernyataan, sedang
jawaban Tidak tidak dihitung (diberi nilai 0), karena hal itu berarti pernyataan
item

tidak

mendeskripsikan

pengalaman

yang

dialami

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

oleh

yang
39

bersangkutan

(responden/kelompok

penilai).

Adapun

nilai

lebih

dimaksudkan untuk memilih Item-item, dimana sebaiknya dipilih yang punya


nilai Q kecil sebab ini menunjukan tingkat kesepakatan yang tinggi di antara
kelompok penilai.
Untuk bahan kajian dan perbandingan serta contoh bagaimana
konstruksi skala sikap model Thurstone, berikut ini akan dikemukakan skala
sikap yang dibuat oleh Thurstone pada tahun 1931, untuk melihat sikap
masyarakat terhadap etnis China.
Dalam skala ini Thurstone ingin mengungkap/mengukur bagaimana
sikap orang Amerika terhadap Suku

China dengan meminta responden

untuk menyatakan kesetujuan atau ketidaksetujuan terhadap pernyataan


yang terdapat angket skala sikap.
Pernyataan-pernyataan yang diungkap diawali dengan hal-hal yang
berkaitan dengan perasaan, seperti perasaan netral/tak peduli, benci, tertarik
dan cinta, dikombinasikan dengan pernyataan-pernyatan yang bersifat
keyakinan seperti inferioritas suku china dibanding suku bangsa responden
(Amerika), dan kecenderungan prilaku yang dimiliki responden terhadap suku
china, seperti untuk hidup di negeri China.
Skala sikap Thurstone ini juga menggambarkan suatu kombinasi
pernyatan positif dan negatif dengan jumlah yang hampir seimbang,
kombinasi semacam ini memang diperlukan dalam penyusunan skala sikap
agar dapat diketahui konsistensi pilihan dari responden, sehingga skala sikap
yang dibuat dapat benar-benar memberikan gambaran sesungguhnya dari
sikap responden terhadap obyek sikap yang menjadi obyek penelitian.

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

40

Contoh Skala Sikap yang dibuat Thurstone tahun 1931


Attitude toward the Chinese
Try to indicate either agreement or disagreement for each statemen. If you simply can not
decide about statemen, you may mark it with a question mark. This is not an examination,
there are no right or wrong answer tothese statements. This is simply a study of peoples
attitudes toward the chinese. Please indicate your own conviction by a check mark when
you agree and by a cross when you disagree
Put a check mark if you agree with the statement.
Put a a cross if you agree with the statement.
-----------------------------------------------------------------------

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

I have no particular love or hate for the Chinese (6.5)


I dislike the Chinese more every time I see (10.1)
The chinese are very preety decent (4.2)
Some Chinese traits are admirable, but on the whole I dont like them (7.2)
The Chinese are superior to all other races (0.5)
The Chinese, as part of the yellow race, are inferior to the white races (8.7)
I like yhe Chinese (3.5)
The more I know about the Chinese, the better I like them (2.8)
The Chinese are aptly described by the term yellow devil (11.0)
The high-class Chinese are superior to us (1.8)
The Chinese are different, but not inferior (5.2)
I hate the Chinese (11.5)
Chinese parents are unusually devoted to their Children (4.1)
Although I respect some of their qualities, I could never consider a Chinese
as a friend (7.7)
------ 15. I would rather live in China than any other place in the world (1.2)
------ 16. There are no refined or cultured Chinese (9.7)
------ 17. The Chinese are no better and no worse than any other people (6.0)
------ 18. I think Chinese should be kept out of the United States (8.4)
------ 19. I consider it a privilege to associate with Chinese people (2.2)
------ 20. The Chinese are inferior in every way (10.6)
------ 21. I dont see how anyone could ever like the Chinese (9.4)
------ 22. Chinese have a very high sense of honor (3.0)
------ 23. I have no desire to know any Chinese (8.6)
------ 24. Chinese people have a refinement and depth of feeling that you dont find
anywhere else (1.4)
------ 25. There is nothing about the Chinese that I like or admire (9.8)
------ 26. Id like to know more Chinese people (3.9)
Note : Scale values appear in parentheses following each item.
Sumber : Daniel J. Mueller. 1986. Measuring Social Attitude

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

41

2. Method of Summated Rating (Likert)


Metode ini merupakan metode penskalaan pernyataan sikap dengan
menggunakan distribusi respon sebagai dasar penentuan skala serta tidak
menggunakan kelompok penilai. Dalam skala Likert, kuantifikasi dilakukan
dengan menghitung respon kesetujuan atau ketidaksetujuan (dalam suatu
kontinum) terhadap obyek sikap tertentu.
Skala model Likert, kategori respon terdiri dari lima, mulai dari Sangat
setuju, Setuju, Tidak pasti/tidak memutuskan, tidak setuju, sangat tidak
setuju, bila pernyataan itu sifatnya posistif diberi skor 5,4,3,2,1, dan bila
pernyataan negatif diberi skor 1,2,3,4,5. Adapun prosedur konstruksi skala
model Likert adalah :
a. Identifikasi obyek-obyek sikap serta jelaskan secara spesifik
b. Kumpulkan item-item opini (30 atau lebih) tentang obyek sikap.
Semua item harus menyatakan sesuatu yang positif atau negatif
c. Uji cobakan item-item tersebut pada sekelompok responden, tiap
responden menunjukan suatu tingkat persetujuan untuk tiap item
d. Beri skor untuk tiap responden, kemudian jumlahkan skor tersebut
untuk tiap responden
e. Korelasikan skor tiap item dengan skor total untuk tiap responden
f.

Hilangkan item yang korelasinya tidak signifikan atau yang


korelasinya negatif. Perhatikan keseimbangan antara item positif
dan negatif.

g. Setelah langkah-langkah tersebut dilakukan maka sebagai hasilnya


akan diperoleh sejumlah pernyataan untuk mengukur sikap yang
dapat dipercaya untuk dapat digunakan dalam penelitian, karena
hanya item yang signifikan saja yang dipergunakan dalam
instrumen penelitian.

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

42

Contoh Skala Sikap Model Likert


Attitude About Marijuana
Indicate on the line to the the left of each statement how much you agree
or disagree with it. Please mark every item. Use the following response
category
A = Strongly agree.
B = Agree.
C = Uncertain.
D = Disagree.
E = Strongly disagree
-----------------------------------------

1.
2.
3.
4.
5.
6.
7.
8.

-----------

9.
10.

------

11.

------

12.

-----------

13.
14.

-------------------------------

15.
16.
17.
18.
19.
20.

No right-thinking person would use marijuana (N)


Marijuana use leads to heroine use (N)
Only hippies and weirdos use marijuana (N)
Marijuana should be legalized (P)
Marijuana use causes birth defect (N)
Since there is no hangover, marijuana is a good substitute for alcohol (P)
Marijuana is a narcotic drug (N)
Most people who criticize marijuana use dont know anything about the
drug (P)
Habitual marijuana users are neurotic (N)
As a symbol of the youth culture, epitomizing disobedience and disregard
for authority, marijuana usage should be put down (N)
In our highly impersonal society, marijuana helps one express feelings and
relate to others, and should therefore definitely be used by those who feel
the needs (P)
Marijuana is a good social stimulator and should be allowed, especially at
parties, wheremixing important (P)
Mariyuana is not a hard drug (P)
If a son or daughter uses marijuana, Mom and Dad should be willing to try it
before they condemn it (P)
Since we arent sure if it can harm us, we should avoid marijuana (N)
Marijuana use is illegal and therefore wrong (N)
Marijuana has psychological theraphy potential (P)
Marijuana causes dehumanization (N)
Criminals have a higher rate of marijuana use than does the general public (N)
Intelligence test scores of marijuana users are higher on the average than
scores of non-users (P)

Note : P = positively keyed item; N = negatively keyed item


Sumber : Daniel J. Mueller. 1986. Measuring Social Attitude

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

43

F. Konversi Nilai Skala


Skala sikap yang diberi bobot nilai 0 4 atau 1 5 sesuai dengan
alternatif respon pada dasarnya merupakan skala yang bernilai Ordinal atau
pemeringkatan ,sebab responden diminta merespon/menjawab sesuai
dengan kecenderungan sikapnya untuk kemudian diberi kode/nilai peringkat
oleh peneliti, namun demikian terdapat para Pakar yang menganggapnya
sebagai Skala Interval sehingga memungkinkan pengolahan datanya dengan
analisis Statistik Parametrik. Terlepas dari kontroversi tersebut, mereka yang
berpendapat bahwa skala sikap bernilai ordinal mengajukan suatu cara untuk
mengkonversi

nilai

skala

tersebut

menjadi

bernilai

Interval

dengan

menempatkan masing-masing nilai skala dalam kelompoknya pada suatu


distribusi normal, sehingga jarak nilai menjadi sama. Dengan cara ini
penentuan nilai skala dilakukan dengan memberi bobot dalam satuan deviasi
normal bagi setiap kategori respon pada suatu kontinum psikologis.
Pengkonversian nilai skala dilakukan pada seluruh pernyataan yang
dipergunakan dalam skala, bila yang diteliti 3 variabel dengan banyak item
pernyataan 30 untuk tiap instrumen, maka penghitungan konversi dilakukan
sebanyak 90 kali (90 Item), jadi banyaknya penghitungan konversi ditentukan
oleh banyaknya item pernyataan dalam suatu skala. Sebagai contoh, kita
ambil satu item pernyataan Positif dengan nilai skala mulai dari 0 sampai
dengan 4 (skala 5), dengan jumlah responden 200 orang (contoh 2.1), dan
satu item pernyataan negatif dengan nilai skala 1 sampai dengan 4 (skala 4),
jumlah responden sebanyak 50 0rang (contoh 2.2). Dalam kenyataannya,
terkadang (bahkan sering) nilai skala konversi (akibat pembulatan) sama
dengan nilai skala asal yang ditetapkan berdasarkan judgement, namun
karena nilai konversi telah melalui pengolahan maka jelas akan lebih dapat
dipertanggungjawabkan bila diperlakukan sebagai data dengan skala
pengukuran interval serta dapat dianalisa menggunakan statistik parametrik
(sudah tentu ditambah syarat lainnya).

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

44

Contoh Pengkonversian nilai skala.


Contoh 2.1. Pernyataan Positif
Alternatif

NS Asal

STS
TS
R
S
SS

0
1
2
3
4

F
6
29
42
103
20

p
0.030
0.145
0.210
0.515
0.100

pk
0.030
0.175
0.385
0.900
1.000

pkt
0.015
0.103
0.280
0.643
0.950

z
z+2.170 NS Konversi
-2.170
0
0
-1.265 0.905
1
-0.583 1.587
2
0.366
2.536
3
1.645
3.815
4

Jml Responden
(N)

200

Contoh 2.2. Pernyataan Negatif


Alternatif

NS Asal

SS
S
TS
STS

1
2
3
4

F
6
15
20
9

p
0.120
0.300
0.400
0.180

pk
0.120
0.420
0.820
1.000

pkt
0.060
0.270
0.620
0.910

z
z+2.555 NS Konversi
-1.555
1
1
-0.613 1.942
2
0.305
2.86
3
1.341
3.896
4

Jml Responden
(N)

50

Penjelasan
1. Hitung frekuensi setiap alternatif respon untuk seluruh responden. Dalam
contoh 2.1 : yang menjawab STS = 6 orang; TS = 29; R = 42; S = 103;
SS = 20; jumlah total 200 (banyaknya responden). Dalam contoh 2.2.
yang menjawab SS = 6; S = 15; TS = 20; STS = 9; jumlah total 50
(banyaknya responden)
2. hitung proporsi tiap alternatif. Dalam contoh 2.2 untuk alternatif STS
dengan f = 6, proporsinya (p) adalah 6 : 50 = 0.120, perhitungan ini
dilakukan untuk setiap alternatif respon.
3. setelah proporsi untuk setiap alternatif dihitung, kemudian dilanjutkan
dengan penghitungan proporsi kumulatif (pk) dengan cara menjumlahkan
proporsi alternatif dengan proporsi sebelumnya, misalnya untuk pk 0.420
diperoleh dengan cara menjumlahkan 0.300 dengan 0.120, demikian juga
untuk alternatif lainnya.

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

45

4. kemudian dihitung pk tengahnya (pkt) dengan cara menjumlahkan p


alternatif yang sedang dicari pkt-nya dengan pk alternatif sebelumnya.
Misalnya untuk pkt = 0.620 (contoh 2.2) diperoleh dari x 400 + 420.
5. selanjutnya untuk tiap-tiap pkt dicari nilai z nya dengan menggunakan
Tabel Deviasi Normal (terlampir), contoh nilai z = - 2.170 (contoh 2.1)
untuk pkt = 0.015, diperoleh dengan cara melihat pertemuan antara baris
yang bernilai 0.01 dengan kolom yang bernilai 5.
6. sesudah diperoleh nilai z untuk masing-masing alternatif respon (pkt),
maka untuk memperoleh nilai skala, nilai z yang pertama (alternatif
dengan nilai skala terkecil) angka mutlaknya ditambahkan pada nilai z tiap
alternatif sedangkan untuk nilai skala yang paling kecil langsung
ditetapkan sesuai judgment yang telah ditentukan (nilai 0 untuk contoh
2.1. ; dan 1 untuk contoh 2.2.), apabila nilai skala dimulai dari 0, nilai z
yang diperoleh langsung ditambahkan, sedangkan jika nilai skala terkecil
sama dengan 1, maka nilai z harus ditambah nilai 1 dahulu baru
kemudian ditambahkan pada masing-masing nilai z berikutnya. Misal
(contoh 2.2.) nilai 3.896 merupakan hasil dari 1.341 + 2.555. sesudah tiap
alternatif respon memperoleh nilainya kemudian dibulatkan seperti terlihat
dalam Nilai Skala Konversi. Dari nilai inilah seluruh analisa data
dilakukan.
Langkah pengkonversian nilai skala dengan memberikan bobot dalam
suatu deviasi normal akan menghasilkan suatu nilai interval yang tepat dalam
memposisikan

masing-masing

kategori/alternatif

respon

dalam

suatu

kontinum, namun demikian penggunaan cara penentuan nilai tanpa konversi


pun dapat saja dilakukan dengan alasan kepraktisan, disamping Likert sendiri
pada tahun 1932 telah menunjukan penemuannya bahwa skor kelompok
responden yang menggunakan cara konversi berkorelasi sebesar 0.99
dengan penentuan skor cara biasa (cara sederhana), namun demikian untuk
kemantapan analisa terutama analisis statistik, pengkonversian nilai skala
nampaknya diperlukan. Sementara itu Saifuddin Azwar menyatakan bahwa
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

46

apabila skala sikap yang disusun tidak untuk digunakan sebagai instrumen
pengukuran yang menyangkut keputusan yang penting sekali, seperti
penelitian pendahuluan atau studi kelompok secara kecil-kecilan, kadangkadang demi kepraktisan, penyusun skala sikap dapat menempuh cara
sederhana untuk menentukan nilai skala (tanpa konversi dengan deviasi
normal)

UNTUK DIDISKUSIKAN
1. Pengukuran merupakan langkah penting dalam suatu penelitian,
khususnya penelitian kuantitatif, jelaskan alasan-alasannya
2. Kemukakan Contoh-contoh Variabel yang mempunyai tingkat
pengukuran :
Nominal.
Ordinal
Interval
Rasio
3. Pengukuran dengan menggunakan skala sikap banyak dilakukan
dalan penelitian pendidikan, jelaskan alasan-alasannya, serta
kemukakan contoh-contoh bagaimana Konsep dapat diteliti
4. Tentukan nilai Skala model Thurstone dari data berikut
No Item

12

20

18

5. Konversikan Nilai skala berikut :


Alternatif
STS
TS
R
S
SS

Nilai Skala
1
2
3
4
5

Frekuensi
10
15
30
25
20

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

47

2.2. Instrumen Penelitian


Penelitian pada dasarnya merupakan suatu upaya untuk memahami
masalah-masalah yang ditemui dalam kehidupan manusia, keterbatasan
manusia

untuk

memahami

permasalahan

tersebut

hanya

dengan

mengandalkan pengalaman hidup sehari-hari secara sporadis dan tidak


tertata, jelas tidak cukup untuk menjadi dasar yang kuat bagi pemahaman
terhadap suatu masalah. Keadaan ini telah mendorong upaya-upaya Pakar
untuk membuat prosedur dan alat yang dapat dipergunakan guna
mengungkap kenyataan-kenyatan (Data) yang dapat dijadikan dasar dalam
memecahkan berbagai masalah. Untuk itu Instrumen penelitian menempati
kedudukan penting dalam suatu penelitian, hal ini tidak lain karena
keberhasilan suatu penelitian dipengaruhi pula oleh instrumen yang
dipergunakan.
Dalam suatu penelitian Kuantitatif (adanya jarak antara subyek dan
obyek) yang bersifat verifikasi hipotesis (pengujian hipotesis), instrumen
penelitian merupakan alat yang dipakai untuk menjembatani antara subyek
dan obyek (secara substansial antara hal-hal teoritis dengan empiris, antara
konsep dengan data), sejauhmana data mencerminkan konsep yang ingin
diukur tergantung pada instrumen (yang substansinya disusun berdasarkan
penjabaran

konsep/penentuan

indikator)

yang

dipergunakan

untuk

mengumpulkan data, masalah ini telah dikemukakan dalam uraian terdahulu,


sehingga gambaran umumnya telah dipahami, adapun pembahasan berikut
akan lebih menjurus pada pembahasan instrumen sebagai alat/cara untuk
memperoleh data.
Menurut Nana Sudjana , dalam penyusunan instrumen penelitian ada
beberapa hal yang harus diperhatikan yaitu :
1. masalah dan variabel yang diteliti termasuk insikator variabel harus
jelas dan spesifik sehingga dapat dengan mudah menetapkan jenis
instrumen yang akan digunakan.
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

48

2. sumber data/informasi baik jumlah maupun keragamannya harus


diketahui terlebih dahulu, sebagai bahan atau dasar dalam
menentukan isi, bahasa, sistematika item dalam instrumen
penelitian.
3. keterandalan

dalam

instrumen

itu

sendiri

sebagai

alat

pengumpulan data baik dari keajegan, kesahihan maupun


obyektivitas.
4. jenis data yang diharapkan dari penggunaan instrumen harus jelas,
sehingga peneliti dapat memperkirakan cara analisis data guna
pemecahan masalah penelitian.
5. mudah dan praktis digunakan, akan tetapi dapat menghasilkan
data yang diperlukan.
Hal penting dari suatu instrumen adalah bahwa substansinya harus
benar-benar menggali informasi yang diperlukan bagi suatu penelitian
dengan mengacu pada konsep empiris atau indikator yang telah ditentukan,
adapun mengenai prosedur penggunaannya, apakah dilengkapkan oleh
peneliti (seperti : rating Scale, Interview, performance checklist) atau
responden (seperti : Kuesioner, skala sikap, test presrtasi dan bakat, Test
kinerja)

sangat

ditentukan

oleh

kepraktisan,

obyektivitas

dan

jangkauan/cakupan perolehan data.


Secara umum terdapat beberapa jenis instrumen penelitian yang
dapat digunakan oleh seorang peneliti yaitu :
Tes. Yaitu suatu alat ukur yang diberikan pada individu (responden)
untuk mendapat jawaban-jawaban baik secara tertulis ataupun lisan,
sehingga

dapat

diketahui

kemampuan

individu/responden

yang

bersangkutan. Contohnya : Tes prestasi belajar yang dimaksudkan untuk


mengetahui/mengukur kemampuan dan penguasaan terhadap hasil dari
proses pembelajaran ; Test intelegensi. Adalah test yang dimaksudkan untuk
mengukur kemampuan atau potensi individu secara umum, seperti test IQ
dari Binet Simon untuk mengetahui tingkatan kecerdasan (IQ) seseorang.
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

49

Kuesioner. Instrumen penelitian dalam bentuk pertanyaan yang


biasanya dimaksudkan untuk mendapatkan informasi berkaitan dengan
pendapat, aspirasi, persepsi, keinginan, keyakinan dan lain-lain secara
tertulis, dan apabila pertanyaan dan jawaban dilakukan secara lisan disebut
Wawancara.

Dalam

suatu

penelitian

kedua

instrumen

ini

sering

dikombinasikan dengan maksud untuk lebih meyakinkan.


Skala. Merupakan alat untuk mengukur nilai/keyakinan, sikap dan halhal yang berkaitan dengan personological Variable, instrumen bentuk skala
biasanya disusun dalam bentuk pernyataan pada suatu kontinum nilai
tertentu, umumnya bentuk skala dipakai untuk mengukur sikap (skala sikap),
atau skala lainnya (tergantung pada konsep yang ingin diukur sesuai dengan
fokus/masalah penelitian).
Instrumen-instrumen penelitian di atas merupakan sebagian dari jenisjenis instrumen lainnya, namun dalam penelitian kuantitatif (dengan obyek
penelitian yang cukup besar) instrumen tersebut sangat sering dipergunakan
dan sangat aplikabel untuk penerapan teknik analisis dengan statistik.
Adapun instrumen lainnya yang bisa dipergunakan dalam suatu penelitian
dapat dilihat dalam tabel berikut :
Yang dilengkapi peneliti

Yang dilengkapi subyek/responden

1. Rating Scale

1. Quetionnaires

2. Interview Schedule

2. Self Checklist

3. Tally Sheets

3. Attitude Scales

4. Flowcharts

4. Personality (or Character) Inventories

5. Performance Checklist

5. Achevement/Aptitude Test

6. Anecdotal Record

6. Performance Tests

7. Time And Motion Logs

7. Projective Devices
8. Sociometric Devices

Sumber : Jack R. Fraenkel, 1993. How to design and evaluation research in education.

2.3. Kriteria Instrumen


stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

50

sebagaimana diketahui bahwa instrumen merupakan alat ukur yang


digunakan untuk mendapatkan informasi tentang variasi karakteristik variabel
secara obyektif. Instrumen mempunyai peranan yang sangat penting dalam
suatu penelitian karena kualitas data (berarti juga kualitas hasil penelitian)
sangat ditentukan/dipengaruhi oleh kualitas instrumen yang digunakan. Oleh
karena itu untuk mendapatkan hasil penelitian yang dapat dipertanggung
jawabkan diperlukan instrumen yang dapat dipertanggungjawabkan pula,
dalam hubungan ini Instrumen penelitian harus memenuhi kriteria Validitas
dan Reliabilitas agar penggunaannya dalam suatu penelitian dapat
menghasilkan data/informasi yang akurat dan obyektif.
2.3.1. Validitas
Validitas atau kesahihan menunjukan pada kemampuan suatu
instrumen (alat pengukur) mengukur apa yang harus diukur (. a valid
measure if it succesfully measure the phenomenon), seseorang yang ingin
mengukur tinggi harus memakai meteran, mengukur berat

dengan

timbangan, meteran, timbangan merupakan alat ukur yang valid dalah kasus
tersebut. Dalam suatu penelitian yang melibatkan variabel/konsep yang tidak
bisa diukur secara langsung, maslah validitas menjadi tidak sederhana, di
dalamnya juga menyangkut penjabaran konsep dari tingkat teoritis sampai
tingkat empiris (indikator), namun bagaimanapun tidak sederhananya suatu
instrumen penelitian harus valid agar hasilnya dapat dipercaya.
Mengingat pentingnya masalah validitas. Maka tidak mengherankan
apabila Para Pakar telah banyak berupaya untuk mengkaji masalah validitas
serta membagi validitas ke dalam beberapa jenis, terdapat perbedaan
pengelompokan jenis-jenis validitas, Elazar Pedhazur menyatakan bahwa
validitas yang umum dipakai tripartite classification yakni Content, Criterion
dan Construct, sementara Kenneth Bailey mengelompokan tiga jenis utama
validitas yaitu : Face validity, Criterion Validity, dan construct validity, dengan
catatan face validity cenderung dianggap sama dengan content validity.
Berikut ini akan dikemukakan beberapa jenis validitas yaitu :
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

51

Validitas Rupa (Face validity). Adalah validitas yang menunjukan


apakah alat pengukur/instrumen penelitian dari segi rupanya nampak
mengukur apa yang ingin diukur, validitas ini lebih mengacu pada bentuk dan
penampilan instrumen. Menurut Djamaludin Ancok validitas rupa amat
penting

dalam

pengukuran

kemampuan

individu

seperti

pengukuran

kejujuran, kecerdasan, bakat dan keterampilan.


Validitas

isi

(Content

Validity).

Valditas

isi

berkaitan

dengan

kemampuan suatu instrumen mengukur isi (konsep) yang harus diukur. Ini
berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau
variabel yang hendak diukur. Misalnya test bidang studi IPS, harus mampu
mengungkap isi bidang studi tersebut, pengukuran motivasi harus mampu
mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan
demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan
validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar ini
Dia berpendapat bahwa validitas isi berbeda dengan validitas rupa yang
kurang menggunakan analisis logis yang sistematis, lebih lanjut dia
menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga
mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
Validitas kriteria (Criterion validity). Adalah validasi suatu instrumen
dengan membandingkannya dengan instrumen-pengukuran lainnya yang
sudah valid dan reliabel dengan cara mengkorelasikannya, bila korelasinya
signifikan maka instrumen tersebut mempunyai validitas kriteria. Terdapat dua
bentuk Validitas kriteria yaitu : Validitas konkuren (Concurrent validity),
Validitas ramalan (Predictive validity).

Validitas konkuren

adalah

kemampuan suatu instrumen pengukuran untuk mengukur gejala tertentu


pada saat sekarang kemudian dibandingkan dengan instrumen pengukuran
lain untuk konstruk yang sama. Validitas ramalan adalah kemampuan suatu
instrumen pengukuran memprediksi secara tepat dengan apa yang akan
terjadi di masa datang. Contohnya apakah test masuk sekolah mempunyai
validitas ramalan atau tidak ditentukan oleh kenyataan apakah terdapat
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

52

korelasi yang signifikan antara hasil test masuk dengan prestasi belajar
sesudah menjadi siswa, bila ada, berarti test tersebut mempunyai validitas
ramalan.
Validitas konstruk (Construct Validity). Konstruk adalah kerangka dari
suatu konsep, validitas konstruk adalah validitas yang berkaitan dengan
kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang
diukurnya. Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas
konstruk) merupakan yang terluas cakupannya dibanding dengan validasi
lainnya, karena melibatkan banyak prosedur termasuk validasi isi dan validasi
kriteria.
Lebih jauh Jack R. FraenkelI meneyatakan bahwa untuk mendapatkan
validitas konstruk ada tiga langkah di dalamnya yaitu :
1. Variabel yang akan diukur harus didefinisikan dengan jelas
2. Hipotesis, yang mengacu pada teori yang mendasari variabel
penelitian harus dapat membedakan orang dengan tingkat gradasi
yang berbeda pada situasi tertentu
3. Hipotesis tersebut diuji secara logis dan empiris.
Dalam upaya memperoleh validitas konstruk, maka seorang peneliti
perlu mencari apa saja yang menjadi suatu kerangka konsep agar dapat
menyusun tolok ukur operasional konsep tersebut. Pencarian kerangka
konsep menurut Djamaludin Ancok dapat ditempuh beberapa cara :
1. Mencari definisi-definisi konsep yang dikemukakan oleh para akhli
yang tertulis dalam buku-buku literatur.
2. Mendefinisikan sendiri konsep yang akan diukur, jika tidak
diperoleh dalam buku-buku literatur
3. Menanyakan definisi konsep yang

akan diukur kepada calon

responden atau orang-orang yang memiliki karakteristik yang sama


dengan responden.
Mengingat pentingnya pendefinisian suatu konsep yang ingin diukur,
maka seorang peneliti perlu mencermatinya, sebab definisi suatu konsep
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

53

perlu dikembangkan dari mulai definisi teoritis, definisi empiris, sampai


definisi operasional (dapat dipadankan dengan konsep teori, konsep empiris,
konsep analitis/operasional, atau dengan konsep, dimensi, dan indikator)
pemahaman definisi tersebut dapat dijadikan awal yang strategis untuk
penjabaran konsep sampai diperoleh indikator, untuk kemudian disusun itemitem yang diperlukan untuk sebuah instrumen penelitian.
Sementara itu Elazar J. Pedhazur mengemukakan tiga pendekatan
dalam Validasi konstruk yaitu : 1). Logical analysis; 2). Internal structure
analysis; 3). Cross-structure analysis. Analisis logis dalam konteks validasi
konstruk dimaksudkan untuk membentuk hipotesis pembanding sebagai
alternatif penjelasan berkaitan dengan konstruk/konsep yang akan diukur,
hubungan antar konsep dan yang sejenisnya. Dalam pendekatan ini langkah
yang

diperlukan

adalah

pendefinisian

konstruk/konsep,

penentuan

kesesuaian isi item dengan indikator, serta penentuan prosedur pengukuran.


Analisis struktur internal merupakan pendekatan kedua dalam validasi
konstruk, analisis ini berkaitan dengan validitas indikator dari suatu
konsep/konstruk, artinya indikator-indikator yang digunakan bersifat homogin
(dalam tingkatan minimum) serta mengukur konsep yang sama (terdapatnya
kesesuaian antara indikator-indikator dengan konsepnya).Sementara itu analisis

struktur silang berkaitan dengan pengkajian analisis internal dari masingmasing konsep terhubung (yang unobservable) yang dihubungkan pada
tataran empirisnya (indikator), sebab pada tataran inilah suatu hipotesis diuji.
2.3.1.1. Perhitungan/pengujian Validitas Instrumen
Apabila langkah-langkah tersebut di atas telah dilakukan, paling tidak
langkah penjabaran konsep yang kemudian diikuti dengan penyusunan itemitem

instrumen,

maka

perhitungan

statistik

dapat

dilakukan

untuk

perhitungan/pengujian validitas instrumen pengukuran. Perhitungan ini


dimaksudkan untuk mengetahui konsistensi internal (sering juga disebut
validitas item atau discriminating power/daya diskriminasi item), dalam arti
sampai sejauh mana item-item mampu membedakan antara individu yang
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

54

memiliki dan tidak memiliki sifat dari item pengukuran, hal ini berarti juga
bahwa item-item dalam instrumen mengukur aspek yang sama. Dalam
hubungan ini langkah yang dilakukan adalah dengan cara mengkorelasikan
antara skor tiap item dengan skor total.
Dalam melakukan perhitungan korelasi antara skor item dengan skor
total dapat menggunakan rumus korelasi Product moment apabila nilai-nilai
skala telah dilakukan konversi menjadi interval (atau secara langsung
dianggap interval dengan mengacu pada pendapat bahwa nilai skala dapat
diperlakukan sebagai data interval), atau menggunakan rumus korelasi tata
jenjang (Rank-Spearman). Untuk memperjelas cara perhitungannya berikut
ini akan dikemukakan contoh perhitungan korelasi Product momen (cara
perhitungan dengan berbagai variasi dapat dilihat dalam Bab 4) dan korelasi
tata jenjang Spearman.
Sebuah instrumen penelitian/pengukuran terdiri dari 10 item dan
disebarkan pada 10 orang responden dengan hasil skor seperti dalam tabel
2.2. perhitungan korelasi dilakukan untuk tiap item dari item nomor 1 sampai
item no 10, untuk contoh perhitungan akan diambil item no 2
Tabel 2.2.
Resp

Nomor Item

A
B
C
D
E
F
G
H
I
J

1
4
2
3
3
3
2
2
4
3
4

2
2
2
2
4
4
4
2
2
2
4

3
2
2
2
3
4
4
2
2
2
4

4
4
3
3
3
4
4
2
4
3
4

5
2
2
2
3
4
4
2
2
2
3

6
3
2
3
3
4
4
3
3
3
4

7
2
2
2
3
3
2
2
2
2
2

8
3
3
3
4
4
4
2
3
3
4

9
3
2
3
3
4
4
2
3
2
3

10
3
2
3
3
4
4
2
3
2
4

I
II

.289
.362

.900
.870

.925
.879

.743
.789

.892
.872

.856
.830

.508
.525

.907
.910

.889
.904

.956
.950

Jml
28
22
26
32
38
36
21
28
24
36

Contoh Perhitungan Validitas menggunakan Korelasi Product Moment


adalah sebagai berikut :
Tabel perhitungan Korelasi Product moment
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

55

Responden
A
B
C
D
E
F
G
H
I
J
Jumlah

Item no 2 (X)
2
2
2
4
4
4
2
2
2
4
28

Jumlah (Y)
28
22
26
32
38
36
21
28
24
36
291

Y2
784
484
676
1024
1444
1296
441
784
576
1296
8805

XY
56
44
52
128
152
144
42
56
48
144
866

N XY - ( X) ( Y)
--------------------------------------------------N X2 ( X)2
N Y2 ( Y)2

10 x 866 - 28 x 291
-------------------------------------------10 x 88 (28)2

X2
4
4
4
16
16
16
4
4
4
16
88

512
------------------9.8

10 x 8805 (291)2

= 0.900

58.04

nilai r untuk item no 2 sebesar 0.90 kemudian dibandingkan dengan tabel r


pada baris N 2 (10 2) yaitu 8 sebesar 0.632 untuk taraf signifikansi 5%,
karena nilai r lebih besar dari nilai r tabel maka item no 2 adalah valid, untuk
item lainnya bandingkan nilai r untuk tiap-tiap item (tabel 2.2. rumawi I
menunjukan nilai r untuk tiap-tiap item) dengan r tabel, hasilnya item no 1
dan nomor 7 tidak valid (r hitung lebih kecil dari r tabel) sedangkan item
lainnya valid. Item-item yang valid saja yang dipergunakan dalam penelitian
sedang yang tidak valid dibuang.
Contoh perhitungan Validitas menggunakan Korelasi tata jenjang dari
Spearman sebagai berikut
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

56

Tabel perhitungan Korelasi Tata Jenjang


Responden Item no 2 (X)) Jumlah (Y)
A
2
28
B
2
22
C
2
26
D
4
32
E
4
38
F
4
36
G
2
21
H
2
28
I
2
24
J
4
36
Jumlah
28
291

Rani X
7.5
7.5
7.5
2.5
2.5
2.5
7.5
7.5
7.5
2.5

Rank Y
5.5
9
7
4
1
2.5
10
5.5
8
2.5

b
2
-1.5
0.5
-1.5
1.5
0
-2.5
2
-0.5
0
0

b2
4
2.25
0.25
2.25
2.25
0
6.25
4
0.25
0
21.5

Rumus korelasi tata jenjang :

rho

= 1 -

6 x b2
-------------n (n2 - 1)

rho

= 1 -

6 x 21.5
-------------10 (99)

rho

= 1 -

rho

= 0.870

0.13

nilai rho untuk item no 2 sebesar 0.870 kemudian dibandingkan dengan


tabel rho dengan N = 10 sebesar 0.648 untuk taraf signifikansi 5%, karena
nilai rho lebih besar dari nilai rho tabel maka item no 2 adalah valid, untuk
item lainnya bandingkan nilai rho untuk tiap-tiap item (tabel 2.2. rumawi II
menunjukan nilai rho untuk tiap-tiap item) dengan rho tabel, hasilnya item no
1 dan nomor 7 tidak valid (rho hitung lebih kecil dari rho tabel), sedangkan
item lainnya valid. Item-item yang valid saja yang dipergunakan dalam
penelitian sedang yang tidak valid dibuang.

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

57

Dengan memperhatikan

hasil kedua perhitungan tersebut nampak

bahwa baik skor item-item tersebut diperlakukan sebagai data interval


maupun ordinal hasilnya tidak menunjukan perbedaan.
2.3.2. Reliabilitas
Reliabilitas berarti
instrumen

pengukuran

kedapat
dikatakan

dipercayaan
reliabel

atau

apabila

keajegan,

instrumen

suatu

tersebut

dipergunakan secara berulang memberikan hasil ukur yang sama, menurut


Elazar J. Pedhazur reliability refers to the degree to which test score are free
from errors of measurement, kesalahan pengukuran akan berakibat pada
hasil yang berbeda dalam mengukur sesuatu yang sama. Dalam ilmu
sosial/pendidikan masalah reliabilitas terutama dalam presisi hasil ukur
cukup sulit apalagi bila dikaitkan dengan pengulangan, hal ini tidak lain
karena obyek yang diteliti cenderung berubah dari waktu kewaktu apalagi jika
rentang waktu pengulangan cukup lama, untuk itu upaya-upaya untuk
menghitung/menguji reliabilitas suatu instrumen merupakan estimasi nilai
pengukuran yang diteliti dengan nilai pengukuran yang sebenarnya. Dalam
upaya tersebut terdapat beberapa pandangan/cara untuk menilai/menghitung
reliabilitas suatu instrument sebagaimana akan terlihat dalam uraian berikut.
2.3.2.1. Teori pengujian klasik
teori pengujian klasik mengacu pada The true-score model dari
Spearman. Menurut model ini skor/nilai hasil observasi terdiri dari dua
komponen yaitu komponen nilai yang benar ditambah kekeliruan acak, yang
dalam bentuk simbul nampak sebagai berikut :
M = T + E
M = nilai/skor yang diukur/diobservasi (measured value)
T = nilai/skor yang benar (True value)
E = Kesalahan Pengukuran (Measurement error)
Pengukuran yang reliabel adalah pengukuran yang mempunyai tingkat
kesalah Nol (E = 0), sehingga nilai yang diobservasi sama dengan nilai yang
sebenarnya (M = T). bila menggunakan analisis statistika reliabilitas
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

58

pengukuran merupakan perbandingan antara

varians nilai/skor yang

sebenarnya dengan varians nilai/skor yang diobservasi, dan akar pangkat


duanya adalah korelasi antara nilai/skor yang sebenarnya dengan nilai/skor
yang diobservasi dan hasil korelasinya disebut indeks reliabilitas. Indeks ini
menurut Pedhazur disebut juga validitas pengukuran teoritis (Theoritical
validity of a measure) atau korelasi epistemik (epistemic correlation).
Secara teoritis cara tersebut cukup bermakna, namun sulit bahkan
tidak dapat dipergunakan untuk memperkirakan tingkat kesalahan yang
terdapat dalam suatu instrumen pengukuran karena tidak diketahuinya nilai
yang benar (T) dan tingkat

kesalahan (E), sehingga diperlukan asumsi-

asumsi berkaitan dengan konstannya substansi yang diukur serta kesalahan


yang terjadi bersifat acak, dan berdasar asumsi tersebut jika pengukuran
dilakukan pada seseorang secara berulang-ulang, maka akan diperoleh
sejumlah persamaan yang masing-masingnya akan mengandung nilai T dan
rata-rata dari E akan (diharapkan) sama dengan Nol, sehingga nilai yang
diobservasi akan sama dengan nilai yang sebenarnya (M = T).
2.3.2.2. Test-retest (Repeated measure)
Pengukuran ulang dimaksudkan untuk melihat konsistensi dari waktu
ke waktu. Cara pelaksanaannya adalah dengan meminta responden untuk
menjawab pertanyaan atau merespon pernyataan yang sama sebanyak dua
kali sesudah selang waktu tertentu. Sesudah diperoleh jawaban/respon
responden untuk dua kali pelaksanaan kemudian nilai/skor dari hasil
pengukuran yang pertama dikorelasikan dengan nilai/skor hasil pengukuran
yang ke dua dengan menggunakan formula korelasi product momen atau
korelasi tata jenjang sesuai dengan karakteristik data yang diperoleh.
Sebagai ilustrasi berikut ini akan diberikan contoh. Misalkan sebuah
instrumen pengukuran dibuat untuk mengetahui persepsi Guru terhadap
kepemimpinan kepala sekolah kepada 10 responden dengan hasil sebagai
mana terlihat dalam tabel berikut :
Tabel nilai skor hasil dua kali pengukuran
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

59

Resp
A
B
C
D
E
F
G
H
I
J

Skor pada Pengukuran


Pertama
20
25
21
23
22
21
24
26
21
22

Skor pada pengukuran


Kedua
20
24
21
23
21
21
24
26
20
22

Skor pengukuran pertama kemudian dikorelasikan dengan skor pengukuran


kedua (cara perhitungan sama seperti dalam perhitungan Validitas), koefisien
korelasi yang diperoleh kemudian di bandingankan dengan nilai tabel, bila
lebih besar berarti instrumen tersebut reliabel. Hasil perhitungan data skor di
atas diperoleh nilai r = 0.970 (nilai tabel = 0.632 pada taraf signifikansi 5%),
dan nilai rho = 0.953 (nilai tabel = 0.648 pada taraf signifikansi 5%), ini
berarti bahwa instrumen pengukuran tersebut reliabel.
Dalam penggunaan cara ini seorang peneliti harus memperhatikan
selang waktu antara pengukuran yang pertama dan yang kedua, tidak ada
patokan yang pasti, yang penting harus dihindari kemungkinan terjadinya
bias akibat responden merasa diperlakukan tidak wajar jika terlalu
pendek,atau terjadi perubahan jika terlalu lama, namun Djamaludin Ancok
menyatakan bahwa

selang waktu antara 15-30 hari pada umumnya

dianggap memenuhi persyaratan tersebut.


2.3.2.3. Metode paralel (Alternate Method)
cara ini dilakukan dengan memberikan dua bentuk pengukuran yang identik
(dalam arti sejajar) kepada responden yang sama secara serempak. Dua
pengukuran identik bermakna bahwa dua instrumen pengukuran tersebut
dimaksudkan untuk mengukur konstruk yang sama namun dengan item-item
pertanyaan/pernyataan

yang

berbeda.

Sebagai

contoh

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

terdapat

dua

60

instrumen pengukuran motivasi yaitu instrumen A dan instrumen B, kedua


instrumen tersebut dikenakan pada sepuluh responden dengan hasil sbb :
Tabel nilai skor hasil dua Instrumen Pengukuran
Resp
A
B
C
D
E
F
G
H
I
J

Skor Instrumen A
20
25
21
23
22
21
24
26
21
22

Skor Instrumen B
20
24
21
23
21
21
24
26
20
22

Skor pengukuran Instrumen A dikorelasikan dengan skor Instrumen B (cara


perhitungan sama seperti dalam perhitungan Validitas), koefisien korelasi
yang diperoleh kemudian di bandingankan dengan nilai tabel, bila lebih besar
berarti instrumen tersebut reliabel. Hasil perhitungan data skor di atas
diperoleh nilai r = 0.970 (nilai tabel = 0.632 pada taraf signifikansi 5%), dan
nilai rho = 0.953 (nilai tabel = 0.648 pada taraf signifikansi 5%), ini berarti
bahwa instrumen pengukuran tersebut reliabel.
2.3.2.4. Pendekatan Konsistensi internal
Pendekatan

konsistensi

internal

merupakan

satu

cara

untuk

mengurangi kesulitan yang diakibatkan oleh dua perlakuan atau dua bentuk
pengukuran seperti dalam metode test-retest dan metode paralel. Dengan
cara ini pengukuran hanya dilakukan satu kali (single-trial administration),
sehingga dapat lebih efisien. konsistensi internal bermakna keajegan dari tiap
item dengan item-item lainnya dalam suatu kerangka instrumen pengukuran.
Terdapat beberapa cara untuk melakukan perhitungan reliabilitas antara lain
Teknik belah dua (Split half method), Formula Rolon, KR20, KR21, dan
Koefisien Alpha. Berikut ini akan dikemukakan contoh perhitungan reliabilitas.
1. Teknik Belah Dua (Split-half method)

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

61

Metode atau teknik belah dua menggunakan formula SpearmanBrown, cara ini hanya dapat dikenakan pada instrumen pengukuran dengan
jumlah item genap (pengelompokan dilakukan pada item-item yang
valid),adapun langkah-langkahnya adalah sbb :

Kelompokan item-item menjadi dua kelompok didasarkan pada


kelompok ganjil (nomor item ganjil) dan kelompok genap (nomor
item genap), atau secara random.

Jumlahkan skor pada setiap kelompok sehingga diperoleh skor


total untuk tiap kelompok.

Korelasikan skor total antar kelompok

dengan formula korelasi

Product moment atau tata jenjang.

Masukan nilai koefisien korelasi tersebut ke dalam rumus


Sperman-Brown untuk mencari koefisien reliabilitas

ri

2 . r
1 + r

ri

= koefisien reliabilitas; rb = koefisien korelasi antar kelompok

Contoh perhitungan :
Tabel nilai skor total kelompok ganjil dan genap
Resp
Skor total kelompok ganjil
A
20
B
25
C
21
D
23
E
22
F
21
G
24
H
26
I
21
J
22
Hasil perhitingan korelasi r = 0.970
Koefisien/angka reliabilitasnya adalah :

Skor total kelompok genap


20
24
21
23
21
21
24
26
20
22

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

62

ri

0.970

1 + 0.970
ri

1.940
1.970

ri

0.985

2. Formula Rulon
Cara ini juga hanya berlaku pada pengelompokan seperti treknik belah dua,
namun estimasi reliabilitas tidak didasarkan pada perhitungan korelasi
melainkan pada varians perbedaan skor dengan varians total, adapun
rumusnya adalah sebagai berikut :

SDb2

rxx

1 -SDt2

rxx

= Koefisien reliabilitas ; SDb

= Varians perbedaan skor belahan ; SDt

= Varians skor Total

Contoh perhitungan :

Tabel nilai skor total kelompok ganjil dan genap


Resp

Skor total
kelompok ganjil

Skor total kelompok


genap

A
20
20
B
25
24
C
21
21
D
23
23
E
22
21
F
21
21
G
24
24
H
26
26
I
21
20
J
22
22
Hasil perhitungan varians menunjukan :

Skor b (selisih

Skor total

ganjil genap)

0
1
0
0
1
0
0
0
1
0

40
49
42
46
43
42
48
52
41
44

Rumus mencari Varians :


2

(X
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif X
/ 2002
N

N -1

)2

63

SDb2 = 0.233

SDt2 = 15.344

Koefisien reliabilitasnya adalah :


0.233

rxx

1 -15.344

rxx

1 --

0.015

0.984

3. Formula Flanagan
Formula Flanagan merupakan estimasi nilai/angka reliabilitas yang tidak
mengacu pada perhitungan korelasi, melainkan sama seperti formula Rulon
yang mengacu pada veriansi tiap-tiap kelompok hasil belah dua, bedanya
dalam formula ini ada nilai konstanta 2 serta varians kelompok dijumlahkan
dan bukan varians beda, sementara pembaginya sama yaitu varians total.
Rumus :
S12 + S22

rxx

2 (1 --

)
St2

S12 = Varians belahan pertama


S22 = Varians belahan kedua
St2 = Varians total

Contoh perhitungan :
Tabel nilai skor ganjil dan genap dan skor total
Resp

Skor total kelompok


ganjil

Skor total kelompok


genap

Skor total

A
B
C
D
E
F
G
H
I
J

20
25
21
23
22
21
24
26
21
22

20
24
21
23
21
21
24
26
20
22

40
49
42
46
43
42
48
52
41
44

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

64

S12 = 3.833
S22 = 3.956
St2 = 15.344
Bila nilai-nilai tersebut dimasukan dalam rumus, akan nampak sebagai
berikut :
3.833 + 3.956

rxx

2 (1 --

)
15.344

rxx

2 (0.492) = 0.985

4. Formula K-R 21 (Kuder Richardson)


Formula K-R merupakan prosedur pencarian nilai reliabilitas dengan
tidak mensyaratkan pembelahan item ke dalam dua kelompok, sehingga bisa
diterapkan pada instrumen yang jumlah itemnya tidak genap.
Rumus :
k

rxx =

M (k M)

) (1 -k - 1

= Mean/rata-rata skor total

k
SDt2

= kelompok/banyaknya item
= Varians total

)
kSDt2

Contoh perhitungan :
Tabel skor tiap item dan Total
Resp
A
B
C
D
E
F
G

1
4
2
3
3
3
2
2

2
2
2
2
4
4
4
2

3
2
2
2
3
4
4
2

4
4
3
3
3
4
4
2

Nomor Item
5
6
2
3
2
2
2
3
3
3
4
4
4
4
2
3

7
2
2
2
3
3
2
2

8
3
3
3
4
4
4
2

9
3
2
3
3
4
4
2

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

10
3
2
3
3
4
4
2

Jml
28
22
26
32
38
36
21

65

H
I
J

4
3
4

2
2
4

= 2.91

SDt2

= 10

2
2
4

4
3
4

2
2
3

3
3
4

2
2
2

3
3
4

3
2
3

3
2
4

28
24
36

37.433

masukan nilai-nilai di atas ke dalam rumus


10

rxx =

2.91(10 2.91)

) (1 --

)
37.433

rxx =

( 1.11 ) (1 --

20.631

37.433

rxx =

0.498

5. Rumus Alpha (Cronbach)


Formula Alpha juga merupakan prosedur pencarian nilai reliabilitas
dengan tidak mensyaratkan pembelahan item ke dalam dua kelompok (meski
bisa juga diterapkan pada teknik belah dua), sehingga bisa diterapkan pada
instrumen yang jumlah itemnya tidak genap. Namun hal yang perlu diingat
adalah bahwa pembelahan mesti dilakukan secara seimbang, sebab

jika

dibelah tidak seimbang akan underestimasi terhadap nilai reliabilitas yang


sebenarnya (biasanya lebih rendah).
Rumus :

SDb2

K
=

)
K- 1

SDb2 = Varians skor kelompok ; SDt2

( 1 --

)
SDt2

Varians skor Total; K = Kelompok/jumlah item

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

66

Sebagai contoh terdapat 10 item yang ingin dibelah menjadi lima


kelompok secara berurutan, untuk itu jumlah tiap-tiap kelompok harus
diketahui untuk dicari variansnya, sesudah itu baru dimasukan ke dalam
rumus Alpha.
Contoh perhitungan :
Tabel skor tiap item, skor kelompok, skorTotal

Res

A
B
C
D
E
F
G
H
I
J

jml

4
2
3
3
3
2
2
4
3
4

2
2
2
4
4
4
2
2
2
4

6
4
5
7
7
6
4
6
5
8

2
2
2
3
4
4
2
2
2
4

No Item dan Jml tiap kelompok


4 jml 5
6 jml 7
8 jml

4
3
3
3
4
4
2
4
3
4

6
5
5
6
8
8
4
6
5
8

2
2
2
3
4
4
2
2
2
3

3
2
3
3
4
4
3
3
3
4

5
4
5
6
8
8
5
5
5
7

2
2
2
3
3
2
2
2
2
2

3
3
3
4
4
4
2
3
3
4

5
5
5
7
7
6
4
5
5
6

3
2
3
3
4
4
2
3
2
3

Tot.
10 jml Jml

3
2
3
3
4
4
2
3
2
4

6
4
6
6
8
8
4
6
4
7

28
22
26
32
38
36
21
28
24
36

SDt2 = 37.433 ; k = 10 ; SDb21 = 1.733 ; SDb22 = 2.1 ; SDb23 = 1.956 ;


SDb24 = 0.944 ; SDb25 = 2.322

5
=

1.733 + 2.1 + 1.956 + 0.944 + 2.322

) (1 --

)
37.433

4
9.055

( 1.25 ) (1 --

)
37.433

( 1.25 ) (0.758) = 0.948

2.3.2.5. Standar Reliabilitas


Besarnya nilai reliabilitas yang bisa diterima sebagai estimasi yang
signifikan terhadap reliabilitas yang sebenarnya merupakan masalah yang
banyak dibicarakan oleh para pakar, pada dasarnya semakin besar koefisien
reliabilitas, semakin baik, namun permasalahannya terletak pada berapa
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

67

besarnya nilai yang memadai. Dalam hubungan ini banyak pengarang yang
memberikan patokan umum tentang standar minimum tingkat nilai koefisien
reliabilitas.

Nunnally

dalam

bukunya

Psychometric

Theory

sebagaimana dikutif oleh Elazar J. Pedhazur menyatakan bahwa koefisien


yang relatif rendah dapat ditoleransi dalam tingkatan penelitian awal,
reliabilitas yang lebih tinggi diperlukan jika pengukuran dipakai untuk
menentukan perbedaan antar kelompok, dan reliabilitas yang sangat tinggi
menjadi esensil jika skor-skor dipakai untuk membuat keputusan penting
tentang seseorang (misalnya keputusan dalam seleksi dan penempatan).
Lebih jauh Nunnally menyatakan bahwa untuk penelitian awal koefisien
reliabilitas 0.60 atau 0.50 sudah cukup, sementara itu Caplan, Naidu dan
Tripathi dalam tulisannya pada Journal of health and social behaviour (1984)
menyatakan bahwa koefisien alpha 0.50 atau lebih dianggap cukup untuk
suatu tujuan penelitian. Disamping pendapat tersebut ada juga akhli yang
menggunakan harga kritik nilai tabel korelasi Product Moment (seperti
Chabib Thaha dalam bukunya Teknik Evaluasi Pendidikan), sehingga nilai
reliabilitas yang diperoleh dibandingkan dengan r tabel, bila lebih besar
berarti instrumen pengukuran tersebut reliabel, sedang bila lebih kecil dari r
UNTUK DIDISKUSIKAN
tabel berarti instrumen pengukuran tersebut tidak reliabel.
Skor item-item suatu skala sikap
Res
1
2
A
5
4
B
4
3
C
3
3
D
4
2
E
2
5
F
3
4
G
4
4
H
3
4
I
3
3
J
2
2
K
5
2
L
4
3
Dari data tersebut :

3
3
4
3
2
5
1
3
4
3
2
5
1

Nomor item
4
5
3
2
5
1
2
3
4
2
3
4
2
4
4
3
3
4
3
3
2
2
5
5
4
1

6
3
4
4
3
2
2
4
4
3
2
2
4

7
4
5
3
3
5
2
4
3
3
2
5
4

8
3
3
4
5
4
2
3
4
3
2
5
1

1. hitung validitas Item


68
2. hitung reliabilitas dengan teknik belah dua menggunakan
seluruh formula
3. hitung reliabilitas dengan teknik membagi empat dengan
menggunakan formula formula yang sesuai

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

Anda mungkin juga menyukai