Bab II Pengukuran Pen Kuanti Revisi

BAB II
PENGUKURAN DAN INSTRUMEN
Ilmu Pendidikan berkomunikasi dengan realitas melalui konsepkonsep, sehingga apabila konsep, baik tunggal maupun yang berhubungan,
mau diteliti maka diperlukan operasionalisasi agar konsep/variabel yang
menjadi fokus perhatian dapat diamati dan diobservasi, sesuatu yang dapat
diobservasi, baik secara langsung ataupun tidak langsung, juga bermakna
dapat diukur (Measurable), oleh karena itu pengukuran menjadi penting
dalam kaitannya dengan penelitian khususnya penelitian kuantitatif.
Pengukuran tidak bisa dilakukan secara sembarangan, sebab
memerlukan keterkaitan/keselarasan antara konsep dengan pelaksanaan
penelitian serta kehati-hatian terhadap kesalahan pengukuran (Measurement
error) yang dapat menjadi ancaman bagi keabsahan suatu penelitian. Dalam
suatu penelitian sosial, menurut Sofian Effendi, proses pengukuran adalah
rangkaian dari empat aktivitas, yakni :
1. menentukan dimensi konsep penelitian
2. rumusan ukuran untuk masing-masing dimensi (pertanyaanpertanyaan yang relevan dengan dimensi)
3. tentukan tingkat ukuran yang akan digunakan (Nominal, Ordinal,
Interval, Rasio)
4. tentukan tingkat kesahihan dan keajegan dari alat pengukur
secara sederhana dapat juga dikatakan bahwa untuk melakukan pengukuran,
maka peneliti perlu menentukan konsep/variabel yang
akan diteliti,
menentukan indikator-indikator dari variabel tersebut, menentukan item-item

untuk pengukuran sesuai dengan indikator masing-masing, dan kemudian
melakukan pengujian atas kesahihan (validitas) dan keajegan (reliabilitas)
alat ukur tersebut (Instrumen Penelitian).
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002
27
Meskipun seorang peneliti berusaha secermat mungkin, namun

terjadinya kesalahan dalam pengukuran masih mungkin, sehingga diperlukan
pemahaman tentang kesalahan-kesalahan yang mungkin terjadi dalam
pengukuran. Terdapat dua tipe kesalahan dalam pengukuran yaitu Random
error yakni ketidak ajegan (unreliability) pengukuran dimana pengulangan
pengukuran menghasilkan hasil yang berbeda, hal ini terjadi apabila
pengacakan sampel kurang representatif atau karena ukuran sampel yang
terlalu kecil dan Non-random error yakni ketidak validan (invalidity) atau bias
dalam pengukuran dimana instrumen pengukuran tidak mengukur apa yang
seharusnya
menggunakan
diukur.
Penelitian
pengukuran
yang
dengan
baik
adalah
menghilangkan
penelitian
atau
paling
yang
tidak
mengurangi kedua tipe kesalahan tersebut.

Dalam analisa data yang menggunakan statistik pengukuran adalah
hal yang sangat penting karena merupakan sumber angka-angka yang
dipakai dalam analisa statistik, disamping sebagai pedoman dalam
penentuan teknik analisis statistik yang dapat dipergunakan. Secara umum
pengukuran diartikan sebagai proses membedakan sesuatu (The process by
which things are differentiated), sedang secara operasional, Pengukuran
adalah penerapan aturan bilangan pada obyek atau fenomena tertentu,
dalam suatu penelitian Kuantitatif pengukuran dikenakan pada variabel yang
kita teliti. Dengan kata lain pengukuran bermakna menandai nilai-nilai suatu
variabel dengan tanda bilangan tertentu secara sistematis.
Memang diakui bahwa apabila hasil suatu pengukuran dapat
dikuantifikasikan serta dinyatakan dalam bentuk angka, ambiguitas bahasa
akan sangat berkurang (seperti saya tinggi dengan Saya 1,62 cm tinggi),
namun demikian dalam proses pengukuran tidak selamanya
harus
menggunakan penandaan dalam bentuk angka (Kuantifikasi), yang penting

tergambar suatu perbedaan posisi yang satu dengan yang lain dalam suatu
kontinum nilai. ketentuan penerapan nilai suatu variabel
bilangan atau lambang disebut skala
dengan tanda
(Levels of Measurement). Dalam
28
hubungan ini terdapat beberapa skala pengukuran (Terkadang disebut jenis

data atau tipe variabel berdasarkan tingkat pengukuran) yang perlu dipahami
oleh seorang peneliti
Skala Nominal. Adalah skala yang hanya mendasarkan pada
pengelompokan atau pengkategorian peristiwa atau fakta dan apabila
menggunakan notasi angka hal itu sama sekali tidak menunjukan perbedaan
kuantitatif melainkan hanya menunjukan perbedaan kualitatif. Banyak
variabel dalam penelitian sosial menggunakan skala nominal seperti Agama,
Jenis kelamin, Tempat lahir, asal sekolah dsb. Adapun ciri dari skala nominal
adalah : (1) kategori data bersifat mutually exclusive (saling memisah), (2)
Kategori data tidak mempunyai aturan yang logis (bisa sembarang).
Skala Ordinal. Adalah pengukuran dimana skala yang dipergunakan
disusun secara terurut dari yang rendah sampai yang tinggi menurut suatu
ciri tertentu, namun antara urutan (ranking) yang satu dengan yang lainnya
tidak mempunyai jarak yang sama, skala ordinal banyak dipergunakan dalam
penelitian sosial dan pendidikan terutama berkaitan dengan pengukuran
kepentingan, persepsi, motivasi serta sikap, apabila mengukur sikap
responden terhadap suatu Kebijakan pendidikan , responden dapat diurutkan
dari mulai Sangat setuju (1), Setuju (2), Tidak berpendapat (3), Kurang Setuju
(4), dan Tidak setuju (5), maka angka-angka tersebut hanya sekedar
menunjukan urutan responden, bukan nilai untuk variabel tersebut. Adapun
ciri dari skala ordinal adalah : (1) kategori data bersifat saling memisah, (2)
kkategori data mempunyai aturan yang logis, (3) kategori data ditentukan
skalanya berdasarkan jumlah karakteristik khusus yang dimilikinya.
Skala Interval. Adalah skala pengukuran dimana jarak satu tingkat
dengan tingkat lainnya sama, oleh karena itu skala interval dapat juga disebut
skala unit yang sama (equal unit scale), contoh yang sangat dikenal adalah
temperatur. Adapun ciri-ciri skala interval adalah : (1) kategori data bersifat
saling memisah, (2) kategori data mempunyai aturan yang logis, (3) kategori
data ditentukan skalanya berdasarkan
jumlah karakteristik khusus yang
29
dimilikinya, (4) perbedaan karakteristik yang sama tergambar dalam

perbedaan yang sama dalam jumlah yang dikenakan pada kategori, (5)
angka nol hanya menggambarkan suatu titik dalam skala (tidak punya nilai
Nol absolut).
Skala Rasio. Skala interval yang benar-benar memiliki nilai nol mutlak
disebut skala rasio, dengan demikian skala rasio menunjukan jenis
pengukuran yang sangat jelas dan akurat (precise). Jika kita memiliki skala
rasio, kita dapat menyatakan tidak hanya jarak yang sama antara satu nilai
dengan nilai lainnya dalam skala, tapi juga tentang jumlah proporsional
karakteristik yang dimiliki dua obyek atau lebih, dan contoh untuk skala ini
adalah uang. Adapun ciri-ciri dari skala rasio adalah : (1) kategori data
bersifat saling memisah, (2) kategori data mempunyai aturan yang logis, (3)
kategori data ditentukan skalanya berdasarkan jumlah karakteristik khusus
yang dimilikinya, (4) perbedaan karakteristik yang sama tergambar dalam
perbedaan yang sama dalam jumlah yang dikenakan pada kategori, (5)
angka nol menggambarkan suatu titik dalam skala yang menunjukan
ketiadaan karakteristik (punya nilai Nol absolut).
Bagi seorang peneliti pemahaman secara tepat tentang skala
pengukuran sangat penting karena dua alasan : Pertama, tiap skala
pengukuran memberikan jumlah informamsi yang berbeda, skala rasio
memberi informasi lebih banyak dibanding interval, interval lebih banyak
dibanding ordinal, dan ordinal memberi informasi lebih banyak dibanding
skala pengukuran nominal, oleh karena itu, jika memungkinkan peneliti
sebaiknya menggunakan skala pengukuran yang dapat memberikan
informasi paling maksimum yang diperlukan untuk menjawab permasalahan
penelitian. Kedua, beberapa jenis prosedur analisa statistik tidak tepat untuk
dipergunakan pada skala pengukuran yang berbeda, untuk itu kejelasan
penentuan skala pengukuran akan menentukan jenis analisis statistik yang
bagaimana yang akan dipergunakan.
30
Gambar 2.1. Empat jenis Skala Pengukuran

SKALA
CONTOH
Jenis Kelamin
(Karakteristik : hanya data
Kelompok dan Label,
melaporkan frekuensi atau
prosentase)
Nominal
Peringkat dalam suatu

Lomba
Ordinal
(Karakteristik : data urutan,

menggunakan angka hanya
untuk menunjukan peringkat)
Ke-4
Ke-3
Ke-2
Ke-1
Temperatur
Interval
10
20
30
(Karakteristik : Menganganggap bahwa perbedaan

antar skor benar-benar menunjukan perbedaan yang
sama dalam variabel yang
diukur)
Uang
(Karakteristik : mencakup
seluruh karakteristik di atas
ditambah nilai nol
mutlak/yang sebenarnya)
Rasio
0
Rp. 10
Rp.20
Rp.30
Rp.40
2.1. Penentuan Indikator/Konsep Empiris

Konsep merupakan konstruksi teoritis yang dimaksudkan untuk
mengorganisasikan realitas dan bukan sesuatu yang punya gambaran visual,
konsep mempunyai gradasi yang berbeda-beda dalam hal kesulitan dan
kemudahannya untuk diukur tergantung pada tingkatan abstraksi, konsep
Tinggi, berat merupakan contoh yang mudah diukur, namun bagaimana
halnya mengukur konsep yang punya tingkat abstraksi tinggi seperti :
Motivasi, Minat , IQ, EQ, dan konsep lain yang sejenis, sudah barang tentu
untuk konsep-konsep seperti itu pengukurannya tidak sederhana karena
31
memerlukan upaya mengempiriskan konsep-konsep tersebut agar dapat

dilakukan pengukuran.
Dengan demikian agar suatu konsep dapat diukur maka diperlukan
pengetahuan tentang unsur-unsur yang dapat dijadikan petunjuk (indikator)
terhadap suatu konsep, oleh karena itu konsep dan indikator merupakan dua
hal yang penting dalam suatu penelitian, keduanya harus menunjukan
validasi konsep yaitu penyimpulan yang valid atas suatu konsep (yang tidak
dapat diobservasi) atas dasar indikator (yang dapat diobservasi).
Seorang peneliti tidak meneliti konsep secara langsung melainkan
secara tidak langsung melalui pengumpulan data sesuai dengan indikatorindikator yang telah ditentukan, untuk itu indikator harus benar-benar dapat
menggambarkan konsepnya, dalam hubungan ini langkah penting dalam
penentuan indikator adalah dengan pengkajian definisi dan teori yang
berkaitan dengan konsep tersebut . Penentuan indikator dapat dilakukan
melalui : 1). penelusuran akibat-akibat dari suatu konsep, hasilnya disebut
Reflective Indicator/Reflector/Effect indicator ; dan 2). Penelusuran sebabsebab dari suatu konsep, hasilnya disebut Formative indicator/Cause
indicator. Cara mana saja yang dipergunakan tidaklah menjadi soal yang
penting
indikator-indikator
yang
dipilih/ditentukan
harus
merupakan
representasi dari konsep-konsep yang menjadi fokus penelitian.

Karena konsep/variabel tidak dapat diukur langsung, maka langkah
penentuan satuan-satuan yang bisa diobservasi menjadi sangat penting
dalam suatu penelitian, dalam hubungan ini terdapat dua cara dalam proses
tersebut yaitu :
1. melalui penjabaran konsep dari mulai Konsep Teori, Konsep
Empiris, Konsep Analitis, dan Konsep Operasional.
2. melalui penelusuran dari Konsep, Dimensi, Indikator, dan item
pertanyaan/pernyataan.
Kedua cara tersebut pada prinsipnya akan menghasilkan output yang sama,
untuk lebih jelasnya berikut ini akan dikemukakan suatu contoh :
32
Penjabaran Konsep
Teoritis
Empiris
Ijazah Terakhir
Pendidikan
Sertifikat Kursus
Analitis
Jawaban responden
Tentang ijazah terakhir
yang dimiliki
Jawaban responden
Tentang sertifikat kursus
yang dimiliki
Operasional (bisa hanya contoh

dan yang lain terpisah)
Apakah ijazah terakhir

Saudara miliki.
yang
Apakah sdr pernah mengikuti

Kursus
Bila Ya sertifikat kursus apa yang
sdr miliki
Penelusuran Konsep sampai Item

Konsep
Pendidikan
Dimensi
Indikator
Pendidikan
Formal/Sekolah
Ijazah terakhir yang

dimiliki
Pendidikan non
formal/Luar sekolah
Sertifikat kursus yang

dimiliki
Item (bisa hanya no Item dengan

item-item lengkap terpisah)
Apakah ijazah terakhir yang

Saudara miliki.
Apakah sdr pernah mengikuti
Kursus
Bila Ya sertifikat kursus apa yang
sdr miliki
kedua cara tersebut akhirnya menghasilkan satuan yang sama dalam hal
obyek yang dapat diukur untuk suatu penelitian, kalau melalui cara
penjabaran konsep diistilahkan dengan konsep empiris, sedangkan kalau
dengan cara Penelusuran konsep disebut indikator. Semua ini jelas sangat
diperlukan agar suatu penelitian dapat memperoleh suatu data untuk
dianalisa sampai diperoleh suatu kesimpulan yang berlaku atau dapat
diterapkan pada konsep-konsep yang menjadi fokus penelitian.
2.2. Pengukuran sikap
Di dalam penelitian Sosial dan Pendidikan dengan pendekatan
Kuantitatif, disamping pengukuran dengan menggunakan bentuk Test,
seorang peneliti akan banyak menghadapi penggunaan pengukuran
berbentuk Skala, baik dengan metode Thurstone, Bogardus ataupun Likert
yang umumnya dikenal dengan Skala Sikap, hal ini tidak lain karena dalam
bidang pendidikan banyak sekali Personological variable yang sulit, bahkan
tidak dapat diobservasi secara langsung melainkan melalui penyimpulan dari
indikasi tidak langsung (seperti Konsep diri, bakat, motivasi belajar).
33
A. Pengertian Sikap
Sikap (attitude) merupakan kecenderungan seseorang untuk bertindak
terhadap obyek tertentu, para akhli telah memberikan definisi yang bervariasi
terhadap konsep sikap, Thurstone sebagai pelopor dalam pengukuran sikap
mendefinisikan sikap sebagai berikut :
o attitude the sum total of mans inclinations and feelings,
prejudice and bias, preconceived notion, ideas, fears, threats, and
conviction about any specified topic (definisi tahun 1928)
o attitude is the affect for or against a psychological object (definisi
tahun 1931)
o attitudethe intensity of positive or negative affect for or against a
psychological object (definisi tahun 1946)
definisi-definisi tersebut oleh Daniel J. Mueller dirumuskan kembali sebagai
berikut :
o Attitude is :
1. affect for or against
2. evaluation of
3. like or dislike
4. positiveness or negativeness toward a psychological object.
pengertian di atas menunjukan bahwa suatu sikap merupakan suatu
perasaan,penilaian, kesukaan atau ketidak sukaan, kepositipan atau
kenegatipan terhadap suatu obyek psikologis tertentu. Sementara itu
Bogardus mendefinisikan Sikap
sebagai
a tendency to act toward
or
against some environmental factor.

B. Karakteristik Sikap
Dalam
bukunya
Principles
of
Educational
and
Psychological
Measurement and Evaluation, sebagaimana dikutip oleh Saifuddin Azwar

G. Sax menyatakan bahwa terdapat beberapa karakteristik dari sikap yaitu :
34
o Arah. Artinya sikap terpilah pada dua arah (kesetujuan atau

ketidaksetujuan; mendukung atau tidak mendukung; memihak atau
tidak memihak)
o Intensitas. Artinya kedalaman atau kekuatan sikap , kesamaan
arah bisa menunjukan intensitas yang berbeda.
o Keluasan. Artinya kesetujuan atau ketidaksejuan dapan mencakup
aspek keseluruhan atau hanya aspek bagian yang sangat spesifik
dari suatu obyek sikap
o Konsistensi. Yaitu kesesuaian antara pernyataan sikap yang
dikemukakan dengan responsnya terhadap obyek sikap dimaksud.
C. Dimensi Sikap
o Dimensi Kognitif (Keyakinan). Ekspresi keyakinan terhadap suatu
obyek sikap tertentu
o Dimensi Afektif (perasaan). Ekspresi perasaan secara langsung
terhadap obyek sikap tertentu
o Dimensi Konatif (kecenderungan prilaku). Pernyataan maksud atau
preferensi prilaku berkaitan dengan obyek tertentu, baik prilaku
personal maupun preferensi prilaku untuk kegiatan sosial.
Contoh Item pernyataan :
Keyakinan
: Biaya pendidikan di SD A tidak memberatkan
Perasaan
: Saya menyukai Lingkungan di SD A
Konatif
: Individu Saya akan menyekolahkan anak saya ke SD

A jika sudah waktunga
sosial
-- Pemerintah harus memberikan beasiswa

bagi Siswa yang kurang mampu
D. Kriteria Penyusunan Pernyataan Skala Sikap

Menurut Prof. Marat dalam bukunya Sikap Manusia, Perubahan dan
Pengukurannya,
kriteria informal
untuk mengedit pernyataan yang
digunakan untuk mengkonstruksikan skala sikap adalah :

35
1. menolak pernyataan yang dihubungkan dengan masa lalu daripada

saat sekarang
2. menolak
pernyataan
yang
faktual
atau
yang
baik
untuk
diinterpretasikan sebagai faktual

3. menolak pernyataan yang dapat diinterpretasikan lebih dari satu
4. menolak pernyataan yang tidak relevan kepada obyek psikologi
5. menolak pernyataan yang dapat diterima oleh hampir semua orang
atau bahkan tidak satupun yang menerima
6. memilih pernyataan yang dianggap memiliki pilihan dari skala efek
mengenai minat
7. menjaga bahasa yang sederhana dari pernyataan untuk jelas dan
langsung (tidak berbelit-belit)
8. pernyataan haruslah pendek kurang lebih dua puluh kata
9. pernyataan haruslah memiliki suatu pemikiran
10. menolak pernyataan yang mengandung kata-kata : semua; selalu;
tidak
satupun;
tidak
pernah;
yang
sering
menimbulkan
ketidakjelasan
11. kata-kata : hanya, benar/tepat, hampir, dan kata-kata lain yang
hampir sama artinya harus digunakan dengan hati-hati dalam
menulis pernyataan
12. bila mungkin pernyataan harus dalam bentuk kalimat yang
sederhana sehingga tidak merupakan bentuk yang kompleks dan
berlebihan
13. menolak penggunaan kata-kata yang tidak mempunyai arti
14. menolak penggunaan negatif rangkap.
E. Contoh Skala Sikap
Untuk lebih memperoleh gambaran tentang bagaimana pakar
membuat Skala Sikap, berikut ini akan dikemukakan dua cara masing-masing
mengacu pada Skala Thurstone dan Likert
36
1. Method of equal appearing Interval (Thurstone)

Metode ini dikemukakan oleh Edward pengarang Buku Technique of
attitude scale construction. Menurut Marat cara ini biasanya digunakan bila
pernyataan yang akan diskala adalah cukup banyak, sehingga sukar untuk
dilakukan penilaian secara perbandingan, sementara itu Saifuddin Azwar
menyatakan bahwa cara penskalaan ini mengacu pada model skala
Thurstone yang mengacu pada pendekatan penskalaan Stimulus serta
penilaiannnya dilakukan oleh kelompok penilai tertentu yang diberi tugas
membaca dengan seksama setiap pernyataan untuk kemudian memberikan
penilaian atau perkiraan tingkat favorable atau tidaknya suatu pernyataan
dalam suatu Psychological Continuum.
Psychological Continuum tersebut disusun dalam bentuk abjad
dengan asumsi bahwa jarak/interval antara hurup dengan huruf setara mulai
dari
yang tidak Favorable sampai yang Favorable dimulai dari abjad A
sampai K, dimana abjad F merupakan bagian yang netral, dalam prakteknya

yang tidak Favorable bernilai 1 dan yang Favorable bernilai 11, akan tetapi
pilihan terhadap suatu nilai tertentu tidak lantas dijadikan nilai skala suatu
item tertentu melainkan sebagai bahan untuk diolah kembali, adapun
kontinum skala tersebut nampak sebagai berikut
A
1
B
2
C
3
D
4
Tak Favorable
E
5
F
6
G
7
H
8
I
9
Netral
J
10
K
11
Favorable
Apabila pernyataan-pernyataan Skala Sikap telah dinilai/dijawab oleh

kelompok kemudian dihitung frekuensi untuk masing-masing pilihan alternatif
per item pernyataan, sebagai contoh : misalkan skala sikap model tersebut
diberikan pada 100 orang (N = 100) penilai dengan 30 item pernyataan,
kemudian kita ambil satu item nomor 1 untuk ditentukan nilainya, dengan
deskripsi sebagai berikut :
Tabel 2.1
37
No Item
1
F
P
Pk
A
1
4
B
2
5
C
3
6
D
4
8
0.04
0.04
0.05
0.09
0.06
0.15
0.08
0.23
Alternatif Pilihan
E
F
G
5
6
7
10
12
30
0.10
0.33
0.12
0.45
0.30
0.75
H
8
6
I
9
8
J
10
9
K
11
2
0.06
0.81
0.08
0.89
0.09
0.98
0.02
1.00
Keterangan :
F
= Frekuensi, jumlah penilai yang memilih tiap-tiap alternatif
= Proporsi tiap Frekuensi pilihan dengan jumlah penilai/penjawab

F dibagi N (F : N)
Pk
= Proporsi Kumulatif yaitu penambahan besarnya proporsi dengan

proporsi sebelumnya, misal 0.09 = 0.04 + 0.05
karena penentuan nilai/skor skala menggunakan ukuran tendendi sentral

Median, maka setiap item
perlu dicari mediannya dengan menggunakan
Rumus Median yang diberi lambang S sebagai berikut :
S = bb+ 0.5 pkb

pm
Keterangan :
S
= Skala nilai dari pernyataan (Median)
pkb
= Proporsi kumulatif di bawah posisi median
pm
= proporsi pada posisi Median
= interval (dalam hal ini sama dengan 1)
apabila diterapkan pada contoh dalam
tabel 2.1 akan nampak sebagai
berikut :
S = 6.5+
0.5 0.45
0.30
S = 6.67
38
Nilai 6.67 ini merupakan nilai skala untuk item nomor 1 tersebut, pencarian
nilai ini dilakukan sebanyak item-item yang tertuang dalam Skala sikap yang
akan dipergunakan dalam penelitian. Disamping itu untuk mengetahui variasi
distribusi dapat dilakukan perhitungan rentang antar kuartil (K 75 - k25) dengan
rumus :
K25 = bb + 0.25 pkb

Pk25
K75 = bb + 0.75 pkb

Pk 75
Bila diterapkan pada item tersebut di atas diperoleh nilai

K25
= 4.7
K75
= 7
= 2.3 (Rentang antar Kuartil)

Setelah dilakukan perhitungan nilai S bagi tiap Item pernyataan maka
akan diperoleh nilai/skor skala untuk setuap item yang menggambarkan

posisi sikap responden dalam suatu kontinum psikologis, dan apabila bentuk
pernyataannya Ya dan Tidak, maka jawaban Ya saja yang diberi skor untuk
kemudian dijumlahkan atau dicari Median/Mean untuk tiap responden,
semakin tinggi skor responden semakin menunjukan sikap Favorable
terhadap masalah yang diungkapkan dalam Item pernyataan, sedang
jawaban Tidak tidak dihitung (diberi nilai 0), karena hal itu berarti pernyataan
item
tidak
mendeskripsikan
pengalaman
yang
dialami
oleh
yang
39
bersangkutan
(responden/kelompok
penilai).
Adapun
nilai
lebih
dimaksudkan untuk memilih Item-item, dimana sebaiknya dipilih yang punya

nilai Q kecil sebab ini menunjukan tingkat kesepakatan yang tinggi di antara
kelompok penilai.
Untuk bahan kajian dan perbandingan serta contoh bagaimana
konstruksi skala sikap model Thurstone, berikut ini akan dikemukakan skala
sikap yang dibuat oleh Thurstone pada tahun 1931, untuk melihat sikap
masyarakat terhadap etnis China.
Dalam skala ini Thurstone ingin mengungkap/mengukur bagaimana
sikap orang Amerika terhadap Suku
China dengan meminta responden
untuk menyatakan kesetujuan atau ketidaksetujuan terhadap pernyataan

yang terdapat angket skala sikap.
Pernyataan-pernyataan yang diungkap diawali dengan hal-hal yang
berkaitan dengan perasaan, seperti perasaan netral/tak peduli, benci, tertarik
dan cinta, dikombinasikan dengan pernyataan-pernyatan yang bersifat
keyakinan seperti inferioritas suku china dibanding suku bangsa responden
(Amerika), dan kecenderungan prilaku yang dimiliki responden terhadap suku
china, seperti untuk hidup di negeri China.
Skala sikap Thurstone ini juga menggambarkan suatu kombinasi
pernyatan positif dan negatif dengan jumlah yang hampir seimbang,
kombinasi semacam ini memang diperlukan dalam penyusunan skala sikap
agar dapat diketahui konsistensi pilihan dari responden, sehingga skala sikap
yang dibuat dapat benar-benar memberikan gambaran sesungguhnya dari
sikap responden terhadap obyek sikap yang menjadi obyek penelitian.
40
Contoh Skala Sikap yang dibuat Thurstone tahun 1931

Attitude toward the Chinese
Try to indicate either agreement or disagreement for each statemen. If you simply can not
decide about statemen, you may mark it with a question mark. This is not an examination,
there are no right or wrong answer tothese statements. This is simply a study of peoples
attitudes toward the chinese. Please indicate your own conviction by a check mark when
you agree and by a cross when you disagree
Put a check mark if you agree with the statement.
Put a a cross if you agree with the statement.
-----------------------------------------------------------------------
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
I have no particular love or hate for the Chinese (6.5)

I dislike the Chinese more every time I see (10.1)
The chinese are very preety decent (4.2)
Some Chinese traits are admirable, but on the whole I dont like them (7.2)
The Chinese are superior to all other races (0.5)
The Chinese, as part of the yellow race, are inferior to the white races (8.7)
I like yhe Chinese (3.5)
The more I know about the Chinese, the better I like them (2.8)
The Chinese are aptly described by the term yellow devil (11.0)
The high-class Chinese are superior to us (1.8)
The Chinese are different, but not inferior (5.2)
I hate the Chinese (11.5)
Chinese parents are unusually devoted to their Children (4.1)
Although I respect some of their qualities, I could never consider a Chinese
as a friend (7.7)
------ 15. I would rather live in China than any other place in the world (1.2)
------ 16. There are no refined or cultured Chinese (9.7)
------ 17. The Chinese are no better and no worse than any other people (6.0)
------ 18. I think Chinese should be kept out of the United States (8.4)
------ 19. I consider it a privilege to associate with Chinese people (2.2)
------ 20. The Chinese are inferior in every way (10.6)
------ 21. I dont see how anyone could ever like the Chinese (9.4)
------ 22. Chinese have a very high sense of honor (3.0)
------ 23. I have no desire to know any Chinese (8.6)
------ 24. Chinese people have a refinement and depth of feeling that you dont find
anywhere else (1.4)
------ 25. There is nothing about the Chinese that I like or admire (9.8)
------ 26. Id like to know more Chinese people (3.9)
Note : Scale values appear in parentheses following each item.
Sumber : Daniel J. Mueller. 1986. Measuring Social Attitude
41
2. Method of Summated Rating (Likert)

Metode ini merupakan metode penskalaan pernyataan sikap dengan
menggunakan distribusi respon sebagai dasar penentuan skala serta tidak
menggunakan kelompok penilai. Dalam skala Likert, kuantifikasi dilakukan
dengan menghitung respon kesetujuan atau ketidaksetujuan (dalam suatu
kontinum) terhadap obyek sikap tertentu.
Skala model Likert, kategori respon terdiri dari lima, mulai dari Sangat
setuju, Setuju, Tidak pasti/tidak memutuskan, tidak setuju, sangat tidak
setuju, bila pernyataan itu sifatnya posistif diberi skor 5,4,3,2,1, dan bila
pernyataan negatif diberi skor 1,2,3,4,5. Adapun prosedur konstruksi skala
model Likert adalah :
a. Identifikasi obyek-obyek sikap serta jelaskan secara spesifik
b. Kumpulkan item-item opini (30 atau lebih) tentang obyek sikap.
Semua item harus menyatakan sesuatu yang positif atau negatif
c. Uji cobakan item-item tersebut pada sekelompok responden, tiap
responden menunjukan suatu tingkat persetujuan untuk tiap item
d. Beri skor untuk tiap responden, kemudian jumlahkan skor tersebut
untuk tiap responden
e. Korelasikan skor tiap item dengan skor total untuk tiap responden
f.
Hilangkan item yang korelasinya tidak signifikan atau yang

korelasinya negatif. Perhatikan keseimbangan antara item positif
dan negatif.
g. Setelah langkah-langkah tersebut dilakukan maka sebagai hasilnya

akan diperoleh sejumlah pernyataan untuk mengukur sikap yang
dapat dipercaya untuk dapat digunakan dalam penelitian, karena
hanya item yang signifikan saja yang dipergunakan dalam
instrumen penelitian.
42
Contoh Skala Sikap Model Likert

Attitude About Marijuana
Indicate on the line to the the left of each statement how much you agree
or disagree with it. Please mark every item. Use the following response
category
A = Strongly agree.
B = Agree.
C = Uncertain.
D = Disagree.
E = Strongly disagree
-----------------------------------------
1.
2.
3.
4.
5.
6.
7.
8.
-----------
9.
10.
------
11.
------
12.
-----------
13.
14.
-------------------------------
15.
16.
17.
18.
19.
20.
No right-thinking person would use marijuana (N)

Marijuana use leads to heroine use (N)
Only hippies and weirdos use marijuana (N)
Marijuana should be legalized (P)
Marijuana use causes birth defect (N)
Since there is no hangover, marijuana is a good substitute for alcohol (P)
Marijuana is a narcotic drug (N)
Most people who criticize marijuana use dont know anything about the
drug (P)
Habitual marijuana users are neurotic (N)
As a symbol of the youth culture, epitomizing disobedience and disregard
for authority, marijuana usage should be put down (N)
In our highly impersonal society, marijuana helps one express feelings and
relate to others, and should therefore definitely be used by those who feel
the needs (P)
Marijuana is a good social stimulator and should be allowed, especially at
parties, wheremixing important (P)
Mariyuana is not a hard drug (P)
If a son or daughter uses marijuana, Mom and Dad should be willing to try it
before they condemn it (P)
Since we arent sure if it can harm us, we should avoid marijuana (N)
Marijuana use is illegal and therefore wrong (N)
Marijuana has psychological theraphy potential (P)
Marijuana causes dehumanization (N)
Criminals have a higher rate of marijuana use than does the general public (N)
Intelligence test scores of marijuana users are higher on the average than
scores of non-users (P)
Note : P = positively keyed item; N = negatively keyed item

Sumber : Daniel J. Mueller. 1986. Measuring Social Attitude
43
F. Konversi Nilai Skala

Skala sikap yang diberi bobot nilai 0 4 atau 1 5 sesuai dengan
alternatif respon pada dasarnya merupakan skala yang bernilai Ordinal atau
pemeringkatan ,sebab responden diminta merespon/menjawab sesuai
dengan kecenderungan sikapnya untuk kemudian diberi kode/nilai peringkat
oleh peneliti, namun demikian terdapat para Pakar yang menganggapnya
sebagai Skala Interval sehingga memungkinkan pengolahan datanya dengan
analisis Statistik Parametrik. Terlepas dari kontroversi tersebut, mereka yang
berpendapat bahwa skala sikap bernilai ordinal mengajukan suatu cara untuk
mengkonversi
nilai
skala
tersebut
menjadi
bernilai
Interval
dengan
menempatkan masing-masing nilai skala dalam kelompoknya pada suatu

distribusi normal, sehingga jarak nilai menjadi sama. Dengan cara ini
penentuan nilai skala dilakukan dengan memberi bobot dalam satuan deviasi
normal bagi setiap kategori respon pada suatu kontinum psikologis.
Pengkonversian nilai skala dilakukan pada seluruh pernyataan yang
dipergunakan dalam skala, bila yang diteliti 3 variabel dengan banyak item
pernyataan 30 untuk tiap instrumen, maka penghitungan konversi dilakukan
sebanyak 90 kali (90 Item), jadi banyaknya penghitungan konversi ditentukan
oleh banyaknya item pernyataan dalam suatu skala. Sebagai contoh, kita
ambil satu item pernyataan Positif dengan nilai skala mulai dari 0 sampai
dengan 4 (skala 5), dengan jumlah responden 200 orang (contoh 2.1), dan
satu item pernyataan negatif dengan nilai skala 1 sampai dengan 4 (skala 4),
jumlah responden sebanyak 50 0rang (contoh 2.2). Dalam kenyataannya,
terkadang (bahkan sering) nilai skala konversi (akibat pembulatan) sama
dengan nilai skala asal yang ditetapkan berdasarkan judgement, namun
karena nilai konversi telah melalui pengolahan maka jelas akan lebih dapat
dipertanggungjawabkan bila diperlakukan sebagai data dengan skala
pengukuran interval serta dapat dianalisa menggunakan statistik parametrik
(sudah tentu ditambah syarat lainnya).
44
Contoh Pengkonversian nilai skala.

Contoh 2.1. Pernyataan Positif
Alternatif
NS Asal
STS
TS
R
S
SS
0
1
2
3
4
F
6
29
42
103
20
p
0.030
0.145
0.210
0.515
0.100
pk
0.030
0.175
0.385
0.900
1.000
pkt
0.015
0.103
0.280
0.643
0.950
z
z+2.170 NS Konversi
-2.170
0
0
-1.265 0.905
1
-0.583 1.587
2
0.366
2.536
3
1.645
3.815
4
Jml Responden
(N)
200
Contoh 2.2. Pernyataan Negatif

Alternatif
NS Asal
SS
S
TS
STS
1
2
3
4
F
6
15
20
9
p
0.120
0.300
0.400
0.180
pk
0.120
0.420
0.820
1.000
pkt
0.060
0.270
0.620
0.910
z
z+2.555 NS Konversi
-1.555
1
1
-0.613 1.942
2
0.305
2.86
3
1.341
3.896
4
Jml Responden
(N)
50
Penjelasan
1. Hitung frekuensi setiap alternatif respon untuk seluruh responden. Dalam
contoh 2.1 : yang menjawab STS = 6 orang; TS = 29; R = 42; S = 103;
SS = 20; jumlah total 200 (banyaknya responden). Dalam contoh 2.2.
yang menjawab SS = 6; S = 15; TS = 20; STS = 9; jumlah total 50
(banyaknya responden)
2. hitung proporsi tiap alternatif. Dalam contoh 2.2 untuk alternatif STS
dengan f = 6, proporsinya (p) adalah 6 : 50 = 0.120, perhitungan ini
dilakukan untuk setiap alternatif respon.
3. setelah proporsi untuk setiap alternatif dihitung, kemudian dilanjutkan
dengan penghitungan proporsi kumulatif (pk) dengan cara menjumlahkan
proporsi alternatif dengan proporsi sebelumnya, misalnya untuk pk 0.420
diperoleh dengan cara menjumlahkan 0.300 dengan 0.120, demikian juga
untuk alternatif lainnya.
45
4. kemudian dihitung pk tengahnya (pkt) dengan cara menjumlahkan p

alternatif yang sedang dicari pkt-nya dengan pk alternatif sebelumnya.
Misalnya untuk pkt = 0.620 (contoh 2.2) diperoleh dari x 400 + 420.
5. selanjutnya untuk tiap-tiap pkt dicari nilai z nya dengan menggunakan
Tabel Deviasi Normal (terlampir), contoh nilai z = - 2.170 (contoh 2.1)
untuk pkt = 0.015, diperoleh dengan cara melihat pertemuan antara baris
yang bernilai 0.01 dengan kolom yang bernilai 5.
6. sesudah diperoleh nilai z untuk masing-masing alternatif respon (pkt),
maka untuk memperoleh nilai skala, nilai z yang pertama (alternatif
dengan nilai skala terkecil) angka mutlaknya ditambahkan pada nilai z tiap
alternatif sedangkan untuk nilai skala yang paling kecil langsung
ditetapkan sesuai judgment yang telah ditentukan (nilai 0 untuk contoh
2.1. ; dan 1 untuk contoh 2.2.), apabila nilai skala dimulai dari 0, nilai z
yang diperoleh langsung ditambahkan, sedangkan jika nilai skala terkecil
sama dengan 1, maka nilai z harus ditambah nilai 1 dahulu baru
kemudian ditambahkan pada masing-masing nilai z berikutnya. Misal
(contoh 2.2.) nilai 3.896 merupakan hasil dari 1.341 + 2.555. sesudah tiap
alternatif respon memperoleh nilainya kemudian dibulatkan seperti terlihat
dalam Nilai Skala Konversi. Dari nilai inilah seluruh analisa data
dilakukan.
Langkah pengkonversian nilai skala dengan memberikan bobot dalam
suatu deviasi normal akan menghasilkan suatu nilai interval yang tepat dalam
memposisikan
masing-masing
kategori/alternatif
respon
dalam
suatu
kontinum, namun demikian penggunaan cara penentuan nilai tanpa konversi

pun dapat saja dilakukan dengan alasan kepraktisan, disamping Likert sendiri
pada tahun 1932 telah menunjukan penemuannya bahwa skor kelompok
responden yang menggunakan cara konversi berkorelasi sebesar 0.99
dengan penentuan skor cara biasa (cara sederhana), namun demikian untuk
kemantapan analisa terutama analisis statistik, pengkonversian nilai skala
nampaknya diperlukan. Sementara itu Saifuddin Azwar menyatakan bahwa
46
apabila skala sikap yang disusun tidak untuk digunakan sebagai instrumen
pengukuran yang menyangkut keputusan yang penting sekali, seperti
penelitian pendahuluan atau studi kelompok secara kecil-kecilan, kadangkadang demi kepraktisan, penyusun skala sikap dapat menempuh cara
sederhana untuk menentukan nilai skala (tanpa konversi dengan deviasi
normal)
UNTUK DIDISKUSIKAN
1. Pengukuran merupakan langkah penting dalam suatu penelitian,
khususnya penelitian kuantitatif, jelaskan alasan-alasannya
2. Kemukakan Contoh-contoh Variabel yang mempunyai tingkat
pengukuran :
Nominal.
Ordinal
Interval
Rasio
3. Pengukuran dengan menggunakan skala sikap banyak dilakukan
dalan penelitian pendidikan, jelaskan alasan-alasannya, serta
kemukakan contoh-contoh bagaimana Konsep dapat diteliti
4. Tentukan nilai Skala model Thurstone dari data berikut
No Item
12
20
18
5. Konversikan Nilai skala berikut :

Alternatif
STS
TS
R
S
SS
Nilai Skala
1
2
3
4
5
Frekuensi
10
15
30
25
20
47
2.2. Instrumen Penelitian

Penelitian pada dasarnya merupakan suatu upaya untuk memahami
masalah-masalah yang ditemui dalam kehidupan manusia, keterbatasan
manusia
untuk
memahami
permasalahan
tersebut
hanya
dengan
mengandalkan pengalaman hidup sehari-hari secara sporadis dan tidak

tertata, jelas tidak cukup untuk menjadi dasar yang kuat bagi pemahaman
terhadap suatu masalah. Keadaan ini telah mendorong upaya-upaya Pakar
untuk membuat prosedur dan alat yang dapat dipergunakan guna
mengungkap kenyataan-kenyatan (Data) yang dapat dijadikan dasar dalam
memecahkan berbagai masalah. Untuk itu Instrumen penelitian menempati
kedudukan penting dalam suatu penelitian, hal ini tidak lain karena
keberhasilan suatu penelitian dipengaruhi pula oleh instrumen yang
dipergunakan.
Dalam suatu penelitian Kuantitatif (adanya jarak antara subyek dan
obyek) yang bersifat verifikasi hipotesis (pengujian hipotesis), instrumen
penelitian merupakan alat yang dipakai untuk menjembatani antara subyek
dan obyek (secara substansial antara hal-hal teoritis dengan empiris, antara
konsep dengan data), sejauhmana data mencerminkan konsep yang ingin
diukur tergantung pada instrumen (yang substansinya disusun berdasarkan
penjabaran
konsep/penentuan
indikator)
yang
dipergunakan
untuk
mengumpulkan data, masalah ini telah dikemukakan dalam uraian terdahulu,

sehingga gambaran umumnya telah dipahami, adapun pembahasan berikut
akan lebih menjurus pada pembahasan instrumen sebagai alat/cara untuk
memperoleh data.
Menurut Nana Sudjana , dalam penyusunan instrumen penelitian ada
beberapa hal yang harus diperhatikan yaitu :
1. masalah dan variabel yang diteliti termasuk insikator variabel harus
jelas dan spesifik sehingga dapat dengan mudah menetapkan jenis
instrumen yang akan digunakan.
48
2. sumber data/informasi baik jumlah maupun keragamannya harus

diketahui terlebih dahulu, sebagai bahan atau dasar dalam
menentukan isi, bahasa, sistematika item dalam instrumen
penelitian.
3. keterandalan
dalam
instrumen
itu
sendiri
sebagai
alat
pengumpulan data baik dari keajegan, kesahihan maupun

obyektivitas.
4. jenis data yang diharapkan dari penggunaan instrumen harus jelas,
sehingga peneliti dapat memperkirakan cara analisis data guna
pemecahan masalah penelitian.
5. mudah dan praktis digunakan, akan tetapi dapat menghasilkan
data yang diperlukan.
Hal penting dari suatu instrumen adalah bahwa substansinya harus
benar-benar menggali informasi yang diperlukan bagi suatu penelitian
dengan mengacu pada konsep empiris atau indikator yang telah ditentukan,
adapun mengenai prosedur penggunaannya, apakah dilengkapkan oleh
peneliti (seperti : rating Scale, Interview, performance checklist) atau
responden (seperti : Kuesioner, skala sikap, test presrtasi dan bakat, Test
kinerja)
sangat
ditentukan
oleh
kepraktisan,
obyektivitas
dan
jangkauan/cakupan perolehan data.

Secara umum terdapat beberapa jenis instrumen penelitian yang
dapat digunakan oleh seorang peneliti yaitu :
Tes. Yaitu suatu alat ukur yang diberikan pada individu (responden)
untuk mendapat jawaban-jawaban baik secara tertulis ataupun lisan,
sehingga
dapat
diketahui
kemampuan
individu/responden
yang
bersangkutan. Contohnya : Tes prestasi belajar yang dimaksudkan untuk

mengetahui/mengukur kemampuan dan penguasaan terhadap hasil dari
proses pembelajaran ; Test intelegensi. Adalah test yang dimaksudkan untuk
mengukur kemampuan atau potensi individu secara umum, seperti test IQ
dari Binet Simon untuk mengetahui tingkatan kecerdasan (IQ) seseorang.
49
Kuesioner. Instrumen penelitian dalam bentuk pertanyaan yang

biasanya dimaksudkan untuk mendapatkan informasi berkaitan dengan
pendapat, aspirasi, persepsi, keinginan, keyakinan dan lain-lain secara
tertulis, dan apabila pertanyaan dan jawaban dilakukan secara lisan disebut
Wawancara.
Dalam
suatu
penelitian
kedua
instrumen
ini
sering
dikombinasikan dengan maksud untuk lebih meyakinkan.

Skala. Merupakan alat untuk mengukur nilai/keyakinan, sikap dan halhal yang berkaitan dengan personological Variable, instrumen bentuk skala
biasanya disusun dalam bentuk pernyataan pada suatu kontinum nilai
tertentu, umumnya bentuk skala dipakai untuk mengukur sikap (skala sikap),
atau skala lainnya (tergantung pada konsep yang ingin diukur sesuai dengan
fokus/masalah penelitian).
Instrumen-instrumen penelitian di atas merupakan sebagian dari jenisjenis instrumen lainnya, namun dalam penelitian kuantitatif (dengan obyek
penelitian yang cukup besar) instrumen tersebut sangat sering dipergunakan
dan sangat aplikabel untuk penerapan teknik analisis dengan statistik.
Adapun instrumen lainnya yang bisa dipergunakan dalam suatu penelitian
dapat dilihat dalam tabel berikut :
Yang dilengkapi peneliti
Yang dilengkapi subyek/responden
1. Rating Scale
1. Quetionnaires
2. Interview Schedule
2. Self Checklist
3. Tally Sheets
3. Attitude Scales
4. Flowcharts
4. Personality (or Character) Inventories
5. Performance Checklist
5. Achevement/Aptitude Test
6. Anecdotal Record
6. Performance Tests
7. Time And Motion Logs
7. Projective Devices
8. Sociometric Devices
Sumber : Jack R. Fraenkel, 1993. How to design and evaluation research in education.
2.3. Kriteria Instrumen

50
sebagaimana diketahui bahwa instrumen merupakan alat ukur yang

digunakan untuk mendapatkan informasi tentang variasi karakteristik variabel
secara obyektif. Instrumen mempunyai peranan yang sangat penting dalam
suatu penelitian karena kualitas data (berarti juga kualitas hasil penelitian)
sangat ditentukan/dipengaruhi oleh kualitas instrumen yang digunakan. Oleh
karena itu untuk mendapatkan hasil penelitian yang dapat dipertanggung
jawabkan diperlukan instrumen yang dapat dipertanggungjawabkan pula,
dalam hubungan ini Instrumen penelitian harus memenuhi kriteria Validitas
dan Reliabilitas agar penggunaannya dalam suatu penelitian dapat
menghasilkan data/informasi yang akurat dan obyektif.
2.3.1. Validitas
Validitas atau kesahihan menunjukan pada kemampuan suatu
instrumen (alat pengukur) mengukur apa yang harus diukur (. a valid
measure if it succesfully measure the phenomenon), seseorang yang ingin
mengukur tinggi harus memakai meteran, mengukur berat
dengan
timbangan, meteran, timbangan merupakan alat ukur yang valid dalah kasus
tersebut. Dalam suatu penelitian yang melibatkan variabel/konsep yang tidak
bisa diukur secara langsung, maslah validitas menjadi tidak sederhana, di
dalamnya juga menyangkut penjabaran konsep dari tingkat teoritis sampai
tingkat empiris (indikator), namun bagaimanapun tidak sederhananya suatu
instrumen penelitian harus valid agar hasilnya dapat dipercaya.
Mengingat pentingnya masalah validitas. Maka tidak mengherankan
apabila Para Pakar telah banyak berupaya untuk mengkaji masalah validitas
serta membagi validitas ke dalam beberapa jenis, terdapat perbedaan
pengelompokan jenis-jenis validitas, Elazar Pedhazur menyatakan bahwa
validitas yang umum dipakai tripartite classification yakni Content, Criterion
dan Construct, sementara Kenneth Bailey mengelompokan tiga jenis utama
validitas yaitu : Face validity, Criterion Validity, dan construct validity, dengan
catatan face validity cenderung dianggap sama dengan content validity.
Berikut ini akan dikemukakan beberapa jenis validitas yaitu :
51
Validitas Rupa (Face validity). Adalah validitas yang menunjukan

apakah alat pengukur/instrumen penelitian dari segi rupanya nampak
mengukur apa yang ingin diukur, validitas ini lebih mengacu pada bentuk dan
penampilan instrumen. Menurut Djamaludin Ancok validitas rupa amat
penting
dalam
pengukuran
kemampuan
individu
seperti
pengukuran
kejujuran, kecerdasan, bakat dan keterampilan.

Validitas
isi
(Content
Validity).
Valditas
isi
berkaitan
dengan
kemampuan suatu instrumen mengukur isi (konsep) yang harus diukur. Ini
berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau
variabel yang hendak diukur. Misalnya test bidang studi IPS, harus mampu
mengungkap isi bidang studi tersebut, pengukuran motivasi harus mampu
mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan
demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan
validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar ini
Dia berpendapat bahwa validitas isi berbeda dengan validitas rupa yang
kurang menggunakan analisis logis yang sistematis, lebih lanjut dia
menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga
mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
Validitas kriteria (Criterion validity). Adalah validasi suatu instrumen
dengan membandingkannya dengan instrumen-pengukuran lainnya yang
sudah valid dan reliabel dengan cara mengkorelasikannya, bila korelasinya
signifikan maka instrumen tersebut mempunyai validitas kriteria. Terdapat dua
bentuk Validitas kriteria yaitu : Validitas konkuren (Concurrent validity),
Validitas ramalan (Predictive validity).
Validitas konkuren
adalah
kemampuan suatu instrumen pengukuran untuk mengukur gejala tertentu

pada saat sekarang kemudian dibandingkan dengan instrumen pengukuran
lain untuk konstruk yang sama. Validitas ramalan adalah kemampuan suatu
instrumen pengukuran memprediksi secara tepat dengan apa yang akan
terjadi di masa datang. Contohnya apakah test masuk sekolah mempunyai
validitas ramalan atau tidak ditentukan oleh kenyataan apakah terdapat
52
korelasi yang signifikan antara hasil test masuk dengan prestasi belajar
sesudah menjadi siswa, bila ada, berarti test tersebut mempunyai validitas
ramalan.
Validitas konstruk (Construct Validity). Konstruk adalah kerangka dari
suatu konsep, validitas konstruk adalah validitas yang berkaitan dengan
kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang
diukurnya. Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas
konstruk) merupakan yang terluas cakupannya dibanding dengan validasi
lainnya, karena melibatkan banyak prosedur termasuk validasi isi dan validasi
kriteria.
Lebih jauh Jack R. FraenkelI meneyatakan bahwa untuk mendapatkan
validitas konstruk ada tiga langkah di dalamnya yaitu :
1. Variabel yang akan diukur harus didefinisikan dengan jelas
2. Hipotesis, yang mengacu pada teori yang mendasari variabel
penelitian harus dapat membedakan orang dengan tingkat gradasi
yang berbeda pada situasi tertentu
3. Hipotesis tersebut diuji secara logis dan empiris.
Dalam upaya memperoleh validitas konstruk, maka seorang peneliti
perlu mencari apa saja yang menjadi suatu kerangka konsep agar dapat
menyusun tolok ukur operasional konsep tersebut. Pencarian kerangka
konsep menurut Djamaludin Ancok dapat ditempuh beberapa cara :
1. Mencari definisi-definisi konsep yang dikemukakan oleh para akhli
yang tertulis dalam buku-buku literatur.
2. Mendefinisikan sendiri konsep yang akan diukur, jika tidak
diperoleh dalam buku-buku literatur
3. Menanyakan definisi konsep yang
akan diukur kepada calon
responden atau orang-orang yang memiliki karakteristik yang sama

dengan responden.
Mengingat pentingnya pendefinisian suatu konsep yang ingin diukur,
maka seorang peneliti perlu mencermatinya, sebab definisi suatu konsep
53
perlu dikembangkan dari mulai definisi teoritis, definisi empiris, sampai

definisi operasional (dapat dipadankan dengan konsep teori, konsep empiris,
konsep analitis/operasional, atau dengan konsep, dimensi, dan indikator)
pemahaman definisi tersebut dapat dijadikan awal yang strategis untuk
penjabaran konsep sampai diperoleh indikator, untuk kemudian disusun itemitem yang diperlukan untuk sebuah instrumen penelitian.
Sementara itu Elazar J. Pedhazur mengemukakan tiga pendekatan
dalam Validasi konstruk yaitu : 1). Logical analysis; 2). Internal structure
analysis; 3). Cross-structure analysis. Analisis logis dalam konteks validasi
konstruk dimaksudkan untuk membentuk hipotesis pembanding sebagai
alternatif penjelasan berkaitan dengan konstruk/konsep yang akan diukur,
hubungan antar konsep dan yang sejenisnya. Dalam pendekatan ini langkah
yang
diperlukan
adalah
pendefinisian
konstruk/konsep,
penentuan
kesesuaian isi item dengan indikator, serta penentuan prosedur pengukuran.

Analisis struktur internal merupakan pendekatan kedua dalam validasi
konstruk, analisis ini berkaitan dengan validitas indikator dari suatu
konsep/konstruk, artinya indikator-indikator yang digunakan bersifat homogin
(dalam tingkatan minimum) serta mengukur konsep yang sama (terdapatnya
kesesuaian antara indikator-indikator dengan konsepnya).Sementara itu analisis
struktur silang berkaitan dengan pengkajian analisis internal dari masingmasing konsep terhubung (yang unobservable) yang dihubungkan pada
tataran empirisnya (indikator), sebab pada tataran inilah suatu hipotesis diuji.
2.3.1.1. Perhitungan/pengujian Validitas Instrumen
Apabila langkah-langkah tersebut di atas telah dilakukan, paling tidak
langkah penjabaran konsep yang kemudian diikuti dengan penyusunan itemitem
instrumen,
maka
perhitungan
statistik
dapat
dilakukan
untuk
perhitungan/pengujian validitas instrumen pengukuran. Perhitungan ini

dimaksudkan untuk mengetahui konsistensi internal (sering juga disebut
validitas item atau discriminating power/daya diskriminasi item), dalam arti
sampai sejauh mana item-item mampu membedakan antara individu yang
54
memiliki dan tidak memiliki sifat dari item pengukuran, hal ini berarti juga
bahwa item-item dalam instrumen mengukur aspek yang sama. Dalam
hubungan ini langkah yang dilakukan adalah dengan cara mengkorelasikan
antara skor tiap item dengan skor total.
Dalam melakukan perhitungan korelasi antara skor item dengan skor
total dapat menggunakan rumus korelasi Product moment apabila nilai-nilai
skala telah dilakukan konversi menjadi interval (atau secara langsung
dianggap interval dengan mengacu pada pendapat bahwa nilai skala dapat
diperlakukan sebagai data interval), atau menggunakan rumus korelasi tata
jenjang (Rank-Spearman). Untuk memperjelas cara perhitungannya berikut
ini akan dikemukakan contoh perhitungan korelasi Product momen (cara
perhitungan dengan berbagai variasi dapat dilihat dalam Bab 4) dan korelasi
tata jenjang Spearman.
Sebuah instrumen penelitian/pengukuran terdiri dari 10 item dan
disebarkan pada 10 orang responden dengan hasil skor seperti dalam tabel
2.2. perhitungan korelasi dilakukan untuk tiap item dari item nomor 1 sampai
item no 10, untuk contoh perhitungan akan diambil item no 2
Tabel 2.2.
Resp
Nomor Item
A
B
C
D
E
F
G
H
I
J
1
4
2
3
3
3
2
2
4
3
4
2
2
2
2
4
4
4
2
2
2
4
3
2
2
2
3
4
4
2
2
2
4
4
4
3
3
3
4
4
2
4
3
4
5
2
2
2
3
4
4
2
2
2
3
6
3
2
3
3
4
4
3
3
3
4
7
2
2
2
3
3
2
2
2
2
2
8
3
3
3
4
4
4
2
3
3
4
9
3
2
3
3
4
4
2
3
2
3
10
3
2
3
3
4
4
2
3
2
4
I
II
.289
.362
.900
.870
.925
.879
.743
.789
.892
.872
.856
.830
.508
.525
.907
.910
.889
.904
.956
.950
Jml
28
22
26
32
38
36
21
28
24
36
Contoh Perhitungan Validitas menggunakan Korelasi Product Moment

adalah sebagai berikut :
Tabel perhitungan Korelasi Product moment
55
Responden
A
B
C
D
E
F
G
H
I
J
Jumlah
Item no 2 (X)
2
2
2
4
4
4
2
2
2
4
28
Jumlah (Y)
28
22
26
32
38
36
21
28
24
36
291
Y2
784
484
676
1024
1444
1296
441
784
576
1296
8805
XY
56
44
52
128
152
144
42
56
48
144
866
N XY - ( X) ( Y)
--------------------------------------------------N X2 ( X)2
N Y2 ( Y)2
10 x 866 - 28 x 291
-------------------------------------------10 x 88 (28)2
X2
4
4
4
16
16
16
4
4
4
16
88
512
------------------9.8
10 x 8805 (291)2
= 0.900
58.04
nilai r untuk item no 2 sebesar 0.90 kemudian dibandingkan dengan tabel r

pada baris N 2 (10 2) yaitu 8 sebesar 0.632 untuk taraf signifikansi 5%,
karena nilai r lebih besar dari nilai r tabel maka item no 2 adalah valid, untuk
item lainnya bandingkan nilai r untuk tiap-tiap item (tabel 2.2. rumawi I
menunjukan nilai r untuk tiap-tiap item) dengan r tabel, hasilnya item no 1
dan nomor 7 tidak valid (r hitung lebih kecil dari r tabel) sedangkan item
lainnya valid. Item-item yang valid saja yang dipergunakan dalam penelitian
sedang yang tidak valid dibuang.
Contoh perhitungan Validitas menggunakan Korelasi tata jenjang dari
Spearman sebagai berikut
56
Tabel perhitungan Korelasi Tata Jenjang

Responden Item no 2 (X)) Jumlah (Y)
A
2
28
B
2
22
C
2
26
D
4
32
E
4
38
F
4
36
G
2
21
H
2
28
I
2
24
J
4
36
Jumlah
28
291
Rani X
7.5
7.5
7.5
2.5
2.5
2.5
7.5
7.5
7.5
2.5
Rank Y
5.5
9
7
4
1
2.5
10
5.5
8
2.5
b
2
-1.5
0.5
-1.5
1.5
0
-2.5
2
-0.5
0
0
b2
4
2.25
0.25
2.25
2.25
0
6.25
4
0.25
0
21.5
Rumus korelasi tata jenjang :
rho
= 1 -
6 x b2
-------------n (n2 - 1)
rho
= 1 -
6 x 21.5
-------------10 (99)
rho
= 1 -
rho
= 0.870
0.13
nilai rho untuk item no 2 sebesar 0.870 kemudian dibandingkan dengan

tabel rho dengan N = 10 sebesar 0.648 untuk taraf signifikansi 5%, karena
nilai rho lebih besar dari nilai rho tabel maka item no 2 adalah valid, untuk
item lainnya bandingkan nilai rho untuk tiap-tiap item (tabel 2.2. rumawi II
menunjukan nilai rho untuk tiap-tiap item) dengan rho tabel, hasilnya item no
1 dan nomor 7 tidak valid (rho hitung lebih kecil dari rho tabel), sedangkan
item lainnya valid. Item-item yang valid saja yang dipergunakan dalam
penelitian sedang yang tidak valid dibuang.
57
Dengan memperhatikan
hasil kedua perhitungan tersebut nampak
bahwa baik skor item-item tersebut diperlakukan sebagai data interval

maupun ordinal hasilnya tidak menunjukan perbedaan.
2.3.2. Reliabilitas
Reliabilitas berarti
instrumen
pengukuran
kedapat
dikatakan
dipercayaan
reliabel
atau
apabila
keajegan,
instrumen
suatu
tersebut
dipergunakan secara berulang memberikan hasil ukur yang sama, menurut

Elazar J. Pedhazur reliability refers to the degree to which test score are free
from errors of measurement, kesalahan pengukuran akan berakibat pada
hasil yang berbeda dalam mengukur sesuatu yang sama. Dalam ilmu
sosial/pendidikan masalah reliabilitas terutama dalam presisi hasil ukur
cukup sulit apalagi bila dikaitkan dengan pengulangan, hal ini tidak lain
karena obyek yang diteliti cenderung berubah dari waktu kewaktu apalagi jika
rentang waktu pengulangan cukup lama, untuk itu upaya-upaya untuk
menghitung/menguji reliabilitas suatu instrumen merupakan estimasi nilai
pengukuran yang diteliti dengan nilai pengukuran yang sebenarnya. Dalam
upaya tersebut terdapat beberapa pandangan/cara untuk menilai/menghitung
reliabilitas suatu instrument sebagaimana akan terlihat dalam uraian berikut.
2.3.2.1. Teori pengujian klasik
teori pengujian klasik mengacu pada The true-score model dari
Spearman. Menurut model ini skor/nilai hasil observasi terdiri dari dua
komponen yaitu komponen nilai yang benar ditambah kekeliruan acak, yang
dalam bentuk simbul nampak sebagai berikut :
M = T + E
M = nilai/skor yang diukur/diobservasi (measured value)
T = nilai/skor yang benar (True value)
E = Kesalahan Pengukuran (Measurement error)
Pengukuran yang reliabel adalah pengukuran yang mempunyai tingkat
kesalah Nol (E = 0), sehingga nilai yang diobservasi sama dengan nilai yang
sebenarnya (M = T). bila menggunakan analisis statistika reliabilitas
58
pengukuran merupakan perbandingan antara
varians nilai/skor yang
sebenarnya dengan varians nilai/skor yang diobservasi, dan akar pangkat

duanya adalah korelasi antara nilai/skor yang sebenarnya dengan nilai/skor
yang diobservasi dan hasil korelasinya disebut indeks reliabilitas. Indeks ini
menurut Pedhazur disebut juga validitas pengukuran teoritis (Theoritical
validity of a measure) atau korelasi epistemik (epistemic correlation).
Secara teoritis cara tersebut cukup bermakna, namun sulit bahkan
tidak dapat dipergunakan untuk memperkirakan tingkat kesalahan yang
terdapat dalam suatu instrumen pengukuran karena tidak diketahuinya nilai
yang benar (T) dan tingkat
kesalahan (E), sehingga diperlukan asumsi-
asumsi berkaitan dengan konstannya substansi yang diukur serta kesalahan

yang terjadi bersifat acak, dan berdasar asumsi tersebut jika pengukuran
dilakukan pada seseorang secara berulang-ulang, maka akan diperoleh
sejumlah persamaan yang masing-masingnya akan mengandung nilai T dan
rata-rata dari E akan (diharapkan) sama dengan Nol, sehingga nilai yang
diobservasi akan sama dengan nilai yang sebenarnya (M = T).
2.3.2.2. Test-retest (Repeated measure)
Pengukuran ulang dimaksudkan untuk melihat konsistensi dari waktu
ke waktu. Cara pelaksanaannya adalah dengan meminta responden untuk
menjawab pertanyaan atau merespon pernyataan yang sama sebanyak dua
kali sesudah selang waktu tertentu. Sesudah diperoleh jawaban/respon
responden untuk dua kali pelaksanaan kemudian nilai/skor dari hasil
pengukuran yang pertama dikorelasikan dengan nilai/skor hasil pengukuran
yang ke dua dengan menggunakan formula korelasi product momen atau
korelasi tata jenjang sesuai dengan karakteristik data yang diperoleh.
Sebagai ilustrasi berikut ini akan diberikan contoh. Misalkan sebuah
instrumen pengukuran dibuat untuk mengetahui persepsi Guru terhadap
kepemimpinan kepala sekolah kepada 10 responden dengan hasil sebagai
mana terlihat dalam tabel berikut :
Tabel nilai skor hasil dua kali pengukuran
59
Resp
A
B
C
D
E
F
G
H
I
J
Skor pada Pengukuran

Pertama
20
25
21
23
22
21
24
26
21
22
Skor pada pengukuran

Kedua
20
24
21
23
21
21
24
26
20
22
Skor pengukuran pertama kemudian dikorelasikan dengan skor pengukuran

kedua (cara perhitungan sama seperti dalam perhitungan Validitas), koefisien
korelasi yang diperoleh kemudian di bandingankan dengan nilai tabel, bila
lebih besar berarti instrumen tersebut reliabel. Hasil perhitungan data skor di
atas diperoleh nilai r = 0.970 (nilai tabel = 0.632 pada taraf signifikansi 5%),
dan nilai rho = 0.953 (nilai tabel = 0.648 pada taraf signifikansi 5%), ini
berarti bahwa instrumen pengukuran tersebut reliabel.
Dalam penggunaan cara ini seorang peneliti harus memperhatikan
selang waktu antara pengukuran yang pertama dan yang kedua, tidak ada
patokan yang pasti, yang penting harus dihindari kemungkinan terjadinya
bias akibat responden merasa diperlakukan tidak wajar jika terlalu
pendek,atau terjadi perubahan jika terlalu lama, namun Djamaludin Ancok
menyatakan bahwa
selang waktu antara 15-30 hari pada umumnya
dianggap memenuhi persyaratan tersebut.

2.3.2.3. Metode paralel (Alternate Method)
cara ini dilakukan dengan memberikan dua bentuk pengukuran yang identik
(dalam arti sejajar) kepada responden yang sama secara serempak. Dua
pengukuran identik bermakna bahwa dua instrumen pengukuran tersebut
dimaksudkan untuk mengukur konstruk yang sama namun dengan item-item
pertanyaan/pernyataan
yang
berbeda.
Sebagai
contoh
terdapat
dua
60
instrumen pengukuran motivasi yaitu instrumen A dan instrumen B, kedua

instrumen tersebut dikenakan pada sepuluh responden dengan hasil sbb :
Tabel nilai skor hasil dua Instrumen Pengukuran
Resp
A
B
C
D
E
F
G
H
I
J
Skor Instrumen A
20
25
21
23
22
21
24
26
21
22
Skor Instrumen B
20
24
21
23
21
21
24
26
20
22
Skor pengukuran Instrumen A dikorelasikan dengan skor Instrumen B (cara

perhitungan sama seperti dalam perhitungan Validitas), koefisien korelasi
yang diperoleh kemudian di bandingankan dengan nilai tabel, bila lebih besar
berarti instrumen tersebut reliabel. Hasil perhitungan data skor di atas
diperoleh nilai r = 0.970 (nilai tabel = 0.632 pada taraf signifikansi 5%), dan
nilai rho = 0.953 (nilai tabel = 0.648 pada taraf signifikansi 5%), ini berarti
bahwa instrumen pengukuran tersebut reliabel.
2.3.2.4. Pendekatan Konsistensi internal
Pendekatan
konsistensi
internal
merupakan
satu
cara
untuk
mengurangi kesulitan yang diakibatkan oleh dua perlakuan atau dua bentuk
pengukuran seperti dalam metode test-retest dan metode paralel. Dengan
cara ini pengukuran hanya dilakukan satu kali (single-trial administration),
sehingga dapat lebih efisien. konsistensi internal bermakna keajegan dari tiap
item dengan item-item lainnya dalam suatu kerangka instrumen pengukuran.
Terdapat beberapa cara untuk melakukan perhitungan reliabilitas antara lain
Teknik belah dua (Split half method), Formula Rolon, KR20, KR21, dan
Koefisien Alpha. Berikut ini akan dikemukakan contoh perhitungan reliabilitas.
1. Teknik Belah Dua (Split-half method)
61
Metode atau teknik belah dua menggunakan formula SpearmanBrown, cara ini hanya dapat dikenakan pada instrumen pengukuran dengan
jumlah item genap (pengelompokan dilakukan pada item-item yang
valid),adapun langkah-langkahnya adalah sbb :
Kelompokan item-item menjadi dua kelompok didasarkan pada

kelompok ganjil (nomor item ganjil) dan kelompok genap (nomor
item genap), atau secara random.
Jumlahkan skor pada setiap kelompok sehingga diperoleh skor

total untuk tiap kelompok.
Korelasikan skor total antar kelompok
dengan formula korelasi
Product moment atau tata jenjang.
Masukan nilai koefisien korelasi tersebut ke dalam rumus

Sperman-Brown untuk mencari koefisien reliabilitas
ri
2 . r
1 + r
ri
= koefisien reliabilitas; rb = koefisien korelasi antar kelompok
Contoh perhitungan :
Tabel nilai skor total kelompok ganjil dan genap
Resp
Skor total kelompok ganjil
A
20
B
25
C
21
D
23
E
22
F
21
G
24
H
26
I
21
J
22
Hasil perhitingan korelasi r = 0.970
Koefisien/angka reliabilitasnya adalah :
Skor total kelompok genap

20
24
21
23
21
21
24
26
20
22
62
ri
0.970
1 + 0.970
ri
1.940
1.970
ri
0.985
2. Formula Rulon
Cara ini juga hanya berlaku pada pengelompokan seperti treknik belah dua,
namun estimasi reliabilitas tidak didasarkan pada perhitungan korelasi
melainkan pada varians perbedaan skor dengan varians total, adapun
rumusnya adalah sebagai berikut :
SDb2
rxx
1 -SDt2
rxx
= Koefisien reliabilitas ; SDb
= Varians perbedaan skor belahan ; SDt
= Varians skor Total
Tabel nilai skor total kelompok ganjil dan genap

Resp
Skor total
kelompok ganjil
Skor total kelompok

genap
A
20
20
B
25
24
C
21
21
D
23
23
E
22
21
F
21
21
G
24
24
H
26
26
I
21
20
J
22
22
Hasil perhitungan varians menunjukan :
Skor b (selisih
Skor total
ganjil genap)
0
1
0
0
1
0
0
0
1
0
40
49
42
46
43
42
48
52
41
44
Rumus mencari Varians :

2
(X
stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif X
/ 2002
N
N -1
)2
63
SDb2 = 0.233
SDt2 = 15.344
Koefisien reliabilitasnya adalah :

0.233
rxx
1 -15.344
rxx
1 --
0.015
0.984
3. Formula Flanagan
Formula Flanagan merupakan estimasi nilai/angka reliabilitas yang tidak
mengacu pada perhitungan korelasi, melainkan sama seperti formula Rulon
yang mengacu pada veriansi tiap-tiap kelompok hasil belah dua, bedanya
dalam formula ini ada nilai konstanta 2 serta varians kelompok dijumlahkan
dan bukan varians beda, sementara pembaginya sama yaitu varians total.
Rumus :
S12 + S22
rxx
2 (1 --
)
St2
S12 = Varians belahan pertama

S22 = Varians belahan kedua
St2 = Varians total
Tabel nilai skor ganjil dan genap dan skor total
Resp
Skor total kelompok

ganjil
Skor total kelompok

genap
Skor total
A
B
C
D
E
F
G
H
I
J
20
25
21
23
22
21
24
26
21
22
20
24
21
23
21
21
24
26
20
22
40
49
42
46
43
42
48
52
41
44
64
S12 = 3.833
S22 = 3.956
St2 = 15.344
Bila nilai-nilai tersebut dimasukan dalam rumus, akan nampak sebagai
berikut :
3.833 + 3.956
rxx
2 (1 --
)
15.344
rxx
2 (0.492) = 0.985
4. Formula K-R 21 (Kuder Richardson)

Formula K-R merupakan prosedur pencarian nilai reliabilitas dengan
tidak mensyaratkan pembelahan item ke dalam dua kelompok, sehingga bisa
diterapkan pada instrumen yang jumlah itemnya tidak genap.
Rumus :
k
rxx =
M (k M)
) (1 -k - 1
= Mean/rata-rata skor total
k
SDt2
= kelompok/banyaknya item
= Varians total
)
kSDt2
Tabel skor tiap item dan Total
Resp
A
B
C
D
E
F
G
1
4
2
3
3
3
2
2
2
2
2
2
4
4
4
2
3
2
2
2
3
4
4
2
4
4
3
3
3
4
4
2
Nomor Item
5
6
2
3
2
2
2
3
3
3
4
4
4
4
2
3
7
2
2
2
3
3
2
2
8
3
3
3
4
4
4
2
9
3
2
3
3
4
4
2
10
3
2
3
3
4
4
2
Jml
28
22
26
32
38
36
21
65
H
I
J
4
3
4
2
2
4
= 2.91
SDt2
= 10
2
2
4
4
3
4
2
2
3
3
3
4
2
2
2
3
3
4
3
2
3
3
2
4
28
24
36
37.433
masukan nilai-nilai di atas ke dalam rumus

10
rxx =
2.91(10 2.91)
) (1 --
)
37.433
rxx =
( 1.11 ) (1 --
20.631
37.433
rxx =
0.498
5. Rumus Alpha (Cronbach)

Formula Alpha juga merupakan prosedur pencarian nilai reliabilitas
dengan tidak mensyaratkan pembelahan item ke dalam dua kelompok (meski
bisa juga diterapkan pada teknik belah dua), sehingga bisa diterapkan pada
instrumen yang jumlah itemnya tidak genap. Namun hal yang perlu diingat
adalah bahwa pembelahan mesti dilakukan secara seimbang, sebab
jika
dibelah tidak seimbang akan underestimasi terhadap nilai reliabilitas yang

sebenarnya (biasanya lebih rendah).
Rumus :
SDb2
K
=
)
K- 1
SDb2 = Varians skor kelompok ; SDt2
( 1 --
)
SDt2
Varians skor Total; K = Kelompok/jumlah item
66
Sebagai contoh terdapat 10 item yang ingin dibelah menjadi lima

kelompok secara berurutan, untuk itu jumlah tiap-tiap kelompok harus
diketahui untuk dicari variansnya, sesudah itu baru dimasukan ke dalam
rumus Alpha.
Tabel skor tiap item, skor kelompok, skorTotal
Res
A
B
C
D
E
F
G
H
I
J
jml
4
2
3
3
3
2
2
4
3
4
2
2
2
4
4
4
2
2
2
4
6
4
5
7
7
6
4
6
5
8
2
2
2
3
4
4
2
2
2
4
No Item dan Jml tiap kelompok

4 jml 5
6 jml 7
8 jml
4
3
3
3
4
4
2
4
3
4
6
5
5
6
8
8
4
6
5
8
2
2
2
3
4
4
2
2
2
3
3
2
3
3
4
4
3
3
3
4
5
4
5
6
8
8
5
5
5
7
2
2
2
3
3
2
2
2
2
2
3
3
3
4
4
4
2
3
3
4
5
5
5
7
7
6
4
5
5
6
3
2
3
3
4
4
2
3
2
3
Tot.
10 jml Jml
3
2
3
3
4
4
2
3
2
4
6
4
6
6
8
8
4
6
4
7
28
22
26
32
38
36
21
28
24
36
SDt2 = 37.433 ; k = 10 ; SDb21 = 1.733 ; SDb22 = 2.1 ; SDb23 = 1.956 ;

SDb24 = 0.944 ; SDb25 = 2.322
5
=
1.733 + 2.1 + 1.956 + 0.944 + 2.322
) (1 --
)
37.433
4
9.055
( 1.25 ) (1 --
)
37.433
( 1.25 ) (0.758) = 0.948
2.3.2.5. Standar Reliabilitas

Besarnya nilai reliabilitas yang bisa diterima sebagai estimasi yang
signifikan terhadap reliabilitas yang sebenarnya merupakan masalah yang
banyak dibicarakan oleh para pakar, pada dasarnya semakin besar koefisien
reliabilitas, semakin baik, namun permasalahannya terletak pada berapa
67
besarnya nilai yang memadai. Dalam hubungan ini banyak pengarang yang
memberikan patokan umum tentang standar minimum tingkat nilai koefisien
reliabilitas.
Nunnally
dalam
bukunya
Psychometric
Theory
sebagaimana dikutif oleh Elazar J. Pedhazur menyatakan bahwa koefisien

yang relatif rendah dapat ditoleransi dalam tingkatan penelitian awal,
reliabilitas yang lebih tinggi diperlukan jika pengukuran dipakai untuk
menentukan perbedaan antar kelompok, dan reliabilitas yang sangat tinggi
menjadi esensil jika skor-skor dipakai untuk membuat keputusan penting
tentang seseorang (misalnya keputusan dalam seleksi dan penempatan).
Lebih jauh Nunnally menyatakan bahwa untuk penelitian awal koefisien
reliabilitas 0.60 atau 0.50 sudah cukup, sementara itu Caplan, Naidu dan
Tripathi dalam tulisannya pada Journal of health and social behaviour (1984)
menyatakan bahwa koefisien alpha 0.50 atau lebih dianggap cukup untuk
suatu tujuan penelitian. Disamping pendapat tersebut ada juga akhli yang
menggunakan harga kritik nilai tabel korelasi Product Moment (seperti
Chabib Thaha dalam bukunya Teknik Evaluasi Pendidikan), sehingga nilai
reliabilitas yang diperoleh dibandingkan dengan r tabel, bila lebih besar
berarti instrumen pengukuran tersebut reliabel, sedang bila lebih kecil dari r
UNTUK DIDISKUSIKAN
tabel berarti instrumen pengukuran tersebut tidak reliabel.
Skor item-item suatu skala sikap
Res
1
2
A
5
4
B
4
3
C
3
3
D
4
2
E
2
5
F
3
4
G
4
4
H
3
4
I
3
3
J
2
2
K
5
2
L
4
3
Dari data tersebut :
3
3
4
3
2
5
1
3
4
3
2
5
1
Nomor item
4
5
3
2
5
1
2
3
4
2
3
4
2
4
4
3
3
4
3
3
2
2
5
5
4
1
6
3
4
4
3
2
2
4
4
3
2
2
4
7
4
5
3
3
5
2
4
3
3
2
5
4
8
3
3
4
5
4
2
3
4
3
2
5
1
1. hitung validitas Item

68
2. hitung reliabilitas dengan teknik belah dua menggunakan
seluruh formula
3. hitung reliabilitas dengan teknik membagi empat dengan
menggunakan formula formula yang sesuai

Bab II Pengukuran Pen Kuanti Revisi

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab II Pengukuran Pen Kuanti Revisi

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB II

PENGUKURAN DAN INSTRUMEN

menentukan indikator-indikator dari variabel tersebut, menentukan item-item

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

Meskipun seorang peneliti berusaha secermat mungkin, namun

mengurangi kedua tipe kesalahan tersebut.

menggunakan penandaan dalam bentuk angka (Kuantifikasi), yang penting

(Levels of Measurement). Dalam

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

hubungan ini terdapat beberapa skala pengukuran (Terkadang disebut jenis

jumlah karakteristik khusus yang

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

dimilikinya, (4) perbedaan karakteristik yang sama tergambar dalam

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

Gambar 2.1. Empat jenis Skala Pengukuran

Peringkat dalam suatu

(Karakteristik : data urutan,

(Karakteristik : Menganganggap bahwa perbedaan

2.1. Penentuan Indikator/Konsep Empiris

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

memerlukan upaya mengempiriskan konsep-konsep tersebut agar dapat

representasi dari konsep-konsep yang menjadi fokus penelitian.

Operasional (bisa hanya contoh

Apakah ijazah terakhir

Apakah sdr pernah mengikuti

Penelusuran Konsep sampai Item

Ijazah terakhir yang

Sertifikat kursus yang

Item (bisa hanya no Item dengan

Apakah ijazah terakhir yang

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

a tendency to act toward

against some environmental factor.

Measurement and Evaluation, sebagaimana dikutip oleh Saifuddin Azwar

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

o Arah. Artinya sikap terpilah pada dua arah (kesetujuan atau

: Biaya pendidikan di SD A tidak memberatkan

: Saya menyukai Lingkungan di SD A

: Individu Saya akan menyekolahkan anak saya ke SD

-- Pemerintah harus memberikan beasiswa

D. Kriteria Penyusunan Pernyataan Skala Sikap

untuk mengedit pernyataan yang

digunakan untuk mengkonstruksikan skala sikap adalah :

1. menolak pernyataan yang dihubungkan dengan masa lalu daripada

diinterpretasikan sebagai faktual

stkip Kuningan / Lembaga Penelitian / Uhar / Penelitian Kuantitatif / 2002

1. Method of equal appearing Interval (Thurstone)

yang tidak Favorable sampai yang Favorable dimulai dari abjad A

sampai K, dimana abjad F merupakan bagian yang netral, dalam prakteknya

Apabila pernyataan-pernyataan Skala Sikap telah dinilai/dijawab oleh

= Frekuensi, jumlah penilai yang memilih tiap-tiap alternatif

= Proporsi tiap Frekuensi pilihan dengan jumlah penilai/penjawab

= Proporsi Kumulatif yaitu penambahan besarnya proporsi dengan

karena penentuan nilai/skor skala menggunakan ukuran tendendi sentral

perlu dicari mediannya dengan menggunakan

Rumus Median yang diberi lambang S sebagai berikut :

S = bb+ 0.5 pkb

= Skala nilai dari pernyataan (Median)

= Proporsi kumulatif di bawah posisi median

= proporsi pada posisi Median

= interval (dalam hal ini sama dengan 1)

apabila diterapkan pada contoh dalam

tabel 2.1 akan nampak sebagai