Pengukuran Dan Instrumen

FAKULTAS TARBIYAH
Evaluasi
pembelajaran
suwahono
aa
[Pick the date]
Mater engukuran instrument menyajikan tentang cara pengukuran

instrument.
PENGUKURAN DAN INSTRUMEN
Ilmu Pendidikan berkomunikasi dengan realitas melalui konsep-

konsep, sehingga apabila konsep, baik tunggal maupun yang berhubungan,
mau diteliti maka diperlukan operasionalisasi agar konsep/variabel yang
menjadi fokus perhatian dapat diamati dan diobservasi, sesuatu yang dapat
diobservasi, baik secara langsung ataupun tidak langsung, juga bermakna
dapat diukur (Measurable), oleh karena itu pengukuran menjadi penting
dalam kaitannya dengan penelitian khususnya penelitian kuantitatif.
Pengukuran tidak bisa dilakukan secara sembarangan, sebab
memerlukan keterkaitan/keselarasan antara konsep dengan pelaksanaan
penelitian serta kehati-hatian terhadap kesalahan pengukuran (Measurement
error) yang dapat menjadi ancaman bagi keabsahan suatu penelitian. Dalam
suatu penelitian sosial, menurut Sofian Effendi, proses pengukuran adalah
rangkaian dari empat aktivitas, yakni :
1. menentukan dimensi konsep penelitian
2. rumusan ukuran untuk masing-masing dimensi (pertanyaan-
pertanyaan yang relevan dengan dimensi)
3. tentukan tingkat ukuran yang akan digunakan (Nominal, Ordinal,
Interval, Rasio)
4. tentukan tingkat kesahihan dan keajegan dari alat pengukur
secara sederhana dapat juga dikatakan bahwa untuk melakukan pengukuran,
maka peneliti perlu menentukan konsep/variabel yang akan diteliti,
menentukan indikator-indikator dari variabel tersebut, menentukan item-item
untuk pengukuran sesuai dengan indikator masing-masing, dan kemudian
melakukan pengujian atas kesahihan (validitas) dan keajegan (reliabilitas)
alat ukur tersebut (Instrumen Penelitian).
Suwahono dokumen 2
Meskipun seorang peneliti berusaha secermat mungkin, namun
terjadinya kesalahan dalam pengukuran masih mungkin, sehingga diperlukan
pemahaman tentang kesalahan-kesalahan yang mungkin terjadi dalam
pengukuran. Terdapat dua tipe kesalahan dalam pengukuran yaitu Random
error yakni ketidak ajegan (unreliability) pengukuran dimana pengulangan
pengukuran menghasilkan hasil yang berbeda, hal ini terjadi apabila
pengacakan sampel kurang representatif atau karena ukuran sampel yang
terlalu kecil dan Non-random error yakni ketidak validan (invalidity) atau bias
dalam pengukuran dimana instrumen pengukuran tidak mengukur apa yang
seharusnya diukur. Penelitian yang baik adalah penelitian yang
menggunakan pengukuran dengan menghilangkan atau paling tidak
mengurangi kedua tipe kesalahan tersebut.
Dalam analisa data yang menggunakan statistik pengukuran adalah
hal yang sangat penting karena merupakan sumber angka-angka yang
dipakai dalam analisa statistik, disamping sebagai pedoman dalam
penentuan teknik analisis statistik yang dapat dipergunakan. Secara umum
pengukuran diartikan sebagai proses membedakan sesuatu (The process by
which things are differentiated), sedang secara operasional, Pengukuran
adalah penerapan aturan bilangan pada obyek atau fenomena tertentu,
dalam suatu penelitian Kuantitatif pengukuran dikenakan pada variabel yang
kita teliti. Dengan kata lain pengukuran bermakna menandai nilai-nilai suatu
variabel dengan tanda bilangan tertentu secara sistematis.
Memang diakui bahwa apabila hasil suatu pengukuran dapat
dikuantifikasikan serta dinyatakan dalam bentuk angka, ambiguitas bahasa
akan sangat berkurang (seperti “saya tinggi” dengan “Saya 1,62 cm tinggi),
namun demikian dalam proses pengukuran tidak selamanya harus
menggunakan penandaan dalam bentuk angka (Kuantifikasi), yang penting
tergambar suatu perbedaan posisi yang satu dengan yang lain dalam suatu
kontinum nilai. ketentuan penerapan nilai suatu variabel dengan tanda
bilangan atau lambang disebut skala (Levels of Measurement). Dalam
Suwahono dokumen 3
hubungan ini terdapat beberapa skala pengukuran (Terkadang disebut jenis
data atau tipe variabel berdasarkan tingkat pengukuran) yang perlu dipahami
oleh seorang peneliti
Skala Nominal. Adalah skala yang hanya mendasarkan pada
pengelompokan atau pengkategorian peristiwa atau fakta dan apabila
menggunakan notasi angka hal itu sama sekali tidak menunjukan perbedaan
kuantitatif melainkan hanya menunjukan perbedaan kualitatif. Banyak
variabel dalam penelitian sosial menggunakan skala nominal seperti Agama,
Jenis kelamin, Tempat lahir, asal sekolah dsb. Adapun ciri dari skala nominal
adalah : (1) kategori data bersifat mutually exclusive (saling memisah), (2)
Kategori data tidak mempunyai aturan yang logis (bisa sembarang).
Skala Ordinal. Adalah pengukuran dimana skala yang dipergunakan
disusun secara terurut dari yang rendah sampai yang tinggi menurut suatu
ciri tertentu, namun antara urutan (ranking) yang satu dengan yang lainnya
tidak mempunyai jarak yang sama, skala ordinal banyak dipergunakan dalam
penelitian sosial dan pendidikan terutama berkaitan dengan pengukuran
kepentingan, persepsi, motivasi serta sikap, apabila mengukur sikap
responden terhadap suatu Kebijakan pendidikan , responden dapat diurutkan
dari mulai Sangat setuju (1), Setuju (2), Tidak berpendapat (3), Kurang Setuju
(4), dan Tidak setuju (5), maka angka-angka tersebut hanya sekedar
menunjukan urutan responden, bukan nilai untuk variabel tersebut. Adapun
ciri dari skala ordinal adalah : (1) kategori data bersifat saling memisah, (2)
kkategori data mempunyai aturan yang logis, (3) kategori data ditentukan
skalanya berdasarkan jumlah karakteristik khusus yang dimilikinya.
Skala Interval. Adalah skala pengukuran dimana jarak satu tingkat
dengan tingkat lainnya sama, oleh karena itu skala interval dapat juga disebut
skala unit yang sama (equal unit scale), contoh yang sangat dikenal adalah
temperatur. Adapun ciri-ciri skala interval adalah : (1) kategori data bersifat
saling memisah, (2) kategori data mempunyai aturan yang logis, (3) kategori
data ditentukan skalanya berdasarkan jumlah karakteristik khusus yang
Suwahono dokumen 4
dimilikinya, (4) perbedaan karakteristik yang sama tergambar dalam
perbedaan yang sama dalam jumlah yang dikenakan pada kategori, (5)
angka nol hanya menggambarkan suatu titik dalam skala (tidak punya nilai
Nol absolut).
Skala Rasio. Skala interval yang benar-benar memiliki nilai nol mutlak
disebut skala rasio, dengan demikian skala rasio menunjukan jenis
pengukuran yang sangat jelas dan akurat (precise). Jika kita memiliki skala
rasio, kita dapat menyatakan tidak hanya jarak yang sama antara satu nilai
dengan nilai lainnya dalam skala, tapi juga tentang jumlah proporsional
karakteristik yang dimiliki dua obyek atau lebih, dan contoh untuk skala ini
adalah uang. Adapun ciri-ciri dari skala rasio adalah : (1) kategori data
bersifat saling memisah, (2) kategori data mempunyai aturan yang logis, (3)
kategori data ditentukan skalanya berdasarkan jumlah karakteristik khusus
yang dimilikinya, (4) perbedaan karakteristik yang sama tergambar dalam
perbedaan yang sama dalam jumlah yang dikenakan pada kategori, (5)
angka nol menggambarkan suatu titik dalam skala yang menunjukan
ketiadaan karakteristik (punya nilai Nol absolut).
Bagi seorang peneliti pemahaman secara tepat tentang skala
pengukuran sangat penting karena dua alasan : Pertama, tiap skala
pengukuran memberikan jumlah informamsi yang berbeda, skala rasio
memberi informasi lebih banyak dibanding interval, interval lebih banyak
dibanding ordinal, dan ordinal memberi informasi lebih banyak dibanding
skala pengukuran nominal, oleh karena itu, jika memungkinkan peneliti
sebaiknya menggunakan skala pengukuran yang dapat memberikan
informasi paling maksimum yang diperlukan untuk menjawab permasalahan
penelitian. Kedua, beberapa jenis prosedur analisa statistik tidak tepat untuk
dipergunakan pada skala pengukuran yang berbeda, untuk itu kejelasan
penentuan skala pengukuran akan menentukan jenis analisis statistik yang
bagaimana yang akan dipergunakan.
Suwahono dokumen 5
Gambar 2.1. Empat jenis Skala Pengukuran
SKALA CONTOH
Jenis Kelamin
(Karakteristik : hanya data
Nominal Kelompok dan Label,
melaporkan frekuensi atau
prosentase)
Peringkat dalam suatu

Ordinal Lomba
(Karakteristik : data urutan,
menggunakan angka hanya
untuk menunjukan peringkat)
Ke-4 Ke-3 Ke-2 Ke-1
Temperatur
(Karakteristik : Meng-
anganggap bahwa perbedaan
Interval antar skor benar-benar me-
10 20 30 nunjukan perbedaan yang
sama dalam variabel yang
diukur)
Uang
(Karakteristik : mencakup
Rasio seluruh karakteristik di atas
ditambah nilai nol
mutlak/yang sebenarnya)
0 Rp. 10 Rp.20 Rp.30 Rp.40
2.1. Penentuan Indikator/Konsep Empiris

Konsep merupakan konstruksi teoritis yang dimaksudkan untuk
mengorganisasikan realitas dan bukan sesuatu yang punya gambaran visual,
konsep mempunyai gradasi yang berbeda-beda dalam hal kesulitan dan
kemudahannya untuk diukur tergantung pada tingkatan abstraksi, konsep
Tinggi, berat merupakan contoh yang mudah diukur, namun bagaimana
halnya mengukur konsep yang punya tingkat abstraksi tinggi seperti :
Motivasi, Minat , IQ, EQ, dan konsep lain yang sejenis, sudah barang tentu
untuk konsep-konsep seperti itu pengukurannya tidak sederhana karena
Suwahono dokumen 6
memerlukan upaya mengempiriskan konsep-konsep tersebut agar dapat
dilakukan pengukuran.
Dengan demikian agar suatu konsep dapat diukur maka diperlukan
pengetahuan tentang unsur-unsur yang dapat dijadikan petunjuk (indikator)
terhadap suatu konsep, oleh karena itu konsep dan indikator merupakan dua
hal yang penting dalam suatu penelitian, keduanya harus menunjukan
validasi konsep yaitu penyimpulan yang valid atas suatu konsep (yang tidak
dapat diobservasi) atas dasar indikator (yang dapat diobservasi).
Seorang peneliti tidak meneliti konsep secara langsung melainkan
secara tidak langsung melalui pengumpulan data sesuai dengan indikator-
indikator yang telah ditentukan, untuk itu indikator harus benar-benar dapat
menggambarkan konsepnya, dalam hubungan ini langkah penting dalam
penentuan indikator adalah dengan pengkajian definisi dan teori yang
berkaitan dengan konsep tersebut . Penentuan indikator dapat dilakukan
melalui : 1). penelusuran akibat-akibat dari suatu konsep, hasilnya disebut
Reflective Indicator/Reflector/Effect indicator ; dan 2). Penelusuran sebab-
sebab dari suatu konsep, hasilnya disebut Formative indicator/Cause
indicator. Cara mana saja yang dipergunakan tidaklah menjadi soal yang
penting indikator-indikator yang dipilih/ditentukan harus merupakan
representasi dari konsep-konsep yang menjadi fokus penelitian.
Karena konsep/variabel tidak dapat diukur langsung, maka langkah
penentuan satuan-satuan yang bisa diobservasi menjadi sangat penting
dalam suatu penelitian, dalam hubungan ini terdapat dua cara dalam proses
tersebut yaitu :
1. melalui penjabaran konsep dari mulai Konsep Teori, Konsep
Empiris, Konsep Analitis, dan Konsep Operasional.
2. melalui penelusuran dari Konsep, Dimensi, Indikator, dan item
pertanyaan/pernyataan.
Kedua cara tersebut pada prinsipnya akan menghasilkan output yang sama,
untuk lebih jelasnya berikut ini akan dikemukakan suatu contoh :
Suwahono dokumen 7
Penjabaran Konsep
Teoritis Empiris Analitis Operasional (bisa hanya contoh

dan yang lain terpisah)
Jawaban responden Apakah ijazah terakhir yang
Ijazah Terakhir Tentang ijazah terakhir Saudara miliki……….
yang dimiliki
Pendidikan Apakah sdr pernah mengikuti
Jawaban responden
Kursus ……
Sertifikat Kursus Tentang sertifikat
Bila Ya sertifikat kursus apa yang
kursus yang dimiliki
sdr miliki ………
Penelusuran Konsep sampai Item

Konsep Dimensi Indikator Item (bisa hanya no Item dengan
item-item lengkap terpisah)
Pendidikan Ijazah terakhir yang Apakah ijazah terakhir yang
Formal/Sekolah dimiliki Saudara miliki……….
Apakah sdr pernah mengikuti
Pendidikan
Pendidikan non Sertifikat kursus yang Kursus ……
formal/Luar sekolah dimiliki Bila Ya sertifikat kursus apa yang
sdr miliki ………
kedua cara tersebut akhirnya menghasilkan satuan yang sama dalam hal
obyek yang dapat diukur untuk suatu penelitian, kalau melalui cara
penjabaran konsep diistilahkan dengan konsep empiris, sedangkan kalau
dengan cara Penelusuran konsep disebut indikator. Semua ini jelas sangat
diperlukan agar suatu penelitian dapat memperoleh suatu data untuk
dianalisa sampai diperoleh suatu kesimpulan yang berlaku atau dapat
diterapkan pada konsep-konsep yang menjadi fokus penelitian.
2.2. Pengukuran sikap

Di dalam penelitian Sosial dan Pendidikan dengan pendekatan
Kuantitatif, disamping pengukuran dengan menggunakan bentuk Test,
seorang peneliti akan banyak menghadapi penggunaan pengukuran
berbentuk Skala, baik dengan metode Thurstone, Bogardus ataupun Likert
yang umumnya dikenal dengan Skala Sikap, hal ini tidak lain karena dalam
bidang pendidikan banyak sekali Personological variable yang sulit, bahkan
tidak dapat diobservasi secara langsung melainkan melalui penyimpulan dari
indikasi tidak langsung (seperti Konsep diri, bakat, motivasi belajar).
Suwahono dokumen 8
A. Pengertian Sikap
Sikap (attitude) merupakan kecenderungan seseorang untuk bertindak
terhadap obyek tertentu, para akhli telah memberikan definisi yang bervariasi
terhadap konsep sikap, Thurstone sebagai pelopor dalam pengukuran sikap
mendefinisikan sikap sebagai berikut :
o attitude… “the sum total of man’s inclinations and feelings,
prejudice and bias, preconceived notion, ideas, fears, threats, and
conviction about any specified topic” (definisi tahun 1928)
o attitude is the affect for or against a psychological object (definisi
tahun 1931)
o attitude…”the intensity of positive or negative affect for or against a
psychological object” (definisi tahun 1946)
definisi-definisi tersebut oleh Daniel J. Mueller dirumuskan kembali sebagai
berikut :
o Attitude is :
1. affect for or against
2. evaluation of
3. like or dislike
4. positiveness or negativeness toward a psychological object.
pengertian di atas menunjukan bahwa suatu sikap merupakan suatu
perasaan,penilaian, kesukaan atau ketidak sukaan, kepositipan atau
kenegatipan terhadap suatu obyek psikologis tertentu. Sementara itu
Bogardus mendefinisikan Sikap sebagai a tendency to act toward or
against some environmental factor.
B. Karakteristik Sikap
Dalam bukunya Principles of Educational and Psychological
Measurement and Evaluation, sebagaimana dikutip oleh Saifuddin Azwar
G. Sax menyatakan bahwa terdapat beberapa karakteristik dari sikap yaitu :
Suwahono dokumen 9
o Arah. Artinya sikap terpilah pada dua arah (kesetujuan atau
ketidaksetujuan; mendukung atau tidak mendukung; memihak atau
tidak memihak)
o Intensitas. Artinya kedalaman atau kekuatan sikap , kesamaan
arah bisa menunjukan intensitas yang berbeda.
o Keluasan. Artinya kesetujuan atau ketidaksejuan dapan mencakup
aspek keseluruhan atau hanya aspek bagian yang sangat spesifik
dari suatu obyek sikap
o Konsistensi. Yaitu kesesuaian antara pernyataan sikap yang
dikemukakan dengan responsnya terhadap obyek sikap dimaksud.
C. Dimensi Sikap
o Dimensi Kognitif (Keyakinan). Ekspresi keyakinan terhadap suatu
obyek sikap tertentu
o Dimensi Afektif (perasaan). Ekspresi perasaan secara langsung
terhadap obyek sikap tertentu
o Dimensi Konatif (kecenderungan prilaku). Pernyataan maksud atau
preferensi prilaku berkaitan dengan obyek tertentu, baik prilaku
personal maupun preferensi prilaku untuk kegiatan sosial.
Contoh Item pernyataan :
Keyakinan : Biaya pendidikan di SD A tidak memberatkan
Perasaan : Saya menyukai Lingkungan di SD A
Konatif : Individu – Saya akan menyekolahkan anak saya ke SD
A jika sudah waktunga
sosial -- Pemerintah harus memberikan beasiswa
bagi Siswa yang kurang mampu
D. Kriteria Penyusunan Pernyataan Skala Sikap

Menurut Prof. Mar’at dalam bukunya Sikap Manusia, Perubahan dan
Pengukurannya, kriteria informal untuk mengedit pernyataan yang
digunakan untuk mengkonstruksikan skala sikap adalah :
Suwahono dokumen 10
1. menolak pernyataan yang dihubungkan dengan masa lalu daripada
saat sekarang
2. menolak pernyataan yang faktual atau yang baik untuk
diinterpretasikan sebagai faktual
3. menolak pernyataan yang dapat diinterpretasikan lebih dari satu
4. menolak pernyataan yang tidak relevan kepada obyek psikologi
5. menolak pernyataan yang dapat diterima oleh hampir semua orang
atau bahkan tidak satupun yang menerima
6. memilih pernyataan yang dianggap memiliki pilihan dari skala efek
mengenai minat
7. menjaga bahasa yang sederhana dari pernyataan untuk jelas dan
langsung (tidak berbelit-belit)
8. pernyataan haruslah pendek kurang lebih dua puluh kata
9. pernyataan haruslah memiliki suatu pemikiran
10. menolak pernyataan yang mengandung kata-kata : semua; selalu;
tidak satupun; tidak pernah; yang sering menimbulkan
ketidakjelasan
11. kata-kata : hanya, benar/tepat, hampir, dan kata-kata lain yang
hampir sama artinya harus digunakan dengan hati-hati dalam
menulis pernyataan
12. bila mungkin pernyataan harus dalam bentuk kalimat yang
sederhana sehingga tidak merupakan bentuk yang kompleks dan
berlebihan
13. menolak penggunaan kata-kata yang tidak mempunyai arti
14. menolak penggunaan negatif rangkap.
E. Contoh Skala Sikap

Untuk lebih memperoleh gambaran tentang bagaimana pakar
membuat Skala Sikap, berikut ini akan dikemukakan dua cara masing-masing
mengacu pada Skala Thurstone dan Likert
Suwahono dokumen 11
1. Method of equal appearing Interval (Thurstone)
Metode ini dikemukakan oleh Edward pengarang Buku Technique of
attitude scale construction. Menurut Mar’at cara ini biasanya digunakan bila
pernyataan yang akan diskala adalah cukup banyak, sehingga sukar untuk
dilakukan penilaian secara perbandingan, sementara itu Saifuddin Azwar
menyatakan bahwa cara penskalaan ini mengacu pada model skala
Thurstone yang mengacu pada pendekatan penskalaan Stimulus serta
penilaiannnya dilakukan oleh kelompok penilai tertentu yang diberi tugas
membaca dengan seksama setiap pernyataan untuk kemudian memberikan
penilaian atau perkiraan tingkat favorable atau tidaknya suatu pernyataan
dalam suatu Psychological Continuum.
Psychological Continuum tersebut disusun dalam bentuk abjad
dengan asumsi bahwa jarak/interval antara hurup dengan huruf setara mulai
dari yang tidak Favorable sampai yang Favorable dimulai dari abjad A
sampai K, dimana abjad F merupakan bagian yang netral, dalam prakteknya
yang tidak Favorable bernilai 1 dan yang Favorable bernilai 11, akan tetapi
pilihan terhadap suatu nilai tertentu tidak lantas dijadikan nilai skala suatu
item tertentu melainkan sebagai bahan untuk diolah kembali, adapun
kontinum skala tersebut nampak sebagai berikut
A B C D E F G H I J K
1 2 3 4 5 6 7 8 9 10 11
Tak Favorable Netral Favorable
Apabila pernyataan-pernyataan Skala Sikap telah dinilai/dijawab oleh

kelompok kemudian dihitung frekuensi untuk masing-masing pilihan alternatif
per item pernyataan, sebagai contoh : misalkan skala sikap model tersebut
diberikan pada 100 orang (N = 100) penilai dengan 30 item pernyataan,
kemudian kita ambil satu item nomor 1 untuk ditentukan nilainya, dengan
deskripsi sebagai berikut :
Tabel 2.1
Suwahono dokumen 12
Alternatif Pilihan
No Item A B C D E F G H I J K
1 2 3 4 5 6 7 8 9 10 11
F 4 5 6 8 10 12 30 6 8 9 2
1 P 0.04 0.05 0.06 0.08 0.10 0.12 0.30 0.06 0.08 0.09 0.02
Pk 0.04 0.09 0.15 0.23 0.33 0.45 0.75 0.81 0.89 0.98 1.00
Keterangan :
F = Frekuensi, jumlah penilai yang memilih tiap-tiap alternatif
P = Proporsi tiap Frekuensi pilihan dengan jumlah penilai/penjawab
F dibagi N (F : N)
Pk = Proporsi Kumulatif yaitu penambahan besarnya proporsi dengan
proporsi sebelumnya, misal 0.09 = 0.04 + 0.05
karena penentuan nilai/skor skala menggunakan ukuran tendendi sentral

Median, maka setiap item perlu dicari mediannya dengan menggunakan
Rumus Median yang diberi lambang S sebagai berikut :
S = bb+ 0.5 – pkb i

pm
Keterangan :
S = Skala nilai dari pernyataan (Median)
pkb = Proporsi kumulatif di bawah posisi median
pm = proporsi pada posisi Median
i = interval (dalam hal ini sama dengan 1)
apabila diterapkan pada contoh dalam tabel 2.1 akan nampak sebagai
berikut :
S = 6.5+ 0.5 – 0.45 i

0.30
S = 6.67
Suwahono dokumen 13
Nilai 6.67 ini merupakan nilai skala untuk item nomor 1 tersebut, pencarian
nilai ini dilakukan sebanyak item-item yang tertuang dalam Skala sikap yang
akan dipergunakan dalam penelitian. Disamping itu untuk mengetahui variasi
distribusi dapat dilakukan perhitungan rentang antar kuartil (K 75 - k25) dengan
rumus :
K25 = bb + 0.25 – pkb i

Pk25
K75 = bb + 0.75 – pkb i

Pk 75
Bila diterapkan pada item tersebut di atas diperoleh nilai

K25 = 4.7
K75 = 7
Q = 2.3 (Rentang antar Kuartil)
Setelah dilakukan perhitungan nilai S bagi tiap Item pernyataan maka
akan diperoleh nilai/skor skala untuk setuap item yang menggambarkan
posisi sikap responden dalam suatu kontinum psikologis, dan apabila bentuk
pernyataannya Ya dan Tidak, maka jawaban Ya saja yang diberi skor untuk
kemudian dijumlahkan atau dicari Median/Mean untuk tiap responden,
semakin tinggi skor responden semakin menunjukan sikap Favorable
terhadap masalah yang diungkapkan dalam Item pernyataan, sedang
jawaban Tidak tidak dihitung (diberi nilai 0), karena hal itu berarti pernyataan
item tidak mendeskripsikan pengalaman yang dialami oleh yang
Suwahono dokumen 14
bersangkutan (responden/kelompok penilai). Adapun nilai Q lebih
dimaksudkan untuk memilih Item-item, dimana sebaiknya dipilih yang punya
nilai Q kecil sebab ini menunjukan tingkat kesepakatan yang tinggi di antara
kelompok penilai.
Untuk bahan kajian dan perbandingan serta contoh bagaimana

konstruksi skala sikap model Thurstone, berikut ini akan dikemukakan skala
sikap yang dibuat oleh Thurstone pada tahun 1931, untuk melihat sikap
masyarakat terhadap etnis China.
Dalam skala ini Thurstone ingin mengungkap/mengukur bagaimana

sikap orang Amerika terhadap Suku China dengan meminta responden
untuk menyatakan kesetujuan atau ketidaksetujuan terhadap pernyataan
yang terdapat angket skala sikap.
Pernyataan-pernyataan yang diungkap diawali dengan hal-hal yang

berkaitan dengan perasaan, seperti perasaan netral/tak peduli, benci, tertarik
dan cinta, dikombinasikan dengan pernyataan-pernyatan yang bersifat
keyakinan seperti inferioritas suku china dibanding suku bangsa responden
(Amerika), dan kecenderungan prilaku yang dimiliki responden terhadap suku
china, seperti untuk hidup di negeri China.
Skala sikap Thurstone ini juga menggambarkan suatu kombinasi

pernyatan positif dan negatif dengan jumlah yang hampir seimbang,
kombinasi semacam ini memang diperlukan dalam penyusunan skala sikap
agar dapat diketahui konsistensi pilihan dari responden, sehingga skala sikap
yang dibuat dapat benar-benar memberikan gambaran sesungguhnya dari
sikap responden terhadap obyek sikap yang menjadi obyek penelitian.
Suwahono dokumen 15
Contoh Skala Sikap yang dibuat Thurstone tahun 1931
Attitude toward the Chinese

Try to indicate either agreement or disagreement for each
statemen. If you simply can not decide about statemen, you may
mark it with a question mark. This is not an examination, there
are no right or wrong answer tothese statements. This is simply a
study of people’s attitudes toward the chinese. Please indicate
your own conviction by a check mark when you agree and by a
cross when you disagree
Put a check mark if you agree with the statement.

Put a a cross if you agree with the statement.
---- 1. I have no particular love or hate for the Chinese (6.5)
--
---- 2. I dislike the Chinese more every time I see (10.1)
--
---- 3. The chinese are very preety decent (4.2)
--
---- 4. Some Chinese traits are admirable, but on the whole I
-- don’t like them (7.2)
---- 5. The Chinese are superior to all other races (0.5)
--
---- 6. The Chinese, as part of the yellow race, are inferior to
-- the white races (8.7)
---- 7. I like yhe Chinese (3.5)
--
---- 8. The more I know about the Chinese, the better I like
-- them (2.8)
---- 9. The Chinese are aptly described by the term “yellow
-- devil” (11.0)
---- 1 The high-class Chinese are superior to us (1.8)
-- 0.
---- 1 The Chinese are different, but not inferior (5.2)
-- 1.
---- 1 I hate the Chinese (11.5)
-- 2.
---- 1 Chinese parents are unusually devoted to their
-- 3. Children (4.1)
---- 1 Although I respect some of their qualities, I could
-- 4. never consider a Chinese as a friend (7.7)
---- 1 I would rather live in China than any other place in the
Suwahono dokumen 16
2. Method of Summated Rating (Likert)
Metode ini merupakan metode penskalaan pernyataan sikap dengan
menggunakan distribusi respon sebagai dasar penentuan skala serta tidak

menggunakan kelompok penilai. Dalam skala Likert, kuantifikasi dilakukan
dengan menghitung respon kesetujuan atau ketidaksetujuan (dalam suatu
kontinum) terhadap obyek sikap tertentu.
Skala model Likert, kategori respon terdiri dari lima, mulai dari Sangat
setuju, Setuju, Tidak pasti/tidak memutuskan, tidak setuju, sangat tidak
setuju, bila pernyataan itu sifatnya posistif diberi skor 5,4,3,2,1, dan bila
pernyataan negatif diberi skor 1,2,3,4,5. Adapun prosedur konstruksi skala
model Likert adalah :
a. Identifikasi obyek-obyek sikap serta jelaskan secara spesifik

b. Kumpulkan item-item opini (30 atau lebih) tentang obyek sikap.
Semua item harus menyatakan sesuatu yang positif atau negatif
c. Uji cobakan item-item tersebut pada sekelompok responden, tiap

responden menunjukan suatu tingkat persetujuan untuk tiap item
d. Beri skor untuk tiap responden, kemudian jumlahkan skor tersebut

untuk tiap responden
e. Korelasikan skor tiap item dengan skor total untuk tiap responden
f. Hilangkan item yang korelasinya tidak signifikan atau yang

korelasinya negatif. Perhatikan keseimbangan antara item positif
dan negatif.
g. Setelah langkah-langkah tersebut dilakukan maka sebagai hasilnya

akan diperoleh sejumlah pernyataan untuk mengukur sikap yang
dapat dipercaya untuk dapat digunakan dalam penelitian, karena
hanya item yang signifikan saja yang dipergunakan dalam
instrumen penelitian.
Suwahono dokumen 17
Contoh Skala Sikap Model Likert
Attitude About Marijuana
Indicate on the line to the the left of each statement how much you agree
or disagree with it. Please mark every item. Use the following response
category
A = Strongly agree.
B = Agree.
C = Uncertain.
D = Disagree.
E = Strongly disagree
---- 1. No right-thinking person would use marijuana (N)

--
---- 2. Marijuana use leads to heroine use (N)
--
---- 3. Only hippies and weirdos use marijuana (N)
--
---- 4. Marijuana should be legalized (P)
--
---- 5. Marijuana use causes birth defect (N)
--
---- 6. Since there is no hangover, marijuana is a good
-- substitute for alcohol (P)
---- 7. Marijuana is a narcotic drug (N)
--
---- 8. Most people who criticize marijuana use don’t know
-- anything about the drug (P)
---- 9. Habitual marijuana users are neurotic (N)
--
---- 1 As a symbol of the youth culture, epitomizing
-- 0. disobedience and disregard for authority, marijuana
usage should be put down (N)
---- 1 In our highly impersonal society, marijuana helps one
-- 1. express feelings and relate to others, and should
therefore definitely be used by those who feel the
needs (P)
---- 1 Marijuana is a good social stimulator and should be
-- 2. allowed, especially at parties, wheremixing important
(P)
---- 1 Mariyuana is not a “hard” drug (P)
-- 3.
---- 1 If a son or daughter uses marijuana, Mom and Dad
4.
Suwahono dokumen 18
F. Konversi Nilai Skala
Skala sikap yang diberi bobot nilai 0 – 4 atau 1 – 5 sesuai dengan
alternatif respon pada dasarnya merupakan skala yang bernilai Ordinal atau
pemeringkatan ,sebab responden diminta merespon/menjawab sesuai
dengan kecenderungan sikapnya untuk kemudian diberi kode/nilai peringkat
oleh peneliti, namun demikian terdapat para Pakar yang menganggapnya
sebagai Skala Interval sehingga memungkinkan pengolahan datanya dengan
analisis Statistik Parametrik. Terlepas dari kontroversi tersebut, mereka yang
berpendapat bahwa skala sikap bernilai ordinal mengajukan suatu cara untuk
mengkonversi nilai skala tersebut menjadi bernilai Interval dengan
menempatkan masing-masing nilai skala dalam kelompoknya pada suatu
distribusi normal, sehingga jarak nilai menjadi sama. Dengan cara ini
penentuan nilai skala dilakukan dengan memberi bobot dalam satuan deviasi
normal bagi setiap kategori respon pada suatu kontinum psikologis.
Pengkonversian nilai skala dilakukan pada seluruh pernyataan yang
dipergunakan dalam skala, bila yang diteliti 3 variabel dengan banyak item
pernyataan 30 untuk tiap instrumen, maka penghitungan konversi dilakukan
sebanyak 90 kali (90 Item), jadi banyaknya penghitungan konversi ditentukan
oleh banyaknya item pernyataan dalam suatu skala. Sebagai contoh, kita
ambil satu item pernyataan Positif dengan nilai skala mulai dari 0 sampai
dengan 4 (skala 5), dengan jumlah responden 200 orang (contoh 2.1), dan
satu item pernyataan negatif dengan nilai skala 1 sampai dengan 4 (skala 4),
jumlah responden sebanyak 50 0rang (contoh 2.2). Dalam kenyataannya,
terkadang (bahkan sering) nilai skala konversi (akibat pembulatan) sama
dengan nilai skala asal yang ditetapkan berdasarkan judgement, namun
karena nilai konversi telah melalui pengolahan maka jelas akan lebih dapat
dipertanggungjawabkan bila diperlakukan sebagai data dengan skala
pengukuran interval serta dapat dianalisa menggunakan statistik parametrik
(sudah tentu ditambah syarat lainnya).
Suwahono dokumen 19
Contoh Pengkonversian nilai skala.
Contoh 2.1. Pernyataan Positif

Alternatif NS Asal F p pk pkt z z+2.170 NS Konversi
STS 0 6 0.030 0.030 0.015 -2.170 0 0
TS 1 29 0.145 0.175 0.103 -1.265 0.905 1
R 2 42 0.210 0.385 0.280 -0.583 1.587 2
S 3 103 0.515 0.900 0.643 0.366 2.536 3
SS 4 20 0.100 1.000 0.950 1.645 3.815 4
Jml Responden
(N) 200
Contoh 2.2. Pernyataan Negatif

Alternatif NS Asal F p pk pkt z z+2.555 NS Konversi
SS 1 6 0.120 0.120 0.060 -1.555 1 1
S 2 15 0.300 0.420 0.270 -0.613 1.942 2
TS 3 20 0.400 0.820 0.620 0.305 2.86 3
STS 4 9 0.180 1.000 0.910 1.341 3.896 4
Jml Responden
(N) 50
Penjelasan
1. Hitung frekuensi setiap alternatif respon untuk seluruh responden. Dalam
contoh 2.1 : yang menjawab STS = 6 orang; TS = 29; R = 42; S = 103;
SS = 20; jumlah total 200 (banyaknya responden). Dalam contoh 2.2.
yang menjawab SS = 6; S = 15; TS = 20; STS = 9; jumlah total 50
(banyaknya responden)
2. hitung proporsi tiap alternatif. Dalam contoh 2.2 untuk alternatif SS
dengan f = 6, proporsinya (p) adalah 6 : 50 = 0.120, perhitungan ini
dilakukan untuk setiap alternatif respon.
3. setelah proporsi untuk setiap alternatif dihitung, kemudian dilanjutkan
dengan penghitungan proporsi kumulatif (pk) dengan cara menjumlahkan
proporsi alternatif dengan proporsi sebelumnya, misalnya untuk pk 0.420
diperoleh dengan cara menjumlahkan 0.300 dengan 0.120, demikian juga
untuk alternatif lainnya.
Suwahono dokumen 20
4. kemudian dihitung pk tengahnya (pkt) dengan cara menjumlahkan ½ p
alternatif yang sedang dicari pkt-nya dengan pk alternatif sebelumnya.
Misalnya untuk pkt = 0.620 (contoh 2.2) diperoleh dari ½ x 400 + 420.
5. selanjutnya untuk tiap-tiap pkt dicari nilai z nya dengan menggunakan
Tabel Deviasi Normal (terlampir), contoh nilai z = - 2.170 (contoh 2.1)
untuk pkt = 0.015, diperoleh dengan cara melihat pertemuan antara baris
yang bernilai 0.01 dengan kolom yang bernilai 5.
6. sesudah diperoleh nilai z untuk masing-masing alternatif respon (pkt),
maka untuk memperoleh nilai skala, nilai z yang pertama (alternatif
dengan nilai skala terkecil) angka mutlaknya ditambahkan pada nilai z tiap
alternatif sedangkan untuk nilai skala yang paling kecil langsung
ditetapkan sesuai judgment yang telah ditentukan (nilai 0 untuk contoh
2.1. ; dan 1 untuk contoh 2.2.), apabila nilai skala dimulai dari 0, nilai z
yang diperoleh langsung ditambahkan, sedangkan jika nilai skala terkecil
sama dengan 1, maka nilai z harus ditambah nilai 1 dahulu baru
kemudian ditambahkan pada masing-masing nilai z berikutnya. Misal
(contoh 2.2.) nilai 3.896 merupakan hasil dari 1.341 + 2.555. sesudah tiap
alternatif respon memperoleh nilainya kemudian dibulatkan seperti terlihat
dalam Nilai Skala Konversi. Dari nilai inilah seluruh analisa data
dilakukan.
Langkah pengkonversian nilai skala dengan memberikan bobot dalam
suatu deviasi normal akan menghasilkan suatu nilai interval yang tepat dalam
memposisikan masing-masing kategori/alternatif respon dalam suatu
kontinum, namun demikian penggunaan cara penentuan nilai tanpa konversi
pun dapat saja dilakukan dengan alasan kepraktisan, disamping Likert sendiri
pada tahun 1932 telah menunjukan penemuannya bahwa skor kelompok
responden yang menggunakan cara konversi berkorelasi sebesar 0.99
dengan penentuan skor cara biasa (cara sederhana), namun demikian untuk
kemantapan analisa terutama analisis statistik, pengkonversian nilai skala
nampaknya diperlukan. Sementara itu Saifuddin Azwar menyatakan bahwa
Suwahono dokumen 21
apabila skala sikap yang disusun tidak untuk digunakan sebagai instrumen
pengukuran yang menyangkut keputusan yang penting sekali, seperti
penelitian pendahuluan atau studi kelompok secara kecil-kecilan, kadang-
kadang demi kepraktisan, penyusun skala sikap dapat menempuh cara
sederhana untuk menentukan nilai skala (tanpa konversi dengan deviasi
normal)
UNTUK DIDISKUSIKAN
1. Pengukuran merupakan langkah penting dalam suatu penelitian,

khususnya penelitian kuantitatif, jelaskan alasan-alasannya
2. Kemukakan Contoh-contoh Variabel yang mempunyai tingkat
pengukuran :
• Nominal.
• Ordinal
• Interval
• Rasio
3. Pengukuran dengan menggunakan skala sikap banyak dilakukan

dalan penelitian pendidikan, jelaskan alasan-alasannya, serta
kemukakan contoh-contoh bagaimana Konsep dapat diteliti
4. Tentukan nilai Skala model Thurstone dari data berikut
No Item A B C D E F G
1 4 6 12 20 18 7 3
F
5. Konversikan Nilai skala berikut :
Alternatif Nilai Skala Frekuensi

STS 1 10
TS 2 15
R 3 30
S 4 25
SS 5 20
Suwahono dokumen 22
2.2. Instrumen Penelitian
Penelitian pada dasarnya merupakan suatu upaya untuk memahami

masalah-masalah yang ditemui dalam kehidupan manusia, keterbatasan
manusia untuk memahami permasalahan tersebut hanya dengan
mengandalkan pengalaman hidup sehari-hari secara sporadis dan tidak
tertata, jelas tidak cukup untuk menjadi dasar yang kuat bagi pemahaman
terhadap suatu masalah. Keadaan ini telah mendorong upaya-upaya Pakar
untuk membuat prosedur dan alat yang dapat dipergunakan guna
mengungkap kenyataan-kenyatan (Data) yang dapat dijadikan dasar dalam
memecahkan berbagai masalah. Untuk itu Instrumen penelitian menempati
kedudukan penting dalam suatu penelitian, hal ini tidak lain karena
keberhasilan suatu penelitian dipengaruhi pula oleh instrumen yang
dipergunakan.
Dalam suatu penelitian Kuantitatif (adanya jarak antara subyek dan
obyek) yang bersifat verifikasi hipotesis (pengujian hipotesis), instrumen
penelitian merupakan alat yang dipakai untuk menjembatani antara subyek
dan obyek (secara substansial antara hal-hal teoritis dengan empiris, antara
konsep dengan data), sejauhmana data mencerminkan konsep yang ingin
diukur tergantung pada instrumen (yang substansinya disusun berdasarkan
penjabaran konsep/penentuan indikator) yang dipergunakan untuk
mengumpulkan data, masalah ini telah dikemukakan dalam uraian terdahulu,
sehingga gambaran umumnya telah dipahami, adapun pembahasan berikut
akan lebih menjurus pada pembahasan instrumen sebagai alat/cara untuk
memperoleh data.
Menurut Nana Sudjana , dalam penyusunan instrumen penelitian ada
beberapa hal yang harus diperhatikan yaitu :
1. masalah dan variabel yang diteliti termasuk insikator variabel harus
jelas dan spesifik sehingga dapat dengan mudah menetapkan jenis
instrumen yang akan digunakan.
Suwahono dokumen 23
2. sumber data/informasi baik jumlah maupun keragamannya harus
diketahui terlebih dahulu, sebagai bahan atau dasar dalam
menentukan isi, bahasa, sistematika item dalam instrumen
penelitian.
3. keterandalan dalam instrumen itu sendiri sebagai alat
pengumpulan data baik dari keajegan, kesahihan maupun
obyektivitas.
4. jenis data yang diharapkan dari penggunaan instrumen harus jelas,
sehingga peneliti dapat memperkirakan cara analisis data guna
pemecahan masalah penelitian.
5. mudah dan praktis digunakan, akan tetapi dapat menghasilkan
data yang diperlukan.
Hal penting dari suatu instrumen adalah bahwa substansinya harus
benar-benar menggali informasi yang diperlukan bagi suatu penelitian
dengan mengacu pada konsep empiris atau indikator yang telah ditentukan,
adapun mengenai prosedur penggunaannya, apakah dilengkapkan oleh
peneliti (seperti : rating Scale, Interview, performance checklist) atau
responden (seperti : Kuesioner, skala sikap, test presrtasi dan bakat, Test
kinerja) sangat ditentukan oleh kepraktisan, obyektivitas dan
jangkauan/cakupan perolehan data.
Secara umum terdapat beberapa jenis instrumen penelitian yang
dapat digunakan oleh seorang peneliti yaitu :
Tes. Yaitu suatu alat ukur yang diberikan pada individu (responden)
untuk mendapat jawaban-jawaban baik secara tertulis ataupun lisan,
sehingga dapat diketahui kemampuan individu/responden yang
bersangkutan. Contohnya : Tes prestasi belajar yang dimaksudkan untuk
mengetahui/mengukur kemampuan dan penguasaan terhadap hasil dari
proses pembelajaran ; Test intelegensi. Adalah test yang dimaksudkan untuk
mengukur kemampuan atau potensi individu secara umum, seperti test IQ
dari Binet Simon untuk mengetahui tingkatan kecerdasan (IQ) seseorang.
Suwahono dokumen 24
Kuesioner. Instrumen penelitian dalam bentuk pertanyaan yang
biasanya dimaksudkan untuk mendapatkan informasi berkaitan dengan
pendapat, aspirasi, persepsi, keinginan, keyakinan dan lain-lain secara
tertulis, dan apabila pertanyaan dan jawaban dilakukan secara lisan disebut
Wawancara. Dalam suatu penelitian kedua instrumen ini sering
dikombinasikan dengan maksud untuk lebih meyakinkan.
Skala. Merupakan alat untuk mengukur nilai/keyakinan, sikap dan hal-
hal yang berkaitan dengan personological Variable, instrumen bentuk skala
biasanya disusun dalam bentuk pernyataan pada suatu kontinum nilai
tertentu, umumnya bentuk skala dipakai untuk mengukur sikap (skala sikap),
atau skala lainnya (tergantung pada konsep yang ingin diukur sesuai dengan
fokus/masalah penelitian).
Instrumen-instrumen penelitian di atas merupakan sebagian dari jenis-
jenis instrumen lainnya, namun dalam penelitian kuantitatif (dengan obyek
penelitian yang cukup besar) instrumen tersebut sangat sering dipergunakan
dan sangat aplikabel untuk penerapan teknik analisis dengan statistik.
Adapun instrumen lainnya yang bisa dipergunakan dalam suatu penelitian
dapat dilihat dalam tabel berikut :
Yang dilengkapi peneliti Yang dilengkapi subyek/responden

1. Rating Scale 1. Quetionnaires
2. Interview Schedule 2. Self Checklist
3. Tally Sheets 3. Attitude Scales
4. Flowcharts 4. Personality (or Character) Inventories
5. Performance Checklist 5. Achevement/Aptitude Test
6. Anecdotal Record 6. Performance Tests
7. Time And Motion Logs 7. Projective Devices

8. Sociometric Devices
Sumber : Jack R. Fraenkel, 1993. How to design and evaluation research in education.
2.3. Kriteria Instrumen
Suwahono dokumen 25
sebagaimana diketahui bahwa instrumen merupakan alat ukur yang
digunakan untuk mendapatkan informasi tentang variasi karakteristik variabel
secara obyektif. Instrumen mempunyai peranan yang sangat penting dalam
suatu penelitian karena kualitas data (berarti juga kualitas hasil penelitian)
sangat ditentukan/dipengaruhi oleh kualitas instrumen yang digunakan. Oleh
karena itu untuk mendapatkan hasil penelitian yang dapat dipertanggung
jawabkan diperlukan instrumen yang dapat dipertanggungjawabkan pula,
dalam hubungan ini Instrumen penelitian harus memenuhi kriteria Validitas
dan Reliabilitas agar penggunaannya dalam suatu penelitian dapat
menghasilkan data/informasi yang akurat dan obyektif.
2.3.1. Validitas
Validitas atau kesahihan menunjukan pada kemampuan suatu
instrumen (alat pengukur) mengukur apa yang harus diukur (…. a valid
measure if it succesfully measure the phenomenon), seseorang yang ingin
mengukur tinggi harus memakai meteran, mengukur berat dengan
timbangan, meteran, timbangan merupakan alat ukur yang valid dalah kasus
tersebut. Dalam suatu penelitian yang melibatkan variabel/konsep yang tidak
bisa diukur secara langsung, maslah validitas menjadi tidak sederhana, di
dalamnya juga menyangkut penjabaran konsep dari tingkat teoritis sampai
tingkat empiris (indikator), namun bagaimanapun tidak sederhananya suatu
instrumen penelitian harus valid agar hasilnya dapat dipercaya.
Mengingat pentingnya masalah validitas. Maka tidak mengherankan
apabila Para Pakar telah banyak berupaya untuk mengkaji masalah validitas
serta membagi validitas ke dalam beberapa jenis, terdapat perbedaan
pengelompokan jenis-jenis validitas, Elazar Pedhazur menyatakan bahwa
validitas yang umum dipakai tripartite classification yakni Content, Criterion
dan Construct, sementara Kenneth Bailey mengelompokan tiga jenis utama
validitas yaitu : Face validity, Criterion Validity, dan construct validity, dengan
catatan face validity cenderung dianggap sama dengan content validity.
Berikut ini akan dikemukakan beberapa jenis validitas yaitu :
Suwahono dokumen 26
Validitas Rupa (Face validity). Adalah validitas yang menunjukan
apakah alat pengukur/instrumen penelitian dari segi rupanya nampak
mengukur apa yang ingin diukur, validitas ini lebih mengacu pada bentuk dan
penampilan instrumen. Menurut Djamaludin Ancok validitas rupa amat
penting dalam pengukuran kemampuan individu seperti pengukuran
kejujuran, kecerdasan, bakat dan keterampilan.
Validitas isi (Content Validity). Valditas isi berkaitan dengan
kemampuan suatu instrumen mengukur isi (konsep) yang harus diukur. Ini
berarti bahwa suatu alat ukur mampu mengungkap isi suatu konsep atau
variabel yang hendak diukur. Misalnya test bidang studi IPS, harus mampu
mengungkap isi bidang studi tersebut, pengukuran motivasi harus mampu
mengukur seluruh aspek yang berkaitan dengan konsep motivasi, dan
demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan
validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar ini
Dia berpendapat bahwa validitas isi berbeda dengan validitas rupa yang
kurang menggunakan analisis logis yang sistematis, lebih lanjut dia
menyatakan bahwa sebuah instrumen yang punya validitas isi biasanya juga
mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.
Validitas kriteria (Criterion validity). Adalah validasi suatu instrumen
dengan membandingkannya dengan instrumen-pengukuran lainnya yang
sudah valid dan reliabel dengan cara mengkorelasikannya, bila korelasinya
signifikan maka instrumen tersebut mempunyai validitas kriteria. Terdapat
dua bentuk Validitas kriteria yaitu : Validitas konkuren (Concurrent validity),
Validitas ramalan (Predictive validity). Validitas konkuren adalah
kemampuan suatu instrumen pengukuran untuk mengukur gejala tertentu
pada saat sekarang kemudian dibandingkan dengan instrumen pengukuran
lain untuk konstruk yang sama. Validitas ramalan adalah kemampuan suatu
instrumen pengukuran memprediksi secara tepat dengan apa yang akan
terjadi di masa datang. Contohnya apakah test masuk sekolah mempunyai
validitas ramalan atau tidak ditentukan oleh kenyataan apakah terdapat
Suwahono dokumen 27
korelasi yang signifikan antara hasil test masuk dengan prestasi belajar
sesudah menjadi siswa, bila ada, berarti test tersebut mempunyai validitas
ramalan.
Validitas konstruk (Construct Validity). Konstruk adalah kerangka dari
suatu konsep, validitas konstruk adalah validitas yang berkaitan dengan
kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang
diukurnya. Menurut Jack R. Fraenkel validasi konstruk (penentuan validitas
konstruk) merupakan yang terluas cakupannya dibanding dengan validasi
lainnya, karena melibatkan banyak prosedur termasuk validasi isi dan validasi
kriteria.
Lebih jauh Jack R. FraenkelI meneyatakan bahwa untuk mendapatkan
validitas konstruk ada tiga langkah di dalamnya yaitu :
1. Variabel yang akan diukur harus didefinisikan dengan jelas
2. Hipotesis, yang mengacu pada teori yang mendasari variabel
penelitian harus dapat membedakan orang dengan tingkat gradasi
yang berbeda pada situasi tertentu
3. Hipotesis tersebut diuji secara logis dan empiris.
Dalam upaya memperoleh validitas konstruk, maka seorang peneliti
perlu mencari apa saja yang menjadi suatu kerangka konsep agar dapat
menyusun tolok ukur operasional konsep tersebut. Pencarian kerangka
konsep menurut Djamaludin Ancok dapat ditempuh beberapa cara :
1. Mencari definisi-definisi konsep yang dikemukakan oleh para akhli
yang tertulis dalam buku-buku literatur.
2. Mendefinisikan sendiri konsep yang akan diukur, jika tidak
diperoleh dalam buku-buku literatur
3. Menanyakan definisi konsep yang akan diukur kepada calon
responden atau orang-orang yang memiliki karakteristik yang sama
dengan responden.
Mengingat pentingnya pendefinisian suatu konsep yang ingin diukur,
maka seorang peneliti perlu mencermatinya, sebab definisi suatu konsep
Suwahono dokumen 28
perlu dikembangkan dari mulai definisi teoritis, definisi empiris, sampai
definisi operasional (dapat dipadankan dengan konsep teori, konsep empiris,
konsep analitis/operasional, atau dengan konsep, dimensi, dan indikator)
pemahaman definisi tersebut dapat dijadikan awal yang strategis untuk
penjabaran konsep sampai diperoleh indikator, untuk kemudian disusun item-
item yang diperlukan untuk sebuah instrumen penelitian.
Sementara itu Elazar J. Pedhazur mengemukakan tiga pendekatan
dalam Validasi konstruk yaitu : 1). Logical analysis; 2). Internal structure
analysis; 3). Cross-structure analysis. Analisis logis dalam konteks validasi
konstruk dimaksudkan untuk membentuk hipotesis pembanding sebagai
alternatif penjelasan berkaitan dengan konstruk/konsep yang akan diukur,
hubungan antar konsep dan yang sejenisnya. Dalam pendekatan ini langkah
yang diperlukan adalah pendefinisian konstruk/konsep, penentuan
kesesuaian isi item dengan indikator, serta penentuan prosedur pengukuran.
Analisis struktur internal merupakan pendekatan kedua dalam validasi
konstruk, analisis ini berkaitan dengan validitas indikator dari suatu
konsep/konstruk, artinya indikator-indikator yang digunakan bersifat homogin
(dalam tingkatan minimum) serta mengukur konsep yang sama (terdapatnya
kesesuaian antara indikator-indikator dengan konsepnya).Sementara itu analisis
struktur silang berkaitan dengan pengkajian analisis internal dari masing-
masing konsep terhubung (yang unobservable) yang dihubungkan pada
tataran empirisnya (indikator), sebab pada tataran inilah suatu hipotesis diuji.
2.3.1.1. Perhitungan/pengujian Validitas Instrumen
Apabila langkah-langkah tersebut di atas telah dilakukan, paling tidak
langkah penjabaran konsep yang kemudian diikuti dengan penyusunan item-
item instrumen, maka perhitungan statistik dapat dilakukan untuk
perhitungan/pengujian validitas instrumen pengukuran. Perhitungan ini
dimaksudkan untuk mengetahui konsistensi internal (sering juga disebut
validitas item atau discriminating power/daya diskriminasi item), dalam arti
sampai sejauh mana item-item mampu membedakan antara individu yang
Suwahono dokumen 29
memiliki dan tidak memiliki sifat dari item pengukuran, hal ini berarti juga
bahwa item-item dalam instrumen mengukur aspek yang sama. Dalam
hubungan ini langkah yang dilakukan adalah dengan cara mengkorelasikan
antara skor tiap item dengan skor total.
Dalam melakukan perhitungan korelasi antara skor item dengan skor
total dapat menggunakan rumus korelasi Product moment apabila nilai-nilai
skala telah dilakukan konversi menjadi interval (atau secara langsung
dianggap interval dengan mengacu pada pendapat bahwa nilai skala dapat
diperlakukan sebagai data interval), atau menggunakan rumus korelasi tata
jenjang (Rank-Spearman). Untuk memperjelas cara perhitungannya berikut
ini akan dikemukakan contoh perhitungan korelasi Product momen (cara
perhitungan dengan berbagai variasi dapat dilihat dalam Bab 4) dan korelasi
tata jenjang Spearman.
Sebuah instrumen penelitian/pengukuran terdiri dari 10 item dan
disebarkan pada 10 orang responden dengan hasil skor seperti dalam tabel
2.2. perhitungan korelasi dilakukan untuk tiap item dari item nomor 1 sampai
item no 10, untuk contoh perhitungan akan diambil item no 2
Tabel 2.2.
Nomor Item
Resp Jml
1 2 3 4 5 6 7 8 9 10
A 4 2 2 4 2 3 2 3 3 3 28
B 2 2 2 3 2 2 2 3 2 2 22
C 3 2 2 3 2 3 2 3 3 3 26
D 3 4 3 3 3 3 3 4 3 3 32
E 3 4 4 4 4 4 3 4 4 4 38
F 2 4 4 4 4 4 2 4 4 4 36
G 2 2 2 2 2 3 2 2 2 2 21
H 4 2 2 4 2 3 2 3 3 3 28
I 3 2 2 3 2 3 2 3 2 2 24
J 4 4 4 4 3 4 2 4 3 4 36
I .289 .900 .925 .743 .892 .856 .508 .907 .889 .956
II .362 .870 .879 .789 .872 .830 .525 .910 .904 .950
 Contoh Perhitungan Validitas menggunakan Korelasi Product Moment
adalah sebagai berikut :
Tabel perhitungan Korelasi Product moment
Suwahono dokumen 30
Responden Item no 2 (X) Jumlah (Y) X2 Y2 XY
A 2 28 4 784 56
B 2 22 4 484 44
C 2 26 4 676 52
D 4 32 16 1024 128
E 4 38 16 1444 152
F 4 36 16 1296 144
G 2 21 4 441 42
H 2 28 4 784 56
I 2 24 4 576 48
J 4 36 16 1296 144
Jumlah 28 291 88 8805 866
N Σ XY - (Σ X) (Σ Y)
r = ---------------------------------------------------
N Σ X2 – (Σ X)2 N Σ Y2– (Σ
Y)2
10 x 866 - 28 x 291
r = --------------------------------------------
10 x 88 – (28)2 10 x 8805 – (291)2
512
r = ------------------- = 0.900
9.8 x 58.04
nilai r untuk item no 2 sebesar 0.90 kemudian dibandingkan dengan tabel r

pada baris N – 2 (10 – 2) yaitu 8 sebesar 0.632 untuk taraf signifikansi 5%,
karena nilai r lebih besar dari nilai r tabel maka item no 2 adalah valid, untuk
item lainnya bandingkan nilai r untuk tiap-tiap item (tabel 2.2. rumawi I
menunjukan nilai r untuk tiap-tiap item) dengan r tabel, hasilnya item no 1
dan nomor 7 tidak valid (r hitung lebih kecil dari r tabel) sedangkan item
lainnya valid. Item-item yang valid saja yang dipergunakan dalam penelitian
sedang yang tidak valid dibuang.
 Contoh perhitungan Validitas menggunakan Korelasi tata jenjang dari
Spearman sebagai berikut
Suwahono dokumen 31
Tabel perhitungan Korelasi Tata Jenjang
Responden Item no 2 (X)) Jumlah (Y) Rani X Rank Y b b2
A 2 28 7.5 5.5 2 4
B 2 22 7.5 9 -1.5 2.25
C 2 26 7.5 7 0.5 0.25
D 4 32 2.5 4 -1.5 2.25
E 4 38 2.5 1 1.5 2.25
F 4 36 2.5 2.5 0 0
G 2 21 7.5 10 -2.5 6.25
H 2 28 7.5 5.5 2 4
I 2 24 7.5 8 -0.5 0.25
J 4 36 2.5 2.5 0 0
Jumlah 28 291 0 21.5
Rumus korelasi tata jenjang :
6 x Σ b2
rho = 1 - --------------
n (n2 - 1)
6 x 21.5
rho = 1 - --------------
10 (99)
rho = 1 - 0.13
rho = 0.870
nilai rho untuk item no 2 sebesar 0.870 kemudian dibandingkan dengan

tabel rho dengan N = 10 sebesar 0.648 untuk taraf signifikansi 5%, karena
nilai rho lebih besar dari nilai rho tabel maka item no 2 adalah valid, untuk
item lainnya bandingkan nilai rho untuk tiap-tiap item (tabel 2.2. rumawi II
menunjukan nilai rho untuk tiap-tiap item) dengan rho tabel, hasilnya item no
1 dan nomor 7 tidak valid (rho hitung lebih kecil dari rho tabel), sedangkan
item lainnya valid. Item-item yang valid saja yang dipergunakan dalam
penelitian sedang yang tidak valid dibuang.
Suwahono dokumen 32
Dengan memperhatikan hasil kedua perhitungan tersebut nampak
bahwa baik skor item-item tersebut diperlakukan sebagai data interval
maupun ordinal hasilnya tidak menunjukan perbedaan.
2.3.2. Reliabilitas
Reliabilitas berarti kedapat dipercayaan atau keajegan, suatu
instrumen pengukuran dikatakan reliabel apabila instrumen tersebut
dipergunakan secara berulang memberikan hasil ukur yang sama, menurut
Elazar J. Pedhazur “reliability refers to the degree to which test score are free
from errors of measurement”, kesalahan pengukuran akan berakibat pada
hasil yang berbeda dalam mengukur sesuatu yang sama. Dalam ilmu
sosial/pendidikan masalah reliabilitas terutama dalam presisi hasil ukur
cukup sulit apalagi bila dikaitkan dengan pengulangan, hal ini tidak lain
karena obyek yang diteliti cenderung berubah dari waktu kewaktu apalagi jika
rentang waktu pengulangan cukup lama, untuk itu upaya-upaya untuk
menghitung/menguji reliabilitas suatu instrumen merupakan estimasi nilai
pengukuran yang diteliti dengan nilai pengukuran yang sebenarnya. Dalam
upaya tersebut terdapat beberapa pandangan/cara untuk menilai/menghitung
reliabilitas suatu instrument sebagaimana akan terlihat dalam uraian berikut.
2.3.2.1. Teori pengujian klasik
teori pengujian klasik mengacu pada The true-score model dari
Spearman. Menurut model ini skor/nilai hasil observasi terdiri dari dua
komponen yaitu komponen nilai yang benar ditambah kekeliruan acak, yang
dalam bentuk simbul nampak sebagai berikut :
M = T + E
M = nilai/skor yang diukur/diobservasi (measured value)

T = nilai/skor yang benar (True value)
E = Kesalahan Pengukuran (Measurement error)
Pengukuran yang reliabel adalah pengukuran yang mempunyai tingkat
kesalah Nol (E = 0), sehingga nilai yang diobservasi sama dengan nilai yang
sebenarnya (M = T). bila menggunakan analisis statistika reliabilitas
Suwahono dokumen 33
pengukuran merupakan perbandingan antara varians nilai/skor yang
sebenarnya dengan varians nilai/skor yang diobservasi, dan akar pangkat
duanya adalah korelasi antara nilai/skor yang sebenarnya dengan nilai/skor
yang diobservasi dan hasil korelasinya disebut indeks reliabilitas. Indeks ini
menurut Pedhazur disebut juga validitas pengukuran teoritis (Theoritical
validity of a measure) atau korelasi epistemik (epistemic correlation).
Secara teoritis cara tersebut cukup bermakna, namun sulit bahkan
tidak dapat dipergunakan untuk memperkirakan tingkat kesalahan yang
terdapat dalam suatu instrumen pengukuran karena tidak diketahuinya nilai
yang benar (T) dan tingkat kesalahan (E), sehingga diperlukan asumsi-
asumsi berkaitan dengan konstannya substansi yang diukur serta kesalahan
yang terjadi bersifat acak, dan berdasar asumsi tersebut jika pengukuran
dilakukan pada seseorang secara berulang-ulang, maka akan diperoleh
sejumlah persamaan yang masing-masingnya akan mengandung nilai T dan
rata-rata dari E akan (diharapkan) sama dengan Nol, sehingga nilai yang
diobservasi akan sama dengan nilai yang sebenarnya (M = T).
2.3.2.2. Test-retest (Repeated measure)
Pengukuran ulang dimaksudkan untuk melihat konsistensi dari waktu
ke waktu. Cara pelaksanaannya adalah dengan meminta responden untuk
menjawab pertanyaan atau merespon pernyataan yang sama sebanyak dua
kali sesudah selang waktu tertentu. Sesudah diperoleh jawaban/respon
responden untuk dua kali pelaksanaan kemudian nilai/skor dari hasil
pengukuran yang pertama dikorelasikan dengan nilai/skor hasil pengukuran
yang ke dua dengan menggunakan formula korelasi product momen atau
korelasi tata jenjang sesuai dengan karakteristik data yang diperoleh.
Sebagai ilustrasi berikut ini akan diberikan contoh. Misalkan sebuah
instrumen pengukuran dibuat untuk mengetahui persepsi Guru terhadap
kepemimpinan kepala sekolah kepada 10 responden dengan hasil sebagai
mana terlihat dalam tabel berikut :
Tabel nilai skor hasil dua kali pengukuran
Suwahono dokumen 34
Resp Skor pada Pengukuran Skor pada pengukuran
Pertama Kedua
A 20 20
B 25 24
C 21 21
D 23 23
E 22 21
F 21 21
G 24 24
H 26 26
I 21 20
J 22 22
Skor pengukuran pertama kemudian dikorelasikan dengan skor pengukuran

kedua (cara perhitungan sama seperti dalam perhitungan Validitas), koefisien
korelasi yang diperoleh kemudian di bandingankan dengan nilai tabel, bila
lebih besar berarti instrumen tersebut reliabel. Hasil perhitungan data skor di
atas diperoleh nilai r = 0.970 (nilai tabel = 0.632 pada taraf signifikansi 5%),
dan nilai rho = 0.953 (nilai tabel = 0.648 pada taraf signifikansi 5%), ini
berarti bahwa instrumen pengukuran tersebut reliabel.
Dalam penggunaan cara ini seorang peneliti harus memperhatikan
selang waktu antara pengukuran yang pertama dan yang kedua, tidak ada
patokan yang pasti, yang penting harus dihindari kemungkinan terjadinya
bias akibat responden merasa diperlakukan tidak wajar jika terlalu
pendek,atau terjadi perubahan jika terlalu lama, namun Djamaludin Ancok
menyatakan bahwa selang waktu antara 15-30 hari pada umumnya
dianggap memenuhi persyaratan tersebut.
2.3.2.3. Metode paralel (Alternate Method)
cara ini dilakukan dengan memberikan dua bentuk pengukuran yang identik
(dalam arti sejajar) kepada responden yang sama secara serempak. Dua
pengukuran identik bermakna bahwa dua instrumen pengukuran tersebut
dimaksudkan untuk mengukur konstruk yang sama namun dengan item-item
pertanyaan/pernyataan yang berbeda. Sebagai contoh terdapat dua
Suwahono dokumen 35
instrumen pengukuran motivasi yaitu instrumen A dan instrumen B, kedua
instrumen tersebut dikenakan pada sepuluh responden dengan hasil sbb :
Tabel nilai skor hasil dua Instrumen Pengukuran
Resp Skor Instrumen A Skor Instrumen B
A 20 20
B 25 24
C 21 21
D 23 23
E 22 21
F 21 21
G 24 24
H 26 26
I 21 20
J 22 22
Skor pengukuran Instrumen A dikorelasikan dengan skor Instrumen B (cara

perhitungan sama seperti dalam perhitungan Validitas), koefisien korelasi
yang diperoleh kemudian di bandingankan dengan nilai tabel, bila lebih besar
berarti instrumen tersebut reliabel. Hasil perhitungan data skor di atas
diperoleh nilai r = 0.970 (nilai tabel = 0.632 pada taraf signifikansi 5%), dan
nilai rho = 0.953 (nilai tabel = 0.648 pada taraf signifikansi 5%), ini berarti
bahwa instrumen pengukuran tersebut reliabel.
2.3.2.4. Pendekatan Konsistensi internal
Pendekatan konsistensi internal merupakan satu cara untuk
mengurangi kesulitan yang diakibatkan oleh dua perlakuan atau dua bentuk
pengukuran seperti dalam metode test-retest dan metode paralel. Dengan
cara ini pengukuran hanya dilakukan satu kali (single-trial administration),
sehingga dapat lebih efisien. konsistensi internal bermakna keajegan dari tiap
item dengan item-item lainnya dalam suatu kerangka instrumen pengukuran.
Terdapat beberapa cara untuk melakukan perhitungan reliabilitas antara lain
Teknik belah dua (Split half method), Formula Rolon, KR20, KR21, dan
Koefisien Alpha. Berikut ini akan dikemukakan contoh perhitungan reliabilitas.
1. Teknik Belah Dua (Split-half method)
Suwahono dokumen 36
Metode atau teknik belah dua menggunakan formula Spearman-
Brown, cara ini hanya dapat dikenakan pada instrumen pengukuran dengan
jumlah item genap (pengelompokan dilakukan pada item-item yang
valid),adapun langkah-langkahnya adalah sbb :
 Kelompokan item-item menjadi dua kelompok didasarkan pada
kelompok ganjil (nomor item ganjil) dan kelompok genap (nomor
item genap), atau secara random.
 Jumlahkan skor pada setiap kelompok sehingga diperoleh skor
total untuk tiap kelompok.
 Korelasikan skor total antar kelompok dengan formula korelasi
Product moment atau tata jenjang.
 Masukan nilai koefisien korelasi tersebut ke dalam rumus
Sperman-Brown untuk mencari koefisien reliabilitas
2 . r
ri = b
1 + r
b
ri = koefisien reliabilitas; rb = koefisien korelasi antar kelompok

Contoh perhitungan :
Tabel nilai skor total kelompok ganjil dan genap
Resp Skor total kelompok ganjil Skor total kelompok genap
A 20 20
B 25 24
C 21 21
D 23 23
E 22 21
F 21 21
G 24 24
H 26 26
I 21 20
J 22 22
Hasil perhitingan korelasi r = 0.970
Koefisien/angka reliabilitasnya adalah :
Suwahono dokumen 37
ri = 2 x 0.970
1 + 0.970
ri = 1.940
1.970
ri = 0.985
2. Formula Rulon
Cara ini juga hanya berlaku pada pengelompokan seperti treknik belah dua,
namun estimasi reliabilitas tidak didasarkan pada perhitungan korelasi
melainkan pada varians perbedaan skor dengan varians total, adapun
rumusnya adalah sebagai berikut :
SDb2
rxx’ = 1 --
SDt2
2 2
rxx’ = Koefisien reliabilitas ; SDb = Varians perbedaan skor belahan ; SDt = Varians skor Total
Tabel nilai skor total kelompok ganjil dan genap
Resp Skor total Skor total kelompok Skor b (selisih Skor total
kelompok ganjil genap ganjil genap)
A 20 20 0 40
B 25 24 1 49
C 21 21 0 42
D 23 23 0 46
E 22 21 1 43
F 21 21 0 42
G 24 24 0 48
H 26 26 0 52
I 21 20 1 41
J 22 22 0 44
Hasil perhitungan varians menunjukan :
Rumus mencari Varians :
Suwahono dokumen ΣX2 – (ΣX )2 38

N
N -1
SDb2 = 0.233 SDt2 = 15.344
Koefisien reliabilitasnya adalah :

0.233
rxx’ = 1 --
15.344
rxx’ = 1 -- 0.015 = 0.984
3. Formula Flanagan
Formula Flanagan merupakan estimasi nilai/angka reliabilitas yang tidak
mengacu pada perhitungan korelasi, melainkan sama seperti formula Rulon
yang mengacu pada veriansi tiap-tiap kelompok hasil belah dua, bedanya
dalam formula ini ada nilai konstanta 2 serta varians kelompok dijumlahkan
dan bukan varians beda, sementara pembaginya sama yaitu varians total.
Rumus :
S12 + S22
rxx’ = 2 (1 -- )
St2
S12 = Varians belahan pertama

S22 = Varians belahan kedua
St2 = Varians total
Tabel nilai skor ganjil dan genap dan skor total

Resp Skor total kelompok Skor total kelompok Skor total
ganjil genap
A 20 20 40
B 25 24 49
C 21 21 42
D 23 23 46
E 22 21 43
F 21 21 42
G 24 24 48
H 26 26 52
I 21 20 41
J 22 22 44
Suwahono dokumen 39
S12 = 3.833
S22 = 3.956
St2 = 15.344
Bila nilai-nilai tersebut dimasukan dalam rumus, akan nampak sebagai
berikut :
3.833 + 3.956
rxx’ = 2 (1 -- )
15.344
rxx’ = 2 (0.492) = 0.985
4. Formula K-R 21 (Kuder Richardson)
Formula K-R merupakan prosedur pencarian nilai reliabilitas dengan
tidak mensyaratkan pembelahan item ke dalam dua kelompok, sehingga bisa
diterapkan pada instrumen yang jumlah itemnya tidak genap.
Rumus :
k M (k – M)
rxx’ = ( ) (1 -- )
k - 1 kSDt2
M = Mean/rata-rata skor total

k = kelompok/banyaknya item
SDt2 = Varians total
Tabel skor tiap item dan Total
Nomor Item
Resp Jml
1 2 3 4 5 6 7 8 9 10
A 4 2 2 4 2 3 2 3 3 3 28
B 2 2 2 3 2 2 2 3 2 2 22
C 3 2 2 3 2 3 2 3 3 3 26
D 3 4 3 3 3 3 3 4 3 3 32
E 3 4 4 4 4 4 3 4 4 4 38
F 2 4 4 4 4 4 2 4 4 4 36
Suwahono dokumen 40
G 2 2 2 2 2 3 2 2 2 2 21
H 4 2 2 4 2 3 2 3 3 3 28
I 3 2 2 3 2 3 2 3 2 2 24
J 4 4 4 4 3 4 2 4 3 4 36
M = 2.91
SDt2 = 37.433
k = 10
masukan nilai-nilai di atas ke dalam rumus
10 2.91(10 – 2.91)
rxx’ = ( ) (1 -- )
9 37.433
rxx’ = ( 1.11 ) (1 -- 20.631 )

37.433
rxx’ = 0.498
5. Rumus Alpha (Cronbach)

Formula Alpha juga merupakan prosedur pencarian nilai reliabilitas
dengan tidak mensyaratkan pembelahan item ke dalam dua kelompok (meski
bisa juga diterapkan pada teknik belah dua), sehingga bisa diterapkan pada
instrumen yang jumlah itemnya tidak genap. Namun hal yang perlu diingat
adalah bahwa pembelahan mesti dilakukan secara seimbang, sebab jika
dibelah tidak seimbang akan underestimasi terhadap nilai reliabilitas yang
sebenarnya (biasanya lebih rendah).
Rumus :
K ΣSDb2
α = ( ) (1
-- )
K- 1 SDt2
Suwahono dokumen 41
SDb2 = Varians skor kelompok ; SDt2 = Varians skor Total; K = Kelompok/jumlah item
Sebagai contoh terdapat 10 item yang ingin dibelah menjadi lima
kelompok secara berurutan, untuk itu jumlah tiap-tiap kelompok harus
diketahui untuk dicari variansnya, sesudah itu baru dimasukan ke dalam
rumus Alpha.
Tabel skor tiap item, skor kelompok, skorTotal
No Item dan Jml tiap kelompok Tot.

Res
1 2 jml 3 4 jml 5 6 jml 7 8 jml 9 10 jml Jml
A 4 2 6 2 4 6 2 3 5 2 3 5 3 3 6 28
B 2 2 4 2 3 5 2 2 4 2 3 5 2 2 4 22
C 3 2 5 2 3 5 2 3 5 2 3 5 3 3 6 26
D 3 4 7 3 3 6 3 3 6 3 4 7 3 3 6 32
E 3 4 7 4 4 8 4 4 8 3 4 7 4 4 8 38
F 2 4 6 4 4 8 4 4 8 2 4 6 4 4 8 36
G 2 2 4 2 2 4 2 3 5 2 2 4 2 2 4 21
H 4 2 6 2 4 6 2 3 5 2 3 5 3 3 6 28
I 3 2 5 2 3 5 2 3 5 2 3 5 2 2 4 24
J 4 4 8 4 4 8 3 4 7 2 4 6 3 4 7 36
SDt2 = 37.433 ; k = 10 ; SDb21 = 1.733 ; SDb22 = 2.1 ; SDb23 = 1.956 ;

SDb24 = 0.944 ; SDb25 = 2.322
5 1.733 + 2.1 + 1.956 + 0.944 + 2.322

α = ( ) (1 -- )
4 37.433
9.055
α = ( 1.25 ) (1 -- )
37.433
α = ( 1.25 ) (0.758) = 0.948

2.3.2.5. Standar Reliabilitas
Besarnya nilai reliabilitas yang bisa diterima sebagai estimasi yang
signifikan terhadap reliabilitas yang sebenarnya merupakan masalah yang
banyak dibicarakan oleh para pakar, pada dasarnya semakin besar koefisien
Suwahono dokumen 42
reliabilitas, semakin baik, namun permasalahannya terletak pada berapa
besarnya nilai yang memadai. Dalam hubungan ini banyak pengarang yang
memberikan patokan umum tentang standar minimum tingkat nilai koefisien
reliabilitas. Nunnally dalam bukunya Psychometric Theory
sebagaimana dikutif oleh Elazar J. Pedhazur menyatakan bahwa koefisien
yang relatif rendah dapat ditoleransi dalam tingkatan penelitian awal,
reliabilitas yang lebih tinggi diperlukan jika pengukuran dipakai untuk
menentukan perbedaan antar kelompok, dan reliabilitas yang sangat tinggi
menjadi esensil jika skor-skor dipakai untuk membuat keputusan penting
tentang seseorang (misalnya keputusan dalam seleksi dan penempatan).
Lebih jauh Nunnally menyatakan bahwa untuk penelitian awal koefisien
reliabilitas 0.60 atau 0.50 sudah cukup, sementara itu Caplan, Naidu dan
Tripathi dalam tulisannya pada Journal of health and social behaviour (1984)
menyatakan bahwa koefisien alpha 0.50 atau lebih dianggap cukup untuk
suatu tujuan penelitian. Disamping pendapat tersebut ada juga akhli yang
menggunakan harga kritik nilai tabel korelasi Product Moment (seperti
Chabib Thaha dalam bukunya Teknik Evaluasi Pendidikan), sehingga nilai
reliabilitas yang diperoleh dibandingkan dengan r tabel, bila lebih besar
UNTUK DIDISKUSIKAN
berarti instrumen pengukuran tersebut reliabel, sedang bila lebih kecil dari r
Skor item-item suatu skala sikap
tabel berarti instrumen pengukuran tersebut tidak reliabel.
Res Nomor item
1 2 3 4 5 6 7 8
A 5 4 3 3 2 3 4 3
B 4 3 4 5 1 4 5 3
C 3 3 3 2 3 4 3 4
D 4 2 2 4 2 3 3 5
E 2 5 5 3 4 2 5 4
F 3 4 1 2 4 2 2 2
G 4 4 3 4 3 4 4 3
H 3 4 4 3 4 4 3 4
I 3 3 3 3 3 3 3 3
J 2 2 2 2 2 2 2 2
K 5 2 5 5 5 2 5 5
L 4 3 1 4 1 4 4 1
Dari data tersebut :
1. hitung validitas Item
Suwahono dokumen 43
2. hitung reliabilitas dengan teknik belah dua menggunakan
seluruh formula
3. hitung reliabilitas dengan teknik membagi empat dengan
menggunakan formula formula yang sesuai

Pengukuran Dan Instrumen

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Pengukuran Dan Instrumen

Diunggah oleh

Hak Cipta:

Format Tersedia

FAKULTAS TARBIYAH

Mater engukuran instrument menyajikan tentang cara pengukuran

Ilmu Pendidikan berkomunikasi dengan realitas melalui konsep-

Peringkat dalam suatu

2.1. Penentuan Indikator/Konsep Empiris

Teoritis Empiris Analitis Operasional (bisa hanya contoh

Penelusuran Konsep sampai Item

2.2. Pengukuran sikap

D. Kriteria Penyusunan Pernyataan Skala Sikap

E. Contoh Skala Sikap

Apabila pernyataan-pernyataan Skala Sikap telah dinilai/dijawab oleh

karena penentuan nilai/skor skala menggunakan ukuran tendendi sentral

S = bb+ 0.5 – pkb i

S = 6.5+ 0.5 – 0.45 i

K25 = bb + 0.25 – pkb i

K75 = bb + 0.75 – pkb i

Bila diterapkan pada item tersebut di atas diperoleh nilai

Untuk bahan kajian dan perbandingan serta contoh bagaimana

Dalam skala ini Thurstone ingin mengungkap/mengukur bagaimana

Pernyataan-pernyataan yang diungkap diawali dengan hal-hal yang

Skala sikap Thurstone ini juga menggambarkan suatu kombinasi

Attitude toward the Chinese

Put a check mark if you agree with the statement.

menggunakan distribusi respon sebagai dasar penentuan skala serta tidak

a. Identifikasi obyek-obyek sikap serta jelaskan secara spesifik

c. Uji cobakan item-item tersebut pada sekelompok responden, tiap

d. Beri skor untuk tiap responden, kemudian jumlahkan skor tersebut

f. Hilangkan item yang korelasinya tidak signifikan atau yang

g. Setelah langkah-langkah tersebut dilakukan maka sebagai hasilnya

---- 1. No right-thinking person would use marijuana (N)

Contoh 2.1. Pernyataan Positif

Contoh 2.2. Pernyataan Negatif

1. Pengukuran merupakan langkah penting dalam suatu penelitian,

3. Pengukuran dengan menggunakan skala sikap banyak dilakukan

4. Tentukan nilai Skala model Thurstone dari data berikut

5. Konversikan Nilai skala berikut :

Alternatif Nilai Skala Frekuensi

Penelitian pada dasarnya merupakan suatu upaya untuk memahami

Yang dilengkapi peneliti Yang dilengkapi subyek/responden

5. Performance Checklist 5. Achevement/Aptitude Test

6. Anecdotal Record 6. Performance Tests

7. Time And Motion Logs 7. Projective Devices

2.3. Kriteria Instrumen

Tabel perhitungan Korelasi Product moment

nilai r untuk item no 2 sebesar 0.90 kemudian dibandingkan dengan tabel r

Rumus korelasi tata jenjang :

nilai rho untuk item no 2 sebesar 0.870 kemudian dibandingkan dengan

M = nilai/skor yang diukur/diobservasi (measured value)

Skor pengukuran pertama kemudian dikorelasikan dengan skor pengukuran

Skor pengukuran Instrumen A dikorelasikan dengan skor Instrumen B (cara

ri = koefisien reliabilitas; rb = koefisien korelasi antar kelompok

Suwahono dokumen ΣX2 – (ΣX )2 38

Koefisien reliabilitasnya adalah :

S12 = Varians belahan pertama

Tabel nilai skor ganjil dan genap dan skor total

rxx’ = 2 (0.492) = 0.985

4. Formula K-R 21 (Kuder Richardson)

Formula K-R merupakan prosedur pencarian nilai reliabilitas dengan

tidak mensyaratkan pembelahan item ke dalam dua kelompok, sehingga bisa

diterapkan pada instrumen yang jumlah itemnya tidak genap.

M = Mean/rata-rata skor total

masukan nilai-nilai di atas ke dalam rumus

rxx’ = ( 1.11 ) (1 -- 20.631 )

5. Rumus Alpha (Cronbach)