Anda di halaman 1dari 41

Chapter 7 :

Measurement :
Scaling, Reliability, Validity
Sumber Buku : Uma Sekaran dan Roger
Bougie_Fifth Edition

Presented By : kelompok 2 Maksi Star BPKP Unair


1

Mengembangkan Skala
Empat jenis skala yang dapat digunakan
untuk mengukur dimensi didefinisikan
secara operasional dan elemen dari
variabel adalah:
skala nominal, ordinal, interval, dan rasio
Perlunya untuk memeriksa metode scaling
(menentukan nomor dan simbol) adalah
untuk
memperoleh
tanggapan
sikap
subyek terhadap obyek, peristiwa, atau
orang.

Kategori Utama Skala Sikap


1. Skala peringkat (rating scale)
Memiliki beberapa kategori respons
dan digunakan untuk mendapatkan
respons yang terkait dengan objek,
peristiwa, atau orang yang dipelajari
2. Skala ranking (ranking scale)
membuat perbandingan antar objek,
peristiwa atau orang dan mengungkap
pilihan
yang
lebih
disukai
dan
merankingnya

Skala peringkat (rating scale)


biasa digunakan untuk penelitian
organisasi

Dichotomous scale
Digunakan untuk mendatangkan
jawaban Ya atau Tidak (Perhatikan
bahwa skala nominal digunakan
untuk memperoleh respon)
contoh :
Apakah kamu memiliki mobil? Ya
Tidak

Category scale
Menggunakan beberapa item untuk
mendapatkan respon tunggal.
Contoh :
Di London mana anda berada?
London Timur
London Selatan
London Barat
London Utara

Semantic differential scale


Skala ini digunakan ketika beberapa atribut
diidentifikasi pada ekstrem skala.
Misalnya, skala akan mempekerjakan istilah-istilah
seperti:
Baik-Buruk
Kuat-Lemah
Panas-dingin
Skala ini juga diperlakukan sebagai skala Interval.
Contoh :
Apa pendapat Anda tentang atasan Anda?
Responsif--------------Merespons
Cantik-------------------jelek
Berani ------------- Pemalu

Numerical scale
Mirip dengan skala diferensial semantik,
dengan perbedaan disediakannya nomor
skala 5 titik atau 7 titik, dengan kata
sifat berkutub pada ujung keduanya dan
menggunakan skala interval.
Contoh:
Betapa senangnya Anda dengan pekerjaan
baru Anda?
Sangat senang 7 6 5 4 3 2 1 sangat tidak
senang

Itemized rating scale


Skala dengan 5 titik/7 titik/lebih yang
menggunakan skala interval, dengan titik
jangkar, disediakan untuk setiap item dan
responden menyatakan jumlah yang sesuai di
sisi setiap item.
Contoh 7 (i) balanced rating scale dengan
sebuah
titik netral
1
2

5
sangat
tidak item
tidak
mungkin
setiap
menggunakan
skala
mungkin
mungkin berpendap

sangat
Tanggapi
di
tidak
bawah, isi dengan nomor yang menurut Anda
mungkin
at
sesuai
Saya akan lulus S2 Maksi dalam 18 bulan ke depan
_______

Itemized rating scale


Contoh 7 (ii) unbalanced rating scale
Lingkari nomor yang paling sesuai dengan
Anda terhadap item di bawah ini:
1

Sama sekali
Agak
Cukup
tidak
berminat
berminat
berminat
Apakah anda berminat menyusun tesis
metode penelitian kuantitatif
1 2 3

4
Sangat
bermin
at
dengan
4

Likert scale
Skala Likert didesain untuk menentukan seberapa
kuat subyek setuju atau tidak setuju dengan
pernyataan pada dalam 5 titik skala yaitu :
Sangat
tidak
setuju
1

Tidak
setuju
2

Tidak
menyata
kan
3

Setuju

Sangat
setju

Analisa respon pada skala Likert dapat dianalisa


per item dan dapat juga menjumlahkan
keseluruhan nomor yang dipilih oleh seorang
responden. Dengan kata lain skala Likert adalah
Skala penjumlahan.

Likert scale
Ada dua pendapat, pendapat pertama Skala Likert
menggunakan skala ordinal, sedangkan yang
satunya menggunakan skala interval. Tapi biasanya
skala likert menggunakan skala interval.
Contoh:
Kuliah metode penelitian sangat menarik
1 2 3
45
Sepanjang hari ini Saya tidak menikmati
kuliah metode penelitian
12345
Kuliah tanpa ada mata kuliah metode
penelitian akan membosankan
12345

Fixed or constant sum rating scale


Skala yang bersifat skala ordinal dimana para
responden diminta untuk mendistribusikan sejumlah
tertentu poin di berbagai item. Contoh:
Berikan nilai diantara tiga aspek di bawah ini sesuai
dengan pengaruhnya dalam menyusun suatu tesis
sehingga nilai total sebesar 100
Topik tesis harus kekinian
.
Tesis diusahakan bukan replikasi penelitian
.
Referensi tesis diusahakan minimal 20 jurnal,
10 jurnal internasional, 10 jurnal dalam negeri ..
100

Staple scale
Skala staple adalah skala interval yang tidak
memiliki titik nol absolute dimana secara
simultan mengukur arah dan intensitas sikap
terhadap item yang dipelajari. Contoh:
Nyatakan bagaimana Anda menilai kemampuan
supervisor Anda terkait dengan setiap
karakteristik
yang disebutkan
di bawah ini,
+3
+3
+3
dengan+2
melingkari nomor
+2yang tepat.
+2
+1
Mengadopsi
Teknologi
Modern
-1
-2
-3

+1
Inovasi Produk
-1
-2
-3

+1
Ketrampilan
antar Pribadi
-1
-2
-3

Graphic rating scale


Skala peringkat grafik merupakan skala ordinal dimana
dapat membantu responden untuk menunjukkan pada
titik mana pada skala grafik yang merupakan jawaban
mereka untuk pertanyaan tertentu. (skala wajah
termasuk skala peringkat grafik untuk memperoleh
respon atas perasaan orang mengenai suatu aspek).
Contoh :
Lingkari nomor yang sesuai perasaan sakit hati Anda jika
tidak mendapatkan nilai A dalam mata kuliah metode
penelitian.

Consensus scale
Skala
pemilihan item tertentu berdasarkan
relevansinya
dengan
konsep
tertentu
berdasarkan konsesus oleh para juri dan setelah
diuji validitas dan realibilitasnya.
Contoh:
Thurstone Equal Appearing Interval Scale.
Sebuah konsep diukur dengan suatu proses rumit
yang melibatkan sebuah panel juri. Menggunakan
setumpuk kartu yang mengandung beberapa
deskripsi konsep, panel juri memberikan masukan
untuk menunjukkan seberapa dekat pernyataan
tertentu dengan konsep yang diteliti, lalu dibuat
berdasarkan consensus yang tercapai.

Other Scale
Multidimensional
scale
adalah
penskalaan objek, subyek atau
kedua-duanya secara visual dan
dilakukan
analisis
gabungan
(conjoint)
sehingga
memberikan
gambar visual hubungan yang ada di
antara dimensi sebuah konsep

Ranking Scales
Digunakan untuk mengungkap preferensi
antara dua atau antara lebih objek atau
item (bersifat ordinal). Namun, ranking
tersebut tidak memberikan petunjuk
definitif untuk jawaban yang dicari.
Contoh:
Ada 4 lini produk, manajer mencari
informasi
yang
akan
membantu
memutuskan produk yang sesuai harus
mendapatkan perhatian yang besar.

Ranking Scales
Asumsikan:
35% responden memilih produk 1.
25% off responden memilih produk 2.
20% dari responden memilih produk 3.
20% dari responden memilih produk 4.
100%
Manajer tidak dapat menyimpulkan bahwa produk
pertama adalah yang paling disukai. Mengapa?
Karena 65% dari responden tidak memilih
produk tersebut. Kita harus menggunakan
metode alternatif seperti Paired Comparisons,
Forced Choice, and The Comparative Scale.

Paired Comparison
Digunakan ketika diantara dejumlah kecil
objek, responden diminta untuk memilih
antara dua objek. Hal ini untuk membantu
dalam menilai preferensi.
Contoh:
seperti
contoh
sebelumnya,preferensi
menunjukkan
produk 1 lebih dari produk 2,3,4, manajer
memahami lini produk mana yang
prioritas. Metode ini sangat baik jika
stimulus/objek sedikit.

Forced Choice
Memungkinkan responden untuk meranking objek
secara relatif satu sama lain, di antara alternative
yang disediakan. Hal ini mempermudah responden,
terutama jika jumlah pilihan yang harus diranking
terbatas jumlah.
Contoh:
Rankingkan nama mata kuliah Maksi STAR semester 2
yang anda jalani, berikan 1 untuk pilihan yang paling
disukai dan 5 untuk yang paling kurang disukai.
Metode Penelitian

Pajak Sektor Publik

Pengelolaan Keuangan Negara ...


Manajemen Penerimaan dan Pengeluaran Pemerintah

Comparative Scale
Memberikan standar (benchmark) atau poin
referensi untuk menilai sikap terhadap
objek,kejadian, atau situasi saat ini yang
diteliti.
Contoh:
Dalam situasi perekonomian saat ini yang tidak
menentu, dibandingkan saham, seberapa
bergunakan
untuk
berinvestasi
dalam
deposito?
Lebih
berguna
Hampir
Sama
Kurang
Berguna
12 3
4
5

Internasional dimensions of Scaling


Setiap negara bereaksi berbeda terhadap masalah
penskalaan. Skala 5 titik atau 7 titik tidak banyak
membuat perbedaan di USA, tapi dapat berbeda
jika subjek berasal dari negara lain (Sekaran dan
Martin, 1992).
Penelitian menunjukkan peneliti dari berbagai
negara cenderung menggunakan skala rating
ekstrim (contoh 1 dan 5 atau 1 dan 7) dan
merespon sesuai cara sosial yang diinginkan (De
Jong, 2006).
Kesimpulannya analisis dan interprestasi data yang
dikumpulkan
di
berbagai
negara
sangat
menantang.

Goodness of measurement /
Ketepatan Pengukuran
Setelah mendefinisikan variabel secara operasional,
menerapkan teknik penskalaan yang berbeda,
selanjutnya penting untuk memastikan instrumen
yang dibuat untuk mengukur konsep adalah
benar-benar akurat mengukur variabel, dan
secara nyata/logis mengukur konsep tersebut,
yaitu dengan cara:
1. Menganalisis item terhadap respon terhadap
pertanyaan yang mengungkap variabel
(Analysis Item)
2. Menguji validitas ukuran (Validity)
3. Menguji Realibilitas/keandalan ukuran (Reability)

Item analysis
Dilakukan untuk melihat apakah item
dalam instrument memang seharusnya
berada dalam instrumen atau tidak.
Mean antara kelompok skor tinggi dan
kelompok skor rendah diuji untuk
menemukan
perbedaan
signifikan
melalui nilai t(uji t). Item dengan nilai t
tinggi dimasukkan ke dalam instrument.

Validity
Validitas ada tiga, antara lain::
Validitas internal tentang otentisitas hubungan
sebab dan akibat
Validitas eksternal tentang generalisasi untuk
lingkungan ekstenal.
Validitas dari instrumen pengukuran yang akan
dibahas di bawah ini.
Validitas adalah keyakinan secara logis bahwa
kita benar-benar mengukur konsep yang telah
direncanakan dan bukan sesuatu yang lain.
Validitas digunakan untuk menguji seberapa
baik instrumen yang dibuat untuk mengukur
konsep sesuatu yang ingin diukur.

Validitas Isi (content validity)


Memastikan
bahwa
pengukuran
memasukkan sekumpulan item yang
memadai
dan
mwakili
yang
mengungkap
konsep
(fungsi
seberapa baik dimensi dan elemen
sebuah konsep telah digambarkan).

Validitas berdasar kriteria (criterionrelaten validity)


Terpenuhi
jika
pengukuran
membedakan individu menurut suatu
kriteria yang diharapkan diprediksi.
Hal ini dapat dilakukan dengan :
1. Validitas
konkuren
(concurrent
validity)
2. Validitas
prediktif
(predictive
validity)

Validitas konkuren (concurrent validity)


Dihasilkan jika skala membedakan individu yang
diketahui
berbeda,
yaitu,
mereka
harus
menghasilkan skor yang berbeda pada instrument
pada contoh sebagai berikut:
Ukuran etika kerja disusun dan diberikan kepada
sekelompok penerima santunan. Nilai etika kerja
tinggi tidak ingin bergantung pada santunan dan
berhasrat untuk memiliki kerjaan. Nilai etika kerja
rendah dengan mengeksploitasi kesempatan untuk
hidup
dengan
santunan
selama
mungkin,
menganggap kerja membosankan. Apabila kedua
orang tersebut memiliki sjor skala etika kerja yang
sama, maka tes tersebut tidak akan menjadi
pengukuran etika kerja.

Validitas prediktif (predictive validity)


Menunjukkan kemampuan instrumen
pengukuran
untuk
membedakan
orang dengan referensi pada suatu
kriteria masa depan. Contoh:
tes bakat pada waktu rekrutmen
memprediksi jika memiliki skor tinggi
menjadi pekerja yang baik, begitu
sebaliknya.

Validitas konsep (construct validity)


Menunjukkan seberapa baik hasil yang diperoleh
dari penggunaan ukuran cocok dengan teori
yang mendasari desain tes.
1. Validitas konvergen (convergent validity)
terpenuhi jika skor yang diperoleh dengan dua
instrumen
berbeda yang mengukur konsep
yang sama menunjukkan korelasi tinggi.
2. Validitas diskriminan (discriminant validity)
Terpenuhi jika, berdasarkan teori, dua variabel
diprediksi tidak berkorelasi, dan skor yang
diperoleh dengan mengukurnya benar-benar
secara empiris membuktikan hal tersebut.

Validity
Validitas di atas dapat dipenuhi melalui:
1.Analisis
korelasional
(correlational
analysis) menghasilkan validitas konkuren
dan prediktif atau validitas konvergen dan
diskriminan.
2.Analisis faktor (factor analysis), teknik
multivariate yang menghasilkan validitas
konsep.
3.Multi karakter atau multi metode matriks
dimana korelasi diperoleh dari pengukuran
konsep dengan berbagai bentuk dan
metode (pengetatan pengukuran).

Reliabilitas/Keandalan
Keandalan
(realibility) suatu pengukuran
menunjukkan sejauh mana pengukuran
tersebut tanpa bias (bebas kesalahan-error
free) dank arena itu menjamin pengukuran
yang kosisten lintas waktu dan lintas
beragam item dalam instrumen, terdiri
dari:
1. Stabilitas
Pengukuran
(Stability
of
measures)
2. Konsistensi Internal Ukuran (Internal
consistency of measures)

Stabilitas Pengukuran (Stability of


measures)

Kemampuan suatu pengukuran untuk tetap sama


sepanjang waktu.
1. Keandalan Tes ulang (Test-retest reliability)
Koefisien
keandalan
yang
diperoleh
dengan
pengulangan ukuran yang sama (kuisoner sama)
dengan responden yang sama pada kesempatan
kedua. Semakin tinggi koefisien tersebut, semakin
baik keandalan tes ulang.
2. Keandalan bentuk Paralel (Parallel-form reliability)
Bila dua tes sebanding/serupa dengan mengungkap
konsep yang sama menghasilkan skor yang
berkorelasi tinggi (misal lebih sama dengan 0,8 ),
maka ukuran tersebut secara logis dapat dipercaya,
dengan varians kesalahan minimal disebabkan oleh
perbedaan susunan kata, urutan atau faktor lain.

Konsistensi Internal Ukuran (Internal


consistency of measures)
Homogenitas item dalam ukuran yang
mengungkap konsep dengan kata lain
item
harus
bersana-sama
sebagai
kesatuan dan mampu secara beban
mengukur konsep yang sama sehingga
responden
men
yematkan
makna
keseluruhan yang sama untuk setiap item,
terdiri dari:
1. Keandalan
Konsistensi
antar-item
(Interitem consistency reliability)
2. Keandalan belah dua (Split-half reliability)

Keandalan Konsistensi antar-item


(Interitem consistency reliability)
Pengujian konsistensi jawaban responden
atas semua item yang diukur, sampai
tingkat dimana item-item merupakan
ukuran bebas dari konsep yang sama
akan berkorelasi satu sama lain.
Semakin tinggi koefisien, semakin baik
instrument pengukuran. Contoh :
koefisien cronbach alfa (1946) digunakan
untuk item skala multipoin dan formula
kuder-Richardson (1937) digunakan
untuk item dikotomi.

Keandalan belah dua (Split-half


reliability)
Mencerminkan korelasi antara dua
bagian instrument. Estimasi akan
berbeda tergantung pada bagaimana
item dalam pengukuran dibelah
dalam dua bagian.
Alfa Cronbach merupakan indeks yang
paling memadai untuk keandalan
konsistensi antar item.

CATATAN
Disarankan
untuk
menggunakan
ukuran
yang
telah
memiliki
keandalan dan validitas yang lebih
baik dan sering digunakan. Ukuran
yang telah ada harus disesuaikan
dengan situasi dan juga harus diuji
lagi validitas dan reliabilitasnya.

Anda mungkin juga menyukai