Anda di halaman 1dari 11

RESUME BAB 9

PENGUKURAN: PENSKALAAN, KEANDALAN, VALIDITAS

Disusun untuk Memenuhi Tugas Mata Kuliah Metode Penelitian

Dosen : Dr. Amin Pujiati, S.E.,M.Si

Nurjannah Rahayu Kistanti, S.E., M.Si.

Disusun Oleh :

Muttoihiroh (7111417007)

Tri Supatmi (7111417054)

Toriq Risqullah Farisy (7111417073)

Etma Puji Setyowati (7111417122)

Program Studi Ekonomi Pembangunan

Fakultas Ekonomi

Universitas Negeri Semarang

2019
BAB 9

PENGUKURAN: PENSKALAAN, KEANDALAN, VALIDITAS


Resume Bab 9 :

1. Bentuk Skala Peringkat dan Skala Rangking


2. Stabilitas dan Konsistensi
3. Bentuk-Bentuk Validitas
4. Arti Ketepatan Pengukuran dan perlunya dalam penelitian

Terdapat dua kategori skala sikap yaitu Skala Peingkat dan Skala Ranking. Skala peringkat
memilik beberapa kategosi respon yang terkait dengan objek , peristiwa atau orang yang
dipelajari . Skala Rankinh membuat perbandingan antara objek , peristiwa atau orang dan
mengungkap pilihan yang disukai dan merangkainya .

SKALA PERINGKAT

Skala peringkat berikut ini sering dipakai dalam penelitian organisasional:

1. Skala Dikotomi (dichotomousscale)

Skala ini digunakan untuk memperoleh jawaban Ya atau idak, seperti dalam contoh di
bawah ini. Perhatikan bahwa skala nomina! (nominal scale) dipakai untuk mengungkap
respons. Contohnya : Apakah Anda memiliki mobil? Tidak / Ya

2. Skala Kategori (categoryscale)

Skala ini menggunakan banyak item untuk mendapatkan respons tunggal seperti dalam
contoh berikut. Contoh ini juga menggunakan skala nominal.
Contoh, Di bagian California Utara mana Anda bertempat tinggal?

-North Bay
-South Bay
-East Bay
-Peninsula
-Lainnya
3. Skala Likert

Skala ini didesain untuk menelaah seberapa kuat subjek setuju atau tidak setuju dengan
pernyataan pada skala 5 titik dengan susunan berikut:

Sangat Tidak Setuju Tidak Setuju Tidak Berpendapat Setuju Sangat Setuju
1 2 3 4 5

Respons terhadap sejumlah item yang berkaitan dengan konsep atau variabel tertentu (seperti
contoh berikut ini) kemudian disajikan kepada tiap responden. Ini adalah skala interval
(interval scale) dan perbedaan dalam respons antara dua titik pada skala tetap sama.
4. Skala Diferensial Semantik

Beberapa atribut berkutub dua (bipolar) diidentifikasi pada skala ekstrem dan responden
diminta untuk menunjukkan sikap mereka pada hal yang bisa disebut sebagai jarak
semantik (semanticspace) terhadap individu, objek, atau
kejadian tertentu pada masing-masing atribut. Kata sifat berkutub dua yang digunakan
misalnya akan berupa istilah tertentu, seperti Baik-Buruk; Kuat- Lemah; Panas-Dingin.
Skala diferensial semantik (semanticdifferentialscale) dipakai untuk menilai sikap
responden terhadap merek, iklan, objek, atau orang tertentu. Respons tersebut bisa diatur
(plotted) untuk mendapatkan ide yang baik mengenai persepsi mereka. Hal tersebut
diperlakukan sebagai skala interval.

5. Skala Numerikal

Skala numerikal (numericalscale) mirip dengan skala diferensial semantik dengan


perbedaan dalam hal nomor pada skala 5 titik atau 7 titik disediakan, dengan kata sifat
berkutub dua pada ujung keduanya. Ini juga merupakán skala interval. Contoh,
Seberapa puas Anda dengan agen real estat yang baru?

Sangat Puas 7 6 5 4 3 2 1 Sangat Tidak Puas

6. Skala Peringkat Terperinci

Pada skala peringkat terperinci (itemizedratingscale), skala 5 titik atau 7 titik dengan titik
panduan atau jangkar (anchor), sesuai keperluan, disediakan untuk tiap item dan
responden menyatakan nomor yang tepat di sebelah masing-masing item, atau melingkari
nomor yang relevan untuk tiap item. Respons terhadap item kemudian disajikan. Hal ini
menggunakan skala interval.

Skala peringkat terperinci ini memberikan fleksibilitas untuk menggunakan sebanyak


mungkin titik sesuai keperluan (4, 5, 7, 9, atau berapa pun), dan juga mungkin untuk
menggunakan panduan (anchor), misalnya Sangat Tidak
Penting hingga Sangat Penting; Sangat Rendah hingga Sangat Tinggi. Bila ada titik
netral, hal tersebut disebut skala peringkat seimbang, dan bila tidak, disebut skala
peringkat tidak seimbang. Penelitian menunjukkan bahwa skala 5 titik adalah sama
baiknya dengan yang lain, dan bahwa kenaikan dari 5 ke 7 atau 9 titik pada skala
peringkat tidak meningkatkan keandalan peringkat (Elmore&Beggs, 1975) Skala
peringkat terperinci sering dipakai dalam penelitian bisnis, karena hal tersebut
menyesuaikan dirinya dengan jumlah titik yang ingin digunakan, serta tata nama dari
anchor, sejauh dianggap perlu untuk mengakomodasi kebutuhan peneliti untuk
mengungkap variabel.
7. Skala Jumlah Konstan atau Tetap

Pada skala ini responden diminta untuk mendistribusikan sejumlah poin yang diberikan
ke berbagai item seperti dalam contoh di bawah. Skala jumlah konstan atau tetap
(fixedorconstant sum scale) lebih bersifat skala ordinal (ordinal scale). Contoh,
Dalam memilih sabun mandi, tunjukkan kepentingan yang Anda kaitkan dengan
kelima aspek berikut ini dengan memberikan poin untuk masing-masing sehingga
totalnya berjumlah 100.

Keharuman __

Warna __

Bentuk __

Ukuran __

Tekstur Busa __

Total Poin 100

8. Skala Stapel

Skala stapel secara simultan mengukur arah dan intensitas sikap terhadap item yang
dipelajari. Skala ini memberikan ide mengenai seberapa dekat atau jauh respons individu
terhadap stimulus. Karena skala ini tidak memiliki titik nol absolut, skala ini adalah skala
interval.

Contoh :

Nyatakan bagaimana Anda menilai kemampuan supervisor anda terkait dengan setiap
karakteristik yang disebutkan di bawah ini , dengan melingkari nomor yang tepat .

+3 +3 +3
+2 +2 +2
+1 +1 +1
Mengadopsi Inovasi Keterampilan
Tekonologi Produk Antarpribadi
Modern
-1 -1 -1
-2 -2 -2
-1 -3 -3

9. Skala Peringkat Grafik

Gambaran grafis membantu responden untuk menunjukkan pada skala peringkat grafik
(graphic rating scale) jawaban mereka untuk pertanyaan tertentu dengan menempatkan
tanda pada titik yang tepat pada garis, seperti dalam contoh berikut. Ini merupakan skala
ordinal, meskipun contoh berikut mungkin membuatnya terlihat seperti skala interval.
Contoh :

Pada skala 1 sampai 10 , bagaimana Anda akan menilai suervisor Anda ?

10 : Sangat Baik

5 : Baik

1 : Buruk

10. Skala Konsensus

Skala juga dibuat berdasarkan konsensus, di mana panel juri memilih item tertentu,
mengukur konsep yang menurut mereka relevan. Item dipilih terutama berdasarkan
ketepatan atau relevansinya dengan konsep. Skala konsensus tersebut dibuat setelah item
terpilih diperiksa dan diuji validitas dan keandalannya. Satu contoh skala konsensus
konsensus adalah Thurstone Equal Apprearing Interval Scale, di mana sebuah konsep
diukur dengan suatu proses rumit yang melibatkan sebuah panel juri. Skala ini jarang
dipakai untuk mengkur konsep organisasional karena banyaknya waktu yang dibutuhkan
untuk membuatnya.

11. Skala Lainnya


Ada juga beberapa metode penskalaan yang sudah sangat maju atau rumit (advance)
seperti penskalaan multidimensional (multidimensional scaling), di mana objek,
orang, atau kedua-duanya, diskalakan secara visual, dan dilakukan analisis gabungan
(conjoint). Hal tersebut memberikan gambar visual mengenai hubungan yang ada
dianara dimensi sebuah konsep (construct).

SKALA RANKING

Skala Ranking ( ranking scales ) digunakan untuk mengungkap preferensi antara dua
atau lebih objek atau item ( bersifat ordinal ). Skala Ranking digunakan untuk
mengungkap preferensi antara dua atau lebih objek atau item. Metode alternatif yang
dipakai adalah:

1. Perbandingan Berpasangan

Skala Perbandingan Berpasangan (paired comparison ) digunakan ketika di antara


sejumlah kecil objek , responden diminta untuk memilih antara 2 objek pada suatu
waktu . Hal ini membantu untuk menilai preferensi .

2. Pilihan yang diharuskan


Memungkinkan responden untuk meranking objek secara relatif satu sama lain , di
antara alternatif yang disediakan . Hal ini mempermudah responden , khususnya jika
jumlah pilihan yang harus dirankingbterbatas jumlahnya .
3. Skala Komparatif

Skala Komparatif memberikan standar atau poin referensi untuk menilai sikap
terhadap objek , kejadian , atau situasi saat ini yang diiteliti .

KETEPATAN PENGUKURAN

Analisis item bertujuan untuk melihat apakah item dalam instrument memang sudah
seharusnya berada dalam instrument atau tidak

KEANDALAN

Keandalan adalah sesuatu yang merujuk pada konsistensi skor yang dicapai oleh orang
yang sama ketika mereka diuji ulang dengan tes yang sama pada kesempatan yang
berbeda (anastasia dan susana, 1997)

1. Stabilitas pengukuran

Stabilitas pengukuran adalah kemampuan suatu pengukuran untuk tetap sama sepanjang
waktu meskipun terdapat kondisi pengujian yang tidak dapat dikontrol atau keadaan
responden itu sendiri, hal tersebut merupakan indikasi dari stabilitas dan kerentanannya
untuk berubah dalam situasi. Terdapat dua uji stabilitas yaitu keandalan tes ulang dan
keandalan bentuk parallel.

1. Keandalan tes ulang


Keandalan tes ulang yaitu koefisien keandalan yang diperoleh dengan pengulangan
ukuran yang sama pada kesempatan kedua.
2. Keandalan bentuk parallel
Keandalan ini terdapat pada kondisi jika respon terhadap dua tes serupa yang
mengungkap ide yang sama menunjukkan korelasi yang tinggi. Kedua item tersebut
memiliki item yang setara dan format yang sama, yang berubah hanyalah susunan
kata dan urutan pertanyaan. Apabila kedua test tersebut menghasilkan skor yang
berkorelasi tinggi, maka dapat kita yakini bahwa ukuran tersebut secara logis dapat
dipercaya.
2. Konsistensi internal ukuran
Konsistensi internal ukuran merupakan indikasi homogenitas item dalam ukuran yang
mengungkap ide. Artinya item harus bersama-sama dan mampu secara beban mengukur
konsep yang sama sehingga responden menyematkan makna secara keseluruhan yang
sama tiap item.
1. Keandalan konsistensi antar-item
Keandalan konsistensi antar item (interitem consistency reliability) merupakan
pengujian konsistensi dari beberapajawaban responden atas semua item yang telah
diukur. Semakin tinggi koefisien, semakin tinggi instrument pengukuran.
2. Keandalan belah-dua
Keandalan belah dua (split-half-reability) pengetesan atau pengukuran yang
dilakukan dengan dua kelompok item yang setara pada saat yang sama bertujuan
untuk mencerminkan korelasi antar dua bagian instrumen, estimasi bergantung pada
bagaimana item dalam pengukuran dibelah ke dalam dua bagian

VALIDITAS

1. Validitas Isi
Validitas isi (content validity) memastikan bahwa pengukuran memasukan sekumpulan
item yang memadai dan mewakili yang mengungkap konsep. Semakin item skala
menxerminkan kawasan atau keseluruhan konsep yang diukur, semakin besar validitas
isi. Dengan kata lain, validitas isi merupakan fungsi seberapa baik dimensi dan elemen
sebuah konsep telah digambarkan. Validitas muka adalah validitas yang paling rendah
signifikasinya karena hanya didasarkan pada penilaian sepintas mengenai isi alat ukur.
Validitas muka (face validity) dianggap oleh sejumlah pihak sebagai indeks validitas isi
yang paling dasar dan sangat minimum. Validitas isi menunjukan bahwa item-item yang
yang dimaksudkan untuk mengukur sebuah konsep, memberikan kesan mampu
mengungkap konsep yang hendak diukur. Namun, beberapa peniliti merasa tidak tepat
untuk memberlakukan validitas muka sebagai komponen yang valid dari validitas isi.
2. Validitas Berdasar Kriteria
Validitas berdasar kriteria (criterion-related validity) terpenuhi jika pengukuran
membedakan individu menurut suatu kriteria yang diharapkan dapat diprediksi. Hal
tersebut dapat dilakukan dengan menghasilkan validitas konkuren (concurrent
validity)atau validitas prediktif (predictive validity)
Validitas konkuren dihasilkan jika skala membedakan individu yang diketahui berbeda
yaitu mereka harus menghasilkan skor yang berbeda pada instrumen.
3. Validitas Konsep
Validitas konsep (construct validity) menunjukkan seberapa baik hasil yang diperoleh
dari penggunaan ukuran cocok dengan teori yang mendasari desain tes. Hal tersebut
dinilai melalui validitas konvergen dan diskriminan.
Validitas konvergen terpenuhi jika skor yang diperoleh dengan dua instrumen berbeda
yang mengukur konsep yang sama menunjukan korelasi tinggi.
Validitas diskriminan terpenuhi jika, berdasarkan teori, dua variabel diprediksi tidak
berkorelasi, dan skor yang diperoleh dengan mengukurnya benar-benar secara empiris
membuktikan hal tersebut.
Dengan demikian validitas bisa dihasilkan dengan berbagai cara. Ukuran yang
dipublikasikan untuk berbagai konsep biasanya melaporkan jenis validitas yang telah
dihasilkan untuk instrumen, sehingga pengguna atau pembaca dapat menilai “ketepatan”
pengukuran.
Beberapa cara dimana bentuk validitas diatas dipenuhi adalah melalui,
1. Analisis Korelasional, seperti dalam kasus menghasilkan validitas konkuren dan
prediktif atau validitas konvergen dan diskriminan
2. Analisis Faktor, teknik multivariat yang akan menegaskan dimensi konsep yang telah
didefinisikan secara operasional, sekaligus menunjukan item mana yang palin tepat
untuk tiap dimensi (menghasilkan validitas konsep)
3. Multikarakter atau multimetode matriks korelasi yang diperoleh dari pengukuran
konsep dengan berbagai bentuk dan metode yang menambah keketatan pengukuran.

Hasil dari setiap penilitian hanya dapat sebaik pengukuran yang mengungkap konsep
dalam kerangka teoritis. Kita perlu menggunakan ukuran yang valid dan terpercaya untuk
memastikan bahwa penelitia kita ilmiah. Dengan demikian, para peniliti dapat memakai
instrumen yang telah dianggap baik, daripada harus bersusah-payah membuat ukuran
mereka sendiri. Tetapi, ketika menggunakan ukuran tersebut, peneliti sebaiknya
menyebutkan sumber sehingga pembaca dapat melihat lebih banyak informasi.
Jenis- Jenis Validitas

Validitas Deskripsi
Validitas isi Apakah pengukuran benar-benar mengukur konsep?
Validitas muka Apakah “para ahli” mengesahkan bahwa instrumen mengukur apa
yang seharusnya diukur?
Validitas berdasar Apakah pengukuran membedakan cara yang membantu
kriteria memprediksi kriteria variabel?
Validitas konkuren Apakah pengukuran membedakan cara yang membantu
memprediksi kriteria variabel saat ini?
Validitas prediktif Apakah pengukuran membedakan individual dalam membantu
memprediksi kriteria masa depan?
Validitas konsep Apakah instrumen menyediakan konsep sebagai teori?
Validitas konvergen Apakah dua instrumen mengukur konsep dengan korelasi yang
tinggi?
Validitas diskriminan Apakah pengukuran memiliki korelasi rendah dengan variabel
yang diperkirakan tidak ada hubungannya dengan variabel
tersebut?

Kerja dalam tiap kasus adalah berbeda dan susunan kata dalam instrumen mungkin perlu
mengalami penyesuaian seperlunya. Tetapi, dalam melakukan hal tersebut kita merusak skala
yang sudah ada, dan disarankan mengujinya untuk pemenuhan validitas dan keandalan.
RINGKASAN

Dalam bab ini kita melihat skala peringkat dan skala ranking sikap yang dapat digunakan
untuk menyusun instrumen setelah sebuah konsep didefinisikan secara operasional. Kita juga
membahas bagaimana ketepatan ukuran dibuktikan dengan mean dari analisis item, dan uji
keandalan dan validitas. Kita juga melihat bahwa skala Likert dan jenis skala tipe interval
lainnya seperti skala numerikal, sangat sering dipakai dalam penelitianorganisasional karena
skala tersebut memungkinkan analisis data yang lebih lanjut. Akhirnya, kita membahas
ketepatan ukuran dalam hal keandalan, validitas, dan berbagai cara untuk menghasilkannya.

Pengetahuan tentang skala dan teknik penskalaan membantu manajer untuk melaksanakan
survei tingkat dengan mendesain pertanyaan yang menggunakan skala ranking atau
peringkat, sesuai keperluan. Kesadaran akan fakta bahwa ukuran telah tersedia bagi banyak
konsep organisasional lebih jauh memfasilitasi survei eksploratif kecil oleh manajer.
REFERENSI

Sekaran, Uma. (2011). Research Methods for business Edisi I and 2. Jakarta: Salemba Empat.

Anonim. (2012). Pengukuran : penskalaan, keandalan dan validitas. Tersedia :

http://markdebie.blogspot.com/2012/05/pengukuran-penskalaan-keandalan.html[7 september
2019]

sabila, diny. (2014). Skala pengukuran dan instrumen penelitian. Tersedia :


https://dinysabila.wordpress.com/2014/01/16/skala-pengukuran-dan-instrumen-penelitian/ [7
september 2019]

Anda mungkin juga menyukai