SKALA PENGUKURAN
“MEASUREMENT SCALE”
OLEH:
Skala dalam riset bisnis umumnya dibangun untuk mengukur perilaku, pengetahuan,
dan sikap. Skala untuk mengukur sikap adalah skala yang paling sulit untuk dibangun,
sehingga sikap akan digunakan untuk mengembangkan pemahaman tentang
pengambilan skala. Skala pengukuran merupakan kesepakatan yang digunakan sebagai
acuan untuk menentukan panjang pendeknya interval yang ada dalam alat ukur,
sehingga alat ukur tersebut bila digunakan dalam pengukuran akan menghasilkan data
kuantitatif.
1. Sifat Sikap
Sikap (attitude) adalah sesuatu yang dapat diamati mengenai kecenderungan yang
stabil untuk bereaksi pada diri sendiri, orang lain, obyek-obyek, atau masalah
dengan cara yang menyenangkan atau tidak menyenangkan secara konsisten. Sikap
biasanya terbentuk dari tiga komponen, yaitu: kognitif, afektif dan tujuan perilaku.
1.1 Hubungan antara Sikap dan Perilaku
Hubungan antara sikap dan perilaku bukan merupakan hubungan
langsung, meskipun mungkin saja terdapat kaitan yang erat diantara keduanya.
Sikap dan perilaku tidak selalu mengarah pada perilaku aktual. Meskipun sikap
serta perilaku diharapkan konsisten satu sama lainnya, namun kejadiannya tidak
selalu demikian. Lebih dari itu, perilaku dapat mempengaruhi sikap.
Periset bisnis memperlakukan sikap sebagai konstruk hipotesis karena
kompleksitasnya dan kenyataan bahwa sikap merupakan kesimpulan yang
diambil dari data pengukuran dimana sikap tidak dapat diamati secara langsung.
Kualifikasi ini menyebabkan periset sangat berhati – hati terhadap aspek – aspek
tertentu pengukuran sikap untuk memprediksi perilaku. Beberapa faktor yang
berpengaruh pada penerapan riset sikap:
a. Sikap-sikap spesifik merupakan pemrediksi perilaku yang lebih baik
daripada sikap umum.
b. Sikap yang kuat merupakan pemrediksi yang lebih baik daripada sikap yang
lemah yang terbentuk dari intensitas yang kecil atau ketertarikan pada topik
tertentu.
3
sangat buruk”. Skala penilaian yang tidak seimbang (unbalanced rating scale)
memiliki angka yang tidak seimbang dari pilihan respons yang mendukung dan
tidak mendukung. Satu contoh skala yang tidak seimbang hanya memiliki satu
istilah deskriptif yang tidak mendukung dan empat istilah mendukung adalah
“buruk-biasa-baik-sangat baik-luar biasa”. Perancang skala mengharapkan mean
dari penilaian akan mendekati “baik” dan bahwa akan ada distribusi simetris dari
jawaban di sekitar titik tersebut, tetapi skala tersebut membuat partisipan yang
tidak mendukung tidak dapat mengekspresikan intensitas sikap mereka.
Penggunaan skala penilaian tidak seimbang dapat disesuaikan dalam
studi di mana sebelumnya pneliti mengetahui bahwa hampir semua skor
pastisipan akan mengarah ke satu arah atau arah lain. Penilai cenderung
memberikan skor yang lebih tinggi untuk suatu objek sikap jika objek tersebut
familiar dan melibatkan ego. Konsumen yang setia pada suatu merek juga
diharapkan memberikan respons yang mendukung. Ketika peneliti mengetahui
bahwa satu sisi skala sepertinya tidak akan digunakan, mereka berusaha untuk
mencapai presisi di sisi yang paling sering menerima perhatian dari partisipan.
Skala yang tidak seimbang juga dipertimbangkan ketika partisipan dikenal
sebagai “penilai yang mudah” atau “penilai yang sulit”. Skala yang tidak
seimbang dapat membantu mengurangi kesalahan kelonggaran yang dibuat oleh
penilai semacam itu.
2.6 Pilihan yang Dipaksakan atau Tidak Dipaksakan
Skala penilaian pilihan yang tidak dipaksakan (unforced-choice rating
scale) memberikan partsipan kesempatan untuk tidak menyatakan opini ketika
mereka tidak mampu membuat pilihan di antara alternatif yang ditawarkan.
Skala penilaian pilihan yang dipaksakan (forced-choice rating scale)
mengharuskan partisipan memilih satu dari alternatif yang ditawarkan. Para
peniliti sering kali tidak menggunakan pilihan respons “tidak memiliki opini”,
“tidak memutuskan”, “tidak tahu”, “tidak pasti”, atau “netral” ketika mereka
mengetahui bahwa sebagian besar partisipian memiliki sikap terhadap topik
tersebut. Dalam situasi seperti ini, merupakan hal yang masuk akal untuk
membatasi partisipan sehingga mereka fokus pada alternatif secara teliti dan
tidak memilih posisi di tengah tanpa tujuan tertentu. Akan tetapi, ketika banyak
7
partisipan secara jelas tidak memutuskan dan skala tidak dapat membuat mereka
mengeskpresikan ketidakpastian, skala pilihan yang dipaksakan membiaskan
hasil. Para peniliti menemukan bias semacam itu ketika persentase partisipan
yang mengekspresikan sikap lebih besar daripada yang dilakukan oleh para
peserta tersebut di studi sebelumnya mengenai persoalan yang sama. Beberapa
dari bias tersebut disebabkan oleh partisipan yang memberikan respons tidak
berarti atau bereaksi terhadap pertanyaan di mana mereka tidak memiliki opini
untuk hal tersebut. Hal ini memengaruhi ukuran statistik dari mean dan median,
yang bergeser ke titik tengah skala sehingga sulit untuk memahamai perbedaan
sikap di sepanjang instrumen. Memahamai jawaban netral merupakan tantangan
para peneliti. Dalam studi kepuasan konsumen yang berfokus pada pertanyaan
kepuasaan secara keseluruhan terhadap perusahaan dalam industri elektronik,
skala yang tidak dipaksakan digunakan. Akan tetapi, hasil studi mengungkapkan
bahwa 75 persen dari partisipan yang berada di kelompok “netral” dapat
dikonversikan ke kelompok yang setia pada merek jika perusahaan unggul
(menerima penilaian yang sangat mendukung) hanya pada 2 dari 26 skala
pertanyaan lain dalam studi. Oleh karena itu, partisipan di kelompok netral tidak
sepenuhnya netral, dan skala pilihan yang dipaksakan akan mengungkapkan
informasi yang diinginkan.
2.7 Jumlah Titik Skala
Akademisi dan praktisi sering kali memiliki reaksi dogmatis terhadap
pertanyaan tersebut, tetapi jawabannya mungkin lebih praktis: Skala harus sesuai
dengan tujuannya. Skala harus mencocokkan stimulus yang disajikan dan
mengekstrak informasi yang sebanding dengan kompleksitas objek, konsep atau
gagasan dari sikap sehingga skala tersebut bermanfaat. Produk yang
memerlukan sedikit usaha atau pertimbangan untuk dibeli, biasanya dibeli secara
berulang atau memiliki manfaat yang cepat hilang (produk keterlibatan rendah),
dapat diukur secara umum dengan skala sederhana. Skala 3 titik (lebih baik
daripada rata-rata_rata-rata_lebih buruk daripada rata-rata) mungkin cukup
untuk deodoran, burger cepat saji, pembungkus kado, atau makanan ringan.
Hanya ada sedikit dukungan untuk memilih skala dengan 5 atau lebih titik dalam
contoh ini. Akan tetapi, ketika produk tersebut kompleks, memainkan peran
8
penting dalam kehidupan konsumen, dan mahal (misalkan jasa keuangan, barang
mewah, mobil dan produk dengan keterlibatan tinggi lain), skala dengan 5
hingga 11 titik harus dipertimbangkan.
Karakteristik dari reliabilitas dan validitas meruapakan faktor penting
yang memengaruhi keputusan pengukuran. Pertama, ketika jumlah titik skala
bertambah, reliabilitas dari ukuran naik. Kedua, dalam beberapa studi, skala
dengan 11 titik dapat menghasilkan hasil yang lebih valid daripada skala dengan
3,5, atau 7 titik. Ketiga beberapa gagasan memerlukan sensitivitas pengukuran
yang lebih besar dan kesempatan untuk mengesktrak lebih banyak varians, yang
disediakan titik skala tambahan. Keempat, jumlah titik skala yang lebih besar
diperlukan untuk menghasilkan keakuratan ketika menggunakan skala dimensi
tuggal versus dimensi berganda. Terkahir, pada pengyukuran antarbudaya,
praktik budaya dapat mengondisikan partisipan pada metrik standar-skala 10
titik di Italia.
2.8 Kesalahan Penilai
Nilai dari skala penialaian bergantung pada asumsi bahwa seseorang
dapat dan akan membuat penilaian yang baik. Sebelum menerima penilaian dari
partisipan, kita seharusnya mempertimbangkan kecenderungan mereka untuk
melakukan kesalahan dari tendensi sentral dan efek halo. Beberapa penilai
enggan untuk memberikan penilaian yang ekstrem dan fakta tersebut
menyebabkan kesalahan tendensi sentral (error of central tendency). Partsipan
juga mengkin adalah “penilai yang mudah” atau “penilai yang sulit”,
menyebabkan apa yang disebut kesalahan kelonggaran (error of leniency).
Kesalahan tersebut sering muncul ketika penilai tidak mengetahui objek atau
sifat yang sedang dinilai. Untuk mengatasi kecenderungan tersebut, peniliti
dapat:
a. Menyesuaikan kekuatan kata sifat deskriptif.
b. Memberi jarak pada frasa deskriptif yang berada di tengah.
c. Memberikan perbedaan yang lebih kecil pada makna di antara langkah-
langkah yang mendekati ujung skala dibandingkan di antara langkah-langkah
yang mendekati tengah skala.
d. Menggunakan lebih banyak titik di dalam skala
9
Efek halo (hello effect) adalah bias sistematis yang ditimbulkan oleh
penilai dengan menggunakan kesan dari subjek yang digeneralisasi dari satu
penilaian ke penilaian yang lain. Seorang instruktur mengharapkan mahasiswa
yang menjawab dengan baik di pertanyaan pertama dari ujian akan mengerjakan
dengan baik di pertanyaan yang kedua. Anda menyimpulkan suatu laporan
bagus karena anda menyukai bentuknya, atau anda yakin seseorang pintar
karena anda setuju dengannya. Sulit untuk menghindari Halo, terutama ketika
sifat yang dipelajari tidak didefinisikan dengan jelas, tidak diamanti dengan
mudah, tidak sering dibahas, melibatkan reaksi dengan orang lain, atau
merupakan ciri dari kepentingan moral yang tinggi. Cara untuk menangkal efek
halo termasuk membuat partisipan menilai satu ciri pada suatu waktu,
mengungkapkan satu ciri per halaman (seperti dalam survei internet, dimana
partisipan tidak dapat kembali untuk mengubah jawabannya), atau secara
periodik membalikkan istilah yang mengikat titik akhir dari skala sehingga
atribut positif tidak selalu sama pada akhir setiap skala.
Tabel 9.1
Karakteristik Jenis Skala
Karakteristik Dikotomi Pilihan Checklist Penilaian Peningkat Respons
Berganda Bebas
Jenis Skala Nominal Nominal, Nominal Ordinal Ordinal Nominal
Ordinal, atau atau Rasio
atau Rasio Interval
Jumlah 2 3 hingga 10 atau 3 hingga 10 atau Tidak ada
Jawaban 10 kurang 7 kurang
Alternatif
yang Bisa
Disediakan
Jumlah 1 1 10 atau 1 per 7 atau 1
Jawaban kurang item kurang
Partisipan
yang
Diinginkan
Digunakan Klasifikasi Klasifikasi, Klasifikasi Urutan Urutan Klasifiaksi
untuk urutan, atau (ide),
Menyediakan atau jarak urutan,
estimasi atau
numerik estimasi
spesifik numerik
spesifik
10
3. Skala Penilaian
Skala penilaian digunakan untuk menilai properti objek tanpa melakukan
referensi ke objek lain yang serupa. Penilaian tersebut mugnkin dalam bentuk
seperti “suka-tidak suka”, “setuju-tidak peduli-tidak setuju”, atau klasifikasi lain
yang menggunakan bahkan lebih banya kategori.
3.1 Skala Sikap Sederhana
Skala kategori sederhana (dikotomi) menawarkan dua pilihan yang harus
dipilih salah satunya. Strategi tanggapan ini berguna untuk pertanyaan-
pertanyaan demografis atau jika tanggapan dikotomi dinilai memadai. Apabila
terdapat banyak pilihan tetapi hanya satu jawaban yang diperlukan, maka skala
pilihan-ganda, tanggapan-tunggal lebih tepat digunakan. Skala pilihan-ganda-
tanggapan-ganda (daftar periksa) memungkinkan penilai memilih satu atau
beberapa alternatif. Baik skala pilihan ganda, skala respons tunggal dan skala
kategori sederhana menghasilkan data nominal.
Skala sikap sederhana mudah dikembangkan, tidak mahal, dan dapat
didesain menjadi sangat spesifik. Skala sikap sederhana dapat memberikan
informasi yang berguna dan memadai jika dikembangkan dengan baik. Adapun
kelemahan dari skala sikap sederhana yakni pendekatan desain bersifat
subyektif. Kita tidak memiliki bukti bahwa setiap orang akan melihat semua
item dengan kerangka acuan yang sama seperti orang lain.
Ada beberapa contoh bentuk dari skala sikap sederhana:
a. Skala Kategori Sederhana
“Saya berencana untuk melamar pekerjaan di Kantor Konsultan Pajak dalam
waktu 1 bulan ini.”
□ Ya
□ Tidak
b. Skala Pilihan Ganda Tanggapan Tunggal
“Surat kabar apa yang paling sering Anda baca untuk mencari berita
finansial ?”
□ East City Gazette
□ West City Tribune
□ Surat kabar local
11
3 …….
dari responden tersebut dapat diberi bobot nilai atau skor likert seperti dibawah
ini :
SS = Sangat Setuju, diberi nilai 5
S = Setuju, diberi nilai 4
RG = Ragu-ragu, diberi nilai 3
TS = Tidak Setuju, diberi nilai 2
STS = Sangat Tidak Setuju, diberi nilai 1
Total Skor Likert dapat dilihat dari perhitungan dibawah ini :
Jumlah skor untuk 30 orang yang menjawab SS = 30 x 5 = 150
Jumlah skor untuk 30 orang yang menjawab S = 30 x 4 = 120
Jumlah skor untuk 5 orang yang menjawab RG = 5 x 3 = 15
Jumlah skor untuk 20 orang yang menjawab TS = 20 x 2 = 60
Jumlah skor untuk 15 orang yang menjawab STS = 15 x 1 = 15
Total Skor = 360
Skala ini mempunyai interval yang sama yang memisahkan titik-titik skala
numeriknya. Skala daftar penilaian ganda serupa dengan skala numeric tetapi
berbeda dalam dua hal:
a. Skala ini menerima tanggapan melingkar.
b. Tata letaknya memberikan visualisasi hasil-hasilnya.
Dalam skala penilaian, responden tidak akan menjawab salah satu dari
jawaban kualitatif yang telah disediakan, tetapi menjawab salah satu jawaban
kuantitatif yang telah disediakan. Oleh karena itu skala penilaian ini lebih
fleksibel, tidak terbatas untuk pengukuran sikap saja tetapi untuk mengukur
persepsi responden terhadap fenomena lainnya, seperti skala untuk mengukur
status sosial ekonomi, pengetahuan, kemampuan, dan lain-lain. Yang penting
dalam skala penilaian adalah harus dapat mengartikan setiap angka yang
diberikan pada alternatif jawaban pada setiap item instrumen. Orang tertentu
memilih jawaban angka 2, tetapi angka 2 oleh orang tertentu belum tentu sama
maknanya dengan orang lain yang juga memilih jawaban dengan angka 2.
Contoh skala penilaian adalah sebagai berikut:
“Beri tanda silang (x) pada angka yang sesuai dengan penilaian Anda terhadap
kinerja auditor !”
Sangat Sangat
Buruk Baik
1 2 3 4 5 6 7 8 9 10
16
__________Kualitas Makanan
__________Pelayanan
__________Harga
100 Total
17
urutan atau posisi item-item alternatif sebagai data ordinal kecuali jika kelinearan
variabel dalam pertanyaan dapat didukung.
6. Penyortiran
Metode ini meminta partisipan memilah kartu-kartu ke dalam tumpukan
menggunakan kriteria yang ditetapkan oleh periset. Tujuan penyortiran adalah
memperoleh gambaran konseptual atas obyek sikap yang disortir serta
membandingkan hubungannya diantara orang-orang. Q-sorts membutuhkan
penyortiran serangkaian kartu menjadi tumpukan-tumpukan yang mewakili titik-
titik sepanjang rangkaian tidak terputus. Periset dengan menggunakan Q-sorts
memecahkan tiga masalah khusus: seleksi item, pilihan terstruktur atau tidak
terstruktur dalam penyortiran, dan analisis data. Tujuan penyortiran adalah
memperoleh gambaran konseptual atas objek sikap yang disortir serta
membandingkan hubungannya dengan orang-orang.
7. Skala Kumulatif
Skor total dalam skala ini memiliki arti sama. Jika diketahui skor total
seseorang, maka sangat mungkin untuk memperkirakan item-item mana yang
dijawab secara positif dan negatif. Skala yang memelopori skala jenis ini adalah
skalogram. Analisis skalogram merupakan sebuah prosedur untuk menentukan
apakah sekumpulan item-item membentuk skala dimensi tunggal.
Berikut adalah Pola Respons scalogram ideal yaitu:
Skor Partisipan
2 4 1 3
X X X X 4
- X X X 3
- - X X 2
- - - X 1
- - - - 0
DAFTAR PUSTAKA
19
Cooper, R. Donald dan Pamela S. Schindler. 2017. Metode Penelitian Bisnis, Edisi 12
Buku 1. Jakarta : Salemba Empat.
Sugiyono, (2017), Metode Penelitian Kuantitatif Kualitatif dan R & D, Penerbit CV.
Alfabeta, Bandung.