Anda di halaman 1dari 47

Subscribe to DeepL Pro to translate larger documents.

Visit www.DeepL.com/pro for more information.

HALAMAN 12

Pengukuran: Penskalaan,
keandalan, dan validitas

TUJUAN PEMBELAJARAN
Setelah menyelesaikan Bab 12, Anda seharusnya bisa:
1. Jelaskan karakteristik dan kekuatan empat jenis skala - nominal, ordinal, interval, dan rasio.
2. Jelaskan dan ketahui bagaimana dan kapan menggunakan berbagai bentuk skala penilaian.
3. Jelaskan dan ketahui bagaimana dan kapan menggunakan berbagai bentuk skala peringkat.
4. Mendiskusikan dimensi internasional dari penskalaan.
5. Menjelaskan validitas dan reliabilitas serta bagaimana keduanya ditetapkan dan menilai
reliabilitas dan validitas skala.
6. Jelaskan perbedaan antara skala reflektif dan formatif.

PENDAHULUAN
Pada bab sebelumnya, kami telah menjelaskan bahwa pengukuran adalah pemberian angka atau simbol lain
pada karakteristik (atau atribut) objek menurut seperangkat aturan yang telah ditetapkan sebelumnya.
Sekarang kita telah mempelajari cara mendefinisikan (atau mengoperasionalkan) sebuah konsep (atau
variabel) secara operasional, kita perlu memberikan angka (atau simbol lain) padanya dengan cara tertentu.
Perlu diperhatikan bahwa aturan untuk memberikan angka pada karakteristik objek harus distandarisasi dan
diterapkan secara konsisten.
Angka memungkinkan kita untuk melakukan analisis statistik pada data yang dihasilkan dan (dalam
penelitian deduktif) untuk menguji hipotesis yang telah kita kembangkan. Selain itu, angka-angka tersebut
memfasilitasi komunikasi hasil penelitian kita.
Pada bab ini kita akan membahas jenis-jenis skala yang dapat digunakan untuk memberikan angka pada
karakteristik objek dan kemudian melihat bagaimana kita menerapkannya. Pertama-tama, kita akan
membahas empat jenis skala yang berbeda (skala nominal, ordinal, interval, dan rasio) dan menunjukkan
bahwa analisis statistik yang dapat kita lakukan nanti dalam proses penelitian terkait langsung dengan jenis
skala yang kita gunakan. Kita juga akan membahas dua kategori utama dari skala sikap (jangan disamakan
dengan empat jenis skala yang berbeda, yang dibahas pertama kali dalam bab ini) - skala penilaian dan skala
peringkat. Skala peringkat memiliki beberapa kategori respons dan digunakan untuk memperoleh respons
terkait objek, peristiwa, atau orang yang diteliti. Skala peringkat, di sisi lain, membuat perbandingan antara
atau di antara objek, peristiwa, atau orang dan mendapatkan pilihan yang lebih disukai dan peringkat di antara
mereka.
206
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 207

EMPAT JENIS TIMBANGAN

Kunjungi situs web pendamping di www.wiley.com/college/sekaran untuk melihat Video


Penulis: Empat jenis timbangan.

Pengukuran berarti mengumpulkan data dalam bentuk angka. Untuk dapat memberikan angka pada atribut
objek, kita memerlukan skala. Skala adalah alat atau mekanisme yang digunakan untuk membedakan
individu-individu berdasarkan perbedaannya satu sama lain dalam variabel-variabel yang menjadi perhatian
kita. Penskalaan melibatkan pembuatan kontinum di mana objek-objek kita berada.
Misalkan kita ingin mengukur sikap konsumen terhadap konsumsi minuman ringan. Setelah kita
mengembangkan satu atau beberapa item skala atau pertanyaan, langkah selanjutnya dalam pengukuran
adalah menentukan skala yang memungkinkan kita untuk memberikan angka pada atribut (sikap terhadap
konsumsi minuman ringan) dari objek kita (konsumen). Hal ini memungkinkan kita untuk
mengklasifikasikan objek kita (konsumen) dalam hal seberapa tidak disukai atau disukai mereka terhadap
minuman ringan. Salah satu dari sekian banyak pilihan yang kita miliki untuk mengklasifikasikan konsumen
adalah skala Likert. Skala Likert adalah skala yang dirancang untuk memeriksa seberapa kuat responden
setuju dengan sebuah pernyataan (seperti "Saya senang minum minuman ringan") pada skala lima poin dengan
jangkar sebagai berikut: 1 = Sangat Tidak Setuju, 2 = Tidak Setuju, 3 = Tidak Setuju atau Kurang Setuju, 4 =
Setuju, 5 = Sangat Setuju (lebih lanjut dalam bab ini kita akan membahas secara menyeluruh berbagai macam
skala penilaian dan peringkat, termasuk skala Likert). Oleh karena itu, skala Likert memungkinkan kita untuk
membedakan konsumen dalam hal bagaimana mereka berbeda satu sama lain dalam hal sikap mereka
terhadap minuman ringan, setiap responden diberi nomor yang menunjukkan lebih atau kurang tidak
menguntungkan, netral, atau lebih atau kurang menguntungkan.
Pertanyaan sejuta dolar adalah: Apa arti angka 1, 2, 3, 4, dan 5? Apakah skala yang kita gunakan
memungkinkan kita, misalnya, untuk mengurutkan objek-objek kita (2 lebih banyak daripada 1)? Apakah
skala ini memungkinkan kita untuk membandingkan perbedaan antara objek (dengan kata lain, apakah
perbedaan antara 1 dan 2 sama dengan perbedaan antara 2 dan 3? Dan apakah memungkinkan kita untuk
menghitung statistik tertentu seperti mean (atau rata-rata) dan deviasi standar? Jawabannya adalah:
tergantung. Tergantung pada jenis skala (yaitu jenis skala dasar) yang kita gunakan.
Ada empat jenis skala dasar: nominal, ordinal, interval, dan rasio. Tingkat kecanggihan skala yang
disesuaikan dengan baik meningkat secara progresif saat kita beralih dari skala nominal ke skala rasio. Itulah
mengapa informasi tentang variabel dapat diperoleh secara lebih rinci ketika kita menggunakan skala interval
atau rasio daripada menggunakan dua skala lainnya. Seiring dengan meningkatnya kecanggihan kalibrasi atau
penyetelan skala, begitu pula dengan kekuatan skala. Dengan skala yang lebih kuat, analisis data yang lebih
canggih dapat dibentuk, yang pada gilirannya berarti jawaban yang lebih bermakna dapat ditemukan untuk
pertanyaan penelitian kita. Namun, variabel-variabel tertentu dapat dengan mudah digunakan untuk
penskalaan yang lebih kuat daripada variabel lainnya. Sekarang mari kita lihat masing-masing dari keempat
skala ini.

Skala nominal
Skala nominal adalah skala yang memungkinkan peneliti untuk menetapkan subjek ke dalam kategori atau
kelompok tertentu. Misalnya, sehubungan dengan variabel jenis kelamin, responden dapat dikelompokkan ke
dalam dua kategori - laki-laki dan perempuan. Kedua kelompok ini dapat diberi nomor kode 1 dan 2. Angka-
angka ini berfungsi sebagai label kategori yang sederhana dan mudah digunakan tanpa nilai intrinsik, selain
untuk menempatkan responden pada salah satu dari dua kategori yang tidak tumpang tindih, atau yang saling
208 METODE PENELITIAN UNTUK BISNIS

terpisah. Perhatikan bahwa kategori-kategori tersebut juga secara kolektif lengkap. Dengan kata lain, tidak ada
kategori ketiga yang biasanya menjadi tempat responden berada. Dengan demikian, skala nominal
mengkategorikan individu atau objek ke dalam kelompok yang saling eksklusif dan lengkap secara kolektif.
Informasi yang dapat dihasilkan dari penskalaan nominal adalah perhitungan persentase (atau frekuensi) laki-
laki dan perempuan dalam sampel responden. Sebagai contoh, jika
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 209

kami telah mewawancarai 200 orang, dan memberikan kode nomor 1 untuk semua responden pria dan nomor
2 untuk semua responden wanita, maka analisis komputer terhadap data di akhir survei dapat menunjukkan
bahwa 98 responden adalah pria dan 102 adalah wanita. Distribusi frekuensi ini memberi tahu kita bahwa 49%
responden survei adalah pria dan 51% wanita. Selain informasi marjinal ini, skala tersebut tidak memberi tahu
kita apa-apa lagi tentang kedua kelompok tersebut. Dengan demikian, skala nominal memberikan beberapa
informasi dasar, kategorikal, dan kasar.

CONTOH
Mari kita lihat variabel lain yang cocok untuk Jerman Swiss
penskalaan nominal - kewarganegaraan individu. India Zambia
Kita dapat menskalakan variabel ini secara nominal Lainnya
dalam kategori yang saling eksklusif dan secara kolektif
Perhatikan bahwa setiap responden harus masuk ke
lengkap.
dalam salah satu dari 11 kategori di atas dan bahwa
Amerika Jepang skala ini memungkinkan perhitungan jumlah dan
Australia Polandia persentase responden yang masuk ke dalam kategori
Bahasa Mandarin Bahasa Rusia tersebut.

Sekarang lakukan Latihan 12.1.

LATIHAN 12.1

Sarankan dua variabel yang akan menjadi kandidat alami untuk skala nominal, dan siapkan kategori yang
saling eksklusif dan lengkap untuk masing-masing variabel.

Skala ordinal
Skala ordinal tidak hanya mengkategorikan variabel sedemikian rupa untuk menunjukkan perbedaan di
antara berbagai kategori, tetapi juga mengurutkan kategori dengan cara yang bermakna. Dengan variabel apa
pun yang kategorinya akan diurutkan menurut beberapa preferensi, skala ordinal akan digunakan. Preferensi
akan diurutkan (misalnya, dari yang terbaik hingga yang terburuk; pertama hingga terakhir) dan diberi nomor
1, 2, dan seterusnya. Sebagai contoh, responden dapat diminta untuk menunjukkan preferensi mereka dengan
memberi peringkat pada lima karakteristik yang mereka anggap penting dalam suatu pekerjaan yang mungkin
ingin diteliti oleh peneliti. Pertanyaan seperti itu dapat berbentuk seperti yang ditunjukkan pada contoh
berikut. Skala ordinal membantu peneliti untuk menentukan persentase responden yang menganggap interaksi
dengan orang lain sebagai hal yang paling penting, mereka yang menganggap menggunakan sejumlah
keterampilan yang berbeda sebagai hal yang paling penting, dan seterusnya. Pengetahuan seperti itu dapat
membantu dalam merancang pekerjaan yang dipandang paling diperkaya oleh mayoritas responden.
karyawan.
Sekarang kita dapat melihat bahwa skala ordinal memberikan lebih banyak informasi daripada skala
nominal. Skala ordinal lebih dari sekadar membedakan kategori, tetapi juga memberikan informasi tentang
bagaimana responden membedakannya dengan mengurutkannya berdasarkan peringkat. Namun, perlu
diperhatikan bahwa skala ordinal tidak memberikan indikasi apa pun tentang besarnya perbedaan di antara
210 METODE PENELITIAN UNTUK BISNIS

peringkat. Misalnya, dalam contoh karakteristik pekerjaan, karakteristik pekerjaan yang berada di peringkat
pertama mungkin hanya sedikit lebih disukai daripada karakteristik yang berada di peringkat kedua,
sedangkan karakteristik yang berada di peringkat ketiga mungkin lebih disukai dalam tingkat yang jauh lebih
besar daripada karakteristik yang berada di peringkat keempat. Dengan demikian, dalam penskalaan ordinal,
meskipun perbedaan peringkat objek, orang, atau peristiwa yang diselidiki diketahui dengan jelas, kita tidak
mengetahui besarnya. Kekurangan ini diatasi dengan penskalaan interval, yang akan dibahas selanjutnya.
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 211

CONTOH
Beri peringkat pada lima karakteristik berikut ini dalam sebuah pekerjaan dengan urutan yang
paling penting sebagai 1, yang berikutnya sebagai 2, dan
seberapa penting karakteristik tersebut bagi Anda. Anda harus
memberi peringkat seperti itu, sampai Anda memberi peringkat 1, 2, 3, 4, atau 5.

Karakteristik pekerjaanRanking
-
kepentingan
Gunakan sejumlah keterampilan yang -
Kesempatan
berbeda. yang diberikan oleh pekerjaan -
untuk: Berinteraksi dengan
Menyelesaikan seluruh tugasorang lain hingga
dari awal -
akhir. Melayani orang lain. -
Bekerja secara mandiri.

Sekarang lakukan Latihan 12.2.

LATIHAN 12.2

Kembangkan skala ordinal untuk preferensi konsumen untuk berbagai merek mobil.

Skala interval
Dalam skala interval, atau skala interval yang sama, jarak yang sama secara numerik pada skala mewakili nilai
yang sama dalam karakteristik yang sedang diukur. Sementara skala nominal memungkinkan kita untuk
membedakan kelompok secara kualitatif dengan mengelompokkan mereka ke dalam set yang saling eksklusif dan
secara kolektif lengkap, dan skala ordinal untuk mengurutkan preferensi, skala interval memungkinkan kita untuk
membandingkan perbedaan antara objek. Perbedaan antara dua nilai pada skala identik dengan perbedaan antara
dua nilai lain yang berdekatan pada skala tersebut. Termometer klinis adalah contoh yang baik untuk instrumen
berskala interval; termometer ini memiliki asal sembarang dan besarnya perbedaan antara 98,6 derajat (yang
seharusnya merupakan suhu tubuh normal) dan 99,6 derajat sama dengan besarnya perbedaan antara 104 dan 105
derajat. Namun demikian, perlu diperhatikan bahwa seseorang mungkin tidak akan terlalu khawatir jika suhu
tubuhnya naik dari 98,6 ke 99,6, tetapi akan sangat khawatir jika suhunya naik dari 104 ke 105 derajat!
Skala interval, kemudian, memanfaatkan perbedaan, urutan, dan kesetaraan besarnya perbedaan dalam
variabel. Dengan demikian, skala ini merupakan skala yang lebih kuat daripada skala nominal dan ordinal, dan
memiliki ukuran kecenderungan cen- derungnya, yaitu rata-rata aritmetik. Ukuran penyebarannya adalah rentang,
deviasi standar, dan varians.

Skala rasio
Skala rasio mengatasi kelemahan dari titik asal yang berubah-ubah pada skala interval, karena skala ini memiliki
titik nol absolut (berbeda dengan titik asal yang berubah-ubah), yang merupakan titik pengukuran yang berarti.
Dengan demikian, skala rasio tidak hanya mengukur besarnya perbedaan antara titik-titik pada skala, tetapi
juga mengetuk proporsi dalam perbedaan tersebut. Timbangan ini merupakan timbangan yang paling kuat dari
keempat timbangan karena memiliki titik nol yang unik (bukan titik nol yang sembarang) dan mencakup semua
sifat dari ketiga timbangan lainnya. Neraca timbangan adalah contoh yang baik dari timbangan rasio.
Timbangan ini memiliki titik nol absolut (dan bukan sembarang titik) yang dikalibrasi, yang memungkinkan
212 METODE PENELITIAN UNTUK BISNIS

kita untuk menghitung rasio bobot dua individu. Misalnya, seseorang dengan berat 250 pon adalah dua kali lebih
berat daripada orang yang beratnya 125 pon. Perhatikan bahwa mengalikan atau membagi kedua angka ini (250
dan 125) dengan angka tertentu akan mempertahankan rasio 2:1. Ukuran tendensi sentral dari skala rasio dapat
berupa rata-rata aritmatika atau geometris dan ukuran
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 213

Ukuran dispersi dapat berupa deviasi standar, atau varians, atau koefisien variasi. Beberapa contoh skala rasio adalah
yang berkaitan dengan usia aktual, pendapatan, dan jumlah organisasi tempat seseorang bekerja.
Sekarang lakukan Latihan 12.3 dan Latihan 12.4.

LATIHAN 12.3

Mengukur tiga variabel pada skala interval atau rasio.

LATIHAN 12.4

Sebutkan satu variabel untuk masing-masing dari empat skala dalam konteks survei pasar, dan jelaskan
bagaimana atau mengapa variabel tersebut sesuai dengan skala tersebut.

Sifat-sifat skala, seiring dengan semakin baiknya penyempurnaan, dirangkum dalam Tabel 12.1. Kita juga dapat
melihat dari tabel tersebut bagaimana kekuatan statistik meningkat ketika kita beralih dari skala nominal (di mana kita
mengelompokkan subjek atau item di bawah beberapa kategori), ke skala ordinal (di mana kita mengurutkan kategori),
ke skala interval (di mana kita mengetuk besarnya perbedaan), ke skala rasio (yang memungkinkan kita untuk
mengukur proporsi perbedaan). Anda pasti sudah menduga bahwa beberapa variabel, seperti jenis kelamin,
hanya dapat diukur pada skala nominal, sementara variabel lainnya, seperti suhu, dapat diukur pada skala
ordinal (panas/sedang/rendah), atau skala interval.
skala melalui termometer. Kapan pun memungkinkan untuk menggunakan skala yang lebih kuat, sebaiknya Anda
melakukannya.

Ordinal atau interval?


Skala Likert (dibahas kemudian dalam bab ini) adalah cara yang umum digunakan untuk mengukur pendapat
dan sikap. Skala ini mengukur sejauh mana peserta setuju atau tidak setuju dengan pernyataan yang diberikan,
dan biasanya berkisar antara 1 (sangat tidak setuju) hingga 5 (sangat setuju) dengan titik netral di tengah-
tengahnya (mis. tidak setuju atau tidak setuju). Apakah skala ini bersifat ordinal atau interval adalah subjek
yang banyak diperdebatkan. Beberapa orang berpendapat bahwa skala Likert bersifat ordinal. Mereka dengan
tepat menunjukkan bahwa seseorang tidak dapat mengasumsikan bahwa semua pasangan yang berdekatan

TA B L E 1 2 . 1
Sifat-sifat dari keempat timbangan

Sorotan
Asal Ukuran Beberapa uji
Skala Perbedaan Pesan jarak yang unik tendensi sentral Ukuran dispersi signifikansi
214 METODE PENELITIAN UNTUK BISNIS

χ2
Nominal Ya Tid Ti Ti Modus -
Ordinal Ya ak da da Median Kisaran semi-interkuartil Korelasi urutan
peringkat
Ya k k
Rasio Ya Rata-rata Standar deviasi, varians, t, F
Ti Tid
Ya da ak aritmatik koefisien variasi
Interval Ya a Standar deviasi atau varians t, F
k
Ya Rata-rata atau koefisien variasi
Tid
aritmatika
Ya
atau
ak
geometris
Ya
Ya

Catatan: Skala interval memiliki 1 sebagai titik awal yang sewenang-wenang. Skala rasio memiliki nilai awal 0, yang bermakna.
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 215

tingkat yang sama (dengan jarak yang sama). Meskipun demikian, skala Likert (dan beberapa skala lainnya,
yaitu skala diferensial semantik dan skala numerik - yang juga dibahas nanti dalam bab ini) umumnya
diperlakukan seolah-olah sebagai skala interval, karena memungkinkan peneliti untuk menghitung rata-rata
dan standar deviasi dan untuk menerapkan teknik statistik lain yang lebih canggih (misalnya, untuk menguji
hipotesis).
Contoh skala Likert diberikan di bawah ini. Bagaimana Anda akan memperlakukan skala ini?

CONTOH
unjukkan sejauh mana Anda setuju dengannomor
yang sesuaiuntuk s e t i a p pernyataanberikut, dengan menggunakan skala pernyataan yang berhubungan
dengan pekerjaan Anda, dengan melingkari yang diberikan di bawah
Sangat Tidak Setuju Sangat
Tidak Kurang Setuju Maupun Setuju Setuju
Setuju 2 Tidak Setuju
3 4 5
1
Peluang yang ditawarkan oleh pekerjaan berikut ini sangat penting bagi
saya:
a. Berinteraksi dengan orang lain 1 2 3 4 5
b. Menggunakan sejumlah keterampilan yang 1 2 3 4 5
berbeda
c. Menyelesaikan tugas dari awal hingga akhir 1 2 3 4 5
d. Melayani orang lain 1 2 3 4 5
e. Bekerja secara mandiri 1 2 3 4 5

Setelah kita melihat empat jenis timbangan, mari kita lihat, melalui contoh berikut ini, kapan dan
bagaimana timbangan harus digunakan.

CONTOH
Penggunaan skala nominal Penggunaan skala ordinal
Skala nominal selalu digunakan untuk mendapatkan Skala ordinal digunakan untuk mengurutkan
data pribadi seperti jenis kelamin atau departemen preferensi atau penggunaan berbagai merek produk
tempat seseorang bekerja, di mana pengelompokan oleh individu dan untuk mengurutkan individu, objek,
individu atau objek berguna, seperti yang atau peristiwa, seperti contoh di bawah ini.
ditunjukkan di bawah ini.
1. Beri peringkat pada komputer pribadi berikut ini
berdasarkan penggunaannya di kantor Anda,
1. Jenis kelamin Anda 2. Departemen Anda dengan memberikan angka 1 untuk sistem yang
paling sering digunakan, 2 untuk sistem yang
Laki-laki Produksi paling sering digunakan berikutnya, dan
Perempuan Penjualan seterusnya. Jika sistem tertentu tidak digunakan
Akuntansi sama sekali di kantor Anda, beri angka 0 di
Keuangan sebelahnya.
Personil
LITBANG Apple Hewlett-Packard
Lainnya (sebutkan) Compaq IBM
216 METODE PENELITIAN UNTUK BISNIS

Comp USA Packard Bell


Dell Computer Sony
Gerbang Toshiba
Lainnya (Sebutkan)
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 217

2. Beri peringkat pada kota-kota yang tercantum di Penggunaan skala interval


bawah ini sesuai dengan urutan yang Anda anggap
Skala interval (perhatikan bahwa skala Likert - secara
cocok untuk membuka pabrik baru. Kota yang
formal merupakan skala ordinal - digunakan dalam
dianggap paling sesuai harus berada di peringkat
contoh berikut ini) digunakan ketika respons
1, 2 berikutnya, dan seterusnya.
terhadap berbagai item yang mengukur variabel
dapat disadap pada skala lima poin (atau tujuh poin
Cincinnati Milwaukee atau jumlah poin lainnya), yang kemudian dapat
Detroit 3. Pittsburgh dijumlahkan di seluruh item. Lihat contoh skala
Des Moines St Louis Likert berikut ini.
Houston Dengan menggunakan skala di bawah ini,
mohon tunjukkan tanggapan Anda terhadap setiap
pertanyaan yang ada, dengan melingkari angka yang
paling menggambarkan perasaan Anda.

Baik
Sangat Setuju Sangat
Tidak Tidak Tidak
Tidaksetuju
juga Setuju. Setuju.
setuju setuju
1 2 3 4 5
1. Pekerjaan saya memberikan saya kesempatan 1 2 3 4 5
untuk menguji diri saya sendiri dan
kemampuan.
2. Menguasai pekerjaan ini sangat berarti bagi saya. 1 2 3 4 5
3. Melakukan pekerjaan ini dengan baik adalah 1 2 3 4 5
sebuah penghargaan tersendiri.
4. Mempertimbangkan waktu yang dihabiskan 1 2 3 4 5
benar-benar
untuk pekerjaanmemahami tugas-tugas saya dan
ini, saya merasa

tanggung jawab.

Penggunaan skala rasio di bawah usia 3 tahun


Skala rasio biasanya digunakan dalam penelitian antara 3 dan 6
bisnis ketika angka pasti tentang faktor objektif lebih dari 6 tahun tetapi di bawah 12 tahun
(bukan subjektif) diperlukan, seperti pada 12 tahun ke atas
pertanyaan-pertanyaan berikut:
3. Berapa banyak gerai ritel yang Anda operasikan?
1. Berapa banyak organisasi lain yang pernah Anda
ikuti sebelum bergabung dengan sistem ini? Jawaban atas pertanyaan-pertanyaan tersebut dapat
2. Mohon sebutkan jumlah anak yang Anda miliki di berkisar dari 0 hingga angka yang masuk akal.
masing-masing kategori berikut:

Tinjauan timbangan
Empat skala yang dapat diterapkan pada pengukuran variabel adalah skala nominal, ordinal, interval, dan rasio.
218 METODE PENELITIAN UNTUK BISNIS

Skala nominal menyoroti perbedaan dengan mengklasifikasikan objek atau orang ke dalam kelompok-kelompok,
dan
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 219

memberikan informasi paling sedikit tentang variabel. Skala ordinal memberikan beberapa informasi
tambahan dengan mengurutkan peringkat kategori skala nominal. Skala interval tidak hanya mengurutkan
peringkat, tetapi juga memberikan informasi tentang besarnya perbedaan dalam variabel. Skala rasio tidak
hanya menunjukkan besarnya perbedaan, tetapi juga proporsinya. Perkalian atau pembagian akan
mempertahankan rasio ini. Ketika kita beralih dari skala nominal ke skala rasio, kita memperoleh ketepatan
yang semakin meningkat dalam mengukur data, dan fleksibilitas yang lebih besar dalam menggunakan uji
statistik yang lebih kuat. Oleh karena itu, jika memungkinkan dan sesuai, skala yang lebih kuat daripada skala
yang kurang kuat harus digunakan untuk mengukur variabel-variabel yang diminati.
Teknik penskalaan spesifik yang biasa digunakan dalam penelitian bisnis dapat diklasifikasikan ke dalam
skala peringkat dan skala peringkat. Dalam skala peringkat, setiap objek diukur secara independen dari objek
lain yang diteliti. Skala peringkat, di sisi lain, membuat perbandingan antara atau di antara objek-objek dan
memperoleh pilihan dan peringkat yang disukai di antara mereka. Skala peringkat dan peringkat spesifik akan
dibahas selanjutnya.

SKALA PEMERINGKATAN
Skala penilaian berikut ini sering digunakan dalam penelitian bisnis:

● Skala dikotomis
● Skala kategori
● Skala diferensial semantik
● Skala numerik
● Skala penilaian yang diperinci
● Skala Likert
● Skala penilaian jumlah tetap atau konstan
● Skala stapel
● Skala penilaian grafis
● Skala konsensus

Skala lain, seperti Skala Interval Muncul Sama Thurstone, dan skala multidimensi, lebih jarang digunakan.
Kami akan menjelaskan secara singkat masing-masing skala sikap di atas.

Skala dikotomis
Skala dikotomis digunakan untuk mendapatkan jawaban Ya atau Tidak, seperti pada contoh di bawah ini.
Perhatikan bahwa skala nominal digunakan untuk mendapatkan respons.

CONTOH
Apakah Anda Ya. Ti
memiliki mobil? da
k.
220 METODE PENELITIAN UNTUK BISNIS

Skala kategori
Skala kategori menggunakan beberapa item untuk memperoleh satu respons, seperti contoh berikut. Ini juga
menggunakan skala nominal.

CONTOH
Di mana Anda tinggal di London?
London Timur
London Selatan
London Barat
London Utara
Pinggiran

Skala diferensial semantik


Beberapa atribut bipolar diidentifikasi pada ujung-ujung skala, dan responden diminta untuk menunjukkan
sikap mereka, pada apa yang disebut ruang semantik, terhadap individu, objek, atau peristiwa tertentu pada
masing-masing atribut. Kata sifat bipolar yang digunakan dapat menggunakan istilah seperti Baik-Buruk;
Kuat-Lemah; Panas-Dingin. Skala diferensial semantik digunakan untuk menilai sikap responden terhadap
merek, iklan, objek, atau individu tertentu. Tanggapan-tanggapan tersebut dapat diplot untuk mendapatkan
gambaran yang baik tentang persepsi mereka. Skala diferensial semantik bersifat ordinal. Namun, sering kali
diperlakukan sebagai skala interval. Contoh skala diferensial semantik adalah sebagai berikut.

CONTOH
Responsif ------ Tidak
Cantik ------ responsif
Berani ------ Jelek
Pemalu

Skala numerik
Skala numerik mirip dengan skala diferensial semantik, dengan perbedaan bahwa angka pada skala lima poin
atau tujuh poin disediakan, dengan kata sifat bipolar di kedua ujungnya, seperti yang diilustrasikan di bawah
ini. Skala ini juga sering diperlakukan sebagai skala interval, meskipun secara formal bersifat ordinal.

CONTOH
Seberapa senangkah Anda dengan agen real estate baru Anda?
Sangat Senang7 6 5 4 3 2 1 Sangat Tidak Senang
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 221

Skala penilaian yang diperinci


Skala lima poin atau tujuh poin dengan jangkar, sesuai kebutuhan, disediakan untuk setiap item dan
responden menyatakan nomor yang sesuai di sisi setiap item, atau melingkari nomor yang relevan pada setiap
item, sesuai dengan contoh soal yang ada. Tanggapan terhadap item-item tersebut kemudian dijumlahkan. Ini
menggunakan skala interval.
CONTOH
Jawablah setiap pertanyaan dengan menggunakan skala di bawah ini, dan tunjukkan nomor jawaban
Anda pada baris di samping setiap pertanyaan.

1 2 Baik Tidak
3 4 5
Sangat Tidak Tidak Mungkin Mung Sangat
Mungkin mungki Maupun dalam waktu 12 bulan
Saya akan berganti pekerjaan kin Mungkin
1 nke depan. Saya akan
Mungkin
menerima tugas baru dalam -
2 waktu dekat. -
3 Ada kemungkinan bahwa saya akan keluar dari organisasi -
ini dalam waktu
Perhatikan bahwa di atas adalah skala penilaian yang seimbang
12 bulan ke depan.
dengan titik netral.
Sama Agak Cukup Sangat
Sekali Tertarik Tertarik Tertarik
Tidak
kebijakan organisasi saat ini? Tertarik
1 2 3 4
Bagaimana
Ini Andapenilaian
adalah skala menilai minat Andaseimbang
yang tidak untuk yang tidak
1 memiliki 2 3 4
berubah
titik netral.

Skala penilaian terinci memberikan fleksibilitas untuk menggunakan sebanyak mungkin poin dalam skala
yang dianggap perlu (4, 5, 7, 9, atau berapa pun), dan juga memungkinkan untuk menggunakan jangkar yang
berbeda (mis., Sangat Tidak Penting hingga Sangat Penting; Sangat Rendah hingga Sangat Tinggi). Ketika titik
netral disediakan, ini adalah skala penilaian yang seimbang, dan ketika tidak, ini adalah skala penilaian yang
tidak seimbang.
Penelitian menunjukkan bahwa skala lima poin sama bagusnya dengan skala lainnya, dan bahwa
peningkatan dari lima menjadi tujuh atau sembilan poin pada skala penilaian tidak meningkatkan keandalan
penilaian (Elmore & Beggs, 1975).
Skala penilaian terinci sering digunakan dalam penelitian bisnis, karena skala ini menyesuaikan diri
dengan jumlah poin yang ingin digunakan oleh peneliti, serta nomenklatur jangkar, yang dianggap perlu
untuk menyesuaikan kebutuhan peneliti untuk menyadap variabel.

Skala Likert
Skala Likert dirancang untuk memeriksa seberapa kuat subjek setuju atau tidak setuju dengan pernyataan pada
skala lima poin dengan jangkar berikut:
222 METODE PENELITIAN UNTUK BISNIS

Sangat Tidak Setuju Tidak Tidak Setuju atau Tidak Setuju. Sangat Setuju
setuju Setuju
1 2 3 4 5
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 223

Tanggapan atas sejumlah item yang menyentuh konsep atau variabel tertentu dapat dianalisis item per
item, tetapi juga memungkinkan untuk menghitung skor total atau penjumlahan untuk setiap responden
dengan menjumlahkan seluruh item. Pendekatan penjumlahan banyak digunakan, dan oleh karena itu skala
Likert juga disebut sebagai skala penjumlahan.
Pada contoh berikut, skor pada item kedua harus dibalik sebelum menghitung skor total, karena skor yang
tinggi pada item ini mencerminkan sikap yang kurang baik terhadap pekerjaan, sedangkan skor yang tinggi
pada item 1 dan 3 mencerminkan sikap yang baik terhadap pekerjaan. Hal ini akan menghasilkan skor total
yang tinggi untuk responden yang memiliki sikap yang baik terhadap pekerjaan dan skor total yang rendah
untuk responden yang memiliki sikap yang tidak baik terhadap pekerjaan.
CONTOH
Dengan menggunakan skala Likert sebelumnya, nyatakan sejauh mana Anda setuju dengan setiap pernyataan berikut ini:

Pekerjaan saya sangat menarik 1 2 3 4 5


Saya tidak asyik dengan pekerjaan saya 1 2 3 4 5
sepanjang hari
Hidup tanpa pekerjaan saya akan 1 2 3 4 5
membosankan

Apakah skala Likert merupakan skala ordinal atau interval adalah subjek yang banyak diperdebatkan.
Orang yang memperlakukan skala Likert sebagai skala ordinal berpendapat bahwa seseorang tidak dapat
mengasumsikan bahwa semua pasangan tingkat yang berdekatan memiliki jarak yang sama. Meskipun demikian,
skala Likert umumnya diperlakukan sebagai skala interval.

Skala jumlah tetap atau konstan


Di sini, responden diminta untuk mendistribusikan sejumlah poin ke berbagai item seperti contoh di bawah
ini. Ini lebih bersifat skala ordinal.

CONTOH
Dalam memilih sabun mandi, tunjukkan tingkat kepentingan yang Anda berikan pada masing-masing dari lima
aspek berikut ini dengan memberikan poin untuk setiap aspek dengan total keseluruhan 100 poin.

Wewangian -
Warna -
Bentuk -
Ukuran -
Tekstur busa -
Total poin 100

Skala stapel
Skala ini secara simultan mengukur arah dan intensitas sikap terhadap item yang diteliti. Karakteristik yang
menarik untuk diteliti ditempatkan di tengah dengan skala numerik yang berkisar, katakanlah, dari +3 hingga -3,
224 METODE PENELITIAN UNTUK BISNIS

di kedua sisi item, seperti yang diilustrasikan dalam contoh di bawah ini. Hal ini memberikan gambaran
tentang seberapa dekat atau jauhnya respons individu terhadap stimulus. Karena ini tidak memiliki titik nol
absolut, maka ini adalah skala interval.
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 225

CONTOH
Nyatakan bagaimana Anda menilai kemampuan supervisor Anda sehubungan dengan setiap karakteristik yang
disebutkan di bawah ini, dengan melingkari nomor yang sesuai.
+3 +3 +3
+2 +2 +2
+1 +1 +1
Mengadopsi teknologi modern Inovasi produk Keterampilan
interpersonal
-1 -1 -1
-2 -2 -2
-3 -3 -3

Skala penilaian grafis


Representasi grafis membantu responden untuk menunjukkan pada skala ini jawaban mereka terhadap
pertanyaan tertentu dengan memberikan tanda pada titik yang sesuai pada garis, seperti pada contoh berikut.
Ini adalah skala ordinal, meskipun contoh berikut ini mungkin terlihat seperti skala interval.

CONTOH
Dalam skala 1 sampai 10, - 10 Sangat
bagaimana Anda menilai baik
supervisor Anda? -
-
-
-
- 5 Memadai
-
-
-
- 1 Sangat
buruk

Skala ini mudah untuk ditanggapi. Deskripsi singkat pada poin-poin skala dimaksudkan sebagai panduan
dalam menentukan peringkat dan bukan mewakili kategori yang terpisah. Skala wajah, yang menggambarkan
wajah mulai dari tersenyum hingga sedih (diilustrasikan pada Bab 9), juga merupakan skala penilaian grafis
yang digunakan untuk mendapatkan tanggapan mengenai perasaan orang sehubungan dengan beberapa aspek
- misalnya, bagaimana perasaan mereka tentang pekerjaan mereka.
226 METODE PENELITIAN UNTUK BISNIS

Skala konsensus
Skala juga dapat dikembangkan melalui konsensus, di mana panel juri memilih item-item tertentu yang
menurut mereka dapat mengukur konsep yang relevan. Item-item tersebut dipilih terutama berdasarkan
kesesuaian atau relevansinya dengan konsep. Skala konsensus semacam itu dikembangkan setelah item-item
yang dipilih diperiksa dan diuji validitas dan reliabilitasnya. Salah satu skala konsensus tersebut adalah
Thurstone Equal Appearing Interval Scale, di mana sebuah konsep diukur melalui proses yang kompleks yang
diikuti oleh panel juri. Dengan menggunakan setumpuk kartu yang berisi beberapa deskripsi konsep, panel
juri memberikan masukan untuk mengindikasikan seberapa dekat atau tidaknya pernyataan-pernyataan
tersebut dengan konsep yang diteliti. Skala kemudian dikembangkan berdasarkan konsensus yang dicapai.
Namun, skala ini jarang digunakan untuk mengukur konsep organisasi karena waktu yang diperlukan untuk
mengembangkannya.

Timbangan lainnya
Ada juga beberapa metode penskalaan tingkat lanjut seperti penskalaan multidimensi, di mana objek, orang,
atau keduanya, diskalakan secara visual, dan analisis konjoin dilakukan. Hal ini memberikan gambaran visual
tentang hubungan dalam ruang di antara dimensi-dimensi sebuah konstruk.
Perlu dicatat bahwa Likert atau beberapa bentuk skala numerik adalah yang paling sering digunakan
untuk mengukur sikap dan perilaku dalam penelitian bisnis.

SKALA PERINGKAT
Seperti yang telah disebutkan, skala peringkat digunakan untuk menyadap preferensi di antara dua atau di
antara beberapa objek atau item (bersifat ordinal). Namun, peringkat tersebut mungkin tidak memberikan
petunjuk yang pasti untuk beberapa jawaban yang dicari. Sebagai contoh, katakanlah ada empat lini produk
dan manajer mencari informasi yang dapat membantu memutuskan lini produk mana yang harus
mendapatkan perhatian paling besar. Anggaplah 35% responden memilih produk pertama, 25% produk kedua,
dan 20% memilih produk ketiga dan keempat sebagai produk yang paling penting bagi mereka. Maka, periset
tidak dapat menyimpulkan bahwa produk pertama adalah yang paling disukai, karena 65% responden tidak
memilih produk tersebut! Metode alternatif yang digunakan adalah perbandingan berpasangan, pilihan paksa,
dan skala komparatif, yang akan dibahas di bawah ini.

Perbandingan berpasangan
Skala perbandingan berpasangan digunakan ketika, di antara sejumlah kecil objek, responden diminta untuk
memilih di antara dua objek sekaligus. Hal ini membantu untuk menilai preferensi. Jika, misalnya, dalam
contoh sebelumnya, selama perbandingan berpasangan, responden secara konsisten menunjukkan preferensi
untuk produk satu daripada produk dua, tiga, dan empat, manajer dapat dengan andal memahami lini produk
mana yang menuntut perhatian penuh. Namun, ketika jumlah objek yang akan dibandingkan meningkat,
begitu pula jumlah perbandingan berpasangan. Jumlah pilihan berpasangan untuk n objek adalah (n)(n - 1)/2.
Semakin banyak jumlah objek atau stimulus, semakin banyak jumlah perbandingan berpasangan yang
disajikan kepada responden, dan semakin besar pula kelelahan responden. Oleh karena itu, perbandingan
berpasangan merupakan metode yang baik jika jumlah stimulus yang disajikan sedikit.

Pilihan yang dipaksakan


CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 227

Pilihan paksa memungkinkan responden untuk mengurutkan objek secara relatif satu sama lain, di antara
alternatif yang disediakan. Hal ini lebih mudah bagi responden, terutama jika jumlah pilihan yang harus diberi
peringkat terbatas.
228 METODE PENELITIAN UNTUK BISNIS

CONTOH
Beri peringkat pada majalah yang ingin Anda langgani sesuai dengan urutan preferensi, dengan memberi angka
1 untuk pilihan yang paling disukai dan 5 untuk pilihan yang paling tidak disukai.

Keberuntungan -
Playboy -
Waktu -
Orang -
Pencegahan -

Skala perbandingan
Skala komparatif memberikan tolok ukur atau titik acuan untuk menilai sikap terhadap objek, peristiwa, atau situasi
yang sedang diteliti. Contoh penggunaan skala komparatif adalah sebagai berikut.

CONTOH
Dalam kondisi keuangan yang tidak menentu, dibandingkan dengan saham, seberapa bijak atau
bermanfaatkah berinvestasi dalam obligasi negara? Mohon lingkari jawaban yang sesuai.

Lebih Hampir sama 3 Kurang


berma 2 4 berm
nfaat 1 anfaa
t5

Singkatnya, data nominal cocok untuk skala dikotomis atau kategori; data ordinal cocok untuk salah satu
skala peringkat - perbandingan berpasangan, pilihan paksa, atau skala komparatif; dan data interval atau data
seperti interval cocok untuk skala peringkat lainnya, seperti yang terlihat dari berbagai contoh di atas.
Perbedaan semantik dan skala numerik, sebenarnya, bukanlah skala interval, meskipun sering diperlakukan
seperti itu dalam analisis data.
Skala peringkat digunakan untuk mengukur sebagian besar konsep perilaku. Skala peringkat digunakan
untuk membuat perbandingan atau memberi peringkat pada variabel yang telah disadap pada skala nominal.

DIMENSI INTERNASIONAL DARI PENSKALAAN


Selain kepekaan terhadap definisi operasional konsep dalam budaya lain, masalah penskalaan juga perlu
diperhatikan dalam penelitian lintas budaya. Budaya yang berbeda bereaksi secara berbeda terhadap masalah
penskalaan. Sebagai contoh, skala lima poin atau tujuh poin mungkin tidak ada bedanya di Amerika Serikat,
tetapi bisa jadi berbeda dalam respon subjek di negara lain (lihat Sekaran & Martin, 1982; Sekaran & Trafton,
1978). Barry (1969), misalnya, menemukan bahwa di beberapa negara, skala tujuh poin lebih sensitif daripada
skala empat poin dalam memunculkan respon yang tidak bias.
Penelitian terbaru menunjukkan bahwa orang-orang dari berbagai negara berbeda dalam hal
kecenderungan mereka untuk menggunakan skala penilaian yang ekstrem (misalnya 1 dan 5 atau 1 dan 7) dan
untuk merespons dengan cara yang diinginkan secara sosial (De Jong,
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 229

2006). Temuan-temuan ini menggambarkan bahwa menganalisis dan menginterpretasikan data yang
dikumpulkan di berbagai negara merupakan pekerjaan yang sangat menantang.

KEBAIKAN TINDAKAN
Setelah kita melihat bagaimana mendefinisikan variabel secara operasional dan menerapkan teknik penskalaan
yang berbeda, penting untuk memastikan bahwa instrumen yang kita kembangkan untuk mengukur konsep
tertentu benar-benar mengukur variabel tersebut secara akurat, dan pada kenyataannya, kita benar-benar
mengukur konsep yang ingin kita ukur. Hal ini memastikan bahwa dalam mendefinisikan variabel persepsi dan
sikap secara operasional, kita tidak mengabaikan beberapa dimensi dan elemen penting atau memasukkan
beberapa dimensi dan elemen yang tidak relevan. Skala yang dikembangkan sering kali tidak sempurna, dan
kesalahan rentan terjadi dalam pengukuran variabel sikap. Penggunaan instrumen yang lebih baik akan
memastikan hasil yang lebih akurat, yang pada gilirannya akan meningkatkan kualitas ilmiah penelitian. Oleh
karena itu, dalam beberapa hal, kita perlu menilai "kebaikan" dari pengukuran yang dikembangkan. Artinya,
kita harus cukup yakin bahwa instrumen yang kita gunakan dalam penelitian kita memang mengukur variabel
yang seharusnya, dan bahwa instrumen tersebut mengukurnya secara akurat.
Sekarang mari kita lihat bagaimana kita dapat memastikan bahwa pengukuran yang dikembangkan cukup
baik. Pertama, analisis item dari jawaban-jawaban atas pertanyaan-pertanyaan yang menyadap variabel
dilakukan, dan kemudian reliabilitas dan validitas dari ukuran-ukuran tersebut ditetapkan, seperti yang
dijelaskan di bawah ini.

Analisis item
Analisis butir soal dilakukan untuk melihat apakah butir-butir soal dalam instrumen sudah sesuai atau belum.
Setiap item diperiksa kemampuannya untuk mendiskriminasi antara subjek yang memiliki skor total tinggi
dan subjek yang memiliki skor rendah. Dalam analisis item, rata-rata antara kelompok dengan skor tinggi dan
kelompok dengan skor rendah diuji untuk mendeteksi perbedaan yang signifikan melalui nilai-t. Item-item
dengan nilai t yang tinggi (tes yang mampu mengidentifikasi item-item yang sangat diskriminatif dalam
instrumen) kemudian dimasukkan ke dalam instrumen. Setelah itu, uji reliabilitas instrumen dilakukan dan
validitas ukuran ditetapkan.
Secara singkat, reliabilitas adalah uji seberapa konsisten alat ukur mengukur konsep apa pun yang
diukurnya. Validitas adalah pengujian seberapa baik instrumen yang dikembangkan mengukur konsep
tertentu yang ingin diukur. Dengan kata lain, validitas berkaitan dengan apakah kita mengukur konsep yang
tepat, dan reliabilitas berkaitan dengan stabilitas dan konsistensi pengukuran. Validitas dan reliabilitas
pengukuran membuktikan ketelitian ilmiah yang telah dilakukan dalam studi penelitian. Kedua kriteria ini
sekarang akan dibahas. Berbagai bentuk reliabilitas dan validitas digambarkan dalam Gambar 12.1.

Validitas
Pada Bab 10, kita telah membahas istilah validitas internal dan validitas eksternal dalam konteks desain
eksperimental. Artinya, kita akan membahas masalah keaslian hubungan sebab-akibat (validitas internal), dan
kemampuan generalisasinya terhadap lingkungan eksternal (validitas eksternal). Untuk saat ini, kita akan
memeriksa validitas alat ukur itu sendiri. Artinya, ketika kita mengajukan serangkaian pertanyaan (yaitu,
mengembangkan alat ukur) dengan harapan bahwa kita sedang mengukur konsep, bagaimana kita bisa yakin
bahwa kita memang mengukur konsep yang ingin kita ukur dan bukan yang lain? Hal ini dapat ditentukan
dengan menerapkan uji validitas tertentu.
Beberapa jenis uji validitas digunakan untuk menguji kebaikan ukuran dan penulis menggunakan istilah
yang berbeda untuk menunjukkannya. Demi kejelasan, kita dapat mengelompokkan uji validitas di bawah tiga
230 METODE PENELITIAN UNTUK BISNIS

judul besar: validitas isi, validitas terkait kriteria, dan validitas konstruk.
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 231

Keandalan tes-retes
Stabilita
s
Keandalan bentuk paralel
Keandala
n
Reliabilitas konsistensi antaritem

Kebaikan Konsistensi
data Keandalan split-half
Validitas
(apakah
kita
mengukur
hal yang
benar?)

Keabsahan Validitas terkait Validitas


logis (isi) kriteria kongruen
(konstruk)

Validitas Prediksi Bersamaan Konvergen Diskriminatif


wajah
GAMBAR
12.1
Menguji kebaikan ukuran: bentuk-bentuk reliabilitas dan validitas

Validitas isi
Validitas isi memastikan bahwa ukuran tersebut mencakup seperangkat item yang memadai dan representatif
yang menyentuh konsep. Semakin banyak item skala yang mewakili domain atau semesta dari konsep yang
diukur, semakin besar validitas isinya. Dengan kata lain, validitas isi adalah fungsi dari seberapa baik dimensi
dan elemen dari sebuah konsep telah digambarkan.
Sebuah panel juri dapat membuktikan validitas isi dari instrumen tersebut. Kidder dan Judd (1986)
mengutip contoh di mana sebuah tes yang dirancang untuk mengukur derajat gangguan bicara dapat dianggap
memiliki validitas jika dievaluasi oleh sekelompok juri ahli (misalnya, terapis wicara profesional).
Validitas muka dianggap oleh beberapa orang sebagai indeks dasar dan minimum dari validitas isi.
Validitas muka menunjukkan bahwa item yang dimaksudkan untuk mengukur suatu konsep, pada dasarnya
terlihat seperti mengukur konsep tersebut. Beberapa peneliti tidak menganggap validitas muka sebagai
komponen yang valid dari validitas isi.

Validitas terkait kriteria


Validitas terkait kriteria ditetapkan ketika ukuran membedakan individu pada kriteria yang diharapkan
untuk diprediksi. Hal ini dapat dilakukan dengan menetapkan validitas konkuren atau validitas prediktif,
seperti yang dijelaskan di bawah ini.
Validitas konkuren ditetapkan ketika skala mendiskriminasi individu yang diketahui berbeda; yaitu,
mereka harus mendapat skor berbeda pada instrumen, seperti pada contoh berikut.
232 METODE PENELITIAN UNTUK BISNIS

CONTOH
Jika ukuran etos kerja dikembangkan dan diberikan pekerjaan untuk menjadi milik mereka sendiri.
kepada sekelompok penerima kesejahteraan, skala Sebaliknya, mereka yang memiliki nilai etos kerja
tersebut harus dapat membedakan antara mereka yang rendah, mungkin akan memanfaatkan kesempatan
yang antusias menerima pekerjaan dan senang untuk bertahan hidup dengan kesejahteraan selama
dengan kesempatan untuk keluar dari kesejahteraan, mungkin, dan menganggap pekerjaan sebagai sesuatu
dengan mereka yang tidak ingin bekerja, bahkan yang membosankan. Jika kedua jenis individu ini
ketika ditawari pekerjaan. Jelas, mereka yang memiliki skor yang sama dalam skala etos kerja, maka
memiliki nilai etos kerja yang tinggi tidak ingin tes ini bukanlah ukuran etos kerja, melainkan sesuatu
menjadi penerima kesejahteraan dan mendambakan yang lain.

Validitas prediktif menunjukkan kemampuan alat ukur untuk membedakan antara individu dengan mengacu
pada kriteria di masa depan.

CONTOH
Jika tes bakat atau kemampuan yang diberikan maka mereka yang mendapat nilai rendah dalam tes
kepada karyawan pada saat perekrutan adalah untuk t e r s e b u t seharusnya berkinerja buruk dan
membedakan individu berdasarkan kinerja pekerjaan mereka yang mendapat nilai tinggi berkinerja baik.
mereka di masa depan,

Validitas konstruk
Validitas konstruk menunjukkan seberapa baik hasil yang diperoleh dari penggunaan alat ukur sesuai dengan
teori-teori yang melandasi perancangan tes. Hal ini dinilai melalui validitas konvergen dan diskriminan, yang
dijelaskan di bawah ini.
Validitas konvergen ditetapkan ketika skor yang diperoleh dengan dua instrumen berbeda yang
mengukur konsep yang sama berkorelasi tinggi.
Validitas diskriminan ditetapkan ketika, berdasarkan teori, dua variabel diprediksi tidak berkorelasi, dan
skor yang diperoleh dengan mengukurnya memang secara empiris ditemukan demikian. Dengan demikian,
validitas dapat dibangun dengan berbagai cara. Pengukuran yang dipublikasikan untuk berbagai konsep
biasanya melaporkan jenis validitas yang telah ditetapkan untuk instrumen tersebut, sehingga pengguna atau
pembaca dapat menilai "kebaikan" dari pengukuran tersebut. Tabel 12.2 merangkum jenis-jenis validitas yang
dibahas di sini.
Beberapa cara yang dapat digunakan untuk menetapkan bentuk validitas di atas adalah sebagai berikut:

1. Analisis korelasional (seperti dalam hal menetapkan validitas konkuren dan prediktif atau validitas
konvergen dan diskriminan).
2. Analisis faktor, sebuah teknik multivariat yang mengonfirmasi dimensi-dimensi konsep yang telah
didefinisikan secara operasional, serta mengindikasikan item-item mana yang paling tepat untuk
setiap dimensi (membangun validitas konstruk).
3. Matriks korelasi multitrait dan multimetode yang berasal dari pengukuran konsep dengan berbagai
bentuk dan metode yang berbeda, juga menetapkan ketahanan pengukuran.
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 233

Singkatnya, kebaikan ukuran ditetapkan melalui berbagai jenis validitas dan reliabilitas yang digambarkan
dalam Gambar 12.1. Hasil dari setiap penelitian hanya dapat sebaik ukuran yang memanfaatkan konsep-konsep
dalam teori
234 METODE PENELITIAN UNTUK BISNIS

TA B L E 12 .2
Jenis validitas

Validitas Deskripsi
Validitas isi Apakah ukuran tersebut cukup mengukur konsepnya?
Validitas wajah Apakah "para ahli" memvalidasi bahwa instrumen tersebut mengukur apa yang disarankan
oleh namanya?
Validitas terkait kriteria Apakah ukuran tersebut membedakan dengan cara yang membantu memprediksi variabel
kriteria?
Validitas bersamaan Apakah ukuran tersebut membedakan dengan cara yang membantu memprediksi variabel
kriteria
saat ini?
Validitas prediktif Apakah ukuran tersebut membedakan individu dengan cara yang membantu memprediksi
masa depan
kriteria?
Validitas konstruk Apakah instrumen ini memanfaatkan konsep seperti yang diteorikan?
Validitas konvergen Apakah dua instrumen yang mengukur konsep berkorelasi tinggi?
Validitas diskriminan Apakah ukuran tersebut memiliki korelasi yang rendah dengan variabel yang seharusnya
tidak berhubungan
ke variabel ini?

kerangka kerja. Kita perlu menggunakan ukuran yang tervalidasi dengan baik dan dapat diandalkan untuk
memastikan bahwa penelitian kita bersifat ilmiah. Untungnya, ukuran-ukuran telah dikembangkan untuk banyak
konsep penting dalam penelitian bisnis dan sifat-sifat psikometriknya (yaitu, keandalan dan validitas) yang ditetapkan
oleh para pengembang. Dengan demikian, para peneliti dapat menggunakan instrumen yang sudah terkenal "baik",
daripada harus bersusah payah mengembangkan ukuran mereka sendiri. Namun, ketika menggunakan instrumen-
instrumen tersebut, peneliti harus mengutip sumbernya (yaitu, penulis dan referensi) sehingga pembaca dapat
mencari informasi lebih lanjut jika diperlukan.
Bukan hal yang tidak biasa jika dua atau lebih ukuran yang sama baiknya dikembangkan untuk konsep
yang sama. Sebagai contoh, ada beberapa instrumen yang berbeda untuk mengukur konsep "kepuasan kerja".
Salah satu skala yang paling sering digunakan untuk tujuan ini adalah Job Descriptive Index (JDI) yang
dikembangkan oleh Smith, Kendall, dan Hulin (1969). Ketika ada lebih dari satu skala untuk variabel apa pun,
akan lebih baik untuk menggunakan ukuran yang memiliki reliabilitas dan validitas yang lebih baik, dan juga
lebih sering digunakan.
Terkadang, kita juga harus mengadaptasi ukuran yang sudah ada agar sesuai dengan lingkungan. Sebagai
contoh, skala yang digunakan untuk mengukur kinerja pekerjaan, karakteristik pekerjaan, atau kepuasan kerja
di industri manufaktur mungkin harus sedikit dimodifikasi agar sesuai dengan perusahaan utilitas atau
organisasi perawatan kesehatan. Lingkungan kerja dalam setiap kasus berbeda dan kata-kata dalam instrumen
mungkin harus diadaptasi secara tepat. Namun, dalam melakukan hal ini, kita tetap berpegang pada skala yang
sudah ada, dan disarankan untuk mengujinya kembali untuk mengetahui kecukupan validitas dan
reliabilitasnya. Contoh dari beberapa ukuran yang digunakan untuk menyadap beberapa konsep yang sering
diteliti dalam manajemen dan maritim.
Area keting disediakan dalam lampiran bab ini.
Terakhir, penting untuk dicatat bahwa validitas adalah syarat yang diperlukan tetapi tidak cukup untuk
menguji kebaikan suatu ukuran. Suatu ukuran tidak hanya harus valid tetapi juga dapat diandalkan. Suatu
ukuran dapat diandalkan jika memberikan hasil yang konsisten. Sekarang kita akan membahas konsep
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 235

reliabilitas.

Keandalan
Keandalan suatu ukuran menunjukkan sejauh mana ukuran tersebut tanpa bias (bebas dari kesalahan) dan
karenanya memastikan pengukuran yang konsisten dari waktu ke waktu dan di berbagai item dalam
instrumen. Dengan kata lain, reliabilitas suatu ukuran merupakan indikasi stabilitas dan konsistensi instrumen
dalam mengukur konsep dan membantu menilai "kebaikan" suatu ukuran.
236 METODE PENELITIAN UNTUK BISNIS

Stabilitas tindakan
Kemampuan suatu ukuran untuk tetap sama dari waktu ke waktu - meskipun kondisi pengujian yang tidak
terkendali atau kondisi responden itu sendiri - menunjukkan stabilitas dan kerentanan yang rendah terhadap
perubahan situasi. Hal ini membuktikan "kebaikannya" karena konsep tersebut diukur secara stabil, tidak
peduli kapan pun pengukuran dilakukan. Dua uji stabilitas adalah reliabilitas tes-retes dan reliabilitas bentuk
paralel.

Reliabilitas tes-retes Koefisien reliabilitas yang diperoleh dengan mengulang pengukuran yang sama untuk
kedua kalinya disebut reliabilitas tes-retes. Artinya, ketika sebuah kuesioner yang berisi beberapa item yang
diajukan untuk mengukur sebuah konsep diberikan kepada sekumpulan responden, sekarang dan sekali lagi
kepada responden yang sama, katakanlah beberapa minggu hingga enam bulan kemudian, maka korelasi
antara skor yang diperoleh pada dua waktu yang berbeda dari sekumpulan responden yang sama disebut
dengan koefisien test-retest. Semakin tinggi koefisien tersebut, semakin baik reliabilitas tes-retes dan,
akibatnya, semakin stabil ukuran tersebut dari waktu ke waktu.

Reliabilitas bentuk paralel Ketika respons pada dua set pengukuran yang sebanding yang mengukur
konstruk yang sama berkorelasi tinggi, kita memiliki reliabilitas bentuk paralel. Kedua bentuk tersebut
memiliki item yang sama dan format respon yang sama, satu-satunya perubahan adalah susunan kata dan
urutan pertanyaan. Apa yang kami coba tentukan di sini adalah variabilitas kesalahan yang dihasilkan dari
susunan kata dan urutan pertanyaan. Jika dua bentuk yang sebanding berkorelasi tinggi (katakanlah 8 atau
lebih), kita mungkin cukup yakin bahwa ukuran-ukuran tersebut cukup dapat diandalkan, dengan variabilitas
kesalahan minimal yang disebabkan oleh susunan kata, urutan, atau faktor lainnya.

Konsistensi internal dari tindakan-tindakan


Konsistensi internal dari pengukuran menunjukkan homogenitas item-item dalam pengukuran yang
mengetes konstruk. Dengan kata lain, item-item tersebut harus "saling terkait sebagai satu kesatuan," dan
mampu mengukur konsep yang sama secara independen sehingga responden memberikan makna keseluruhan
yang sama pada setiap item. Hal ini dapat dilihat dengan memeriksa apakah item-item dan subset dari item-
item dalam alat ukur berkorelasi tinggi. Konsistensi dapat diperiksa melalui uji reliabilitas konsistensi antar
item dan reliabilitas belah dua.

Reliabilitas konsistensi interitem Reliabilitas konsistensi interitem adalah uji konsistensi jawaban
responden terhadap semua item dalam suatu pengukuran. Sejauh item-item tersebut merupakan ukuran
independen dari konsep yang sama, maka item-item tersebut akan berkorelasi satu sama lain. Uji reliabilitas
konsistensi antar item yang paling populer adalah koefisien alpha Cronbach (Cronbach, 1946), yang
digunakan untuk item-item berskala banyak, dan formula Kuder-Richardson (Kuder & Richardson, 1937),
yang digunakan untuk item-item yang bersifat dikotomis. Semakin tinggi koefisien reliabilitasnya, semakin
baik alat ukur tersebut.

Reliabilitas belah dua Reliabilitas belah dua mencerminkan korelasi antara dua bagian instrumen.
Estimasi akan bervariasi tergantung pada bagaimana item dalam pengukuran dibagi menjadi dua bagian.
Reliabilitas belah dua mungkin lebih tinggi daripada alpha Cronbach hanya dalam keadaan ada lebih dari satu
dimensi respons yang mendasari yang disadap oleh pengukuran dan ketika kondisi tertentu lainnya juga
terpenuhi (untuk detail lengkap, lihat Campbell, 1976). Oleh karena itu, dalam hampir semua kasus, alpha
Cronbach dapat dianggap sebagai indeks yang sangat memadai untuk reliabilitas konsistensi antar item.
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 237

SKALA PENGUKURAN REFLEKTIF VERSUS FORMATIF


Pada saat ini, penting untuk kembali pada pendapat bahwa item-item dari pengukuran multi-item harus
digabungkan menjadi satu kesatuan dan mampu mengukur konsep yang sama secara independen (ini
mungkin akan membuat Anda pusing saat ini, namun hal ini akan menyelamatkan Anda dari pusing yang lebih
besar di masa depan karir Anda sebagai peneliti, jadi bersabarlah). Faktanya adalah bahwa item-item yang
mengukur sebuah konsep tidak harus selalu berkaitan: ini hanya berlaku untuk skala reflektif, tapi tidak untuk
skala formatif.

Apa yang dimaksud dengan skala reflektif?


Dalam skala reflektif, item-itemnya (semuanya!) diharapkan berkorelasi. Tidak seperti item yang digunakan
dalam skala formatif, yang akan dibahas selanjutnya, setiap item dalam skala reflektif diasumsikan memiliki
dasar yang sama (konstruk yang mendasari minat). Oleh karena itu, peningkatan nilai konstruk akan
diterjemahkan ke dalam peningkatan nilai untuk semua item yang mewakili konstruk tersebut. Contoh skala
reflektif adalah skala Sikap Terhadap Penawaran yang dikembangkan oleh Burton dan Lichtenstein (1988).
Skala ini terdiri dari enam item, sembilan poin yang dijumlahkan untuk mengukur sikap seseorang terhadap
produk tertentu yang ditawarkan dengan harga tertentu. Skala ini terdiri dari lima kata sifat bipolar (tidak
menguntungkan-menguntungkan; buruk-baik; merugikan-menguntungkan; tidak menarik-menarik; buruk-
sangat baik) dan satu item tidak setuju-setuju (diperkenalkan oleh batang: "Saya suka kesepakatan ini"), yang
diukur dengan skala grafis sembilan poin. Tentu saja, kami berharap bahwa sikap yang lebih baik terhadap
penawaran akan diterjemahkan ke dalam peningkatan nilai dari keenam item yang mewakili sikap terhadap
penawaran. Oleh karena itu, kita mengharapkan keenam item tersebut berkorelasi. Perhatikan bahwa arah
"kausalitas" adalah dari konstruk ke item.

Apa yang dimaksud dengan skala formatif dan mengapa item-item dalam skala
formatif tidak selalu saling berkaitan?
Skala formatif digunakan ketika sebuah konstruk dipandang sebagai kombinasi penjelas dari indikator-
indikatornya (Fornell, 1987; Fornell & Bookstein, 1982). Contohnya adalah Job Description Index (Smith,
Kendall & Hulin, 1969), sebuah ukuran komposit yang dimaksudkan untuk mengevaluasi kepuasan kerja.
Ukuran ini mencakup lima dimensi: jenis pekerjaan (18 item), peluang untuk promosi (9 item), kepuasan
dengan pengawasan (18 item), rekan kerja (18 item), dan gaji (9 item). Kelima dimensi tersebut dipandang
sebagai lima karakteristik penentu kepuasan kerja.
Kelima dimensi tersebut diterjemahkan ke dalam 72 elemen yang dapat diamati dan diukur seperti
"Kesempatan yang baik untuk maju", "Promosi yang teratur", "Kesempatan yang cukup baik untuk promosi",
"Penghasilan yang cukup untuk pengeluaran normal", "Gaji yang tinggi", dan "Memberikan rasa pencapaian".
Idenya adalah bahwa kita mengharapkan tiga item pertama ("Kesempatan yang baik untuk maju," "Promosi
yang teratur," dan "Kesempatan yang cukup baik untuk promosi") untuk berkorelasi (bagaimanapun juga,
semuanya bertujuan untuk mengukur satu dimensi tertentu dari kepuasan kerja, yaitu "kesempatan untuk
promosi"). Namun, item-item ini tidak selalu berkorelasi dengan item-item yang mengukur "Gaji" (dimensi
kedua), seperti "Penghasilan yang cukup untuk pengeluaran normal" dan "Gaji yang tinggi", karena dimensi
"Kesempatan yang baik untuk maju" tidak selalu terkait dengan dimensi "Gaji". Memang, pekerja pertama
mungkin memiliki gaji yang sangat baik tetapi tidak ada peluang untuk promosi, pekerja kedua mungkin
memiliki peluang yang sangat baik untuk promosi tetapi gajinya sangat buruk, dan pekerja ketiga mungkin
memiliki gaji yang sangat baik dan peluang yang sangat baik untuk promosi.
Demikian juga, kita akan mengharapkan item "Pendapatan yang memadai untuk pengeluaran normal"
dan "Bergaji tinggi" untuk saling berhubungan satu sama lain (karena kedua item tersebut mengukur gaji),
238 METODE PENELITIAN UNTUK BISNIS

tetapi kita tidak akan mengharapkan item-item tersebut berkorelasi dengan item "Memberikan rasa
pencapaian" (karena item yang terakhir ini tidak mengukur gaji, melainkan dimensi lain dari Indeks Deskripsi
Pekerjaan).
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 239

Secara ringkas, Indeks Deskripsi Pekerjaan mencakup lima dimensi dan 72 item. Ke-72 item ini tidak
selalu terkait satu sama lain, karena lima dimensi yang mereka wakili tidak selalu berhubungan.
Skala yang berisi item-item yang tidak selalu berhubungan disebut skala formatif. Kami telah menjelaskan
bahwa skala formatif digunakan ketika sebuah konstruk (seperti kepuasan kerja) dipandang sebagai kombinasi
penjelas dari indikator-indikatornya (promosi, gaji, kepuasan terhadap supervisi, rekan kerja, dan pekerjaan);
yaitu, ketika perubahan pada salah satu indikator (dimensi) diharapkan dapat mengubah nilai konstruk secara
keseluruhan, tanpa memperhatikan nilai indikator (dimensi) yang lain. Indeks Deskripsi Pekerjaan bersifat
formatif, karena peningkatan nilai salah satu indikatornya, seperti "kesempatan untuk promosi", diharapkan
dapat menghasilkan skor yang lebih tinggi untuk kepuasan kerja, terlepas dari nilai indikator lainnya. Dengan
demikian, Job Description Index mengkonseptualisasikan kepuasan kerja sebagai total skor tertimbang dari 72
item kepuasan kerja, di mana setiap item berhubungan dengan dimensi independen tertentu dari kepuasan
kerja.
Skala formatif yang baik (yaitu, yang valid) adalah skala yang mewakili seluruh domain konstruk. Ini
berarti bahwa skala yang valid harus mewakili semua aspek yang relevan dari konstruk yang diminati,
meskipun aspek-aspek ini tidak selalu berkorelasi.
Meskipun masuk akal untuk menguji konsistensi antar item pada skala reflektif, namun tidak masuk akal
untuk menguji konsistensi antar item pada skala formatif. Alasannya adalah karena kita tidak mengharapkan
item-item dalam skala formatif untuk menjadi homogen; dengan kata lain, kita tidak mengharapkan semua
item berkorelasi. Karena alasan ini, pengujian konsistensi jawaban responden terhadap item-item pengukuran
formatif tidak memberi tahu kita apa pun tentang kualitas instrumen pengukuran kita. Perlu diketahui bahwa
ada metode lain untuk menilai kebaikan skala formatif (lihat, misalnya, Jarvis, MacKenzie & Podsakoff, 2003).

RINGKASAN

● Tujuan pembelajaran 1: Menjelaskan karakteristik dan kekuatan empat jenis skala - nominal,
ordinal, interval, dan rasio.
Untuk dapat memberikan angka pada atribut objek, kita memerlukan skala. Skala adalah alat atau
mekanisme yang digunakan untuk membedakan individu-individu berdasarkan perbedaannya satu sama
lain dalam variabel-variabel yang menjadi perhatian kita. Penskalaan melibatkan pembuatan kontinum di
mana objek kita berada. Ada empat jenis skala dasar: nominal, ordinal, interval, dan rasio. Tingkat
kecanggihan skala yang disetel dengan baik meningkat secara progresif saat kita beralih dari skala nominal
ke skala rasio.

● Tujuan pembelajaran 2: Menjelaskan dan mengetahui bagaimana dan kapan menggunakan berbagai bentuk skala
penilaian.
Dalam skala penilaian, setiap objek dinilai secara independen dari objek lain yang diteliti. Skala penilaian
berikut ini sering digunakan dalam penelitian bisnis: skala dikotomi, skala kategori, skala diferensial
semantik, skala numerik, skala penilaian terinci, skala Likert, skala penilaian jumlah tetap atau konstan,
skala Stapel, skala penilaian grafis, dan skala konsensus. Skala Likert atau beberapa bentuk skala numerik
adalah yang paling sering digunakan untuk mengukur sikap dan perilaku dalam penelitian bisnis.

● Tujuan pembelajaran 3: Menjelaskan dan mengetahui bagaimana dan kapan menggunakan berbagai
bentuk skala peringkat. Skala peringkat digunakan untuk menyadap preferensi di antara dua atau di
antara beberapa objek atau item. Skala perbandingan berpasangan digunakan ketika, di antara sejumlah
kecil objek, responden diminta untuk memilih di antara dua objek sekaligus. Pilihan yang dipaksakan
memungkinkan responden untuk mengurutkan objek secara relatif satu sama lain, di antara alternatif yang
disediakan. Skala perbandingan memberikan tolok ukur atau titik acuan untuk menilai sikap terhadap
240 METODE PENELITIAN UNTUK BISNIS

objek, peristiwa, atau situasi yang sedang diteliti.


CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 241

● Tujuan pembelajaran 4: Mendiskusikan dimensi internasional dari penskalaan.


Budaya yang berbeda bereaksi secara berbeda terhadap masalah penskalaan. Terlebih lagi, penelitian
terbaru menunjukkan bahwa orang-orang dari berbagai negara berbeda dalam kecenderungan mereka
untuk menggunakan skala penilaian yang ekstrem (misalnya 1 dan 5 atau 1 dan 7) dan merespons dengan
cara yang diinginkan secara sosial. Temuan-temuan ini menggambarkan bahwa menganalisis dan
menginterpretasikan data yang dikumpulkan di berbagai negara merupakan tugas yang menantang.

● Tujuan pembelajaran 5: Menjelaskan validitas dan reliabilitas serta bagaimana keduanya ditetapkan
dan menilai kemampuan reliabilitas dan validitas suatu skala.
Reliabilitas adalah uji seberapa konsisten alat ukur mengukur konsep apa pun yang diukurnya. Validitas
adalah uji seberapa baik instrumen yang dikembangkan mengukur konsep tertentu yang ingin diukur.
Beberapa jenis uji validitas digunakan untuk menguji kebaikan pengukuran. Validitas isi memastikan
bahwa ukuran tersebut mencakup seperangkat item yang memadai dan representatif yang menyentuh
konsep. Validitas terkait kriteria ditetapkan ketika ukuran tersebut membedakan individu berdasarkan
kriteria yang diharapkan untuk diprediksi. Validitas konstruk menunjukkan seberapa baik hasil yang
diperoleh dari penggunaan alat ukur sesuai dengan teori yang mendasari perancangan tes. Dua uji
stabilitas adalah reliabilitas tes-retes dan reliabilitas bentuk paralel. Konsistensi internal dari pengukuran
menunjukkan homogenitas dari item-item dalam pengukuran yang mengetes konstruk.

● Tujuan pembelajaran 6: Jelaskan perbedaan antara skala reflektif dan formatif.


Item-item yang mengukur sebuah konsep tidak harus selalu berkaitan: hal ini hanya berlaku untuk skala
reflektif, tapi tidak untuk skala formatif. Dalam skala reflektif, item-itemnya (semuanya!) diharapkan
berkorelasi. Skala formatif digunakan ketika sebuah konstruk dipandang sebagai kombinasi penjelas dari
indikator-indikatornya.

Kunjungi situs web pendamping di www.wiley.com/college/sekaran untuk Studi Kasus:


Standard Asian Merchant Bank.

PERTANYAAN DISKUSI

1. Jelaskan empat jenis timbangan.


2. Bagaimana skala interval lebih canggih daripada skala nominal dan ordinal?
3. Mengapa skala rasio dianggap sebagai yang paling kuat di antara keempat skala lainnya?
4. Jelaskan secara singkat perbedaan antara skala penilaian sikap dan skala peringkat dan tunjukkan
kapan keduanya digunakan.
5. Mengapa penting untuk menetapkan "kebaikan" dari suatu tindakan dan bagaimana hal ini
dilakukan?
6. Jelaskan perbedaan antara skala formatif dan reflektif.
7. Jelaskan mengapa tidak masuk akal untuk menilai konsistensi internal skala formatif.
8. "Ukuran keterlibatan kerja yang dijelaskan dalam lampiran bersifat reflektif." Berikan komentar
atas pernyataan ini.
242 METODE PENELITIAN UNTUK BISNIS

9. Buatlah skala diferensial semantik untuk menilai sifat-sifat merek kopi atau teh tertentu.
10. Jika memungkinkan, disarankan untuk menggunakan instrumen yang telah dikembangkan dan
digunakan berulang kali dalam penelitian yang telah dipublikasikan, daripada mengembangkan
instrumen sendiri untuk penelitian kita. Setujukah Anda? Diskusikan alasan dari jawaban Anda.
11. "Instrumen yang valid selalu dapat diandalkan, tetapi instrumen yang dapat diandalkan belum
tentu valid." Berikan komentar atas pernyataan ini.

Sekarang lakukan Latihan 12.5 dan Latihan 12.6.

LATIHAN 12.5

Kembangkan dan beri nama jenis alat ukur yang akan Anda gunakan untuk mengetuk yang berikut ini:
a. Merek pasta gigi apa yang dikonsumsi oleh berapa banyak orang?
b. Di antara tiga jenis ujian - pilihan ganda, esai, dan campuran keduanya - manakah yang paling
disukai oleh siswa?
c. Sejauh mana individu setuju dengan definisi Anda tentang prinsip-prinsip akuntansi?
d. Seberapa banyak orang menyukai kebijakan organisasi yang ada.
e. Usia karyawan dalam suatu organisasi.
f. Jumlah karyawan di masing-masing dari 20 departemen di sebuah perusahaan.

LATIHAN 12.6

"Skala SERVQUAL yang dijelaskan dalam lampiran bersifat formatif." Berikan komentar terhadap
pernyataan ini. Jelaskan mengapa tidak masuk akal untuk menilai konsistensi antar item dari skala ini.
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 243

A P P ENDIX

Contoh beberapa tindakan


Beberapa ukuran yang digunakan dalam penelitian bisnis dapat ditemukan dalam Buku Pegangan Skala
Pemasaran oleh Bruner, Hensel dan James. Volume terbaru (5, 6, dan 7) adalah satu-satunya yang tersedia saat
ini. Volume-volume sebelumnya dalam seri ini tidak lagi diterbitkan, namun versi revisi dari tinjauan
timbangan mereka ada di database. Volume 5 berisi ulasan timbangan yang diterbitkan dalam artikel pemasaran
ilmiah antara tahun 2002 dan 2005. Volume 6 berisi ulasan yang dilaporkan dalam artikel-artikel dari tahun
2006 hingga 2009. Volume 7 adalah buku terbaru dan mencakup tahun 2010 dan 2011. Untuk dapat
dimasukkan ke dalam buku-buku ini, skala harus terdiri dari tiga item atau lebih, memiliki bukti empiris
mengenai kualitas psikometriknya, dan telah diperlakukan oleh para penggunanya sebagai ukuran reflektif
daripada formatif. Sumber-sumber lain yang berguna (namun agak ketinggalan jaman) adalah Handbook of
Organizational Measurement oleh Price dan Mueller (1986) dan Michigan Organizational Assessment Package
yang diterbitkan oleh Institute of Survey Research di Ann Arbor, Michigan. Beberapa ukuran juga dapat
dilihat di Psychological Measurement Yearbooks dan buku-buku lain yang diterbitkan. Contoh pengukuran
dari bidang akuntansi, keuangan, manajemen, dan pemasaran disediakan dalam lampiran ini.

Langkah-langkah dari penelitian keuangan perilaku


Di bawah ini adalah contoh skala yang digunakan untuk mengukur variabel-variabel yang terkait dengan penelitian
keuangan perilaku.

Informasi yang berlebihan


Ukuran Kelebihan Informasi (dalam skala 1 sampai 6, dari sangat tidak setuju sampai sangat setuju)

1. Terlalu banyak pilihan yang berbeda untuk dipertimbangkan.


2. Keputusan ini memerlukan banyak pertimbangan.
3. Ini adalah keputusan yang sulit.
4. Saya merasa keputusan ini sangat berat.
5. Sulit untuk memahami semua informasi yang tersedia bagi saya.
6. Tugas ini sangat menegangkan.
7. Sungguh melegakan untuk membuat keputusan.
Sumber: Agnew, JR & Szykman, LR (2010) Alokasi aset dan kelebihan informasi: Pengaruh tampilan informasi,
pilihan aset, dan pengalaman investor. Journal of Behavioral Finance, 6(2), 57-70. Direproduksi dengan izin.
244 METODE PENELITIAN UNTUK BISNIS

Orientasi terhadap keuangan: minat terhadap informasi keuangan


Ukuran Minat terhadap Informasi Keuangan (dalam skala 1 sampai 5, dari sangat tidak setuju hingga sangat setuju)

Saya tidak pernah membaca halaman keuangan di koran saya (reverse coding). Saya
mencoba mengikuti tren ekonomi secara umum.
Saya tidak tertarik dengan bagian keuangan dari kehidupan (reverse coding). Saya
secara teratur mencari peluang investasi yang menarik untuk uang saya. Saya
tertarik dengan evolusi nilai mata uang.
Sumber: Loix, E., Pepermans, R., Mentens, C., Goedee, M. & Jegers (2005), M. Orientasi terhadap keuangan:
Pengembangan skala pengukuran. Journal of Behavioral Finance, 6(4), 192-201. Direproduksi dengan izin.

Langkah-langkah dari penelitian akuntansi manajemen


Di bawah ini adalah contoh skala yang digunakan untuk mengukur variabel-variabel yang terkait dengan penelitian
akuntansi manajemen.

Formalitas evaluasi kinerja:


Atasan saya tidak mendokumentasikan tujuan 12345 Atasan sayasecara eksplisit
kerja secara eksplisit dalam bentuk tertulis. mendokumentasikan tujuan kerja
Ketika menilai kinerja saya, atasan saya secara tertulis.
menggunakan penilaian pribadinya atas kinerja 12345 Ketikamenilai kinerja saya, atasan saya
saya. mengandalkan informasi yang obyektif dari
Gaji saya didasarkan pada penilaian pribadi sistem informasi.
atasan atas kinerja saya. 12345 Gaji sayadidasarkan pada informasi yang
obyektif dari sistem informasi.
Sumber: Hartmann, F. & Slapničar, S. (2012) Keadilan yang dirasakan dalam evaluasi kinerja: Peran ketidakpastian. Management Accounting
Research, 23(1), 17-33. Direproduksi dengan izin.

Kinerja organisasi (diukur dengan skala 1 sampai 5, dari sangat tidak setuju sampai sangat setuju):

Kinerja perusahaan Anda dalam hal laba atas investasi lebih baik daripada pesaing Anda.
Kinerj
a perusahaan Anda dalam hal marjin laba kotor lebih baik daripada pesaing Anda.
Kinerj
a perusahaan Anda dalam hal kepuasan pelanggan lebih baik daripada pesaing Anda.
Kinerj
a perusahaan Anda dalam hal kualitas produk/jasa lebih baik daripada pesaing Anda. Kinerja
perusahaan Anda dalam hal produktivitas karyawan lebih baik daripada pesaing Anda.
Sumber: Lee, C. & Yang, H. (2011). Struktur organisasi, kompetisi dan sistem pengukuran kinerja dan pengaruhnya secara bersama-sama
terhadap kinerja. Management Accounting Research, 22(2), 84-104. Direproduksi dengan izin.
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 245

Langkah-langkah dari penelitian manajemen


Di bawah ini adalah contoh skala yang digunakan untuk mengukur variabel-variabel yang terkait dengan penelitian
manajemen.
246 METODE PENELITIAN UNTUK BISNIS

Keterlibatan
dalam pekerjaan
Tidak
Sangat Setuju Sangat
atau
Tidak Tidak Tidak setuju Setuju. Setuju.
setuju setuju
1. Pekerjaan saya lebih berarti bagi saya daripada 1 2 3 4 5
sekadar uang.
2. Kepuasan utama dalam hidup saya berasal dari 1 2 3 4 5
pekerjaan saya.
3. Saya sangat tertarik dengan pekerjaan saya. 1 2 3 4 5
4. Saya mungkin akan tetap bekerja meskipun 1 2 3 4 5
saya tidak membutuhkan uang.
5. Hal terpenting yang terjadi pada saya adalah 1 2 3 4 5
pekerjaan saya.
6. Saya akan tetap lembur untuk menyelesaikan 1 2 3 4 5
pekerjaan, meskipun tidak dibayar.
7. Bagi saya, beberapa jam pertama di tempat kerja 1 2 3 4 5
benar-benar cepat berlalu.
8. Saya benar-benar menikmati melakukan 1 2 3 4 5
kegiatan sehari-hari yang menjadi bagian dari
pekerjaan saya.
9. Saya selalu menantikan untuk datang ke tempat 1 2 3 4 5
kerja setiap hari.
Sumber: White, J. K. dan Ruh, R. A. (1973) Pengaruh nilai-nilai pribadi pada hubungan antara partisipasi dan sikap kerja. Administrative Science
Quarterly, 18(4), hal. 509. Direproduksi dengan izin.

Partisipasi dalam pengambilan keputusan

Tidak di Sang Untuk yang Untuk yang besar


at moderat
semu sedikit Agak luas luas
a
1. Secara umum, seberapa besar pengaruh yang 1 2 3 4 5
Anda miliki terhadap cara Anda melakukan
pekerjaan Anda?
2. Sejauh mana Anda dapat memutuskan 1 2 3 4 5
bagaimana melakukan pekerjaan Anda?
3. Secara umum, seberapa besar pendapat atau 1 2 3 4 5
pengaruh Anda
Anda tentang apa yang terjadi dalam kelompok
kerja Anda?
4. Secara umum, seberapa besar pendapat atau 1 2 3 4 5
pengaruh Anda
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 247

terhadap keputusan-keputusan yang


memengaruhi pekerjaan Anda?
5. Atasan saya menerima dan mendengarkan ide 1 2 3 4 5
dan saran saya.
Sumber: White, J. K. dan Ruh, R. A. (1973) Pengaruh nilai-nilai pribadi pada hubungan antara partisipasi dan sikap kerja. Administrative Science
Quarterly, 18(4), hal. 509. Direproduksi dengan izin.
248 METODE PENELITIAN UNTUK BISNIS

Penonjolan karier

Sangat
Tidak setuju Tidak setuju Sedikit Tidak Setuju Sedikit Setuju Setuju. Sangat Setuju
Netral
1 2 3 4 5 6 7
1 Pilihan karier saya adalah keputusan pekerjaan yang baik bagi saya.
2 Karier saya memungkinkan saya untuk memberikan kontribusi yang signifikan
kepada masyarakat.
3 Karier yang saya jalani sangat cocok dengan saya dan mencerminkan kepribadian saya.
4 Pendidikan dan pelatihan saya tidak dirancang untuk karier ini.
5 Saya tidak berniat untuk berganti karier.
6 Semua perencanaan dan pemikiran yang saya berikan untuk mengejar karier ini adalah
sia-
sia.
7 Karier saya adalah bagian yang tidak terpisahkan dari hidup saya.
Sumber: Sekaran, U. (1986) Keluarga Karir Ganda: Isu-isu Organisasi dan Konseling Kontemporer. San Francisco: Jossey-Bass. Direproduksi
dengan izin.

Langkah-langkah dari riset pemasaran


Di bawah ini adalah contoh beberapa skala yang digunakan untuk mengukur konsep-konsep yang umum
diteliti dalam pemasaran. Bruner dan Hensel telah melakukan pekerjaan yang ekstensif sejak tahun 1992 dalam
mendokumentasikan dan merinci beberapa skala dalam riset pemasaran. Untuk setiap skala yang diperiksa,
mereka telah memberikan informasi berikut:

1. Deskripsi skala
2. Asal skala
3. Sampel di mana skala digunakan
4. Keandalan skala
5. Validitas skala
6. Bagaimana skala ini diberikan
7. Temuan-temuan utama dari penelitian yang menggunakan skala

Siswa yang tertarik harus merujuk pada lima volume Buku Pegangan Timbangan Pemasaran oleh G. C.
Bruner dan P. J. Hensel (Volume 1 dan 2); G. C. Bruner, P. J. Hensel, dan K. E. James yang diterbitkan oleh
Asosiasi Pemasaran Amerika (Volume 1, 2, dan 3) dan Thomson (Volume 4 dan 5). Volume pertama
mencakup skala yang digunakan dalam artikel yang diterbitkan pada tahun 1980-an, dan volume kedua
mencakup skala yang digunakan dalam artikel yang diterbitkan dari tahun 1990 hingga 1993. Volume ketiga
mencakup periode dari tahun 1994 hingga 1997. Volume keempat mencakup timbangan pemasaran yang
dilaporkan dalam artikel yang diterbitkan dari tahun 1998 hingga 2001. Volume kelima mencakup periode
2001 hingga 2005.
CEAPTER �� PENGUKURAN: PENSKALAAN, RELIABILITAS DAN VALIDITAS 249

Kemungkinan keberhasilan pengaduan


Kemungkinan pengaduan berhasil (skala 5 poin dengan titik akhir berlabel "sangat tidak mungkin" dan "sangat
mungkin"):

Pada saat terjadi kegagalan layanan, seberapa besar kemungkinan penyedia layanan akan. . .
. . mengambil tindakan yang tepat untuk menangani masalah Anda jika Anda melaporkan kejadian tersebut?

. . menyelesaikan masalah Anda dan memberikan layanan yang lebih baik kepada Anda di masa mendatang jika Anda
melaporkan kejadian tersebut?
. . lebih berhati-hati di masa depan dan semua orang akan diuntungkan jika Anda melaporkan kejadian tersebut.

Sumber: Bougie, R., Pieters, R. dan Zeelenberg, M. (2003) Pelanggan yang marah tidak akan kembali, mereka akan kembali: Pengalaman dan
implikasi perilaku dari kemarahan dan ketidakpuasan dalam layanan. Jurnal Akademi Ilmu Pemasaran, 31, 377-393. Direproduksi dengan izin.

SERVQUAL: Skala multidimensi untuk menangkap persepsi dan ekspektasi pelanggan


terhadap kualitas layanan
Item keandalan:

1. Ketika Perusahaan XYZ berjanji untuk melakukan sesuatu pada waktu tertentu, maka perusahaan akan
melakukannya.
2. Ketika Anda memiliki masalah, Perusahaan XYZ menunjukkan minat yang tulus untuk menyelesaikannya.
3. Perusahaan XYZ melakukan layanan dengan benar saat pertama kali.
4. Perusahaan XYZ menyediakan layanannya pada waktu yang dijanjikan.
5. Perusahaan XYZ selalu menginformasikan kepada pelanggan tentang kapan layanan akan dilakukan.

Item-item daya tanggap:

1. Karyawan di Perusahaan XYZ memberikan layanan yang cepat.


2. Karyawan di Perusahaan XYZ selalu bersedia membantu Anda.
3. Karyawan di Perusahaan XYZ tidak pernah terlalu sibuk untuk menanggapi permintaan Anda.

Item jaminan:

1. Perilaku karyawan di Perusahaan XYZ menanamkan kepercayaan diri Anda.


2. Anda merasa aman dalam bertransaksi dengan Perusahaan XYZ.
3. Karyawan di Perusahaan XYZ secara konsisten bersikap sopan kepada Anda.
4. Karyawan di Perusahaan XYZ memiliki pengetahuan untuk menjawab pertanyaan Anda.

Item empati:

1. Perusahaan XYZ memberi Anda perhatian individual.


2. Perusahaan XYZ memiliki karyawan yang memberikan perhatian secara individual kepada Anda.
3. Perusahaan XYZ mengutamakan kepentingan Anda.
4. Karyawan Perusahaan XYZ memahami kebutuhan spesifik Anda.
250 METODE PENELITIAN UNTUK BISNIS

Barang-barang berwujud:

1. Perusahaan XYZ memiliki peralatan yang terlihat modern.


2. Fasilitas fisik Perusahaan XYZ menarik secara visual.
3. Karyawan Perusahaan XYZ tampil rapi.
4. Materi yang terkait dengan layanan ini (seperti pamflet atau pernyataan) menarik secara visual di Perusahaan XYZ.
5. Perusahaan XYZ memiliki jam kerja yang nyaman.
Sumber: Parasuraman, A., Zeithaml, V. A. dan Berry, L. L. (1988) SERVQUAL: Skala multi-item untuk mengukur persepsi konsumen
terhadap kualitas layanan. Journal of Retailing 64(1) (Musim Semi). Direproduksi dengan izin.

Ambiguitas peran (tenaga penjual)

Sangat Salah Sangat Benar


1 2 3 4 5 6 7
1. Saya merasa yakin tentang seberapa besar otoritas yang saya miliki dalam posisi penjualan saya.
2. Saya memiliki tujuan yang terencana dengan jelas untuk pekerjaan penjualan saya.
3. Saya yakin saya membagi waktu saya dengan baik saat melakukan tugas-tugas penjualan.
4. Saya tahu tanggung jawab saya dalam posisi penjualan.
5. Saya tahu persis apa yang diharapkan dari saya dalam posisi penjualan saya.
6. Saya menerima penjelasan yang jelas tentang apa yang harus saya lakukan dalam pekerjaan penjualan saya.
Sumber: Dimodifikasi dari Rizzo, JR, House, RJ dan Lirtzman, SL (1970) Konflik peran dan ambiguitas peran dalam organisasi yang kompleks.
Administrative Science Quarterly, 15, 156.

Anda mungkin juga menyukai