Anda di halaman 1dari 31

Pengukuran variabel:

Definisi operasional

BAGAIMANA VARIABEL DIUKUR

Untuk menguji hipotesis bahwa keragaman tenaga kerja mempengaruhi efektivitas


organisasi kita harus mengukur keragaman tenaga kerja dan efektivitas organisasi. Pengukuran
adalah penugasan angka atau simbol lain ke karakteristik (atau atribut) objek menurut
seperangkat aturan yang telah ditentukan sebelumnya. Objeknya antara lain orang, unit bisnis
strategis, perusahaan, negara, sepeda, gajah, peralatan dapur, restoran, sampo, yoghurt, dan
sebagainya. Contoh karakteristik objek adalah kecenderungan mencari gairah, motivasi
berprestasi, efektivitas organisasi, kenikmatan berbelanja, panjang, bobot, keragaman etnis,
kualitas layanan, efek pengondisian, dan rasa. Penting bagi Anda untuk menyadari bahwa Anda
tidak dapat mengukur objek (misalnya, perusahaan); Anda mengukur karakteristik atau atribut
objek (misalnya, keefektifan organisasi perusahaan). Dengan cara yang sama, Anda dapat
mengukur panjang (atribut) seseorang (objek), berat seekor gajah, kecenderungan para pialang
saham yang mencari gairah, kenikmatan berbelanja wanita, kualitas layanan restoran, efek
pengondisian sampo, dan rasa yogurt merek tertentu. Untuk dapat mengukur Anda
membutuhkan suatu benda dan atribut dari suatu benda, tetapi Anda juga membutuhkan seorang
juri. Judge adalah seseorang yang memiliki pengetahuan dan keterampilan yang diperlukan
untuk menilai “kualitas” sesuatu, seperti rasa yogurt, kecenderungan pialang saham yang
mencari gairah, atau keterampilan komunikasi siswa. Dalam banyak kasus, objek dan hakim
adalah orang yang sama. Misalnya, jika Anda ingin mengukur jenis kelamin (atribut) karyawan
Anda (objek), atau kenikmatan berbelanja (atribut) wanita (objek), Anda cukup meminta objek
(karyawan dan wanita masing-masing) untuk memberi Anda detail yang diperlukan melalui
kuesioner yang dikelola sendiri. Namun, kecil kemungkinan objek tersebut memiliki
pengetahuan dan keterampilan yang diperlukan untuk bertindak sebagai juri ketika ingin
mengukur rasa (atribut) yogurt (objek), kualitas layanan restoran, keterampilan komunikasi
siswa, atau bahkan keahlian manajerial supervisor.

Atribut objek yang dapat diukur secara fisik oleh beberapa instrumen yang dikalibrasi
tidak menimbulkan masalah pengukuran. Misalnya, panjang dan lebar meja kantor persegi
panjang dapat dengan mudah diukur dengan pita pengukur atau penggaris. Hal yang sama
berlaku untuk mengukur luas lantai kantor dan untuk mengukur berat gajah (setidaknya sampai
batas tertentu). Data yang mewakili beberapa karakteristik demografis personel kantor juga
mudah diperoleh dengan mengajukan pertanyaan yang sederhana dan lugas kepada karyawan,
seperti: "Sudah berapa lama Anda bekerja di organisasi ini?" atau "Apa status perkawinan
Anda?"

Namun, pengukuran atribut yang lebih abstrak dan subjektif lebih sulit. Misalnya, relatif
sulit mengukur tingkat motivasi berprestasi pegawai kantoran, kenikmatan berbelanja
perempuan, atau kebutuhan kognisi siswa. Demikian juga, tidak langsung menguji hipotesis
tentang hubungan antara keragaman tenaga kerja, keahlian manajerial, dan efektivitas organisasi.
Masalahnya adalah kita tidak bisa begitu saja mengajukan pertanyaan seperti "Seberapa beragam
tenaga kerja perusahaan Anda?" atau "Seberapa efektif organisasi Anda?" karena sifat abstrak
dari variabel "keragaman tenaga kerja" dan "efektivitas organisasi". Tentu saja, ada solusi untuk
masalah ini. Salah satu solusi ini dibahas selanjutnya. Tapi mari kita, sebelum kita membahas
solusinya, rangkum masalahnya.

Variabel tertentu memungkinkan pengukuran yang mudah melalui penggunaan alat ukur
yang tepat; misalnya fenomena fisiologis yang berkaitan dengan manusia, seperti tekanan darah,
denyut nadi, dan suhu tubuh, serta atribut fisik tertentu seperti panjang dan berat. Tetapi ketika
kita masuk ke ranah perasaan subjektif, sikap, dan persepsi orang, pengukuran faktor atau
variabel ini menjadi lebih sulit. Dengan demikian, setidaknya ada dua jenis variabel: satu cocok
untuk pengukuran yang objektif dan tepat; yang lain lebih kabur dan tidak cocok untuk
pengukuran yang akurat karena sifatnya yang abstrak dan subjektif.

DEFINISI OPERASIONAL OPERASIONALISASI

Meskipun kekurangan alat pengukur fisik untuk mengukur variabel yang lebih samar, ada
cara untuk memanfaatkan jenis variabel ini. Salah satu tekniknya adalah dengan mereduksi
gagasan atau konsep abstrak ini menjadi perilaku dan / atau karakteristik yang dapat diamati.
Dengan kata lain, pengertian abstrak dipecah menjadi perilaku atau karakteristik yang dapat
diamati. Misalnya, konsep haus adalah abstrak; kita tidak bisa melihatnya. Namun, kita
mengharapkan orang yang haus minum banyak cairan. Dengan kata lain, reaksi yang diharapkan
orang terhadap rasa haus adalah minum cairan. Jika beberapa orang mengatakan bahwa mereka
haus, maka kita dapat menentukan tingkat haus dari masing-masing individu tersebut dengan
mengukur jumlah cairan yang mereka minum untuk memuaskan dahaga mereka. Dengan
demikian, kita dapat mengukur tingkat rasa haus mereka, meskipun konsep haus itu sendiri
abstrak dan samar-samar. Pengurangan konsep abstrak untuk membuatnya terukur dengan cara
yang nyata disebut mengoperasionalkan konsep.

Operasionalisasi dilakukan dengan melihat dimensi perilaku, segi, atau properti yang
dilambangkan dengan konsep. Ini kemudian diterjemahkan menjadi elemen-elemen yang dapat
diamati dan diukur untuk mengembangkan indeks pengukuran konsep. Mengoperasikan konsep
melibatkan serangkaian langkah. Langkah pertama adalah memberikan definisi konstruksi yang
ingin Anda ukur. Kemudian, perlu dipikirkan tentang isi ukuran; Artinya, instrumen (satu atau
lebih item atau pertanyaan) yang benar-benar mengukur konsep yang ingin diukur harus
dikembangkan. Selanjutnya, diperlukan format tanggapan (misalnya, skala penilaian tujuh poin
dengan titik akhir berlabuh dengan "sangat tidak setuju" dan "sangat setuju") diperlukan, dan,
terakhir, validitas dan keandalan skala pengukuran harus dinilai . Bab selanjutnya membahas
langkah 3 dan 4. Dalam bab ini kita akan membahas langkah 2: pengembangan serangkaian item
atau pertanyaan yang memadai dan representatif.

Operasionalisasi: dimensi dan elemen

Contoh rasa haus dan kebutuhan kognisi menggambarkan bagaimana konsep abstrak
dioperasionalkan dengan menggunakan elemen yang dapat diamati dan diukur, seperti jumlah
minuman yang digunakan orang untuk memuaskan dahaga mereka, dan sejauh mana orang lebih
menyukai masalah yang kompleks daripada yang sederhana. Anda mungkin telah
memperhatikan bahwa sementara hanya satu item yang diperlukan untuk mengukur rasa haus
("berapa banyak minuman yang Anda gunakan untuk memuaskan dahaga Anda?"), 34 item
diperlukan untuk mengukur kebutuhan kognisi. 34 item ini diperlukan karena jika kita
menggunakan kurang dari 34 item ini, skala pengukuran kita mungkin tidak akan mewakili
seluruh domain atau semesta yang membutuhkan kognisi; dengan kata lain, ukuran kami
mungkin tidak akan mencakup serangkaian item (atau elemen) yang memadai dan representatif.
Akibatnya, ukuran kami tidak valid. Sebuah ukuran valid dari kebutuhan kognisi sehingga
mengandung 34 item meskipun kebutuhan kognisi adalah konstruk unidimensi.
Contoh konstruksi dengan lebih dari satu dimensi adalah agresi. Agresi setidaknya
memiliki dua dimensi: agresi verbal dan agresi fisik. Artinya, agresi dapat mencakup perilaku
seperti berteriak dan mengumpat pada seseorang (agresi verbal), tetapi juga melempar benda,
membenturkan dinding, dan menyakiti orang lain secara fisik (agresi fisik). Skala pengukuran
agresi yang valid harus mencakup item yang mengukur agresi verbal dan item yang mengukur
agresi fisik. Skala pengukuran yang hanya mencakup item yang mengukur agresi fisik tidak akan
valid jika tujuan kita adalah mengukur agresi. Demikian juga, skala yang hanya mencakup item
yang mengukur agresi verbal juga bukan merupakan ukuran agresi yang valid. Dengan demikian,
skala pengukuran yang valid mencakup pertanyaan atau item yang dapat diukur secara kuantitatif
atau item (atau elemen) yang secara memadai mewakili domain atau semesta konstruksi; Jika
konstruksi memiliki lebih dari satu domain atau dimensi, kami harus memastikan bahwa
pertanyaan yang secara memadai mewakili domain atau dimensi ini disertakan dalam
pengukuran kami.

Mengoperasikan konsep (multidimensi) motivasi berprestasi

Misalkan kita tertarik untuk membangun hubungan antara gender dan motivasi
berprestasi. Untuk menguji hubungan ini, kita harus mengukur jenis kelamin dan motivasi
berprestasi. Pada titik ini, Anda mungkin akan memahami bahwa meskipun mengukur jenis
kelamin tidak akan menimbulkan masalah, mengukur motivasi berprestasi mungkin akan
menimbulkan masalah, karena konstruk yang terakhir bersifat abstrak dan subjektif. Untuk
alasan ini kita harus menyimpulkan motivasi berprestasi dengan mengukur dimensi perilaku,
segi, atau karakteristik yang kita harapkan akan ditemukan pada orang dengan motivasi
berprestasi tinggi. Memang, tanpa mengukur dimensi, aspek, atau karakteristik ini, kita tidak
akan dapat sampai pada pernyataan garis bawah tentang hubungan antara gender dan motivasi
berprestasi.

Setelah kita mendefinisikan konstruk, langkah selanjutnya dalam proses pengukuran


konstruk abstrak seperti motivasi berprestasi adalah melalui literatur untuk mengetahui apakah
ada ukuran konsep yang ada. Baik jurnal ilmiah dan "buku pegangan skala" adalah sumber
penting dari pengukuran yang ada. Sebagai aturan, artikel empiris yang diterbitkan dalam jurnal
akademis memberikan deskripsi rinci tentang bagaimana konstruksi tertentu diukur; informasi
sering diberikan tentang tindakan apa yang digunakan, kapan dan bagaimana tindakan tersebut
dikembangkan, oleh siapa, dan untuk berapa lama telah digunakan. Buku pegangan skala juga
merupakan sumber berguna dari skala pengukuran yang ada. Buku pegangan skala, seperti Buku
Pegangan Timbangan Pemasaran atau Buku Pegangan Pengukuran Organisasi, memberikan
gambaran menyeluruh tentang skala pengukuran yang telah muncul dalam literatur akademis.
Buku pegangan ini membantu Anda untuk menentukan apakah ada skala pengukuran dan, jika
ada lebih dari satu skala pengukuran, untuk membuat pilihan logis antara pengukuran yang
tersedia. Penggunaan timbangan ukur yang ada memiliki beberapa keunggulan. Pertama, ini
menghemat banyak waktu dan energi. Kedua, ini memungkinkan Anda untuk memverifikasi
temuan orang lain dan mengembangkan karya orang lain (ini sangat penting dalam penelitian
ilmiah tetapi tidak mungkin jika Anda menggunakan ukuran yang berbeda dari yang digunakan
pendahulu kami!). Oleh karena itu, jika Anda ingin mengukur sesuatu, lihat apakah itu telah
diukur sebelumnya dan kemudian gunakan ukuran ini (sesuaikan dengan kebutuhan spesifik
Anda kapan pun diperlukan). Pastikan Anda mendokumentasikan penggunaan skala pengukuran
yang ada dengan benar.

Ada beberapa ukuran motivasi berprestasi yang tersedia dari literatur (Amabile, Hill,
Hennessey & Tighe, 1994; Gordon, 1973; Heggestad & Kanfer, 1999; Super, 1970). Tetapi
bagaimana jika tidak ada ukuran yang tersedia? Dalam kasus seperti itu, kami sendiri harus
mengembangkan ukuran; ini berarti bahwa kita harus memecah konsep "motivasi berprestasi"
menjadi perilaku atau karakteristik yang dapat diamati, seperti yang dijelaskan selanjutnya.

Dimensi dan unsur motivasi berprestasi

Mari kita coba mengoperasionalkan "motivasi berprestasi," sebuah konsep yang menarik
bagi pendidik, manajer, dan siswa. Dimensi perilaku, segi, atau karakteristik apa yang kita
harapkan untuk ditemukan pada orang dengan motivasi berprestasi tinggi? Mereka mungkin
memiliki lima karakteristik umum berikut, yang akan kita sebut dimensi:

1. Mereka akan didorong oleh pekerjaan; artinya, mereka akan bekerja hampir sepanjang waktu
untuk memperoleh kepuasan karena telah "mencapai dan mencapai".
2. Banyak dari mereka umumnya tidak berminat untuk bersantai dan mengarahkan perhatian
mereka ke hal lain selain aktivitas yang berhubungan dengan pekerjaan.
3. Karena mereka ingin selalu berprestasi dan mencapai prestasi, mereka lebih suka bekerja
sendiri daripada dengan orang lain.
4. Dengan pikiran dan hati yang tertuju pada pencapaian dan pencapaian, mereka lebih suka
terlibat dalam pekerjaan yang menantang daripada pekerjaan yang mudah dan menyenangkan.
Namun, mereka tidak ingin mengambil pekerjaan yang terlalu menantang karena harapan dan
kemungkinan pencapaian dan pencapaian dalam pekerjaan semacam itu tidak akan terlalu
tinggi.
5. Mereka akan sangat ingin mengetahui bagaimana kemajuan mereka dalam pekerjaan mereka
seiring berjalannya waktu. Artinya, mereka ingin mendapatkan umpan balik yang sering
secara langsung dan halus dari atasan, kolega, dan kadang-kadang bahkan bawahan mereka,
untuk mengetahui bagaimana kemajuan mereka.

Jadi, kami mengharapkan mereka yang memiliki motivasi berprestasi tinggi untuk
mendorong diri mereka sendiri dengan keras dalam pekerjaan, merasa sulit untuk bersantai, lebih
suka bekerja sendiri, terlibat dalam pekerjaan yang menantang (tetapi tidak terlalu menantang),
dan mencari umpan balik. Meskipun memecah konsep menjadi lima dimensi ini telah
mengurangi tingkat abstraksinya, kita masih belum mengoperasionalkan konsep tersebut menjadi
elemen perilaku yang dapat diukur. Ini dapat dilakukan dengan memeriksa masing-masing dari
lima dimensi dan memecah masing-masing lebih jauh ke dalam elemen-elemennya, sehingga
menggambarkan pola perilaku aktual yang akan diperlihatkan. Ini harus diukur secara kuantitatif
sehingga kita dapat membedakan mereka yang memiliki motivasi tinggi dari mereka yang
kurang. Mari kita lihat bagaimana ini bisa dilakukan.

Elemen dimensi 1 Dimungkinkan untuk menggambarkan perilaku seseorang yang didorong oleh
pekerjaan. Orang seperti itu akan (1) berada di tempat kerja sepanjang waktu, (2) enggan
mengambil cuti dari pekerjaan, dan (3) bertahan bahkan dalam menghadapi beberapa
kemunduran. Jenis perilaku ini cocok untuk pengukuran. Misalnya, kami dapat menghitung
jumlah jam karyawan terlibat dalam aktivitas terkait pekerjaan selama jam kerja, di luar jam
kerja di tempat kerja, dan di rumah, di mana mereka cenderung untuk mengejar tugas yang
belum selesai. Jadi, jumlah jam yang mereka habiskan untuk bekerja adalah indeks sejauh mana
pekerjaan "mendorong" mereka.
Selanjutnya, mencatat seberapa sering orang bertahan dengan pekerjaan mereka
meskipun mengalami kegagalan adalah cerminan dari seberapa gigih mereka dalam mencapai
tujuan mereka. Seorang siswa yang putus sekolah karena gagal lulus ujian pertama sama sekali
tidak dapat dianggap sebagai individu yang sangat gigih dan berorientasi pada prestasi. Namun,
seorang siswa yang, meskipun mendapatkan nilai D pada tiga kuis, bekerja keras siang dan
malam tanpa henti untuk memahami dan menguasai mata pelajaran yang dianggapnya sulit,
menunjukkan ketekunan dan perilaku yang berorientasi pada prestasi. Individu yang termotivasi
pencapaian biasanya tidak ingin menyerah pada tugas mereka bahkan ketika dihadapkan pada
kegagalan awal. Ketekunan mendorong mereka untuk melanjutkan. Oleh karena itu, ukuran
ketekunan dapat diperoleh dari jumlah kemunduran yang dialami orang pada tugas tersebut
namun terus bekerja, tidak gentar oleh kegagalan. Misalnya, seorang akuntan mungkin
menemukan bahwa dia tidak dapat menyeimbangkan pembukuan. Dia menghabiskan satu jam
mencoba mendeteksi kesalahan, gagal melakukannya, menyerah, dan meninggalkan tempat
kerja. Karyawan lain di posisi yang sama tetap sabar dalam pekerjaannya, menemukan
kesalahannya, dan menyeimbangkan pembukuan, menghabiskan sepanjang malam dalam proses
tersebut. Dalam hal ini, mudah untuk membedakan mana dari keduanya yang lebih gigih hanya
dengan mengamati mereka.

Terakhir, untuk mengukur keengganan untuk mengambil cuti, kita hanya perlu
mengetahui seberapa sering orang mengambil cuti dari pekerjaan mereka, dan untuk alasan apa.
Jika seorang karyawan diketahui telah mengambil cuti tujuh hari selama enam bulan sebelumnya
untuk menonton pertandingan sepak bola, menghadiri sirkus luar kota, dan mengunjungi teman-
teman, kita dapat menyimpulkan bahwa individu tersebut mungkin tidak akan ragu-ragu untuk
meluangkan waktu dari pekerjaan. Namun, jika seseorang tidak pernah absen bahkan satu hari
pun selama 15 bulan terakhir, dan tidak absen dari pekerjaannya meskipun sedikit tidak sehat,
jelas bahwa dia terlalu berdedikasi untuk bekerja sehingga tidak dapat mengambil cuti dari
pekerjaannya.

Jadi, jika kita dapat mengukur berapa jam per minggu yang dihabiskan individu untuk
aktivitas yang terkait dengan pekerjaan, seberapa tekun mereka dalam menyelesaikan tugas
sehari-hari, dan seberapa sering dan untuk alasan apa mereka mengambil cuti dari pekerjaannya,
kita akan mengukur sejauh mana karyawan didorong oleh pekerjaan. Variabel ini, jika diukur,
akan menempatkan individu pada kontinum mulai dari mereka yang paling tidak didorong oleh
pekerjaan hingga mereka yang hidupnya adalah pekerjaan. Hal ini kemudian akan memberikan
indikasi sejauh mana motivasi berprestasi mereka.

Gambar 11.2 secara skematis menguraikan dimensi (beberapa aspek atau karakteristik
utama) dan elemen (perilaku representatif) untuk konsep motivasi berprestasi. Referensi yang
sering ke gambar ini akan membantu Anda mengikuti pembahasan selanjutnya.

Elemen dimensi 2 Tingkat keengganan untuk bersantai dapat diukur dengan mengajukan
pertanyaan seperti:

1. Seberapa sering Anda memikirkan tentang pekerjaan saat Anda jauh dari tempat kerja?
2. Apa hobi Anda?
3. Bagaimana Anda menghabiskan waktu Anda ketika Anda jauh dari tempat kerja?

Mereka yang dapat bersantai menunjukkan bahwa mereka umumnya tidak memikirkan
pekerjaan atau tempat kerja saat berada di rumah, bahwa mereka menghabiskan waktu untuk
hobi, terlibat dalam kegiatan waktu senggang, dan menghabiskan waktu bangun mereka dengan
keluarga atau dalam kegiatan sosial atau sosial lainnya. kegiatan budaya.

Dengan demikian, kita dapat menempatkan karyawan pada suatu kontinum mulai dari
mereka yang sangat rileks hingga mereka yang sangat sedikit rileks. Dimensi ini juga kemudian
menjadi terukur.

Elemen dimensi 3 Individu dengan motivasi berprestasi tinggi tidak memiliki kesabaran dengan
orang yang tidak efektif dan enggan bekerja dengan orang lain. Sementara orang yang memiliki
motivasi berprestasi dalam organisasi mungkin memiliki peringkat yang sangat tinggi pada
predisposisi perilaku ini, mungkin ada orang lain yang tidak termotivasi untuk berprestasi. Yang
terakhir mungkin sama sekali tidak keberatan dengan ketidakefektifan baik pada diri mereka
sendiri atau orang lain, dan mungkin sangat bersedia untuk bekerja dengan hampir semua orang.
Jadi, ketidaksabaran dengan ketidakefektifan juga bisa diukur dengan mengamati perilaku.

Elemen dimensi 4 Ukuran seberapa bersemangat orang dalam mencari pekerjaan yang
menantang dapat diperoleh dengan menanyakan kepada karyawan jenis pekerjaan apa yang
mereka sukai. Sejumlah deskripsi pekerjaan yang berbeda dapat disajikan - beberapa pekerjaan
memerlukan pekerjaan stereotip yang bersifat rutin, dan lainnya dengan gradasi tantangan yang
dibangun di dalamnya. Preferensi karyawan untuk berbagai jenis pekerjaan kemudian dapat
ditempatkan pada suatu kontinum mulai dari mereka yang lebih memilih pekerjaan yang cukup
rutin hingga mereka yang lebih menyukai pekerjaan dengan tantangan yang semakin meningkat.
Mereka yang memilih tantangan tingkat menengah cenderung lebih termotivasi untuk
pencapaian daripada mereka yang memilih tingkat tantangan yang lebih rendah atau lebih tinggi.
Individu yang berorientasi pada prestasi cenderung realistis dan memilih pekerjaan yang cukup
menantang dan dalam jangkauan pencapaian. Orang yang lalai dan terlalu percaya diri mungkin
akan memilih pekerjaan yang sangat menantang di mana keberhasilannya lambat, tidak
menyadari apakah hasil akhirnya akan tercapai atau tidak. Mereka yang motivasi berprestasi
rendah mungkin akan memilih pekerjaan yang lebih rutin. Dengan demikian, mereka yang
mencari tantangan moderat juga dapat diidentifikasi.

Elemen dimensi 5 Mereka yang menginginkan umpan balik mencarinya dari atasan, rekan kerja,
dan terkadang bahkan dari bawahan mereka. Mereka ingin mengetahui pendapat orang lain
tentang seberapa baik kinerja mereka. Umpan balik, baik positif maupun negatif, menunjukkan
kepada mereka seberapa banyak yang mereka capai dan capai. Jika mereka menerima pesan yang
menyarankan perlunya perbaikan, mereka akan menindaklanjutinya. Karenanya, mereka terus
mencari umpan balik dari beberapa sumber. Dengan melacak seberapa sering individu mencari
umpan balik dari orang lain selama periode waktu tertentu - katakanlah, selama beberapa bulan -
karyawan dapat kembali ditempatkan pada suatu kontinum mulai dari mereka yang mencari
umpan balik ekstensif dari semua sumber hingga mereka yang tidak pernah mencari umpan balik
dari siapa pun kapan pun.

Setelah mengoperasionalkan konsep motivasi berprestasi dengan mengurangi tingkat


abstraksinya menjadi perilaku yang dapat diamati, dimungkinkan untuk mengembangkan ukuran
yang baik untuk memanfaatkan konsep motivasi berprestasi. Kegunaannya adalah orang lain
dapat menggunakan ukuran yang sama, sehingga memastikan dapat direplikasi. Bagaimanapun,
harus diakui bahwa setiap operasionalisasi kemungkinan besar, pertama, mengecualikan
beberapa dimensi dan elemen penting yang timbul dari kegagalan untuk mengenali atau
mengkonseptualisasikannya dan, kedua, memasukkan fitur-fitur tertentu yang tidak relevan, yang
secara keliru dianggap relevan.
Apa operasionalisasi tidak

Sama pentingnya untuk memahami apa itu operasionalisasi, sama pentingnya untuk
mengingat apa yang bukan. Operasionalisasi tidak menggambarkan korelasi konsep tersebut.
Misalnya, kesuksesan dalam kinerja tidak dapat menjadi dimensi motivasi berprestasi, meskipun
orang yang termotivasi kemungkinan besar akan bertemu dengannya. Jadi, motivasi berprestasi
dan kinerja dan / atau kesuksesan mungkin sangat berkorelasi, tetapi kita tidak dapat mengukur
tingkat motivasi individu melalui kesuksesan dan kinerja. Kinerja dan kesuksesan mungkin
dimungkinkan sebagai konsekuensi dari motivasi berprestasi, tetapi di dalam dan dari dirinya
sendiri, keduanya bukanlah ukuran untuk itu. Untuk menjelaskannya, seseorang dengan motivasi
berprestasi tinggi mungkin telah gagal karena suatu alasan, mungkin di luar kendalinya, untuk
melakukan pekerjaan dengan sukses. Jadi, jika kita menilai motivasi berprestasi orang ini dengan
kinerja sebagai tolak ukur, kita akan salah mengukur konsep. Alih-alih mengukur motivasi
berprestasi - variabel minat kita - kita akan mengukur kinerja, variabel lain yang tidak ingin kita
ukur atau minati.

Dengan demikian, jelas bahwa mengoperasionalkan konsep tidak terdiri dari


penggambaran alasan, anteseden, konsekuensi, atau korelasi dari konsep tersebut. Sebaliknya, ini
menggambarkan karakteristik yang dapat diamati untuk dapat mengukur konsep tersebut.
Penting untuk mengingat ini karena jika kita salah mengoperasionalkan konsep atau
mengacaukannya dengan konsep lain, maka kita tidak akan memiliki ukuran yang valid. Artinya
kita tidak akan memiliki data yang “baik”, dan penelitian kita tidak akan ilmiah.

Review operasionalisasi

Sejauh ini kami telah memeriksa bagaimana mendefinisikan konsep secara operasional.
Operasionalisasi diperlukan untuk mengukur konsep abstrak dan subyektif seperti perasaan dan
sikap. Variabel yang lebih obyektif seperti usia atau tingkat pendidikan dapat diukur dengan
mudah melalui pertanyaan yang sederhana dan lugas dan tidak harus dioperasionalkan. Kami
telah menunjukkan bahwa operasionalisasi dimulai dengan definisi konsep. Langkah selanjutnya
adalah menemukan atau mengembangkan (serangkaian) pertanyaan tertutup yang memadai yang
memungkinkan Anda mengukur konsep dengan cara yang andal dan valid. Untungnya, ukuran
untuk banyak konsep yang relevan dalam penelitian bisnis telah dikembangkan oleh para
peneliti. Saat Anda meninjau literatur di area tertentu, Anda mungkin ingin mencatat secara
khusus referensi yang membahas instrumen yang digunakan untuk mengetuk konsep dalam
penelitian, dan membacanya. Artikel ini akan memberi tahu Anda kapan ukuran itu
dikembangkan, oleh siapa, dan untuk berapa lama telah digunakan. Jika Anda tidak dapat
menemukan atau menggunakan ukuran yang ada, Anda harus mengembangkan ukuran Anda
sendiri. Untuk dapat melakukan ini, Anda perlu menjadi seorang ahli dalam domain tertentu; ini
memungkinkan Anda untuk memasukkan dimensi dan elemen yang relevan dalam ukuran Anda.
Hanya instrumen yang dikembangkan dengan baik, yang telah dioperasionalkan dengan hati-hati,
akan diterima dan sering digunakan oleh peneliti lain.

DIMENSI INTERNASIONAL OPERASIONALISASI

Dalam melakukan penelitian transnasional, perlu diingat bahwa variabel tertentu


memiliki arti dan konotasi yang berbeda dalam budaya yang berbeda. Misalnya, istilah "cinta"
tunduk pada beberapa interpretasi dalam budaya yang berbeda dan memiliki setidaknya 20
interpretasi berbeda di beberapa negara. Demikian pula, konsep "pengetahuan" disamakan
dengan "jnana" di beberapa budaya Timur dan diartikan sebagai "realisasi Yang Maha Kuasa."
Oleh karena itu, adalah bijaksana bagi peneliti yang berasal dari negara yang berbicara bahasa
berbeda untuk merekrut bantuan sarjana lokal untuk mengoperasionalkan konsep tertentu sambil
melakukan penelitian lintas budaya.

Pengukuran: Scaling, reliabilitas dan validitas

EMPAT JENIS TIMBANGAN

Pengukuran berarti mengumpulkan data dalam bentuk angka. Untuk dapat memberikan
angka ke atribut objek kita membutuhkan skala. Skala adalah alat atau mekanisme di mana
individu dibedakan tentang bagaimana mereka berbeda satu sama lain pada variabel yang
menarik untuk penelitian kami. Penskalaan melibatkan pembuatan kontinum tempat objek kita
berada.

Misalkan kita ingin mengukur sikap konsumen terhadap konsumsi minuman ringan.
Setelah kita mengembangkan satu atau lebih item skala atau pertanyaan, langkah selanjutnya
dalam pengukuran adalah memutuskan skala yang memungkinkan kita untuk menetapkan angka
ke atribut (sikap terhadap konsumsi minuman ringan) dari objek kita (konsumen). Hal ini
memungkinkan kami untuk selanjutnya mengklasifikasikan objek kami (konsumen) dalam istilah
seberapa tidak menguntungkan atau menguntungkan mereka terhadap minum minuman ringan.
Salah satu dari banyak opsi yang kami miliki untuk mengklasifikasikan konsumen adalah skala
likert. Skala Likert adalah skala yang dirancang untuk menguji seberapa kuat responden setuju
dengan pernyataan (seperti “Saya menikmati minuman ringan”) pada skala lima poin dengan
jangkar sebagai berikut: 1 = Sangat Tidak Setuju, 2 = Tidak Setuju, 3 = Neither Agree Nor
Disagree, 4 = Agree, 5 = Strongly Agree (selanjutnya dalam bab ini kita akan membahas secara
menyeluruh berbagai macam skala peringkat dan peringkat, termasuk skala Likert). Oleh karena
itu, skala Likert memungkinkan kita untuk membedakan konsumen dalam hal bagaimana mereka
berbeda satu sama lain dalam sikap mereka terhadap minuman ringan, setiap responden diberi
nomor yang menunjukkan kurang lebih tidak disukai, netral, atau kurang lebih disukai.

Pertanyaan jutaan dolar adalah: Apa arti angka 1, 2, 3, 4, dan 5? Apakah skala yang kita
gunakan memungkinkan kita misalnya untuk menentukan peringkat objek kita (2 lebih dari 1)?
Apakah itu memungkinkan kita untuk membandingkan perbedaan antara objek (dengan kata lain
adalah perbedaan antara 1 dan 2 sama dengan perbedaan antara 2 dan 3? Dan apakah itu
memungkinkan kita untuk menghitung statistik tertentu seperti mean (atau rata-rata) dan standar
deviasi? Jawabannya adalah: tergantung. Itu tergantung pada jenis skala (yaitu, jenis skala dasar)
yang kita gunakan.

Ada empat jenis skala dasar: nominal, ordinal, interval, dan rasio. Tingkat kecanggihan di
mana timbangan disetel dengan baik semakin meningkat seiring dengan perpindahan dari skala
nominal ke skala rasio. Itulah sebabnya informasi tentang variabel dapat diperoleh secara lebih
rinci bila kita menggunakan skala interval atau rasio daripada menggunakan dua skala lainnya.
Saat kalibrasi atau penyesuaian timbangan meningkat kecanggihannya, begitu pula kekuatan
timbangan tersebut. Dengan skala yang lebih kuat, analisis data yang semakin canggih dapat
dilakukan, yang pada gilirannya, berarti bahwa jawaban yang lebih bermakna dapat ditemukan
untuk pertanyaan penelitian kami. Namun, variabel tertentu lebih memudahkan penskalaan yang
lebih kuat daripada yang lain. Sekarang mari kita periksa masing-masing dari empat skala ini.

Skala nominal
Skala nominal adalah skala yang memungkinkan peneliti untuk menetapkan subjek ke
kategori atau kelompok tertentu. Misalnya, dalam hal variabel jenis kelamin, responden dapat
dikelompokkan menjadi dua kategori - laki-laki dan perempuan. Kedua kelompok ini dapat
diberi nomor kode 1 dan 2. Nomor ini berfungsi sebagai label kategori yang sederhana dan
nyaman tanpa nilai intrinsik, selain untuk menetapkan responden ke salah satu dari dua kategori
yang tidak tumpang tindih, atau saling eksklusif. Perhatikan bahwa kategorinya juga lengkap
secara kolektif. Dengan kata lain, tidak ada kategori ketiga di mana responden biasanya
termasuk. Dengan demikian, skala nominal mengategorikan individu atau objek ke dalam
kelompok yang saling eksklusif dan menyeluruh. Informasi yang dapat dihasilkan dari
penskalaan nominal adalah perhitungan persentase (atau frekuensi) laki-laki dan perempuan
dalam sampel responden kami. Misalnya, jika kami telah mewawancarai 200 orang, dan
memberikan kode nomor 1 untuk semua responden laki-laki dan nomor 2 untuk semua
responden perempuan, maka analisis data komputer pada akhir survei dapat menunjukkan bahwa
98 responden adalah laki-laki dan 102 adalah wanita. Distribusi frekuensi ini menunjukkan
bahwa 49% responden survei adalah laki-laki dan 51% perempuan. Selain informasi marjinal ini,
penskalaan seperti itu tidak memberi tahu kita lebih banyak tentang kedua kelompok. Jadi, skala
nominal memberikan beberapa informasi dasar, kategoris, dan kasar.

Skala ordinal

Skala ordinal tidak hanya mengkategorikan variabel sedemikian rupa untuk menunjukkan
perbedaan di antara berbagai kategori, tetapi juga menyusun urutan kategori dengan cara yang
bermakna. Dengan variabel apapun yang kategorinya akan diurutkan menurut beberapa
preferensi, skala ordinal akan digunakan. Preferensi akan diberi peringkat (misalnya, dari terbaik
ke terburuk; pertama ke terakhir) dan diberi nomor 1, 2, dan seterusnya. Misalnya, responden
mungkin diminta untuk menunjukkan preferensi mereka dengan memeringkat pentingnya
mereka lampirkan pada lima karakteristik berbeda dalam pekerjaan yang mungkin tertarik untuk
dipelajari oleh peneliti. Pertanyaan seperti itu mungkin berbentuk seperti yang ditunjukkan pada
contoh berikut.

Skala ordinal membantu peneliti untuk menentukan persentase responden yang


menganggap interaksi dengan orang lain sebagai yang terpenting, mereka yang menganggap
menggunakan sejumlah keterampilan yang berbeda sebagai yang paling penting, dan sebagainya.
Pengetahuan semacam itu dapat membantu dalam merancang pekerjaan yang dianggap paling
diperkaya oleh sebagian besar karyawan.

Sekarang kita dapat melihat bahwa skala ordinal memberikan lebih banyak informasi
daripada skala nominal. Skala ordinal lebih dari sekadar membedakan kategori untuk
memberikan informasi tentang bagaimana responden membedakannya dengan urutan peringkat.
Perhatikan, bagaimanapun, bahwa skala ordinal tidak memberikan indikasi apapun tentang
besarnya perbedaan antar tingkatan. Misalnya, dalam contoh karakteristik pekerjaan,
karakteristik pekerjaan peringkat pertama mungkin hanya sedikit lebih disukai daripada
karakteristik peringkat kedua, sedangkan karakteristik peringkat ketiga mungkin lebih disukai
dalam derajat yang jauh lebih besar daripada peringkat keempat. Jadi, dalam penskalaan ordinal,
meskipun perbedaan dalam peringkat objek, orang, atau peristiwa yang diinvestigasi diketahui
dengan jelas, kita tidak mengetahui besarnya. Kekurangan ini diatasi dengan penskalaan interval,
yang akan dibahas selanjutnya

Skala interval

Dalam skala interval, atau skala interval yang sama, jarak yang sama secara numerik
pada skala mewakili nilai yang sama dalam karakteristik yang diukur. Sedangkan skala nominal
memungkinkan kita hanya untuk membedakan kelompok secara kualitatif dengan
mengkategorikannya ke dalam himpunan yang saling eksklusif dan lengkap, dan skala ordinal
untuk menentukan peringkat preferensi, skala interval memungkinkan kita untuk
membandingkan perbedaan antara objek. Perbedaan antara dua nilai pada skala identik dengan
perbedaan antara dua nilai tetangga skala lainnya. Termometer klinis adalah contoh yang baik
dari instrumen skala interval; itu memiliki asal yang berubah-ubah dan besarnya perbedaan
antara 98,6 derajat (seharusnya suhu tubuh normal) dan 99,6 derajat adalah sama dengan
besarnya perbedaan antara 104 dan 105 derajat. Perhatikan, bagaimanapun, bahwa seseorang
mungkin tidak terlalu khawatir jika suhu seseorang naik dari 98,6 menjadi 99,6, tetapi
kemungkinan besar akan begitu ketika suhu naik dari 104 menjadi 105 derajat!

Skala interval, kemudian, mengetuk perbedaan, urutan, dan persamaan dari besarnya
perbedaan dalam variabel. Dengan demikian, ini adalah skala yang lebih kuat daripada skala
nominal dan ordinal, dan memiliki mean aritmatika untuk mengukur tendensi sentralnya. Ukuran
dispersinya adalah kisaran, deviasi standar, dan varians.

Skala rasio

Skala rasio mengatasi kerugian dari titik asal sewenang-wenang dari skala interval,
karena memiliki titik nol absolut (berbeda dengan sembarang), yang merupakan titik pengukuran
yang berarti. Dengan demikian, skala rasio tidak hanya mengukur besarnya perbedaan antar titik
pada skala tetapi juga menyentuh proporsi dalam perbedaan tersebut. Ini adalah yang paling kuat
dari empat skala karena memiliki asal nol yang unik (bukan asal sembarangan) dan memasukkan
semua properti dari tiga skala lainnya. Timbangan timbangan adalah contoh yang baik dari skala
rasio. Ini memiliki asal nol mutlak (dan tidak sewenang-wenang) yang dikalibrasi di atasnya,
yang memungkinkan kita menghitung rasio bobot dua individu. Misalnya, seseorang dengan
berat 250 pon dua kali lebih berat dari orang yang beratnya 125 pon. Perhatikan bahwa
mengalikan atau membagi kedua angka ini (250 dan 125) dengan angka apa pun akan
mempertahankan rasio 2: 1. Ukuran tendensi sentral dari skala rasio dapat berupa aritmatika atau
rata-rata geometris dan ukuran dispersi dapat berupa deviasi standar, atau varians, atau koefisien
variasi. Beberapa contoh skala rasio adalah yang berkaitan dengan usia aktual, pendapatan, dan
jumlah organisasi yang pernah bekerja.

Properti timbangan, seiring dengan semakin banyaknya penyetelan yang dilakukan,


dirangkum dalam Tabel 12.1. Kita juga dapat melihat dari tabel bagaimana kekuatan statistik
meningkat saat kita menjauh dari skala nominal (di mana kita mengelompokkan subjek atau item
di bawah beberapa kategori), ke skala ordinal (di mana kita menyusun urutan kategori), ke skala
skala interval (di mana kita mengetuk besarnya perbedaan), ke skala rasio (yang memungkinkan
kita mengukur proporsi perbedaan).

Anda pasti sudah menduga sekarang bahwa beberapa variabel, seperti jenis kelamin,
hanya dapat diukur pada skala nominal, sementara yang lain, seperti suhu, dapat diukur pada
skala ordinal (panas / sedang / rendah), atau skala interval melalui termometer. Kapan pun
dimungkinkan untuk menggunakan skala yang lebih kuat, adalah bijaksana untuk melakukannya.

Ordinal atau interval?


Skala likert (dibahas nanti dalam bab ini) adalah cara yang umum digunakan untuk
mengukur opini dan sikap. Mereka mengukur sejauh mana peserta setuju atau tidak setuju
dengan pernyataan yang diberikan, dan biasanya berkisar dari 1 (sangat tidak setuju) hingga 5
(sangat setuju) dengan titik netral di tengah (misalnya tidak setuju atau tidak setuju). Apakah
skala ini bersifat ordinal atau interval adalah topik perdebatan. Beberapa orang berpendapat
bahwa skala likert bersifat ordinal. Mereka dengan tepat menunjukkan bahwa seseorang tidak
dapat berasumsi bahwa semua pasang tingkat yang berdekatan berjarak sama (dengan jarak yang
sama). Meskipun demikian, skala Likert (dan beberapa skala lainnya, yaitu skala diferensial
semantik dan skala numerik - juga dibahas nanti dalam bab ini) umumnya diperlakukan seolah-
olah skala interval, karena memungkinkan peneliti menghitung rata-rata dan standar.
penyimpangan dan untuk menerapkan teknik statistik lain yang lebih maju (misalnya, untuk
menguji hipotesis)

Review skala

Empat skala yang dapat diterapkan pada pengukuran variabel adalah skala nominal,
ordinal, interval, dan rasio. Skala nominal menyoroti perbedaan dengan mengklasifikasikan
objek atau orang ke dalam kelompok, dan memberikan informasi paling sedikit tentang variabel
tersebut. Skala ordinal memberikan beberapa informasi tambahan dengan urutan peringkat
kategori skala nominal. Skala interval tidak hanya memberi peringkat, tetapi juga memberi kita
informasi tentang besarnya perbedaan variabel. Skala rasio tidak hanya menunjukkan besarnya
perbedaan tetapi juga proporsinya. Perkalian atau pembagian akan mempertahankan rasio ini.
Saat kami beralih dari skala nominal ke rasio, kami memperoleh ketepatan yang semakin
meningkat dalam mengukur data, dan fleksibilitas yang lebih besar dalam menggunakan uji
statistik yang lebih canggih. Oleh karena itu, jika memungkinkan dan sesuai, skala yang lebih
kuat daripada skala yang kurang kuat harus digunakan untuk mengukur variabel yang menarik.

Teknik penskalaan khusus yang biasa digunakan dalam penelitian bisnis dapat
diklasifikasikan ke dalam skala peringkat dan skala peringkat. Dalam skala peringkat, setiap
objek diskalakan secara independen dari objek lain yang diteliti. Skala peringkat, di sisi lain,
membuat perbandingan antara atau di antara objek dan memperoleh pilihan dan peringkat yang
disukai di antara mereka. Peringkat khusus dan skala peringkat dibahas selanjutnya.
SKALA PERINGKAT

Skala penilaian berikut sering digunakan dalam penelitian bisnis:

 Skala dikotomi
 Skala kategori
 Skala diferensial semantik
 Skala numerik
 Skala peringkat yang diperinci
 Skala likert
 Skala peringkat jumlah tetap atau konstan
 Skala stapel
 Skala penilaian grafis
 Skala konsensus

Skala lain, seperti Skala Interval Penampilan Sama Thurstone, dan skala multidimensi,
lebih jarang digunakan. Kami akan menjelaskan secara singkat masing-masing skala sikap di
atas.

Skala dikotomi

Skala dikotomis digunakan untuk mendapatkan jawaban Ya atau Tidak, seperti pada
contoh di bawah ini. Perhatikan bahwa skala nominal digunakan untuk memperoleh respons.

Skala kategori

Skala kategori menggunakan beberapa item untuk memperoleh respons tunggal, seperti
contoh berikut. Ini juga menggunakan skala nominal.

Skala diferensial semantik

Beberapa atribut bipolar diidentifikasi pada skala ekstrem, dan responden diminta untuk
menunjukkan sikap mereka, pada apa yang disebut ruang semantik, terhadap individu, objek,
atau peristiwa tertentu pada setiap atribut. Kata sifat bipolar yang digunakan mungkin
menggunakan istilah-istilah seperti Baik – Buruk; Kuat lemah; Panas dingin. Skala diferensial
semantik digunakan untuk menilai sikap responden terhadap merek, iklan, objek, atau individu
tertentu. Tanggapan dapat diplot untuk mendapatkan gambaran yang baik tentang persepsi
mereka. Skala diferensial semantik bersifat ordinal. Namun, ini sering diperlakukan sebagai
skala interval. Contoh skala diferensial semantik berikut.

Skala numerik

Skala numerik mirip dengan skala diferensial semantik, dengan perbedaan yang
disediakan angka pada skala lima poin atau tujuh poin, dengan kata sifat bipolar di kedua
ujungnya, seperti yang diilustrasikan di bawah ini. Skala ini juga sering diperlakukan sebagai
skala interval, meskipun secara formal bersifat ordinal.

Skala peringkat yang diperinci

Skala lima poin atau tujuh poin dengan jangkar, sesuai kebutuhan, disediakan untuk
setiap item dan responden menyatakan nomor yang sesuai di sisi setiap item, atau lingkari nomor
yang relevan pada setiap item, sesuai contoh berikut. Tanggapan terhadap item kemudian
dijumlahkan. Ini menggunakan skala interval.

Skala peringkat yang diperinci memberikan fleksibilitas untuk menggunakan sebanyak


mungkin poin dalam skala yang dianggap perlu (4, 5, 7, 9, atau apa pun), dan juga
memungkinkan untuk menggunakan jangkar yang berbeda (misalnya, Sangat Tidak Penting
hingga Sangat Penting; Sangat Tidak Penting; Rendah hingga Sangat Tinggi). Ketika titik netral
diberikan, itu adalah skala peringkat seimbang, dan jika tidak, itu adalah skala peringkat tidak
seimbang.

Penelitian menunjukkan bahwa skala lima poin sama baiknya dengan yang lainnya, dan
bahwa peningkatan dari lima menjadi tujuh atau sembilan poin pada skala peringkat tidak
meningkatkan keandalan peringkat (Elmore & Beggs, 1975).

Skala peringkat yang diperinci sering digunakan dalam penelitian bisnis, karena
menyesuaikan dengan jumlah poin yang ingin digunakan peneliti, serta nomenklatur jangkar,
yang dianggap perlu untuk mengakomodasi kebutuhan peneliti untuk mengetuk variabel .

Skala likert
Skala Likert dirancang untuk menguji seberapa kuat subjek setuju atau tidak setuju
dengan pernyataan pada skala lima poin dengan jangkar berikut:

Tanggapan atas sejumlah item yang menyentuh konsep atau variabel tertentu dapat
dianalisis item demi item, tetapi juga memungkinkan untuk menghitung skor total atau
penjumlahan untuk setiap responden dengan menjumlahkan seluruh item. Pendekatan
penjumlahan banyak digunakan, dan oleh karena itu skala likert juga disebut sebagai skala
penjumlahan.

Pada contoh berikut, skor pada item kedua harus dibalik sebelum menghitung skor
penjumlahan, karena skor yang tinggi pada item ini mencerminkan sikap kurang baik untuk
bekerja, sedangkan skor tinggi pada item 1 dan 3 mencerminkan sikap yang mendukung
bekerja. . Hal ini akan menyebabkan skor total yang tinggi untuk responden yang memiliki sikap
baik terhadap pekerjaan dan skor total yang rendah untuk responden yang memiliki sikap kurang
baik terhadap pekerjaan.

Apakah skala Likert adalah skala ordinal atau interval adalah subjek banyak perdebatan.
Orang yang memperlakukan skala Likert sebagai skala ordinal berpendapat bahwa seseorang
tidak dapat berasumsi bahwa semua pasangan dari level yang berdekatan memiliki jarak yang
sama. Meskipun demikian, skala Likert umumnya diperlakukan sebagai skala interval.

Skala jumlah tetap atau konstan

Responden di sini diminta untuk mendistribusikan sejumlah poin ke berbagai item sesuai
contoh di bawah ini. Ini lebih bersifat skala ordinal.

Skala stapel

Skala ini secara simultan mengukur arah dan intensitas sikap terhadap item yang diteliti.
Karakteristik yang menarik untuk penelitian ini ditempatkan di tengah dengan skala numerik
yang berkisar, katakanlah, dari +3 hingga −3, di kedua sisi item, seperti yang diilustrasikan
dalam contoh di bawah ini. Ini memberikan gambaran tentang seberapa dekat atau jauh respon
individu terhadap stimulus tersebut. Karena ini tidak memiliki titik nol mutlak, ini adalah skala
interval.
Skala peringkat grafis

Representasi grafis membantu responden untuk menunjukkan pada skala ini jawaban
mereka atas pertanyaan tertentu dengan memberi tanda pada titik yang sesuai pada garis, seperti
pada contoh berikut. Ini adalah skala ordinal, meskipun contoh berikut mungkin membuatnya
terlihat seperti skala interval.

Skala ini mudah ditanggapi. Deskripsi singkat tentang poin skala dimaksudkan sebagai
panduan dalam menemukan peringkat daripada mewakili kategori yang berbeda. Skala wajah,
yang menggambarkan wajah mulai dari tersenyum hingga sedih (diilustrasikan di Bab 9), juga
merupakan skala penilaian grafis yang digunakan untuk mendapatkan tanggapan terkait perasaan
orang sehubungan dengan beberapa aspek - misalnya, bagaimana perasaan mereka tentang
pekerjaan mereka.

Skala konsensus

Skala juga dapat dikembangkan melalui konsensus, di mana panel juri memilih item
tertentu, yang dalam pandangannya mengukur konsep yang relevan. Item dipilih secara khusus
berdasarkan ketepatan atau relevansinya dengan konsep. Skala konsensus semacam itu
dikembangkan setelah item yang dipilih telah diperiksa dan diuji validitas dan reliabilitasnya.
Salah satu skala konsensus tersebut adalah Skala Interval Penampilan Sama Thurstone, di mana
sebuah konsep diukur dengan proses yang kompleks yang diikuti oleh panel juri. Dengan
menggunakan tumpukan kartu yang berisi beberapa uraian konsep, panel juri memberikan
masukan untuk menunjukkan seberapa dekat atau tidak pernyataan tersebut dengan konsep yang
diteliti. Skala tersebut kemudian dikembangkan berdasarkan konsensus yang dicapai. Namun,
skala ini jarang digunakan untuk mengukur konsep organisasi karena waktu yang dibutuhkan
untuk mengembangkannya.

Timbangan lainnya

Ada juga beberapa metode penskalaan lanjutan seperti penskalaan multidimensi, di mana
objek, orang, atau keduanya, diskalakan secara visual, dan analisis konjoin dilakukan. Ini
memberikan gambaran visual tentang hubungan dalam ruang di antara dimensi konstruksi.
Perlu dicatat bahwa Likert atau beberapa bentuk skala numerik adalah yang paling sering
digunakan untuk mengukur sikap dan perilaku dalam penelitian bisnis.

SKALA PERINGKAT

Seperti yang telah disebutkan, skala peringkat digunakan untuk memanfaatkan preferensi
antara dua atau di antara lebih banyak objek atau item (bersifat ordinal). Namun, peringkat
tersebut mungkin tidak memberikan petunjuk pasti untuk beberapa jawaban yang dicari.
Misalnya, katakanlah ada empat lini produk dan manajer mencari informasi yang akan
membantu memutuskan lini produk mana yang harus mendapatkan perhatian paling banyak.
Mari kita asumsikan juga bahwa 35% responden memilih produk pertama, 25% yang kedua, dan
20% memilih masing-masing produk tiga dan empat sebagai produk yang penting bagi mereka.
Manajer kemudian tidak dapat menyimpulkan bahwa produk pertama adalah yang paling
disukai, karena 65% responden tidak memilih produk tersebut! Metode alternatif yang digunakan
adalah perbandingan berpasangan, pilihan paksa, dan skala komparatif, yang dibahas di bawah
ini.

Perbandingan berpasangan

Skala perbandingan berpasangan digunakan ketika, di antara sejumlah kecil objek,


responden diminta untuk memilih di antara dua objek sekaligus. Ini membantu untuk menilai
preferensi. Jika, misalnya, pada contoh sebelumnya, selama perbandingan berpasangan,
responden secara konsisten menunjukkan preferensi untuk produk satu di atas produk dua, tiga,
dan empat, manajer dapat diandalkan untuk memahami lini produk mana yang membutuhkan
perhatian penuh. Namun, seiring bertambahnya jumlah objek yang akan dibandingkan, begitu
pula jumlah perbandingan berpasangan. Jumlah pilihan berpasangan untuk n objek akan menjadi
(n) (n - 1) / 2. Semakin besar jumlah objek atau rangsangan, semakin besar jumlah perbandingan
berpasangan yang disajikan kepada responden, dan semakin besar kelelahan responden.
Karenanya, perbandingan berpasangan adalah metode yang baik jika jumlah rangsangan yang
disajikan kecil.

Perbandingan berpasangan
Pilihan paksa memungkinkan responden untuk memberi peringkat objek relatif satu sama
lain, di antara alternatif yang disediakan. Hal ini memudahkan responden, terutama jika jumlah
pilihan yang akan diranking terbatas jumlahnya.

Skala perbandingan

Skala komparatif memberikan tolak ukur atau titik acuan untuk menilai sikap terhadap
objek, peristiwa, atau situasi saat ini yang diteliti. Contoh penggunaan skala komparatif berikut.

Singkatnya, data nominal cocok dengan skala dikotomis atau kategori; data ordinal ke
salah satu skala peringkat - perbandingan berpasangan, pilihan paksa, atau skala komparatif; dan
data interval atau seperti interval ke skala penilaian lainnya, seperti yang terlihat dari berbagai
contoh di atas. Diferensial semantik dan skala numerik, sebenarnya, bukanlah skala interval,
meskipun sering diperlakukan seperti itu dalam analisis data.

Skala penilaian digunakan untuk mengukur sebagian besar konsep perilaku. Skala
pemeringkatan digunakan untuk membuat perbandingan atau mengurutkan variabel-variabel
yang telah disadap pada skala nominal.

DIMENSI INTERNASIONAL SCALING

Terlepas dari kepekaan terhadap definisi operasional konsep dalam budaya lain, masalah
penskalaan juga perlu ditangani dalam penelitian lintas budaya. Budaya yang berbeda bereaksi
berbeda terhadap masalah penskalaan. Misalnya, skala lima poin atau tujuh poin mungkin tidak
membuat perbedaan di Amerika Serikat, tetapi bisa dalam tanggapan subjek di negara lain (lihat
Sekaran & Martin, 1982; Sekaran & Trafton, 1978). Barry (1969), misalnya, menemukan bahwa
di beberapa negara, skala tujuh poin lebih sensitif daripada skala empat poin dalam
memunculkan tanggapan yang tidak bias.

Penelitian terbaru menunjukkan bahwa orang-orang dari berbagai negara berbeda dalam
kecenderungan mereka untuk menggunakan skala penilaian yang ekstrim (misalnya 1 dan 5 atau
1 dan 7) dan untuk menanggapi dengan cara yang diinginkan secara sosial (De Jong, 2006).
Temuan ini menggambarkan bahwa menganalisis dan menafsirkan data yang dikumpulkan di
banyak negara merupakan pekerjaan yang sangat menantang.
KEBAIKAN UKURAN

Sekarang kita telah melihat bagaimana mendefinisikan variabel secara operasional dan
menerapkan teknik penskalaan yang berbeda, penting untuk memastikan bahwa instrumen yang
kita kembangkan untuk mengukur konsep tertentu memang mengukur variabel secara akurat, dan
sebenarnya, kita benar-benar mengukur konsep yang akan kami ukur. Ini memastikan bahwa
dalam mendefinisikan variabel persepsi dan sikap secara operasional, kami tidak mengabaikan
beberapa dimensi dan elemen penting atau menyertakan beberapa yang tidak relevan. Skala yang
dikembangkan seringkali tidak sempurna, dan kesalahan cenderung terjadi dalam pengukuran
variabel sikap. Penggunaan instrumen yang lebih baik akan memastikan hasil yang lebih akurat,
yang pada gilirannya akan meningkatkan kualitas ilmiah penelitian. Karenanya, dalam beberapa
hal, kita perlu menilai “kebaikan” dari ukuran yang dikembangkan. Artinya, kita perlu cukup
yakin bahwa instrumen yang kita gunakan dalam penelitian kita memang mengukur variabel
yang seharusnya, dan mengukurnya secara akurat.

Sekarang mari kita periksa bagaimana kita dapat memastikan bahwa tindakan yang
dikembangkan cukup baik. Pertama, analisis item dari tanggapan atas pertanyaan yang
menyentuh variabel dilakukan, dan kemudian reliabilitas dan validitas ukuran ditetapkan, seperti
yang dijelaskan di bawah ini.

Analisis item

Analisis item dilakukan untuk melihat apakah item dalam instrumen tersebut ada atau
tidak. Setiap item diperiksa kemampuannya untuk membedakan antara subjek yang skor totalnya
tinggi dan subjek yang skornya rendah. Dalam analisis item, mean antara kelompok skor tinggi
dan kelompok skor rendah diuji untuk mendeteksi perbedaan yang signifikan melalui nilai-t.
Soal-soal dengan nilai t tinggi (tes yang mampu mengidentifikasi soal-soal yang sangat
diskriminatif dalam instrumen) dimasukkan ke dalam instrumen. Setelah itu, uji reliabilitas
instrumen dilakukan dan validitas ukuran ditetapkan.

Singkatnya, reliabilitas adalah tes tentang seberapa konsisten alat ukur mengukur konsep
apa pun yang diukurnya. Validitas adalah pengujian seberapa baik instrumen yang
dikembangkan mengukur konsep tertentu yang ingin diukur. Dengan kata lain, validitas
berkaitan dengan apakah kita mengukur konsep yang benar, dan reliabilitas dengan stabilitas dan
konsistensi pengukuran. Validitas dan reliabilitas ukuran membuktikan ketelitian ilmiah yang
telah dimasukkan ke dalam studi penelitian. Kedua kriteria ini sekarang akan dibahas. Berbagai
bentuk reliabilitas dan validitas digambarkan pada Gambar 12.1.

Keabsahan

Dalam Bab 10 kita memeriksa istilah validitas internal dan validitas eksternal dalam
konteks desain eksperimental. Artinya, kami akan prihatin tentang masalah keaslian hubungan
sebab-akibat (validitas internal), dan generalisasinya ke lingkungan eksternal (validitas
eksternal). Untuk saat ini, kita akan memeriksa keabsahan alat ukur itu sendiri. Artinya, ketika
kita mengajukan serangkaian pertanyaan (yaitu, mengembangkan alat ukur) dengan harapan
bahwa kita mengetuk konsep tersebut, bagaimana kita bisa cukup yakin bahwa kita memang
mengukur konsep yang kita tetapkan untuk diukur dan bukan sesuatu yang lain. ? Ini dapat
ditentukan dengan menerapkan tes validitas tertentu.

Beberapa jenis uji validitas digunakan untuk menguji kebaikan ukuran dan penulis
menggunakan istilah yang berbeda untuk menunjukkannya. Demi kejelasan, kami dapat
mengelompokkan tes validitas dalam tiga judul besar: validitas konten, validitas terkait kriteria,
dan validitas konstruk.

Validitas konten

Validitas konten memastikan bahwa ukuran tersebut mencakup serangkaian item yang
memadai dan representatif yang menyentuh konsep tersebut. Semakin banyak item skala
mewakili domain atau semesta konsep yang diukur, semakin besar validitas konten. Dengan kata
lain, validitas konten adalah fungsi dari seberapa baik dimensi dan elemen konsep telah
digambarkan.

Panel juri dapat membuktikan keabsahan konten instrumen. Kidder dan Judd (1986)
mengutip contoh di mana tes yang dirancang untuk mengukur derajat gangguan bicara dapat
dianggap memiliki validitas jika dievaluasi oleh sekelompok juri ahli (yaitu, terapis wicara
profesional).

Validitas wajah dianggap oleh beberapa indeks dasar dan minimum validitas konten.
Validitas wajah menunjukkan bahwa item-item yang dimaksudkan untuk mengukur suatu
konsep, memang, secara sepintas lalu, terlihat seperti mengukur konsep tersebut. Beberapa
peneliti tidak melihat kesesuaian untuk memperlakukan validitas wajah sebagai komponen
validitas konten yang valid.

Validitas terkait kriteria

Validitas terkait kriteria dibuat ketika ukuran tersebut membedakan individu pada kriteria
yang diharapkan untuk diprediksi. Ini dapat dilakukan dengan menetapkan validitas konkuren
atau validitas prediksi, seperti yang dijelaskan di bawah ini.

Validitas konkuren dibentuk ketika skala mendiskriminasi individu yang dikenal berbeda;
artinya, skor mereka harus berbeda pada instrumen, seperti pada contoh berikut.

Validitas prediktif menunjukkan kemampuan alat ukur untuk membedakan antara


individu dengan mengacu pada kriteria masa depan.

Bangun validitas

Validitas konstruk membuktikan seberapa baik hasil yang diperoleh dari penggunaan
ukuran sesuai dengan teori di sekitar tes yang dirancang. Ini dinilai melalui validitas konvergen
dan diskriminan, yang dijelaskan di bawah ini.

Validitas konvergen dibentuk ketika skor yang diperoleh dengan dua instrumen berbeda
yang mengukur konsep yang sama berkorelasi tinggi.

Validitas diskriminan ditetapkan ketika, berdasarkan teori, dua variabel diperkirakan


tidak berkorelasi, dan skor yang diperoleh dengan mengukurnya memang secara empiris
ditemukan demikian. Validitas dengan demikian dapat ditetapkan dengan berbagai cara.
Pengukuran yang dipublikasikan untuk berbagai konsep biasanya melaporkan jenis validitas
yang telah ditetapkan untuk instrumen tersebut, sehingga pengguna atau pembaca dapat menilai
“kebaikan” ukuran tersebut. Tabel 12.2 merangkum jenis validitas yang dibahas di sini.

Beberapa cara di mana bentuk validitas di atas dapat ditetapkan adalah melalui berikut
ini:
1. Analisis korelasional (seperti dalam kasus pembentukan validitas konkuren dan prediktif atau
validitas konvergen dan diskriminan).
2. Analisis faktor, teknik multivariat yang menegaskan dimensi konsep yang telah ditetapkan
secara operasional, serta menunjukkan item mana yang paling sesuai untuk setiap dimensi
(menetapkan validitas konstruk).
3. Matriks korelasi multitrait dan multimetode yang diturunkan dari konsep-konsep pengukuran
dengan berbagai bentuk dan metode yang berbeda, selain itu menetapkan kekuatan
pengukuran.

Singkatnya, kebaikan ukuran ditetapkan melalui berbagai jenis validitas dan reliabilitas
yang digambarkan dalam Gambar 12.1. Hasil penelitian apa pun hanya bisa sebaik ukuran yang
memanfaatkan konsep-konsep dalam kerangka teori. Kita perlu menggunakan ukuran yang
tervalidasi dengan baik dan dapat diandalkan untuk memastikan bahwa penelitian kita bersifat
ilmiah. Untungnya, langkah-langkah telah dikembangkan untuk banyak konsep penting dalam
penelitian bisnis dan sifat psikometriknya (yaitu, keandalan dan validitas) yang ditetapkan oleh
pengembang. Dengan demikian, peneliti dapat menggunakan instrumen yang sudah dianggap
"baik", daripada dengan susah payah mengembangkan ukuran mereka sendiri. Namun, saat
menggunakan ukuran ini, peneliti harus mengutip sumbernya (yaitu, penulis dan referensi)
sehingga pembaca dapat mencari lebih banyak informasi jika diperlukan.

Bukan hal yang aneh jika dua atau lebih ukuran yang sama baiknya dikembangkan untuk
konsep yang sama. Misalnya, ada beberapa instrumen berbeda untuk mengukur konsep
"kepuasan kerja". Salah satu skala yang paling sering digunakan untuk tujuan tersebut,
bagaimanapun, adalah Job Descriptive Index (JDI) yang dikembangkan oleh Smith, Kendall, dan
Hulin (1969). Jika ada lebih dari satu skala untuk variabel apa pun, lebih baik menggunakan
ukuran yang memiliki keandalan dan validitas yang lebih baik, dan juga lebih sering digunakan.

Kadang-kadang, kami mungkin juga harus menyesuaikan ukuran yang ditetapkan agar
sesuai dengan pengaturan. Misalnya, skala yang digunakan untuk mengukur kinerja pekerjaan,
karakteristik pekerjaan, atau kepuasan kerja di industri manufaktur mungkin harus sedikit
dimodifikasi agar sesuai dengan perusahaan utilitas atau organisasi perawatan kesehatan.
Lingkungan kerja di setiap kasus berbeda dan susunan kata dalam instrumen mungkin harus
disesuaikan dengan tepat. Namun, dalam melakukan ini, kami merusak skala yang sudah mapan,
dan disarankan untuk mengujinya lagi untuk kecukupan validitas dan reliabilitas.

Contoh dari beberapa ukuran yang digunakan untuk memanfaatkan beberapa konsep
yang sering diteliti di bidang pengelolaan dan pemasaran tersedia di lampiran bab ini.

Akhirnya, penting untuk dicatat bahwa validitas adalah kondisi yang diperlukan tetapi
tidak cukup untuk menguji kebaikan suatu ukuran. Suatu ukuran seharusnya tidak hanya valid
tetapi juga dapat diandalkan. Suatu ukuran dapat diandalkan jika memberikan hasil yang
konsisten. Sekarang kita akan membahas konsep reliabilitas.

Keandalan

Keandalan suatu ukuran menunjukkan sejauh mana tindakan tersebut tanpa bias (bebas
kesalahan) dan karenanya memastikan pengukuran yang konsisten sepanjang waktu dan di
berbagai item dalam instrumen. Dengan kata lain, reliabilitas suatu alat ukur merupakan indikasi
stabilitas dan konsistensi instrumen mengukur konsep dan membantu menilai “kebaikan” suatu
alat ukur.

Stabilitas tindakan

Kemampuan suatu ukuran untuk tetap sama dari waktu ke waktu - terlepas dari kondisi
pengujian yang tidak terkendali atau keadaan responden itu sendiri - menunjukkan stabilitas dan
kerentanannya yang rendah terhadap perubahan situasi. Ini membuktikan "kebaikan" karena
konsep diukur secara stabil, tidak peduli kapan itu dilakukan. Dua tes stabilitas adalah reliabilitas
tes-tes ulang dan reliabilitas bentuk paralel.

Reliabilitas tes-tes ulang Koefisien reliabilitas yang diperoleh dengan pengulangan ukuran yang
sama pada kesempatan kedua disebut reliabilitas tes-tes ulang. Artinya, ketika kuesioner yang
berisi beberapa item yang seharusnya mengukur suatu konsep diberikan kepada sekumpulan
responden, kadang-kadang kepada responden yang sama, katakanlah beberapa minggu hingga
enam bulan kemudian, maka korelasi antara skor yang diperoleh pada keduanya. waktu yang
berbeda dari satu dan kumpulan responden yang sama disebut koefisien tes-tes ulang. Semakin
tinggi, semakin baik reliabilitas tes-tes ulang dan, konsekuensinya, stabilitas pengukuran
sepanjang waktu.
Reliabilitas bentuk paralel Ketika respons pada dua set ukuran yang sebanding yang
menyentuh konstruksi yang sama sangat berkorelasi, kami memiliki reliabilitas bentuk paralel.
Kedua formulir tersebut memiliki item yang serupa dan format jawaban yang sama, yang
berubah hanya kata-kata dan urutan atau urutan pertanyaannya. Apa yang kami coba tentukan di
sini adalah variabilitas kesalahan yang dihasilkan dari susunan kata dan urutan pertanyaan. Jika
dua bentuk yang sebanding sangat berkorelasi (katakanlah 8 dan di atasnya), kita mungkin cukup
yakin bahwa ukuran tersebut cukup andal, dengan variasi kesalahan minimal yang disebabkan
oleh kata-kata, urutan, atau faktor lainnya.

Konsistensi ukuran internal

Konsistensi internal langkah-langkah menunjukkan keseragaman item dalam ukuran yang


menyentuh konstruksi. Dengan kata lain, item-item tersebut harus “digantung bersama-sama
sebagai satu set”, dan mampu mengukur konsep yang sama secara independen sehingga
responden melampirkan arti keseluruhan yang sama untuk masing-masing item. Hal ini dapat
dilihat dengan memeriksa apakah item dan subset item dalam alat ukur memiliki korelasi yang
tinggi. Konsistensi dapat diperiksa melalui reliabilitas konsistensi interitem dan uji reliabilitas
split-half.

Reliabilitas konsistensi interitem Reliabilitas konsistensi interitem merupakan pengujian


konsistensi jawaban responden terhadap semua item dalam suatu ukuran. Sejauh item merupakan
ukuran independen dari konsep yang sama, mereka akan berkorelasi satu sama lain. Tes yang
paling populer dari reliabilitas konsistensi interitem adalah koefisien alpha Cronbach (Cronbach,
1946), yang digunakan untuk item berskala banyak, dan rumus Kuder – Richardson (Kuder &
Richardson, 1937), digunakan untuk item dikotomis. Semakin tinggi koefisiennya, semakin baik
alat ukurnya.

Reliabilitas separuh-separuh Keandalan separuh-separuh mencerminkan korelasi antara dua


separuh instrumen. Estimasi akan bervariasi tergantung pada bagaimana item dalam ukuran
tersebut dibagi menjadi dua bagian. Reliabilitas split-half mungkin lebih tinggi daripada alpha
Cronbach hanya jika terdapat lebih dari satu dimensi respon yang mendasari yang diketuk oleh
ukuran dan ketika kondisi tertentu lainnya terpenuhi juga (untuk detail lengkap, lihat Campbell,
1976). Oleh karena itu, dalam hampir semua kasus, alpha Cronbach dapat dianggap sebagai
indeks yang sangat memadai untuk keandalan konsistensi antar item

Timbangan Pengukuran FORMATIF VERSUS REFLEKTIF

Pada saat ini, penting untuk kembali ke anggapan bahwa item dari ukuran multi-item
harus digantung bersama sebagai satu set dan mampu mengukur konsep yang sama secara
independen (mungkin membuat Anda pusing saat ini, tetapi kebanyakan pasti akan
menyelamatkan Anda dari sakit kepala yang lebih besar dalam karir masa depan Anda sebagai
peneliti, jadi bersabarlah dengan kami). Faktanya adalah bahwa item yang mengukur sebuah
konsep tidak harus selalu saling berhubungan: ini hanya berlaku untuk skala reflektif, tetapi tidak
untuk skala formatif.

Apa itu skala reflektif?

Dalam skala reflektif, item (semuanya!) Diharapkan berkorelasi. Tidak seperti item yang
digunakan dalam skala formatif, yang akan dibahas selanjutnya, setiap item dalam skala reflektif
diasumsikan memiliki dasar yang sama (konstruksi minat yang mendasari). Karenanya,
peningkatan nilai konstruk akan diterjemahkan ke dalam peningkatan nilai untuk semua item
yang mewakili konstruk. Contoh skala reflektif adalah skala Sikap Menuju Tawaran yang
dikembangkan oleh Burton dan Lichtenstein (1988). Ini adalah skala peringkat yang terdiri dari
enam item, sembilan poin yang mengukur sikap seseorang tentang produk tertentu yang
ditawarkan dengan harga tertentu. Skala ini terdiri dari lima kata sifat bipolar (tidak
menguntungkan-menguntungkan; buruk-baik; berbahaya-menguntungkan; tidak menarik-
menarik; buruk-sangat baik) dan satu item tidak setuju-setuju (diperkenalkan oleh batang: "Saya
suka kesepakatan ini"), diukur pada skala grafis sembilan poin. Memang, kami berharap bahwa
sikap yang lebih mendukung terhadap penawaran tersebut akan diterjemahkan ke dalam
peningkatan nilai keenam item yang mewakili sikap terhadap penawaran tersebut. Oleh karena
itu, kami berharap keenam item tersebut berkorelasi. Perhatikan bahwa arah "kausalitas" adalah
dari konstruksi ke item.

Apa itu skala formatif dan mengapa item dari skala formatif tidak selalu saling berhubungan?
Skala formatif digunakan ketika sebuah konstruksi dipandang sebagai kombinasi penjelas
dari indikatornya (Fornell, 1987; Fornell & Bookstein, 1982). Ambil Job Description Index
(Smith, Kendall & Hulin, 1969), ukuran komposit yang dimaksudkan untuk mengevaluasi
kepuasan kerja. Ukuran ini mencakup lima dimensi: jenis pekerjaan (18 item), peluang untuk
promosi (9 item), kepuasan dengan pengawasan (18 item), rekan kerja (18 item), dan gaji (9
item).

Lima dimensi dilihat sebagai lima karakteristik yang menentukan kepuasan kerja. Kelima
dimensi tersebut diterjemahkan ke dalam 72 elemen yang dapat diamati dan diukur seperti
"Peluang yang baik untuk kemajuan", "Promosi reguler", "Kesempatan yang cukup baik untuk
promosi", "Pendapatan yang memadai untuk pengeluaran normal", "Digaji tinggi", dan
"Memberikan pengertian pencapaian. " Idenya adalah kita mengharapkan tiga item pertama
("Peluang bagus untuk maju", "Promosi reguler", dan "Kesempatan yang cukup baik untuk
promosi") berkorelasi (bagaimanapun juga, semuanya bertujuan untuk mengukur satu dimensi
pekerjaan tertentu kepuasan, yaitu, "kesempatan untuk promosi"). Namun, item ini tidak selalu
berkorelasi dengan item yang mengukur "Bayar" (dimensi kedua), seperti "Pendapatan yang
memadai untuk pengeluaran normal" dan "Digaji tinggi," karena dimensi "Peluang baik untuk
maju" tidak selalu terkait ke dimensi "Bayar". Memang, pekerja pertama mungkin memiliki gaji
yang sangat baik tetapi tidak ada kesempatan untuk promosi, pekerja kedua mungkin memiliki
peluang yang sangat baik untuk promosi tetapi gaji yang sangat rendah, dan pekerja ketiga
mungkin memiliki gaji yang sangat baik dan peluang yang sangat baik untuk promosi.

Demikian pula, kami mengharapkan item "Pendapatan yang memadai untuk pengeluaran
normal" dan "Dibayar tinggi" akan berkorelasi satu sama lain (karena kedua item mengukur
pembayaran), tetapi kami tidak mengharapkan item ini berkorelasi dengan item "Memberi
pengertian pencapaian ”(karena item terakhir ini tidak mengukur gaji tetapi dimensi lain dari
Indeks Deskripsi Pekerjaan)

Singkatnya, Indeks Deskripsi Pekerjaan mencakup lima dimensi dan 72 item. 72 item ini
belum tentu terkait satu sama lain, karena lima dimensi yang mereka wakili tidak selalu saling
terkait.
Skala yang berisi item-item yang belum tentu terkait disebut skala formatif. Kami telah
menjelaskan bahwa skala formatif digunakan ketika sebuah konstruk (seperti kepuasan kerja)
dipandang sebagai kombinasi penjelas dari indikatornya (promosi, gaji, kepuasan dengan
pengawasan, rekan kerja, dan pekerjaan); yaitu, ketika perubahan salah satu indikator (dimensi)
diharapkan mengubah skor keseluruhan konstruk, terlepas dari nilai indikator (dimensi) lainnya.
Job Description Index bersifat formatif, karena peningkatan nilai salah satu indikatornya, seperti
“peluang untuk promosi,” diharapkan menghasilkan skor kepuasan kerja yang lebih tinggi,
terlepas dari nilai indikator lainnya. Dengan demikian, Indeks Deskripsi Pekerjaan
mengkonseptualisasikan kepuasan kerja sebagai skor tertimbang total di 72 item kepuasan kerja,
di mana setiap item sesuai dengan dimensi independen tertentu dari kepuasan kerja.

Skala formatif yang baik (yaitu, valid) adalah skala yang mewakili seluruh domain
konstruksi. Ini berarti bahwa skala yang valid harus mewakili semua aspek yang relevan dari
konstruksi yang diminati, bahkan jika aspek-aspek ini tidak selalu berkorelasi.

Meskipun masuk akal untuk menguji konsistensi interitem dari skala reflektif, tidak
masuk akal untuk menguji konsistensi interitem dari skala formatif. Alasannya adalah kami tidak
mengharapkan item dalam skala formatif menjadi homogen; dengan kata lain, kami tidak
mengharapkan semua item berkorelasi. Oleh karena itu, pengujian konsistensi jawaban
responden terhadap item-item ukuran formatif tidak memberi tahu apa-apa tentang kualitas alat
ukur kami. Perhatikan bahwa ada metode lain untuk menilai kebaikan skala formatif (lihat,
misalnya, Jarvis, MacKenzie & Podsakoff, 2003).

Anda mungkin juga menyukai