Anda di halaman 1dari 8

PENGUKURAN: SKALA, KEANDALAN, VALIDITAS

Sekarang kita telah mengetahui empat jenis skala yang dapat digunakan untuk mengukur dimensi dan
elemen yang didefinisikan secara operasional dari suatu variabel, perlu untuk memeriksa metode
penskalaan (yaitu, menetapkan angka atau simbol) untuk memperoleh tanggapan sikap dari variabel.
subjek terhadap objek, peristiwa, atau orang. Ada dua kategori utama skala sikap (jangan bingung
dengan empat jenis skala yang berbeda) — skala penilaian dan skala peringkat. Penilaian sisik
memiliki beberapa kategori respon dan digunakan untuk respon Menimbulkan dengan memperhatikan
objek, peristiwa, atau orang belajar. Skala peringkat, di sisi lain, membuat perbandingan antara atau di
antara objek, peristiwa, atau orang dan memperoleh pilihan dan peringkat yang disukai di antara
mereka. Kedua skala tersebut dibahas di bawah ini.
SKALA PERINGKAT
Skala peringkat berikut sering digunakan dalam penelitian organisasi:
 Skala dikotomi
 Skala kategori
 Skala likert
 Skala numerik
 Skala diferensial semantik
 Skala peringkat yang diperinci
 Skala peringkat jumlah tetap atau konstan
 Skala stapel
 Skala peringkat grafis
 Skala konsensus
 Skala lain seperti Skala Interval Penampilan Sama Thurstone, dan Skala Multidimensi lebih
jarang digunakan. Kami akan menjelaskan secara singkat masing-masing skala sikap di atas.
Skala Dikotomi
Skala dikotomis digunakan untuk mendapatkan jawaban Ya atau Tidak, seperti pada contoh di bawah
ini. Perhatikan bahwa skala nominal digunakan untuk memperoleh respons.
Contoh 9.1
Apakah kamu memiliki mobil? Ya Tidak              
Skala Kategori
Skala kategori menggunakan beberapa item untuk mendapatkan satu respons seperti contoh berikut .
Ini juga menggunakan skala nominal.
Contoh 9.2 .
Di mana di California utara Anda tinggal?
- __ Teluk Utara         
- __ South Bay         
- __ East Bay         
- __ Peninsula         
- __ Lainnya         
Skala Likert
Skala Likert dirancang untuk menguji seberapa kuat subjek setuju atau tidak setuju dengan pernyataan
pada skala 5 poin dengan jangkar berikut:
Tanggapan atas sejumlah item yang menyentuh konsep atau variabel tertentu (seperti contoh berikut)
kemudian dijumlahkan untuk setiap responden. Ini adalah skala interval dan perbedaan tanggapan
antara dua titik pada skala tetap sama .
Contoh 9.3
Dengan menggunakan skala Likert sebelumnya, nyatakan sejauh mana Anda setuju dengan setiap
pernyataan berikut:
- Pekerjaan saya sangat menarik 1 2 3 4 5                                     
- Saya tidak sibuk dengan pekerjaan saya sepanjang hari 1 2 3 4 5                        
- Hidup tanpa pekerjaanku akan membosankan 1 2 3 4 5                       
Skala Diferensial Semantik
Beberapa atribut bipolar diidentifikasi pada skala ekstrem, dan responden diminta untuk menunjukkan
sikap mereka, pada apa yang disebut ruang semantik, terhadap individu, objek, atau peristiwa tertentu
pada setiap atribut. Kata sifat bipolar yang digunakan, misalnya, akan menggunakan istilah-istilah
seperti Baik-Buruk; Kuat lemah; Panas dingin. Skala diferensial semantik digunakan untuk menilai
sikap responden terhadap merek, iklan, objek, atau individu tertentu. Tanggapan dapat diplot untuk
mendapatkan gambaran yang baik tentang persepsi mereka. Ini diperlakukan sebagai skala interval.
Contoh skala diferensial semantik berikut.
Skala Numerik
Skala numerik mirip dengan skala diferensial semantik, dengan perbedaan yang disediakan angka
pada skala 5 poin atau 7 poin, dengan kata sifat bipolar di kedua ujungnya, seperti yang diilustrasikan
di bawah ini. Ini juga merupakan skala interval.
Skala Peringkat Terinci
Skala 5 poin atau 7 poin dengan jangkar, sesuai kebutuhan, disediakan untuk setiap item dan
responden menyatakan nomor yang sesuai di sisi setiap item, atau lingkari nomor yang relevan pada
setiap item, sesuai contoh berikut. The tanggapan terhadap barang-barang tersebut kemudian
dijumlahkan. Ini menggunakan skala interval.
Skala Jumlah Tetap atau Konstan
Responden di sini diminta untuk mendistribusikan sejumlah poin ke berbagai item sesuai contoh di
bawah ini. Ini lebih bersifat skala ordinal.
Skala Stapel
Skala ini secara simultan mengukur arah dan intensitas sikap terhadap item yang diteliti. Karakteristik
minat studi ditempatkan di tengah dan skala numerik berkisar, katakanlah, dari + 3 hingga - 3, di
kedua sisi item seperti yang diilustrasikan di bawah ini. Ini memberikan gambaran tentang seberapa
dekat atau jauh respon individu terhadap stimulus, seperti yang ditunjukkan pada contoh di bawah ini.
Karena ini tidak memiliki titik nol mutlak, ini adalah skala interval.
Skala Peringkat Grafis
Representasi grafis membantu responden untuk menunjukkan pada skala ini jawaban mereka atas
pertanyaan tertentu dengan memberi tanda pada titik yang sesuai pada garis, seperti pada contoh
berikut. Ini adalah skala ordinal, meskipun contoh berikut mungkin terlihat seperti skala interval.
Skala ini mudah ditanggapi. Deskripsi singkat tentang poin skala dimaksudkan sebagai panduan
dalam menemukan peringkat daripada mewakili kategori yang berbeda. Skala wajah, yang
menggambarkan wajah mulai dari tersenyum hingga sedih (diilustrasikan di Bab 10), juga merupakan
skala peringkat grafis. digunakan untuk mendapatkan tanggapan tentang perasaan orang sehubungan
dengan beberapa aspek — misalnya, bagaimana perasaan mereka tentang pekerjaan mereka.
Skala Konsensus
Skala juga dikembangkan melalui konsensus, di mana panel juri memilih item tertentu , yang dalam
pandangannya mengukur konsep yang relevan. Item dipilih secara khusus berdasarkan ketepatan atau
relevansinya dengan konsep. Skala konsensus semacam itu dikembangkan setelah item yang dipilih
diperiksa dan diuji validitas dan reliabilitasnya. Salah satu skala konsensus tersebut adalah Skala
Interval Penampilan Sama Thurstone , di mana sebuah konsep diukur melalui proses yang kompleks
yang diikuti oleh panel juri. Dengan menggunakan tumpukan kartu yang berisi beberapa uraian
konsep, panel juri memberikan masukan untuk menunjukkan seberapa dekat atau tidak pernyataan
tersebut dengan konsep yang diteliti. Skala tersebut kemudian dikembangkan berdasarkan konsensus
yang dicapai. Namun, skala ini jarang digunakan untuk mengukur konsep organisasi karena waktu
yang dibutuhkan untuk mengembangkannya.
Timbangan Lainnya
Ada juga beberapa metode penskalaan lanjutan seperti penskalaan multidimensi, di mana objek,
orang, atau keduanya, diskalakan secara visual, dan analisis konjoin dilakukan. Ini memberikan
gambaran visual tentang hubungan dalam ruang di antara dimensi konstruksi. Perlu dicatat bahwa
biasanya Likert atau beberapa bentuk skala numerik biasanya paling sering digunakan untuk
mengukur sikap dan perilaku dalam penelitian organisasi .
SKALA PERINGKAT
Seperti yang telah disebutkan, skala peringkat digunakan untuk memanfaatkan preferensi antara dua
atau di antara lebih banyak objek atau item (bersifat ordinal). Namun, peringkat seperti itu mungkin
tidak memberikan petunjuk pasti untuk beberapa jawaban yang dicari. Misalnya, katakanlah ada
empat lini produk dan manajer mencari informasi yang akan membantu memutuskan lini produk
mana yang harus mendapat perhatian paling banyak. Mari kita asumsikan juga bahwa 35% responden
memilih produk pertama, 25% yang kedua, dan 20% memilih masing-masing produk tiga dan empat
sebagai produk yang penting bagi mereka. Manajer kemudian tidak dapat menyimpulkan bahwa
produk pertama adalah yang paling disukai karena 65% responden tidak memilih produk tersebut!
Metode alternatif yang digunakan adalah perbandingan berpasangan, pilihan paksa, dan skala
komparatif, yang dibahas di bawah ini.
Perbandingan Berpasangan
Skala perbandingan berpasangan digunakan ketika, di antara sejumlah kecil objek, responden diminta
untuk memilih di antara dua objek sekaligus. Ini membantu untuk menilai preferensi. Jika, misalnya,
dalam contoh sebelumnya, selama perbandingan berpasangan , responden secara konsisten
menunjukkan preferensi untuk produk satu di atas produk dua, tiga, dan empat, manajer dapat
diandalkan untuk memahami lini produk mana yang menuntut perhatian penuhnya. Namun, seiring
bertambahnya jumlah objek yang akan dibandingkan , begitu pula jumlah perbandingan berpasangan.
Pilihan berpasangan untuk n objek akan menjadi [(n) (n – 1) / 2]. Semakin besar jumlah objek atau
rangsangan, semakin besar jumlah perbandingan berpasangan yang disajikan kepada responden, dan
semakin besar kelelahan responden. Karenanya perbandingan berpasangan adalah metode yang baik
jika jumlah rangsangan yang disajikan kecil.
Pilihan Paksa
Pilihan paksa memungkinkan responden untuk memberi peringkat objek relatif satu sama lain, di
antara alternatif yang disediakan. Hal ini memudahkan responden, terutama jika jumlah pilihan yang
akan diranking terbatas jumlahnya. Contoh 9.10 Beri peringkat majalah berikut yang ingin Anda
berlangganan dalam urutan preferensi, tetapkan 1 untuk pilihan yang paling disukai dan 5 untuk yang
paling tidak disukai.
- Keberuntungan -         
- Playboy -         
- Waktu -         
- Orang -         
- Pencegahan -         
Skala Perbandingan
Skala komparatif memberikan tolak ukur atau titik acuan untuk menilai sikap terhadap objek,
peristiwa, atau situasi saat ini yang diteliti. Contoh penggunaan skala komparatif berikut.
KEBAIKAN UKURAN
Sekarang kita telah melihat bagaimana mendefinisikan variabel secara operasional dan menerapkan
teknik penskalaan yang berbeda , penting untuk memastikan bahwa instrumen yang kita kembangkan
untuk mengukur konsep tertentu memang mengukur variabel secara akurat, dan sebenarnya, kita
benar-benar mengukur konsep yang ingin kami ukur. Ini memastikan bahwa dalam mendefinisikan
variabel persepsi dan sikap secara operasional, kami tidak mengabaikan beberapa dimensi dan elemen
penting atau menyertakan beberapa yang tidak relevan. Skala yang dikembangkan seringkali tidak
sempurna, dan kesalahan cenderung terjadi dalam pengukuran variabel sikap. The penggunaan
instrumen yang lebih baik akan memastikan akurasi lebih dalam hasil, yang pada gilirannya, akan
meningkatkan kualitas ilmiah penelitian. Karenanya, dalam beberapa hal, kita perlu menilai
“kebaikan” dari ukuran yang dikembangkan. Artinya, kita perlu cukup yakin bahwa instrumen yang
kita gunakan dalam penelitian kita memang mengukur variabel yang seharusnya, dan mengukurnya
secara akurat. Sekarang mari kita periksa bagaimana kita dapat memastikan bahwa tindakan yang
dikembangkan cukup baik. Pertama, analisis item dari tanggapan atas pertanyaan yang mengetuk
variabel dilakukan, dan kemudian reliabilitas dan validitas ukuran ditetapkan, seperti yang dijelaskan
di bawah ini.
Analisis Item
Analisis item dilakukan untuk melihat apakah item-item dalam instrumen tersebut ada atau tidak.
Setiap item diperiksa kemampuannya untuk membedakan antara subjek yang skor totalnya tinggi, dan
subjek yang skornya rendah. Dalam analisis item, rata-rata antara kelompok skor tinggi dan kelompok
skor rendah diuji untuk mendeteksi perbedaan yang signifikan melalui nilai-t (lihat Modul di akhir
buku untuk penjelasan tentang uji-t). Soal- soal dengan nilai t tinggi (tes yang mampu
mengidentifikasi soal-soal yang sangat diskriminatif dalam instrumen) dimasukkan ke dalam
instrumen. Setelah itu, uji reliabilitas instrumen dilakukan dan validitas ukuran ditetapkan.
Secara singkat, reliabilitas menguji seberapa konsisten suatu alat ukur mengukur konsep apa pun yang
diukurnya. Validitas menguji seberapa baik instrumen yang dikembangkan mengukur konsep tertentu
yang ingin diukur. Dengan kata lain , validitas berkaitan dengan apakah kita mengukur konsep yang
benar, dan reliabilitas dengan stabilitas dan konsistensi pengukuran. Validitas dan reliabilitas ukuran
membuktikan ketelitian ilmiah yang telah dimasukkan ke dalam studi penelitian. Kedua kriteria ini
sekarang akan dibahas. Berbagai bentuk reliabilitas dan validitas digambarkan pada Gambar 9.1.
KEANDALAN
Keandalan suatu ukuran menunjukkan sejauh mana tindakan tersebut tanpa bias ( bebas kesalahan )
dan karenanya memastikan pengukuran yang konsisten sepanjang waktu dan di berbagai item dalam
instrumen. Dengan kata lain, reliabilitas suatu alat ukur merupakan indikasi stabilitas dan konsistensi
instrumen mengukur konsep dan membantu menilai “kebaikan” suatu alat ukur.
Stabilitas Pengukuran
Kemampuan suatu ukuran untuk tetap sama dari waktu ke waktu — terlepas dari kondisi pengujian
yang tidak terkendali atau keadaan responden itu sendiri — menunjukkan stabilitas dan
kerentanannya yang rendah terhadap perubahan situasi. Ini membuktikan "kebaikan" karena konsep
diukur secara stabil, tidak peduli kapan itu selesai. Dua tes stabilitas adalah reliabilitas tes-tes ulang
dan reliabilitas bentuk paralel.
Reliabilitas Tes Ulang
Koefisien reliabilitas yang diperoleh dengan pengulangan ukuran yang sama pada kesempatan kedua
disebut reliabilitas test-retest. Artinya, ketika kuesioner yang berisi beberapa item yang seharusnya
mengukur suatu konsep diberikan kepada sekumpulan responden sekarang, dan lagi kepada responden
yang sama, katakanlah beberapa minggu hingga 6 bulan kemudian, maka korelasi antara skor yang
diperoleh pada keduanya. waktu yang berbeda dari satu dan kumpulan responden yang sama disebut
koefisien tes-tes ulang. Semakin tinggi nilainya, semakin baik reliabilitas tes-tes ulang, dan
konsekuensinya, stabilitas pengukuran sepanjang waktu.
Keandalan Bentuk Paralel
Ketika tanggapan pada dua set ukuran yang sebanding yang mengetuk konstruksi yang sama sangat
berkorelasi, kami memiliki keandalan bentuk paralel. Kedua formulir memiliki item yang sama dan
format jawaban yang sama, yang berubah hanya susunan kata dan urutan atau urutan pertanyaan. Apa
yang kami coba tentukan di sini adalah variabilitas kesalahan yang dihasilkan dari susunan kata dan
urutan pertanyaan. Jika dua bentuk yang sebanding sangat berkorelasi (katakanlah 8 ke atas), kita
mungkin cukup yakin bahwa ukuran tersebut cukup andal, dengan variasi kesalahan minimal yang
disebabkan oleh kata-kata, urutan, atau faktor lainnya.
Pengukuran Konsistensi Internal
Konsistensi internal langkah-langkah menunjukkan keseragaman item dalam ukuran yang
memanfaatkan konstruksi. Dengan kata lain, item-item tersebut harus “digantung bersama sebagai
satu set,” dan mampu mengukur konsep yang sama secara independen sehingga responden
melampirkan arti keseluruhan yang sama untuk masing-masing item. Hal ini dapat dilihat dengan
memeriksa apakah item dan subset item dalam alat ukur memiliki korelasi yang tinggi. Konsistensi
dapat diperiksa melalui uji reliabilitas konsistensi antar item dan uji reliabilitas split-half.
Keandalan Konsistensi Interitem
Ini merupakan pengujian konsistensi jawaban responden terhadap semua item dalam suatu ukuran.
Sejauh item merupakan ukuran independen dari konsep yang sama, mereka akan berkorelasi satu
sama lain. Tes yang paling populer dari reliabilitas konsistensi interitem adalah koefisien alpha
Cronbach (Cronbach's alpha; Cronbach, 1946), yang digunakan untuk item berskala banyak, dan
rumus Kuder-Richardson (Kuder & Richardson, 1937), digunakan untuk item dikotomis. Semakin
tinggi koefisiennya, semakin baik alat ukurnya.
Keandalan Split-Half
Reliabilitas split-half mencerminkan korelasi antara dua bagian instrumen. Estimasi akan bervariasi
tergantung pada bagaimana item dalam ukuran tersebut dibagi menjadi dua bagian. Reliabilitas split-
half bisa lebih tinggi dari alpha Cronbach hanya jika terdapat lebih dari satu dimensi respon yang
mendasari yang diketuk oleh ukuran dan ketika kondisi tertentu lainnya terpenuhi juga (untuk detail
lengkap , lihat Campbell, 1976). Oleh karena itu, dalam hampir semua kasus, alpha Cronbach dapat
dianggap sebagai indeks yang sangat memadai untuk keandalan konsistensi interitem. Perlu dicatat
bahwa konsistensi penilaian beberapa penilai tentang bagaimana mereka melihat suatu fenomena atau
menafsirkan beberapa tanggapan disebut reliabilitas antar penilai , dan tidak boleh disamakan dengan
keandalan alat ukur. Seperti yang telah kami catat sebelumnya, keandalan antar penilai sangat relevan
ketika data diperoleh melalui observasi, tes proyektif, atau wawancara tidak terstruktur , yang
semuanya dapat ditafsirkan secara subyektif. Penting untuk dicatat bahwa reliabilitas adalah syarat
yang diperlukan tetapi tidak cukup untuk pengujian kebaikan suatu ukuran. Misalnya, seseorang dapat
dengan sangat andal mengukur konsep yang menetapkan stabilitas dan konsistensi tinggi, tetapi
mungkin bukan konsep yang ditetapkan untuk diukur. Validitas memastikan kemampuan skala untuk
mengukur konsep yang dimaksudkan. Sekarang kita akan membahas konsep validitas.
KEABSAHAN
Kami memeriksa sebelumnya, di Bab 7, istilah validitas internal dan validitas eksternal dalam konteks
desain eksperimental. Yaitu, kami prihatin tentang masalah keaslian hubungan sebab-akibat (validitas
internal), dan generalisasinya ke lingkungan eksternal (validitas eksternal). Kami sekarang akan
memeriksa validitas alat ukur itu sendiri. Artinya, ketika kita mengajukan serangkaian pertanyaan
(yaitu, mengembangkan alat ukur) dengan harapan bahwa kita mengetuk konsep tersebut, bagaimana
kita bisa cukup yakin bahwa kita memang mengukur konsep yang akan kita lakukan dan bukan
sesuatu yang lain. ? Ini dapat ditentukan dengan menerapkan tes validitas tertentu. Beberapa jenis tes
validitas digunakan untuk menguji kebaikan ukuran dan penulis menggunakan istilah yang berbeda
untuk menunjukkannya. Demi kejelasan, kami dapat mengelompokkan tes validitas dalam tiga judul
besar: validitas konten, validitas terkait kriteria , dan validitas konstruk.
Validitas Isi
Validitas konten memastikan bahwa ukuran tersebut mencakup serangkaian item yang memadai dan
representatif yang menyentuh konsep tersebut. Semakin banyak item skala mewakili domain atau
semesta konsep yang diukur, semakin besar validitas konten. Dengan kata lain, validitas konten
adalah fungsi dari seberapa baik dimensi dan elemen konsep telah digambarkan. Panel juri dapat
membuktikan keabsahan konten instrumen. Kidder dan Judd (1986) mengutip contoh di mana tes
yang dirancang untuk mengukur derajat gangguan bicara dapat dianggap memiliki validitas jika
dievaluasi oleh sekelompok juri ahli (yaitu, terapis bicara profesional). Validitas wajah dianggap oleh
beberapa orang sebagai indeks validitas dasar dan sangat minimum . Validitas wajah menunjukkan
bahwa item-item yang dimaksudkan untuk mengukur suatu konsep, dilakukan secara sepintas lalu
terlihat seperti mereka mengukur konsep tersebut. Beberapa peneliti tidak menganggapnya tepat
untuk memperlakukan validitas wajah sebagai komponen validitas konten yang valid.
Validitas Terkait Kriteria
Validitas terkait kriteria dibuat ketika ukuran tersebut membedakan individu pada kriteria yang
diharapkan untuk diprediksi. Hal ini dapat dilakukan dengan menetapkan validitas konkuren atau
validitas prediktif, seperti dijelaskan di bawah ini Validitas konkuren dibentuk ketika skala
mendiskriminasi individu yang diketahui berbeda; artinya, skor mereka harus berbeda pada instrumen
seperti pada contoh berikut.
Contoh 9.1 2.  Jika ukuran etos kerja dikembangkan dan diterapkan pada sekelompok penerima
kesejahteraan , skala tersebut harus membedakan mereka yang antusias untuk menerima pekerjaan
dan senang mendapat kesempatan untuk berhenti sejahtera, dari mereka yang tidak mau bekerja
bahkan ketika ditawari pekerjaan. Tentunya, mereka yang memiliki nilai etos kerja tinggi tidak ingin
sejahtera dan merindukan pekerjaan yang dilakukan sendiri. Di sisi lain, mereka yang rendah nilai
etos kerja dapat memanfaatkan kesempatan untuk bertahan hidup dengan kesejahteraan selama
mungkin, menganggap pekerjaan itu membosankan. Jika kedua tipe individu tersebut memiliki skor
yang sama pada skala etos kerja, maka tes tersebut bukan menjadi tolak ukur etos kerja, melainkan
tolak ukur lain.
Validitas prediktif menunjukkan kemampuan alat ukur untuk membedakan antara individu dengan
mengacu pada kriteria masa depan. Misalnya, jika tes bakat atau kemampuan yang diberikan kepada
karyawan pada saat perekrutan bertujuan untuk membedakan individu berdasarkan kinerja pekerjaan
mereka di masa depan, maka mereka yang mendapat nilai rendah dalam tes tersebut haruslah yang
berkinerja buruk dan mereka yang memiliki skor tinggi berkinerja baik.
Bangun Validitas
Validitas konstruk membuktikan seberapa baik hasil yang diperoleh dari penggunaan ukuran sesuai
dengan teori di sekitar tes yang dirancang. Ini dinilai melalui validitas konvergen dan diskriminan,
yang dijelaskan di bawah ini. Validitas konvergen dibentuk ketika skor yang diperoleh dengan dua
instrumen berbeda yang mengukur konsep yang sama berkorelasi tinggi. Validitas diskriminan
ditetapkan ketika, berdasarkan teori, dua variabel diperkirakan tidak berkorelasi, dan skor yang
diperoleh dengan mengukurnya memang secara empiris ditemukan demikian. Dengan demikian,
validitas dapat ditetapkan dengan berbagai cara. Pengukuran yang dipublikasikan untuk berbagai
konsep biasanya melaporkan jenis validitas yang telah ditetapkan untuk instrumen tersebut, sehingga
pengguna atau pembaca dapat menilai “kebaikan” ukuran tersebut. Tabel 9.1 merangkum jenis
validitas yang dibahas di sini. Beberapa cara di mana bentuk validitas di atas dapat ditetapkan adalah
melalui (1) analisis korelasional (seperti dalam kasus membangun validitas konkuren dan prediktif
atau validitas konvergen dan diskriminan), (2) analisis faktor, teknik multivariat yang akan
mengkonfirmasi dimensi konsep yang telah didefinisikan secara operasional, serta menunjukkan item
mana yang paling sesuai untuk setiap dimensi (menetapkan validitas konstruk), dan (3) matriks
korelasi multitrait dan multimetode yang diturunkan dari konsep pengukuran dengan berbagai bentuk
dan metode yang berbeda, selain itu menetapkan kekuatan pengukuran.
Singkatnya, kebaikan ukuran ditetapkan melalui berbagai jenis validitas dan reliabilitas yang
digambarkan dalam Gambar 9.1. Hasil penelitian apa pun hanya bisa sebaik ukuran yang
memanfaatkan konsep-konsep dalam kerangka teoretis. Kita perlu menggunakan ukuran yang
tervalidasi dengan baik dan dapat diandalkan untuk memastikan bahwa penelitian kita bersifat ilmiah.
Untungnya, ukuran telah dikembangkan untuk banyak konsep penting dalam penelitian organisasi dan
sifat psikometri mereka (yaitu, keandalan dan validitas) yang ditetapkan oleh pengembang. Dengan
demikian, peneliti dapat menggunakan instrumen yang sudah terkenal sebagai "baik", daripada
dengan susah payah mengembangkan ukuran mereka sendiri. Namun, saat menggunakan ukuran ini,
peneliti harus mengutip sumbernya (yaitu, penulis dan referensi) sehingga pembaca dapat mencari
lebih banyak informasi jika perlu.
Bukan hal yang aneh jika dua atau lebih ukuran yang sama baiknya dikembangkan untuk konsep yang
sama. Misalnya, ada beberapa instrumen berbeda untuk mengukur konsep kepuasan kerja. Salah satu
skala yang paling sering digunakan untuk tujuan tersebut, bagaimanapun, adalah Job Descriptive
Index (JDI) yang dikembangkan oleh Smith, Kendall, dan Hulin (1969). Jika ada lebih dari satu skala
untuk variabel apa pun, lebih disukai menggunakan ukuran yang memiliki keandalan dan validitas
yang lebih baik dan juga lebih sering digunakan. Kadang-kadang, kami mungkin juga harus
menyesuaikan ukuran yang ditetapkan agar sesuai dengan pengaturan. Misalnya, skala yang
digunakan untuk mengukur kinerja pekerjaan, karakteristik pekerjaan, atau kepuasan kerja di industri
manufaktur mungkin harus sedikit dimodifikasi agar sesuai dengan perusahaan utilitas atau organisasi
perawatan kesehatan. Lingkungan kerja di setiap kasus berbeda dan susunan kata dalam instrumen
mungkin harus disesuaikan dengan tepat. Namun, dalam melakukan ini, kami merusak skala yang
sudah mapan , dan akan disarankan untuk mengujinya lagi untuk kecukupan validitas dan reliabilitas.
Contoh dari beberapa ukuran yang digunakan untuk memanfaatkan beberapa konsep yang sering
diteliti dalam bidang manajemen dan pemasaran tersedia di Lampiran bab ini.
- Validitas: Deskripsi         
- Validitas isi : Apakah ukuran tersebut mengukur konsep secara memadai?          
- Validitas wajah : Apakah "ahli" memvalidasi bahwa instrumen mengukur sesuai dengan
namanya?         
- Validitas terkait kriteria : Apakah ukuran tersebut dibedakan dengan cara yang membantu
memprediksi variabel kriteria?         
- Validitas bersamaan : Apakah ukuran tersebut berbeda dengan cara yang membantu
memprediksi variabel kriteria saat ini?         
- Validitas prediktif : Apakah ukuran tersebut membedakan individu dengan cara membantu
memprediksi kriteria masa depan?         
- Membangun validitas: Apakah instrumen memanfaatkan konsep seperti yang diteorikan?          
- Validitas konvergen : Apakah dua instrumen yang mengukur konsep berkorelasi tinggi?          
- Validitas diskriminan : Apakah ukuran tersebut memiliki korelasi rendah dengan variabel yang
seharusnya tidak terkait dengan variabel ini?         
RINGKASAN
Dalam bab ini, kita melihat jenis skala penilaian sikap dan skala peringkat yang dapat digunakan
dalam mengembangkan instrumen setelah konsep didefinisikan secara operasional. Kami juga
membahas bagaimana kebaikan ukuran ditentukan melalui analisis item, dan uji reliabilitas dan
validitas. Kami juga mencatat bahwa skala Likert dan jenis skala tipe interval lainnya seperti skala
numerik, banyak digunakan dalam penelitian organisasi karena mereka cocok untuk analisis data yang
lebih canggih. Akhirnya, kami membahas kebaikan ukuran dalam hal reliabilitas dan validitas dan
berbagai cara untuk menetapkannya. Pengetahuan tentang berbagai skala dan teknik penskalaan
membantu manajer untuk mengelola survei singkat dengan merancang pertanyaan yang menggunakan
skala peringkat atau peringkat, yang sesuai. Kesadaran akan fakta bahwa langkah-langkah telah
tersedia untuk banyak konsep organisasi selanjutnya memfasilitasi survei eksplorasi mini oleh
manajer. Pada bab selanjutnya, kita akan melihat berbagai sumber dan metode pengumpulan data.
 
 

Anda mungkin juga menyukai