Anda di halaman 1dari 20

Rangkuman bab 11 & 12 Kelompok 2 Metode Penelitian

Murni Oktafiani Laela 195020901111001


Annisa Mulya Chasanah 195020901111002
Vivin Anis Safitri 195020901111003
Ardea Zakky Kawabiki Munajat 195020907111022
Farah Salsabila 195020907111005
Ananda Zhafira Nugrahani 195020900111022

BAB 11 ( Measurement of variables: Operational definition )


Measurement of variables : Operational Definition

Pengukuran variabel merupakan bagian integral dari penelitian dan aspek penting dari
desain penelitian. Pengukuran adalah penugasan angka atau simbol lain ke karakteristik (atau
atribut) objek menurut seperangkat aturan yang telah ditentukan sebelumnya.

Objeknya antara lain orang, unit bisnis strategis, perusahaan, negara, dll. Contoh
karakteristik objek adalah kecenderungan mencari gairah, motivasi berprestasi, efektivitas
organisasi, dll.

Penting bagi kita untuk menyadari bahwa kita tidak dapat mengukur objek (misalnya,
perusahaan); kita mengukur karakteristik atau atribut objek (misalnya, keefektifan organisasi
perusahaan). Dengan cara yang sama, kita dapat mengukur panjang (atribut) seseorang (objek),
berat seekor gajah, kecenderungan para pialang saham yang mencari gairah, kenikmatan
berbelanja wanita, kualitas layanan sebuah restoran, efek pengondisian shampoo, dan rasa
yogurt merek tertentu. Untuk dapat mengukur kita membutuhkan suatu benda dan atribut dari
suatu benda, tetapi kita juga membutuhkan seorang juri yang memiliki pengetahuan dan
keterampilan yang diperlukan untuk menilai kualitas sesuatu. Sama hal-nya dengan
operasional.

Operational Definition

Operasionalisasi adalah melihat dimensi perilaku, segi, atau sifat yang dilambangkan
dengan konsep kemudian diterjemahkan ke dalam elemen yang dapat diamati dan diukur untuk
mengembangkan indeks pengukuran konsep lalu mengurangi konsep abstrak agar dapat diukur
dengan cara yang nyata. Ketika tidak ada alat pengukuran, maka yang dapat dilakukan adalah
mereduksi abstrak dari segi karakteristik dan perilaku. Dengan kata lain, pengertian abstrak
dipecah menjadi perilaku atau karakteristik yang dapat diamati. Misalnya, konsep haus adalah
abstrak; kita tidak bisa melihatnya. Namun, kita mengharapkan orang yang haus minum banyak
cairan. Dengan kata lain, reaksi yang diharapkan orang terhadap rasa haus adalah minum
cairan. Jika beberapa orang mengatakan bahwa mereka haus, maka kita dapat menentukan
tingkat haus masing-masing individu ini dengan mengukur jumlah cairan yang mereka minum
untuk memuaskan dahaga mereka. Dengan demikian, kita akan dapat mengukur tingkat rasa
haus mereka, meskipun konsep haus itu sendiri abstrak dan samar-samar.

Operationalization : dimension and elements

Didalam operasionalisasi, dimensi adalah ruangan atau cakupan apa yang ingin kita
teliti. Sedangkan elemen adalah komponen apa saja yang ingin dicari dari ruangan (dimensi)
yang sedang kita teliti.

Contoh rasa haus dan kebutuhan kognisi menggambarkan bagaimana konsep abstrak
dioperasionalkan dengan menggunakan elemen yang dapat diamati dan diukur, seperti jumlah
minuman yang digunakan orang untuk memuaskan dahaga mereka, dan sejauh mana orang
lebih menyukai masalah yang kompleks daripada yang sederhana. Sementara hanya satu item
yang diperlukan untuk mengukur rasa haus (berapa banyak minuman yang Anda gunakan
untuk memuaskan dahaga Anda?), 34 item diperlukan untuk mengukur kebutuhan kognisi. 34
item ini diperlukan karena jika kita menggunakan kurang dari 34 item ini, skala pengukuran
kita mungkin tidak akan mewakili semesta yang membutuhkan kognisi; dengan kata lain,
pengukuran ini mungkin tidak akan mencakup serangkaian item (atau elemen) yang memadai
dan representatif. Akibatnya, pengukuran ini tidak valid.

Contoh konstruksi dengan lebih dari satu dimensi adalah agresi. Agresi setidaknya memiliki
dua dimensi: agresi verbal dan agresi fisik. Artinya, agresi dapat berupa perilaku seperti
berteriak dan mengumpat pada seseorang (agresi verbal), tetapi juga melempar benda,
membenturkan dinding, dan melukai orang lain secara fisik (agresi fisik). Skala pengukuran
agresi yang valid harus mencakup item yang mengukur agresi verbal dan item yang mengukur
agresi fisik. Skala pengukuran yang hanya mencakup item yang mengukur agresi fisik tidak
akan valid jika tujuan kita adalah mengukur agresi. Demikian pula, skala yang hanya mencakup
item yang mengukur agresi verbal juga bukan merupakan ukuran agresi yang valid. Dengan
demikian, skala pengukuran yang valid mencakup pertanyaan atau item yang dapat diukur
secara kuantitatif atau item (atau elemen) yang secara memadai mewakili domain atau semesta
konstruksi; jika konstruksi memiliki lebih dari satu domain atau dimensi, kami harus
memastikan bahwa pertanyaan yang secara memadai mewakili domain atau dimensi ini
disertakan dalam pengukuran kami.

Operationalizing the (multidimensional) concept of achievement motivation

Misalkan kita tertarik untuk membangun hubungan antara gender dan motivasi berprestasi.
Untuk menguji hubungan ini, kita harus mengukur jenis kelamin dan motivasi berprestasi. Pada
titik ini, kita mungkin akan memahami bahwa meskipun mengukur jenis kelamin tidak akan
menimbulkan masalah, mengukur motivasi berprestasi mungkin akan menimbulkan masalah,
karena konstruk yang terakhir bersifat abstrak dan subjektif. Untuk alasan ini kita harus
menyimpulkan motivasi berprestasi dengan mengukur dimensi perilaku, segi, atau
karakteristik yang kita harapkan akan ditemukan pada orang dengan motivasi berprestasi
tinggi. Memang, tanpa mengukur dimensi, aspek, atau karakteristik ini kita tidak akan dapat
sampai pada pernyataan garis bawah tentang hubungan antara gender dan motivasi berprestasi.

Langkah-langkahnya :

1. Mendefinisikan konstruk yang bersifat abstrak dan subjektif dengan mengukur jenis
kelamin dan motivasi
2. Mengukur konstruk abstrak seperti motivasi berprestasi adalah melalui literatur untuk
mengetahui apakah ada ukuran konsep yang ada
Baik jurnal ilmiah dan "buku pegangan skala" adalah sumber penting dari pengukuran
yang ada. Biasanya, artikel empiris yang diterbitkan dalam jurnal akademis
memberikan penjelasan rinci tentang bagaimana konstruksi tertentu diukur; informasi
sering diberikan tentang tindakan apa yang digunakan, kapan dan bagaimana tindakan
ini dikembangkan, oleh siapa, dan untuk berapa lama telah digunakan.

Operalization is not
Operasi tidaklah menjelaskan relasi dari sebuah konsep. Operasi tidak dapat mengukur
kadar individu terhadap sesuatu. Contoh, orang yang sukses belum tentu memiliki motivasi
yang tinggi dari dirinya sendiri. Terkadang, ada faktor lain yang memang tampak
menjadikannya sukses seperti faktor keberuntungan, faktor prestis, dll. Maka dari itu, operasi
memerlukan adanya standar yang menjadi faktor baku sehingga dapat menjelaskan dan
menerjemahkan suatu kasus atau masalah beserta solusinya.

BAB 12 ( Measurement: Scaling, reliability and validity )


SKALA PENGUKURAN

Skala pengukuran adalah sebuah acuan yang digunakan untuk menentukan panjang pendeknya
interval yang ada dalam satuan alat ukur. Dengan menggunakan skala pengukuran, maka alat
ukur yang digunakan akan menghasilkan data kuantitatif. Setelah proses pengukuran yang
menghasilkan data kuantitatif yang berupa angka-angka tersebut baru lah kemudian ditentukan
analisis yang cocok untuk digunakan. Terdapat 4 skala yang dapat digunakan pada pengukuran
variabel:

1. Skala Nominal
Skala nominal merupakan skala pengukuran paling sederhana atau tingkatannya paling rendah
di dalam suatu penelitian. Skala ini hanya digunakan untuk memberikan kategori saja.
Misalnya digunakan untuk memberi label, simbol, lambang, atau nama pada sebuah kategori
sehingga akan mempermudah pengelompokan data menurut kategorinya. Pada skala nominal
ini, peneliti akan mengelompokkan objek, baik individu atau pun kelompok kedalam kategori
tertentu dan disimbolkan dengan label atau kode tertentu. Kemudian, angka yang diberikan
kepada objek hanya memiliki arti sebagai label atau pembeda saja dan bukan untuk
menunjukkan adanya tingkatan.
Contoh Skala Nominal:
a) contoh yang paling umum digunakan yaitu variabel jenis kelamin. Jenis kelamin akan
dibedakan menjadi Laki-laki dan Perempuan. Dalam hal ini, hasil pengukuran tidak
memiliki tingkatan tertentu. Artinya laki-laki tidak lebih tinggi daripada perempuan,
atau sebaliknya. Di dalam sebuah penelitian, biasanya akan diberi simbol angka sebagai
pembeda, misal jenis kelamin laki-laki diberi simbol angka 1, jenis kelamin perempuan
diberi simbol 0. Simbol angka disini hanya untuk membedakan saja, tidak
menunjukkan bahwa 1 lebih besar dari 0 dan sebagainya.
b) misal nama kota lahir. Ada yang Bandung, Jakarta, Surabaya, Bogor, dan lain lain. Hal
ini hanya untuk pembeda saja, tidak menunjukkan tingkatan tertentu. Dengan kata lain,
orang yang lahir di Bandung bukan berarti lebih baik dari Bogor atau yang lainnya.

2. Skala Ordinal
Skala ordinal merupakan skala pengukuran yang sudah menyatakan peringkat antar tingkatan.
Jarak atau interval antar tingkatan juga tidak harus sama. Skala ordinal ini memiliki tingkatan
yang lebih tinggi daripada skala nominal, karena skala ini tidak hanya menunjukkan kategori
saja tetapi juga menunjukkan peringkat. Di dalam skala ordinal, objek atau kategorinya disusun
berdasarkan urutan tingkatannya, dari tingkat terendah ke tingkat tertinggi atau sebaliknya,
Contoh Skala Ordinal:
a) pada variabel sikap seseorang terhadap suatu pernyataan, sikap tersebut berupa sangat
setuju, setuju, biasa saja, tidak setuju, sangat tidak setuju. Pada variabel sikap ini dari
sangat setuju ke sangat tidak setuju menunjukkan kategori dan memiliki tingkatan. Di
dalam sebuah penelitian, kategori tersebut bisa disimbolkan dengan angka, misal angka
5 untuk sangat setuju, angka 4 untuk setuju, angka 3 untuk biasa saja, angka 2 untuk
tidak setuju, dan angka 1 untuk sangat tidak setuju.
b) misal dalam variabel nilai huruf mutu pada perkuliahan, yaitu nilai A, B, C, D, dan E.
Pada nilai ini menunjukkan tingkatan bahwa nilai A lebih besar dari B, dan seterusnya.

3. Skala Interval
Skala Interval merupakan skala pengukuran yang bisas digunakan untuk menyatakan peringkat
untuk antar tingkatan. Jarak atau interval antar tingkatan pun sudah jelas, hanya saja tidak
memiliki nilai 0 (nol) mutlak. Skala interval ini bisa dikatakan berada diatas skala ordinal dan
nominal. Besar interval atau jarak satu data dengan data yang lainnya memiliki bobot nilai yang
sama. Besar interval ini bisa saja di tambah atau dikurang.
Contoh Skala Interval:
a) contoh yang paling umum pada skala interval adalah suhu. Misalkan suatu ruangan
memiliki suhu 0C, ini bukan berarti bahwa ruangan tersebut tidak ada suhunya. Angka
0C disini merupakan suhu, hal ini dikarena pada skala interval 0 (nol) bukanlah nilai
yang mutlak.
b) jam 00.00 bukan berarti waktunya kosong atau tidak ada nilainya, karena jam 00.00
sendiri masih menunjukkan waktu dimana jam 00.00 sama dengan jam 12 malam.
4. Skala Rasio
Skala rasio adalah skala pengukuran yang ditujukan pada hasil pengukuran yang bisa
dibedakan, diurutkan, memiliki jarak tertentu, dan bisa dibandingkan. Skala rasio merupakan
tingkatan skala paling tinggi dan paling lengkap dibanding skala-skala lainnya. Jarak atau
interval antar tingkatan sudah jelas, dan memiliki nilai 0 (nol) yang mutlak. Nilai nol mutlak
berarti benar-benar menyatakan tidak ada.
Contoh Skala Rasio:
a) tinggi badan Agung adalah 190 cm sedangkan tinggi badan Vatinson adalah 95 cm.
Pada situasi ini dapat dikatakan bahwa jarak tinggi badan Vatinson dengan Agung
adalah 95 cm. Bisa juga dikatakan bahwa tinggi badan Agung 2 kali tinggi badan
Vatinson.
b) nilai ujian matematika Tono adalah 50, sedangkan nilai Toni adalah 100. Ukuran
rasionya dapat dinyatakan bahwa nilai Toni adalah 2 kali nilai Tono.

Ordinal atau Interval?


Skala likert adalah cara yang umum digunakan untuk mengukur opini dan sikap. Mereka
mengukur sejauh mana peserta setuju atau tidak setuju dengan pernyataan yang diberikan, dan
biasanya berkisar dari 1 (sangat tidak setuju) hingga 5 (sangat setuju) dengan titik netral di
tengah (misalnya, tidak setuju maupun tidak setuju). Apakah skala ini bersifat ordinal atau
interval adalah topik perdebatan. Beberapa orang berpendapat demikian skala likert bersifat
ordinal. Mereka dengan tepat menunjukkan bahwa seseorang tidak dapat berasumsi bahwa
semua pasangan dari tingkat yang berdekatan memiliki jarak yang sama (dengan jarak yang
sama). Meskipun demikian, skala Likert (dan beberapa skala lainnya, yaitu skala diferensial
semantik dan skala numerik) umumnya diperlakukan seolah-olah itu adalah skala interval,
karena memungkinkan peneliti menghitung rata-rata dan standar deviasi dan untuk
menerapkan teknik statistik lain yang lebih maju (misalnya, untuk menguji hipotesis).

RATING SCALES ( SKALA BERTINGKAT )

Rating scale adalah pertanyaan survei tertutup yang digunakan untuk mewakili umpan balik
responden dalam bentuk komparatif untuk fitur, produk, atau layanan tertentu sehingga varian
dari pertanyaan pilihan ganda populer yang banyak digunakan untuk mengumpulkan informasi
relatif tentang topik penelitian tertentu.

Skala peringkat berikut ini sering dipakai dalam penelitian organisasional :


• Skala dikotomi ( dichotomous scale )
• Skala kategori ( category scale )
• Skala diferensial semantic ( semantic differential scale )
• Skala peringkat terperinci ( itemized rating scale )
• Skala numerical ( numerical scale )
• Skala likert ( likert scale )
• Skala peringkat jumlah konstan atu tetap ( fixed or constant sum rating scale )
• Skala stapel ( stapel scale )
• Skala peringkat grafik ( graphic rating scale )
• Skala konsesus ( consensus scale )

Skala lain, seperti Skala Interval Penampilan Sama Thurstone, dan skala multidimensi, lebih
jarang untuk digunakan.

a. Skala Dikotomi ( dichotomous scale )


Digunakan dengan memperoleh jawaban Ya atau Tidak, seperti contoh di bawah ini.
Contoh :

Apakah kamu memiliki mobil pribadi ? Yes No

b. Skala Kategori ( category scale )


Digunakan untuk memperoleh respon tunggal dari responden atas pilihan respon yang
disediakan.
Contoh :
Di Indonesia, dimanakah merupakan pulau tempat anda tinggal ?
____ Sumatera
____ Jawa
____ Kalimantan
____ Sulawesi
____ Papua
Misalnya digunakan untuk memberi label, simbol, lambang, atau nama pada sebuah
kategori sehingga akan mempermudah pengelompokan data menurut kategorinya.
Kemudian, angka yang diberikan kepada objek hanya memiliki arti sebagai label atau
pembeda saja dan bukan untuk menunjukkan adanya tingkatan.

c. Skala diferensial semantik ( semantic differential scale )


Beberapa atribut berkutub dua (bipolar) diidentifikasi pada skala ekstrem, dan
responden diminta untuk menunjukkan sikap mereka pada hal yang bisa disebut sebagai
jarak semantik (semantic space) terhadap individu, objek atau kejadian tertentu pada
masing-masing atribut. Kata sifat berkutub dua yang digunakan misalnya akan berupa
istilah tertentu, seperti Baik-Buruk; Kua-Lemah; Panas-Dingin. Skala diferensial
semantik (semantic differential scale) dipakai untuk menilai sikap responden terhadap
merek, iklan, objek atau orang tertentu. Data yang diperoleh melalui pengukuran
dengan skala semantic differential adalah data interval. Skala bentuk ini biasanya
digunakan untuk mengukur sikap atau karakteristik tertentu yang dimiliki seseorang.
Contoh : Penggunaan skala Semantik Diferensial mengenai gaya kepemimpinan kepala
sekolah.

Demokrasi 5 4 3 2 1 Otoriter
Bertanggung Jawab 5 4 3 2 1 Tidak
Bertanggung Jawab
Memberi Kepercayaan 5 4 3 2 1
Mendominasi
Menghargai Bawahan 5 4 3 2 1 Tidak Menghargai
Bawahan
Keputusan Diambil Bersama 5 4 3 2 1 Keputusan
Diambil Sendiri

d. Skala peringkat terperinci ( itemized rating scale )


Digunakan untuk dengan dasar skala numerical dengan titik panduan sesuai dengan
keperluan dalam penelitian.
Contoh :
Skala peringkat seimbang dengan sebuag titik netral
Skala peringkat yang tidak seimbang yang tidak memiliki titik netral
Skala peringkat terperinci memberikan fleksibilitas untuk menggunakan sebanyak
mungkin titik sesuia keperluan (4,5,7,9 atau berapa pun) dan juga mungkin untuk
menggunakan panduan misalnya Sangat Tidak Penting hingga Sangat Peting ; Sangat
Rendah hingga Sangat Tinggi. Bila ada titik netral, hal tersebut disubut skala peringkat
seimbang, dan bila tidak, disebut skala peringkat tidak seimbang.

e. Skala numerikal ( numerical scale )


Digunakan untuk memperoleh respon dengan memerikan skala berupa angka dengan
kata sifat berkutub kedua ujungnya.
Contoh :
Sangat Sangat
puas 1 2 3 4 5 6 7 tidak
puas

f. Skala likert ( likert scale )


Didesain untuk menelaah seberapa kuat subjek setuju atau tidak setuju dengan
pernyataan pada skala 5 titik.
Contoh :
Sangat Tidak Setuju Tidak Setuju Baik Setuju maupun Tidak Setuju Sangat
Setuju
1 2 3 4 5
Dengan menggunakan skala Likert sebelumnya, nyatakan sejauh mana Anda setuju
dengan setiap pernyataan berikut:
Perkerjaan saya sangat menarik 1 2 3 4 5
Hidup tanpa pekerjaan akan 1 2 3 4 5
Membosankan
Saya tidak merasa sibuk dengan 1 2 3 4 5
pekerjaan saya sepanjang hari

g. Skala peringkat jumlah konstan atu tetap ( fixed or constant sum rating scale )
Didesain dimana responden diminta untuk mendistribusikan sejumlah poin yang
diberikan ke berbagai item. Skala jumlah konstan atau tetap lebih bersifat skala ordinal.
Jadi skala yang digunakan biasannya lebih untuk mengukur sikap dengan
mendistribusikan sejumlah poin dan mengakumulasikannya.
Contoh :
Dalam memilih sabun mandi, tunjukan kepentingan yang anda kaitkan dengan kelima
aspek berikut ini dengan memberikan poin untuk masing-masing sehingga totalnya
berjumlah 100.

Keharuman ___
Warna ___
Bentuk ___
Ukuran ___
Tekstur ___
Total poin 100

h. Skala stapel ( stapel scale )


Skala staple (staple scale) secara simultan mengukur arah dan intensitas sikap terhadap
item yang dipelajari. Karakteristik minat terhadap studi ditempatkan di bagian tengah
dengan jarak skala numerik, katakanlah, dari +3 ke -3, pada tiap sisi item seperti
diilustraikan di bawah. Skala ini memberikan ide mengenai seberap dekat atau jauh
respons individu terhadap stimulus, skala ini tidak memiliki titik nol absolut, skala ini
adalah skala interval.
Contoh :
Nyatakan bagaimana Anda menilai kemampuan supervisor Anda sehubungan dengan
masing-masing karakteristik yang disebutkan di bawah ini, dengan melingkari nomor
yang sesuai.

+3 +3 +3
+2 +2 +2
+1 +1 +1
Adopting modern product interpersonal skills
Technology innovation
-1 -1 -1
-2 -2 -2
-3 -3 -3

i. Skala peringkat grafik ( graphic rating scale )


Memberikan gambaran grafis yang membantu responden untuk menunjukan pada skala
peringkat grafik. Jawaban mereka untuk pertanyaan tertentu dengan menempatkan
tanda pada titik yang tepat pada garis, ini merupakan skala ordinal.

j. Skala konsesus ( consensus scale )


Dibuat berdasarkan konsensus, dimana panel juri memilih item tertentu, mengukur
konsep yang menurut mereka relavan. Item dipilih terutama berdasarkan ketepatan atau
relevansinya dengan konsep. Skala konsensus (consensus scale) tersebut dibuat setelah
item terpilih diperiksa dan diuji validitas dan keandalannya.

k. Skala Lainnya
Ada juga beberapa metode penskalaan yang sudah sangat maju atau rumit (advance)
seperti penskalaan multidimensional (multidimensional scaling), di mana objek, orang,
atau kedua-duanya, diskalakan secara visual, dan dilakukan analisis gabungan
(conjoint). Hal tersebut memberikan gambar visual mengenai hubungan yang ada
dianara dimensi sebuah konsep (construct).

RANKING SCALES

Ranking Scales (skala peringkat) digunakan untuk memanfaatkan kecenderungan


antara dua atau lebih objek-objek atau item. Namun, peringkat tersebut tidak dapat memberikan
petunjuk pasti untuk beberapa jawaban yang dicari. Namun, peringkat tersebut mungkin tidak
memberikan petunjuk pasti untuk beberapa jawaban yang dicari.
Misalnya, ada empat lini produk dan manajer mencari informasi yang akan membantu
memutuskan lini produk yang harus mendapatkan perhatian paling besar. Asumsikan bahwa
35% responden memilih produk pertama, 25% yang kedua, dan 20% memilih masing-masing
produk tiga dan empat. Manajer terebut kemudian tidak dapat menyimpulkan bahwa produk
pertama adalah yang paling disukai, karena 65% responden tidak memilih produk itu. Metode
alternatif yang digunakan adalah paired comparison, forced choice, dan comparative scale,
yang dibahas di bawah ini.

Paired Comparison (Perbandingan Berpasangan)

Skala perbandingan yang dipasangkan digunakan ketika, di antara sejumlah kecil objek,
responden diminta untuk memilih antara dua objek pada satu waktu. Ini membantu menilai
preferensi. Jika, misalnya, dalam contoh sebelumnya, selama perbandingan yang dipasangkan,
responden secara konsisten menunjukkan preferensi untuk produk satu di atas produk dua, tiga,
dan empat, manajer dapat dengan andal memahami lini produk mana yang menuntut perhatian
maksimalnya. Namun, karena jumlah objek yang akan dibandingkan meningkat, begitu juga
jumlah perbandingan yang dipasangkan. Jumlah pilihan yang dipasangkan untuk objek n
adalah (n)(n − 1)/2. Semakin besar jumlah objek atau rangsangan, semakin besar jumlah
perbandingan yang dipasangkan yang disajikan kepada responden, dan semakin besar
kelelahan responden. Oleh karena itu, perbandingan yang dipasangkan adalah metode yang
baik jika jumlah rangsangan yang disajikan kecil.

Forced Choice (Pilihan Paksa)

Pilihan paksa memungkinkan responden untuk menempatkan objek relatif satu sama
lain, di antara alternatif yang disediakan. Ini lebih mudah bagi responden, terutama jika jumlah
pilihan yang akan diberi peringkat terbatas jumlahnya.

Contoh :
Peringkat majalah berikut yang ingin berlangganan dalam urutan preferensi, menetapkan
pilihan 1 yang paling disukai dan 5 untuk yang paling tidak disukai.

Fortune —
Playboy —
Time —
People —
Prevention —

Comparative Scale (Skala komparatif)


Skala komparatif memberikan tolok ukur atau titik referensi untuk menilai sikap
terhadap objek, peristiwa, atau situasi saat ini yang sedang dipelajari. Penggunaan skala
komparatif adalah sebagai berikut.

Contoh
Dalam lingkungan keuangan yang fluktuatif dibandingkan dengan saham, seberapa bijaksana
atau berguna untuk berinvestasi dalam obligasi negara?

Silakan lingkari respons yang sesuai.

Lebih berguna Rata-rata Kurang berguna

1 2 3 4 5

Singkatnya, yang digunakan di sini adalah data nominal atau data dalam bentuk
kategori; data ordinal ke salah satu ranking scale – paired comparison, forced choice, dan
comparative scale; dan interval atau data seperti interval ke skala peringkat lainnya, seperti
yang terlihat dari berbagai contoh di atas. Rating scales digunakan untuk mengukur sebagian
besar konsep perilaku. Ranking scales digunakan untuk membuat perbandingan atau peringkat
variabel yang telah disadap pada skala nominal.

INTERNATIONAL DIMENSIONS OF SCALING

Selain kepekaan terhadap definisi operasional konsep dalam budaya lain, masalah
scaling juga perlu dibahas dalam lintas budaya penelitian. Budaya yang berbeda bereaksi secara
berbeda juga terhadap masalah scaling. Misalnya, titik lima atau skala tujuh poin dapat
membuat perbedaan di AS, tetapi bisa di respon secara berbeda oleh subyek di negara lain.
(Sekaran & Martin, 1982; Sekaran & Trafton, 1978). Barry (1969), misalnya, ditemukan bahwa
di beberapa negara, skala tujuh poin lebih sensitif daripada skala empat poin dalam melakukan
tanggapannya.
Penelitian terbaru menunjukkan bahwa orang-orang dari berbagai negara memiliki
perbedaan kecenderungan rating scale (misalnya 1 dan 5 atau 1 dan 7) dan untuk merespons
dengan cara yang diinginkan secara sosial (De Jong, 2006). Temuan ini menggambarkan
bahwa menganalisis dan menginterpretasikan data yang dikumpulkan di beberapa negara
adalah usaha yang sangat tidak mudah.

Goodness of measure
Dalam melakukan pengukuran variabel dan menerapkan teknik skala yang berbeda sangatlah
penting untuk memastikan bahwa instrumen yang kita kembangkan untuk mengukur konsep
tertentu memang akurat dalam mengukur variabel. Dan pada kenyataannya, kita benar-benar
mengukur konsep yang kita tetapkan. Dalam menghitung perseptif dan variabel sikap, kita
tidak mengabaikan beberapa dimensi dan elemen penting yang tidak relevan. Skala yang
dikembangkan sering kali tidak sempurna, dan kesalahan cenderung terjadi dalam pengukuran
variabel. Penggunaan instrumen yang lebih baik akan memastikan hasil yang lebih akurat, yang
selanjutnya akan meningkatkan kualitas ilmiah riset. Oleh karena itu, dengan satu atau lain
cara, kita perlu menilai "kebaikan" dari langkah-langkah yang dikembangkan. Yaitu, kita perlu
cukup yakin bahwa instrumen yang kita gunakan dalam penelitian kita memang mengukur
variabel yang seharusnya, dan bahwa mereka mengukur secara akurat. Lalu bagaimana kita
dapat memastikan bahwa langkah-langkah yang dikembangkan cukup baik. Pertama, analisis
item tanggapan terhadap pertanyaan yang menekan variabel dilaksanakan, dan kemudian
keandalan dan keabsahan langkah-langkah ditetapkan.

Item Analysis

Analisis Item dilakukan untuk melihat apakah benda-benda di instrumen berada di sana atau
tidak. Setiap item diperiksa karena kemampuannya untuk membedakan antara mereka mata
pelajaran yang total nilai tinggi dan mereka dengan nilai rendah. Dalam analisis item, sarana
antara kelompok skor tinggi dan kelompok skor rendah diuji untuk mendeteksi perbedaan
signifikan melalui t-value. Item dengan nilai tinggi (tes yang mampu mengidentifikasi yang
sangat diskriminatif item dalam instrumen) kemudian disertakan dalam instrumen. Setelah itu,
diuji apakah instrumen tersebut dapat diandalkan dan keabsahan instrumen itu ditetapkan.

Validity

Validitas adalah tes tentang seberapa baik instrumen yang dikembangkan mengukur konsep
tertentu yang dimaksudkan untuk diukur. Dengan kata lain, keabsahan berkaitan dengan
apakah kita mengukur konsep yang benar, dan keterandalan dengan stabilitas dan konsistensi
ukuran. Keabsahan dan keterandalan pengukuran membuktikan keakuratan ilmiah yang telah
masuk dalam penelitian.

Dua kriteria ini sekarang akan dibahas. Berbagai bentuk keandalan dan keabsahan
digambarkan dalam gambar 12.1.
Content Validity

Isi validitas memastikan bahwa ukuran tersebut mencakup seperangkat item yang memenuhi
syarat dan mewakili yang menyadap konsep tersebut. Semakin banyak benda-benda skala yang
mewakili ranah atau alam semesta dari konsep yang sedang diukur, semakin besar validitas
isinya. Untuk menempatkannya secara berbeda, konten validitas adalah fungsi dari seberapa
baik dimensi dan unsur dari suatu konsep telah tergambar.Sekelompok hakim bisa
membuktikan kebenaran instrumen itu. Kidder dan Judd (1986) menyebutkan contoh di mana
sebuah tes yang dirancang untuk mengukur tingkat gangguan bicara dapat dianggap sebagai
keabsahan jika dinilai demikian oleh sekelompok hakim ahli. Face validity dianggap oleh
beberapa orang sebagai dasar dan minimum indeks isi. Face validity menunjukkan bahwa item
yang dimaksudkan untuk mengukur konsep dan melakukan di wajah. Terlihat seperti mereka
mengukur konsep, beberapa peneliti tidak merasa cocok untuk mengakui keabsahan wajah
sebagai komponen kebenaran isi yang sah.

Criterion-related validity

Validitas terkait dengan kriteria ditetapkan ketika ukuran membeda-bedakan individu pada
kriteria yang diharapkan untuk memprediksi. Hal ini dapat dilakukan dengan menetapkan
keabsahan atau keabsahan prediktif. Pembuktian kebenarannya ditetapkan ketika skala
mendiskriminasi individu yang dikenal berbeda; Yaitu, mereka harus memberikan nilai yang
berbeda pada instrumen tersebut, seperti pada contoh berikut.
Contoh :

Jika sejumlah etika kerja dikembangkan dan diberikan kepada sekelompok penerima
kesejahteraan, skala itu hendaknya membedakan mereka yang antusias menerima pekerjaan
dan senang mendapat kesempatan untuk tidak menikmati kesejahteraan, dari mereka yang tidak
ingin bekerja, bahkan ketika ditawari pekerjaan. Jelaslah, orang-orang yang memiliki nilai etos
kerja yang tinggi tidak ingin hidup sejahtera dan mendambakan pekerjaan untuk mandiri. Di
pihak lain, orang-orang yang rendah dalam nilai etos kerja mungkin memanfaatkan kesempatan
untuk bertahan hidup dengan kesejahteraan selama mungkin, menganggap pekerjaan sebagai
pekerjaan yang membosankan. Jika kedua jenis individu memiliki nilai yang sama pada skala
etos kerja, maka tes ini bukan ukuran etika kerja, tetapi dari sesuatu yang lain. Predictive
validity atau validitas prediktif mengindikasikan kemampuan alat pengukur untuk
membedakan antara individu dengan kriteria masa depan.

Contoh :

Jika tes bakat atau kemampuan yang diberikan kepada karyawan pada saat perekrutan adalah
untuk membedakan individu berdasarkan kinerja masa depan mereka, maka mereka yang nilai
rendah pada tes memiliki perilaku yang buruk dan mereka dengan nilai tinggi memiliki perilaku
yang baik.

Construct validity

Membangun keabsahan membuktikan seberapa baik hasil yang diperoleh dari penggunakan
ukuran sesuai dengan teori di mana tes telah dirancang. Ini dinilai melalui konversi dan
validitas diskriminatif, yang dijelaskan. Convergent validity ditetapkan ketika nilai diperoleh
dengan dua instrumen yang berbeda mengukur konsep yang sama sangat berkorelasi.

Discriminant validity ditetapkan ; berdasarkan teori, dua variabel diprediksikan tidak


berkorelasi, dan skor diperoleh dengan mengukur mereka memang secara empiris ditemukan
begitu. Dengan demikian, keabsahan dapat diteguhkan dengan berbagai cara. Langkah-langkah
yang diterbitkan untuk berbagai konsep biasanya melaporkan jenis keabsahan yang telah
ditetapkan untuk instrumen tersebut, sehingga pengguna atau pembaca dapat menilai
"kebaikan" dari ukuran tersebut.
Beberapa cara dimana bentuk-bentuk validitas di atas dapat ditegakkan adalah melalui yang
berikut:

1. Analisis korelasi (seperti dalam kasus penetapan validitas kontekstual dan prediktif atau
konvergen dan validitas diskriminatif).

2. Analisis faktor, sebuah teknik multivariat yang meneguhkan dimensi konsep yang telah
dijabarkan secara operasional, serta menunjukkan mana yang paling cocok untuk setiap
dimensi (membangun keabsahan).

3. Multitrait, multimetode matriks korelasi yang diambil dari mengukur konsep dengan bentuk
yang berbeda dan metode yang berbeda.

Reliability

Reability atau keterandalan suatu ukuran menunjukkan sejauh mana ia tanpa prasangka (bebas
kesalahan) dan dengan demikian memastikan keterukuran waktu dan lintas berbagai benda
pada alat itu. Dengan kata lain, keandalan suatu ukuran merupakan indikasi kestabilan dan
konsistensi yang dengannya instrumen itu mengukur konsep tersebut dan membantu menilai
"kebaikan" suatu ukuran.

Stability of measures atau Langkah - langkah yang kestabilan merupakan kemampuan untuk
tetap sama selama beberapa waktu meskipun kondisi pengujian yang tak terkendali atau
keadaan responden sendiri menunjukkan stabilitas dan rendahnya kerentanan terhadap
perubahan dalam situasi. Hal ini membuktikan "kebaikan" -nya karena konsepnya diukur
dengan pasti, tidak soal kapan itu dilakukan. Dua tes stabilitas adalah keandalan dan bentuk
paralelasi keandalan.

Test–retest reliability merupakan koefisien yang diperoleh oleh pengulangan ukuran yang
sama pada kesempatan kedua disebut retest keandalan. Yaitu, ketika sebuah kuesioner yang
berisi beberapa hal yang seharusnya untuk mengukur suatu konsep diberikan kepada satu set
responden, sekarang dan lagi kepada responden yang sama, katakan beberapa minggu sampai
enam bulan kemudian, maka korelasi antara skor yang diperoleh pada dua waktu berbeda dari
satu dengan seperangkat responden yang sama disebut koefisien uji coba. Semakin tinggi itu,
lebih baik test - retest keandalan dan, akibatnya, stabilitas ukuran melintasi waktu.
Parallel-form reliability : ketika tanggapan pada dua set langkah yang sebanding
mengetukkan konstruksi yang sama sangat berkorelasi, kami memiliki paralel-bentuk
keandalan. Kedua bentuk ini memiliki bentuk yang sama dan format tanggapan yang sama,
satu-satunya perubahan adalah susunan kata-kata dan urutan atau urutan pertanyaan. Apa yang
kami coba buktikan di sini adalah kesalahan yang bervariasi akibat pilihan kata dan urutan
pertanyaan. Jika dua bentuk yang serupa seperti itu sangat berkorelasi (katakanlah 8 dan atas),
kita mungkin cukup yakin bahwa langkah-langkah tersebut cukup dapat diandalkan, dengan
sedikit perbedaan kesalahan yang disebabkan oleh pilihan kata, urutan, atau faktor-faktor lain.

Internal consistency of measures

Konsistensi internal tindakan menunjukkan homogenitas item dalam mengukur yang ketukan
konstruksi. Dengan kata lain, benda-benda itu hendaknya "dipasang bersama-sama sebagai satu
kelompok", dan mampu secara independen mengukur konsep yang sama sehingga para
responden menerapkan makna keseluruhan yang sama pada setiap benda. Hal ini dapat terlihat
dengan memeriksa apakah benda-benda itu dan subset benda-benda dalam alat pengukur itu
berkorelasi tinggi. Konsistensi dapat diperiksa melalui konsistensi interitem kehandalan dan
split-setengah tes keandalan.

Interitem consistency reliability adalah menguji konsistensi jawaban responden untuk semua
item dalam ukuran. Sampai pada tingkat bahwa item adalah langkah-langkah independen dari
konsep yang sama, mereka akan berkorelasi satu sama lain. Tes yang paling populer dari
keterandalan konsistensi interitem adalah Cronbach's coefisien alpha (Cronbach, 1946), yang
digunakan untuk multipoint skala item, dan rumus Kuder & Richardson (Kuder & Richardson,
1937), yang digunakan untuk item dichotomous. Semakin tinggi koefisien, semakin baik alat
pengukur.

Split-half reliability : mencerminkan korelasi di antara dua bagian instrumen. Perkiraan akan
bervariasi tergantung pada bagaimana benda-benda dalam ukuran itu dibagi menjadi dua
bagian. Pembagian setengah porsi dapat lebih tinggi daripada yang digunakan untuk
Cronbach's alpha hanya dalam keadaan ada lebih dari satu dimensi respon yang mendasari
disadap oleh ukuran dan ketika kondisi-kondisi lain tertentu terpenuhi juga (untuk rincian
lengkap, merujuk pada Campbell, 1976). Oleh karena itu, dalam hampir semua kasus,
Cronbach's alpha dapat dianggap sebagai indeks yang sangat memadai tentang keandalan antar
item.
Skala Pengukuran Formatif di bandingkan dengan Reflektif
Skala reflektif adalah faktor yang menimbulkan sesuatu pada apa yang sedang diamati.
Dalam skala reflektif, semua item diharapkan dapat saling berkaitan. Setiap item dalam skala
reflektif dianggap berbagi dasar yang sama. Pada Model indikator reflektif secara matematis
menempatkan indikator seolah-olah dipengaruhi oleh variabel laten, namun variabel bebas
tidak memiliki data. Oleh karena itu Model indikator reflektif menghendaki antar indikator
saling berkorelasi satu sama lain. Apabila terjadi perubahan dari satu indikator maka akan
berakibat pada perubahan indikator lainnya dengan arah yang sama, namun tidak akan
berakibat mengubah makna variabel laten. Secara konseptual, model pengukuran reflektif
terjadi ketika indikator konstruk dianggap disebabkan oleh konstruk itu. Misalnya, tes
kecerdasan : jika anda lebih cerdas, anda memiliki probabilitas lebih tinggi untuk mendapatkan
jawaban yang benar untuk suatu pertanyaan. Oleh karena itu tingkat kecerdasan anda
(diteorikan) memprediksi skor pada pertanyaan. Variabel laten (kecerdasan) adalah prediktor,
variabel terukur (tes) adalah hasilnya.

Skala formatif digunakan ketika sebuah konstruksi dipandang sebagai kombinasi


penjelas dari indikatornya (Fornell, 1987; Fornell & Bookstein, 1982). Ambil Job Description
Index (Smith, Kendall & Hulin, 1969), ukuran komposit dimaksudkan untuk mengevaluasi
kepuasan kerja. Ukuran ini mencakup 5 dimensi:
1. Jenis pekerjaan (18 item)
2. Peluang untuk promosi (9 item)
3. Kepuasan dengan pengawasan (18 item)
4. Rekan kerja (18 item), dan
5. gaji (9 item).
Kelima dimensi tersebut dilihat sebagai lima karakteristik yang menentukan kepuasan kerja.
Kelima dimensi tersebut diterjemahkan ke dalam 72 elemen yang dapat diamati dan diukur
seperti “Peluang baik untuk kemajuan”, “Promosi reguler ”, “ Kesempatan promosi yang cukup
baik”, “Penghasilan memadai untuk pengeluaran normal”, “Gaji tinggi” dan “Memberi rasa
pencapaian”. Idenya adalah kita mengharapkan tiga item pertama ("Bagus peluang untuk
kemajuan," "Promosi reguler," dan "Kesempatan yang cukup baik untuk promosi") untuk
dikorelasikan (bagaimanapun juga, mereka semua bertujuan untuk mengukur satu dimensi
tertentu dari kepuasan kerja, yaitu, "peluang untuk promosi"). Namun, item ini tidak selalu
berkorelasi dengan item yang mengukur "Bayar" (dimensi kedua), seperti “Penghasilan
memadai untuk pengeluaran normal” dan “Digaji tinggi,” karena dimensi “Peluang bagus
untuk kemajuan” tidak selalu terkait dengan dimensi “Pembayaran”. Memang, pekerja pertama
mungkin memiliki gaji yang sangat bagus tetapi tidak ada peluang untuk promosi, pekerja
kedua mungkin memiliki peluang yang sangat baik untuk promosi tetapi sangat gaji yang
buruk, dan pekerja ketiga mungkin memiliki gaji yang sangat baik dan kesempatan yang sangat
baik untuk promosi. Demikian pula, mengharapkan item "Pendapatan yang memadai untuk
pengeluaran normal" dan "Dibayar tinggi" akan berkorelasi satu sama lain (karena kedua item
mengukur pembayaran), tetapi tidak selalu mengharapkan item ini berkorelasi dengan item
"Memberi rasa pencapaian" (karena item terakhir ini tidak mengukur gaji tetapi dimensi lain
dari Job Description Index).
Singkatnya, Indeks Deskripsi Pekerjaan mencakup lima dimensi dan 72 item. 72 item
ini belum tentu terkait satu sama lain, karena lima dimensi yang mereka wakili tidak selalu
saling terkait. Skala yang berisi item-item yang belum tentu terkait disebut skala formatif. Kita
sudah menjelaskan bahwa skala formatif digunakan ketika sebuah konstruk (seperti kepuasan
kerja) dipandang sebagai penjelasan kombinasi indikatornya (promosi, gaji, kepuasan dengan
pengawasan, rekan kerja, dan pekerjaan); yaitu, kapan perubahan salah satu indikator (dimensi)
diharapkan mengubah skor keseluruhan konstruksi, terlepas dari nilai indikator (dimensi)
lainnya. Job Description Index bersifat formatif, karena peningkatan nilai salah satu
indikatornya, seperti "peluang untuk promosi," diharapkan menghasilkan skor kepuasan kerja
yang lebih tinggi, terlepas dari nilai indikator lainnya. Demikian Job Description Indeks
mengkonseptualisasikan kepuasan kerja sebagai skor tertimbang total di 72 item kepuasan
kerja, di mana masing-masing item sesuai dengan dimensi independen tertentu dari kepuasan
kerja. Skala formatif yang baik (yaitu, valid) adalah skala yang mewakili seluruh domain
konstruksi. Ini berarti bahwa skala yang valid harus mewakili semua aspek yang relevan dari
konstruksi yang diminati, bahkan jika aspek-aspek ini tidak tentu berkorelasi. Meskipun masuk
akal untuk menguji konsistensi interitem dari skala reflektif, tidak masuk akal untuk menguji
konsistensi interitem dari skala formatif. Alasannya adalah kami tidak mengharapkan item
dalam skala formatif menjadi homogen; dengan kata lain, kami tidak mengharapkan semua
item berkorelasi. Untuk alasan ini, uji konsistensi jawaban responden untuk item ukuran
formatif tidak memberi tahu kami apa pun tentang kualitas alat ukur kami. Perhatikan bahwa
ada metode lain untuk menilai kebaikan skala formatif (lihat, misalnya, Jarvis, MacKenzie &
Podsakoff, 2003).

Anda mungkin juga menyukai