Anda di halaman 1dari 20

MAKALAH METODOLOGI PENELITIAN

“Measurement of Variables: Operational Definition and


Measurement: Scaling, Reliability And Validity”

Dosen Pengampu: Assc. Prof. Dr. Ach. Mohyi, M.M., CPHRM

Disusun Oleh:
KELOMPOK 4
Tsiqatun Nasyiah 202120280211044
Nastiti Kartika Dewi 202120280211048

PROGRAM STUDI MAGISTER MANAJEMEN


DIREKTORAT PROGRAM PASCASARJANA
UNIVERSITAS MUHAMMADIYAH MALANG
2022
KATA PENGANTAR

Puji syukur kami ucapkan kepada Tuhan Yang Maha Esa yang telah memberikan karunianya
sehingga kami dapat menyelesaikan makalah “Pengukuran Variabel: Definisi Operasional:
Pengukuran Variabel: Skala, Reliabilitas dan Validitas” untuk memenuhi tugas mata kuliah
Metodologi Penelitian Program Magister Manajemen Universitas Muhammadiyah Malang.
Harapan kami semoga makalah ini membantu menambah pengetahuan dan pengalaman bagi
para pembaca. Penulis mengakui bahwa makalah ini masih banyak kekurangan, maka dari itu
kami berharap kepada pembaca untuk memberikan masukan-masukan yang bersifat membangun
untuk kesempurnaan makalah ini.

Malang, April 2022


Hormat kami,

Penyusun
i
DAFTAR ISI

KATA PENGANTAR.............................................................................................i
DAFTAR ISI...........................................................................................................ii
BAB I : PENDAHULUAN...................................................................................1
A. Latar Belakang....................................................................................1
B. Rumusan Masalah...............................................................................1
C. Tujuan Penulisan.................................................................................2
BAB II : PEMBAHASAN.....................................................................................3
2.1. Pengukuran Variabel: Definisi Operasional......................................................3
A. Bagaimana Variabel Diukur...............................................................3
B. Definisi Operasional...........................................................................4
C. Dimensi Operasionalisasi Internasional..............................................5
2.2. Pengukuran: Skala, Reliabilitas dan Validitas..................................................5
A. Empat Jenis Skala...............................................................................5
B. Skala Rating........................................................................................8
C. Skala Peringkat...................................................................................9
D. Skala Dimensi Internasional.............................................................10
E. Ketepatan Pengukuran......................................................................10
F. Keandalan/Reliabilitas.......................................................................12
G. Refleksi Versus Formative Measurement Scale...............................14
BAB III : PENUTUP............................................................................................15
DAFTAR PUSTAKA...........................................................................................16

ii
BAB I
PENDAHULUAN
A. Latar Belakang

Pengukuran variabel merupakan bagian integral dari penelitian dan aspek penting dari
desain penelitian. Kecuali variabel diukur dalam beberapa cara, kami tidak akan dapat
menemukan jawaban atas pertanyaan penelitian kami. Survei dan desain eksperimental, dibahas
dalam bab-bab sebelumnya, sering menggunakan kuesioner untuk mengukur variabel-variabel
yang menarik. Dalam bab ini kita akan membahas bagaimana variabel memungkinkan
pengukuran.
Skala adalah sebuah alat atau mekanisme yang oleh individu digunakan untuk
membedakan satu variabel dengan variabel lainnya pada suatu yang menarik dipelajari.Ada
empat tipe dasar dari skala: nominal, ordinal, interval, dan rasio. Tingkat kecanggihan yang
timbangan fine-tuned meningkat progresif sively seperti yang kita bergerak dari nominal dengan
skala rasio. Artinya, informasi tentang variabel dapat diperoleh secara lebih rinci ketika kita
menggunakan selang atau skala rasio dari dua skala lainnya. Sebagai kalibrasi atau fine-tuning
dari meningkatnya skala kecanggihan, demikian kekuatan skala. Dengan skala yang lebih kuat,
analisis data yang semakin canggih dapat dilakukan, yang, pada gilirannya, berarti bahwa
jawaban lebih bermakna dapat ditemukan untuk pertanyaan penelitian.

B. Rumusan Masalah

1. Bagaimana variabel diukur?


2. Apakah definisi dari operasional?
3. Apakah dimensi operasionalisasi internasional?
4. Apa sajakah empat jenis skala?
5. Apakah skala rating itu?
6. Bagaimanakah skala peringkat itu?
7. Bagaimanakah skala dimensi internasional itu?
8. Bagaimanakah ketepatan pengukuran?
9. Bagaimana keandalan/reliabilitas itu?
10. Bagaimana reflektif versus formative measurement scales?
1
C. Tujuan Penulisan

1. Untuk mengetahui variabel yang diukur.


2. Untuk mengetahui definisi dari opersional.
3. Untuk mengetahui dimensi operasional internasional.
4. Untuk mengetahui empat jenis skala
5. Untuk mengetahui skala reting
6. Untuk mengetahui skala peringkat
7. Untuk mengetahui skala dimensi internasional
8. Untuk mengetahui ketepatan pengukuran
9. Untuk mengetahui keandalan/reliabilitas.
10. Untuk mengetahui reflektif versus formative measurement scales.

2
BAB II
PEMBAHASAN

2.1 Pengukuran Variabel : Definisi Operasional


A. Bagaimana Variabel Diukur
Pengukuran adalah penugasan angka atau simbol lain untuk karakteristik (atau atribut)
objek sesuai dengan seperangkat aturan yang ditetapkan sebelumnya. Objek termasuk orang, unit
bisnis strategis, perusahaan, negara, sepeda, gajah, peralatan dapur, restoran, sampo, yoghurt,
dan sebagainya. Contoh karakteristik objek adalah kecenderungan pencarian arousal, motivasi
berprestasi, keefektifan organisasi, kesenangan berbelanja, panjang, berat badan, keragaman
etnis, kualitas layanan, efek pengkondisian, dan rasa. Penting untuk menyadari bahwa Anda tidak
dapat mengukur objek (misalnya, perusahaan); Anda mengukur karakteristik atau atribut objek
(misalnya, efektivitas organisasi suatu perusahaan). Dengan cara yang sama, Anda dapat
mengukur panjang (atribut) seseorang (objek), berat seekor gajah, kecenderungan mencari nafsu
dari pialang saham, kenikmatan belanja wanita, kualitas layanan restoran, efek pengkondisi
sampo, dan rasa merek yoghurt tertentu. Untuk dapat mengukur Anda membutuhkan objek dan
atribut objek, tetapi Anda juga membutuhkan hakim. Seorang hakim adalah seseorang yang
memiliki pengetahuan dan keterampilan yang diperlukan untuk menilai "kualitas" sesuatu,
seperti rasa yogurt, kecenderungan mencari-cari para pialang saham, atau keterampilan
komunikasi siswa. Dalam banyak kasus, objek dan hakim adalah orang yang sama. Misalnya,
jika Anda ingin mengukur jenis kelamin (atribut) karyawan Anda (objek), atau kenikmatan
belanja (atribut) wanita (objek), Anda dapat meminta objek (karyawan dan wanita) untuk
menyediakan Anda dengan rincian yang diperlukan melalui kuesioner yang dikelola sendiri.
Namun, tidak mungkin bahwa objek tersebut memiliki pengetahuan dan keterampilan yang
diperlukan untuk bertindak sebagai hakim ketika Anda ingin mengukur rasa (atribut) yogurt
(objek), kualitas layanan restoran, keterampilan komunikasi siswa, atau bahkan keahlian
manajerial pengawas.
Atribut objek yang dapat diukur secara fisik oleh beberapa instrumen yang dikalibrasi
tidak menimbulkan masalah pengukuran. Misalnya, panjang dan lebar meja kantor persegi
panjang dapat dengan mudah diukur dengan pita pengukur atau penggaris. Hal yang sama

3
berlaku untuk mengukur luas lantai kantor dan untuk mengukur berat seekor gajah (setidaknya
sampai batas tertentu). Data yang mewakili beberapa karakteristik demografi pegawai kantor
juga mudah diperoleh dengan mengajukan pertanyaan sederhana kepada karyawan, seperti:
"Sudah berapa lama Anda bekerja di organisasi ini?" Atau "Apa status perkawinan Anda?"
Pengukuran atribut yang lebih abstrak dan subyektif lebih sulit. Misalnya, relatif sulit
untuk mengukur tingkat motivasi berprestasi dari pegawai kantor, kesenangan berbelanja wanita,
atau kebutuhan untuk kognisi siswa. Demikian juga, tidak mudah untuk menguji hipotesis
tentang hubungan antara keragaman tenaga kerja, keahlian manajerial, dan efektivitas organisasi.
Masalahnya adalah bahwa kita tidak dapat sekadar mengajukan pertanyaan seperti “Seberapa
beragamkah tenaga kerja perusahaan Anda?” Atau “Seberapa efektifkah organisasi Anda?”
Karena sifat abstrak dari variabel “keragaman tenaga kerja” dan “efektivitas organisasi.” Tentu
saja, ada solusi untuk masalah ini. Salah satu solusi ini dibahas selanjutnya. Tapi mari kita,
sebelum kita membahas solusinya, meringkas masalahnya.
Variabel tertentu memungkinkan pengukuran yang mudah melalui penggunaan alat ukur
yang tepat; misalnya, fenomena fisiologis yang berkaitan dengan manusia, seperti tekanan darah,
denyut nadi, dan suhu tubuh, serta atribut fisik tertentu seperti panjang dan berat badan. Namun
ketika kita memasuki ranah perasaan, sikap, dan persepsi subyektif orang, pengukuran faktor
atau variabel ini menjadi lebih sulit. Dengan demikian, setidaknya ada dua jenis variabel: satu
cocok untuk pengukuran yang obyektif dan tepat; yang lainnya lebih samar dan tidak cocok
untuk pengukuran yang akurat karena sifatnya yang abstrak dan subyektif.

B. Definisi Operasional

Meskipun kurangnya alat pengukur fisik untuk mengukur variabel yang samar, ada cara
untuk mengetahui jenis variabel ini. Salah satu teknik adalah untuk mengurangi gagasan atau
konsep abstrak ini ke perilaku atau karakteristik yang dapat diamati. Dengan kata lain, gagasan
abstrak dipecah menjadi perilaku atau karakteristik yang dapat diamati. Misalnya, konsep dari
thirst adalah abstrak; kita tidak bisa melihatnya. Namun, kami mengharapkan orang yang haus
untuk minum banyak cairan. Dengan kata lain, reaksi yang diharapkan dari orang yang haus
adalah minum cairan. Jika beberapa orang mengatakan mereka haus, maka kita dapat
menentukan tingkat kehausan dari masing-masing individu ini dengan ukuran kuantitas cairan
yang mereka minum untuk memuaskan dahaga mereka. Dengan demikian kita akan mampu
4
mengukur tingkat kehausan mereka, meskipun konsep kehausan itu sendiri abstrak dan samar-
samar. Pengurangan konsep abstrak untuk membuat mereka dapat diukur dengan cara yang nyata
disebut operasionalisasi konsep.
Operasionalisasi dilakukan dengan melihat perilaku dimensi, aspek, atau properti
dilambangkan dengan konsep. Ini kemudian diterjemahkan ke dalam elemen yang dapat diamati
dan terukur sehingga dapat mengembangkan indeks pengukuran konsep. Pengoperasian konsep
melibatkan serangkaian langkah. Langkah pertama adalah menghasilkan definisi konstruksi yang
ingin diukur. Maka, perlu dipikirkan tentang isi dari ukuran yang bersangkutan; yaitu, instrumen
(satu atau lebih item atau pertanyaan) yang benar-benar mengukur konsep yang ingin diukur
seseorang dan harus dikembangkan. Selanjutnya, format tanggapan (misalnya, skala peringkat
tujuh poin dengan end- point yang dilabeli oleh "sangat tidak setuju" dan "sangat setuju")
diperlukan, dan akhirnya, validitas dan reliabilitas skala pengukuran yang harus dinilai.

C. Dimensi Operasionalisasi Internasional


Dalam melakukan penelitian transnasional, penting untuk diingat bahwa variabel-variabel
tertentu memiliki makna dan konotasi yang berbeda dalam budaya yang berbeda. Misalnya,
istilah "cinta" memiliki beberapa makna dalam budaya yang berbeda dan memiliki setidaknya 20
interpretasi yang berbeda di beberapa negara. Demikian juga konsep “pengetahuan” yang
disamakan dengan “jnana” dalam beberapa budaya Timur dan dianggap sebagai “perwujudan
dari Yang Mahakuasa”. Dengan demikian, adalah sebaiknya para peneliti yang berasal dari
negara dengan bahasa yang berbeda untuk merekrut bantuan dari ahli setempat untuk
mengoperasionalkan konsep tertentu saat terlibat dalam suatu penelitian lintas budaya.

2.2 Pengukuran: Skala, Reliabilitas, Validitas


A. Empat Jenis Skala
Pengukuran berarti mengumpulkan data dalam bentuk angka. Untuk dapat menetapkan
angka kepada objek, kita memerlukan skala. Sebuah skala adalah alat atau mekanisme dimana
individu dibedakan bagaimana mereka berbeda satu sama lain pada variabel yang ada untuk
sebuah penelitian. Misalnya, kita ingin mengukur sikap konsumen ketika mengonsumsi
minuman ringan. Setelah kita mengembangkan satu atau lebih item skala atau pertanyaan,
langkah berikutnya dalam pengukuran adalah memutuskan skala yang memungkinkan kita untuk
menetapkan angka pada atribut (sikap ketika mengkonsumsi minuman ringan) dari objek
5
(konsumen). Hal ini memungkinkan kita untuk kemudian mengklasifikasikan objek kita
(konsumen) dalam hal seberapa tidak menguntungkan atau menguntungkan mereka terhadap
minum-minuman ringan. Salah satu dari banyak pilihan yang kita miliki untuk
mengklasifikasikan konsumen adalah skala Likert.
Skala Likert adalah skala yang dirancang untuk memeriksa seberapa kuat responden
setuju dengan pernyataan (seperti “Saya sangat menikmati minuman ringan”) pada skala
lima poin ditetapkan sebagai berikut: 1 = Sangat Tidak Setuju, 2 = Tidak Setuju, 3 = Netral, 4 =
Setuju, 5 = Sangat Setuju. Oleh karena itu, skala Likert memungkinkan kita untuk membedakan
konsumen dalam hal bagaimana mereka berbeda satu sama lain dalam sikap mereka ketika
mengkonsumsi minuman ringan, masing-masing responden diberi nomor yang menunjukkan
kurang lebih tidak menguntungkan, netral, atau kurang atau lebih baik.
Ada empat tipe dasar skala: nominal, ordinal, interval, dan rasio. Informasi tentang
variabel dapat diperoleh secara lebih rinci ketika kita menggunakan interval atau skala rasio
daripada menggunakan dua skala lainnya. Ketika kalibrasi atau fine-tuning dari skala meningkat,
begitu juga kekuatan skala. Dengan skala yang lebih kuat, analisis data yang semakin canggih
dapat dilakukan. Namun, variabel tertentu meminjamkan diri dengan lebih mudah ke skala yang
lebih kuat daripada yang lain.

1. Skala Nominal

Skala nominal adalah salah satu yang memungkinkan peneliti untuk menetapkan subyek
untuk kategori atau kelompok tertentu. Misalnya, sehubungan dengan variabel gender,
responden dapat dikelompokkan menjadi dua kategori: pria dan wanita. Kedua kelompok ini
dapat diberi nomor kode 1 dan 2. Angka-angka ini berfungsi sebagai label kategori sederhana
dan nyaman tanpa nilai intrinsik, selain untuk menetapkan responden ke salah satu dari dua
kategori yang tidak tumpang tindih, atau saling eksklusif. Karena itu, skala nominal
mengkategorikan individu atau objek ke dalam kelompok-kelompok yang saling eksklusif dan
kolektif yang lengkap. Informasi yang dapat dihasilkan dari skala nominal adalah perhitungan
persentase (atau frekuensi) dalam sampel responden.

2. Skala Ordinal
Skala ordinal tidak hanya mengkategorikan variabel sedemikian rupa untuk menunjukkan

6
perbedaan antara berbagai kategori, tetapi juga peringkat. Dengan variabel apa pun untuk
kategori yang sesuai dengan beberapa preferensi, maka akan menggunakan skala ordinal. Suatu
preferensi akan diberi peringkat (misalnya, dari yang terbaik hingga terburuk; pertama hingga
terakhir) dan bernomor 1, 2, dan seterusnya. Misalnya, responden mungkin diminta untuk
menunjukkan preferensi mereka dengan memberi peringkat pentingnya mereka melekatkan lima
karakteristik yang berbeda dalam pekerjaan yang mungkin tertarik untuk dipelajari oleh peneliti.

Skala ordinal membantu peneliti untuk menentukan persentase responden yang


menganggap interaksi dengan orang lain sebagai hal yang paling penting, mereka yang
mempertimbangkan untuk menggunakan sejumlah keterampilan yang berbeda sebagai yang
paling penting, dan seterusnya. Skala ordinal memberikan lebih banyak informasi daripada skala
nominal. Skala ordinal melampaui kategori yang membedakan untuk memberikan informasi
tentang bagaimana responden membedakan mereka dengan urutan peringkat mereka. Akan
tetapi, skala ordinal tidak memberikan indikasi tentang besarnya perbedaan di antara pangkat.
Misalnya, dalam contoh karakteristik pekerjaan, karakteristik pekerjaan peringkat pertama
mungkin hanya sedikit lebih disukai daripada karakteristik peringkat kedua, sedangkan
karakteristik yang menduduki peringkat ketiga mungkin lebih disukai dalam tingkat yang jauh
lebih besar daripada peringkat keempat. Jadi, dalam skala ordinal, meskipun perbedaan dalam
pemeringkatan objek, orang, atau peristiwa yang diselidiki sudah diketahui dengan jelas,
tetap saja tidak diketahui besarnya.

3. Skala Interval
Dalam skala interval, jarak yang sama secara numerik pada skala merepresentasikan nilai
yang sama dalam karakteristik yang diukur. Skala interval memungkinkan peneliti untuk
membandingkan perbedaan antara objek. Perbedaan antara dua nilai pada skala identik dengan
perbedaan antara dua nilai yang bersebelahan dengan skala lainnya. Skala interval
menekankan perbedaan, urutan, dan persamaan dari besarnya perbedaan dalam variabel. Dengan
skala interval, kita bisa mengetahui urutan dan perbedaan jarak antar datanya. Karakteristik skala
interval sama dengan skala nominal dan ordinal hanya saja ditambah dengan interval yang tetap.
Namun skala ini belum memiliki nilai nol mutlak.

4. Skala Rasio

7
Skala rasio mengatasi kerugian dari titik asal yang sewenang-wenang dari skala interval
dan memiliki titik nol mutlak, yang merupakan titik pengukuran yang berarti. Dengan demikian,
skala rasio tidak hanya mengukur besarnya perbedaan pada skala, tetapi juga proporsi dalam
perbedaan yang ditentukan.

B. Skala Rating

Skala penilaian berikut ini merupakan skala yang sering digunakan dalam suatu riset bisnis:
• Skala dikotomi : Digunakan untuk mendapatkan jawaban Ya atau Tidak

• Skala kategori : Menggunakan beberapa item untuk mendapatkan respon tunggal

• Skala diferensial semantic : Digunakan untuk menilai sikap responden terhadap


merek tertentu, iklan, objek, atau individu.
• Skala numeric : Mirip dengan skala diferensial semantik, dengan perbedaan bahwa
angka pada lima titik atau tujuh poin skala disediakan, dengan kata sifat bipolar pada
kedua ujungnya.
• Skala Likert : Dirancang untuk memeriksa seberapa kuat subjek setuju atau tidak
setuju dengan pernyataan.

a. Skala Penilaian Grafis

Representasi grafis membantu responden untuk menunjukkan skala jawaban mereka


terhadap pertanyaan tertentu dengan menempatkan tanda pada titik yang tepat pada garis. Skala
ini merupakan skala ordinal. Skala ini mudah untuk ditanggapi. Metode ini mencatatkan
sejumlah ciri-ciri (seperti kualitas dan kepercayaan) dan jangkauan nilai kinerja (dari tidak
memuaskan sampai luar biasa) untuk setiap ciri-ciri.

b. Skala Konsensus

Skala juga dapat dikembangkan melalui konsensus, di mana peneliti memilih item
tertentu, yang dalam pandangannya mengukur konsep yang relevan. Item-item dipilih terutama
berdasarkan pada relevansinya. Skala konsensus tersebut dikembangkan setelah item yang dipilih

8
telah diperiksa dan diuji validitas dan reliabilitasnya. Salah satu skala konsensus tersebut adalah
Skala Interval Tampak Sama Thurstone, di mana konsep diketuk oleh proses kompleks yang
diikuti oleh panel hakim. Dengan menggunakan tumpukan kartu yang berisi beberapa deskripsi
konsep, panel hakim menawarkan masukan untuk menunjukkan seberapa dekat atau tidaknya
pernyataan tersebut dengan konsep yang sedang diteliti. Skala ini kemudian dikembangkan
berdasarkan konsensus yang dicapai. Namun, skala ini jarang digunakan untuk mengukur konsep
organisasi karena waktu yang diperlukan untuk mengembangkannya.
c. Skala Lainnya

Ada juga beberapa metode skala lanjutan seperti skala multidimensi, di mana objek,
orang, atau keduanya, secara visual diskalakan, dan analisis konjoin dilakukan. Ini memberikan
gambaran visual dari hubungan dalam ruang di antara dimensi dari sebuah konstruksi. Perlu
dicatat bahwa Likert atau beberapa bentuk skala numerik adalah yang paling sering digunakan
untuk mengukur sikap dan perilaku dalam riset bisnis.

C. Skala Peringkat

Skala peringkat digunakan untuk mencari preferensi antara dua atau lebih banyak objek
atau item (secara ordinal). Namun, peringkat semacam itu mungkin tidak memberikan petunjuk
definitif untuk beberapa jawaban yang dicari. Misalnya, ada empat lini produk dan manajer
mencari informasi yang akan membantu memutuskan lini produk mana yang harus mendapat
perhatian paling banyak. Jika dianggap 35% dari responden memilih produk pertama, 25%
kedua, dan 20% memilih masing-masing produk tiga dan empat, manajer tidak dapat
menyimpulkan bahwa produk pertama adalah yang paling disukai, karena 65% responden tidak
memilih produk itu.

a. Perbandingan Berpasangan

Skala perbandingan berpasangan digunakan ketika di antara sejumlah kecil benda,


responden diminta untuk memilih antara dua benda pada satu waktu. Ini membantu menilai
preferensi. Misalnya dalam contoh sebelumnya, selama perbandingan yang dipasangkan,
responden secara konsisten menunjukkan preferensi untuk produk yang satu terhadap produk
dua, tiga, dan empat, manajer dapat dengan andal memahami lini produk mana yang menuntut
perhatiannya sepenuhnya. Namun, karena jumlah objek yang akan diperbandingkan meningkat,
9
begitu pula jumlah perbandingan yang dipasangkan. Jumlah pasangan pilihan untuk n objek
adalah ( n ) ( n - 1) / 2. Semakin besar jumlah objek atau rangsangan, semakin besar jumlah
perbandingan berpasangan yang disajikan kepada responden. Oleh karena itu, perbandingan
berpasangan adalah metode yang baik jika jumlah rangsangan yang disajikan kecil.

b. Pilihan yang Dipaksakan

Pilihan yang dipaksakan memungkinkan responden untuk menilai objek relatif terhadap
satu sama lain, di antara alternatif yang disediakan. Pilihan ini lebih mudah bagi responden,
terutama jika jumlah pilihan yang akan digolongkan terbatas jumlahnya.
c. Skala Komparatif

Skala komparatif atau perbandingan menyediakan patokan atau titik acuan untuk menilai
sikap terhadap objek, peristiwa, atau situasi saat ini yang diteliti. Data skala komparatif harus
diinterpretasikan dalam istilah relatif dan memiliki hanya sifat-sifat urutan ordinal atau ranking.

D. Skala Dimensi Internasional

Terlepas dari kepekaan terhadap definisi konsep operasional dalam budaya lain, masalah
penskalaan juga perlu ditangani dalam penelitian lintas budaya. Budaya yang berbeda bereaksi
berbeda terhadap masalah penskalaan. Sebagai contoh, skala lima poin atau tujuh poin mungkin
tidak membuat perbedaan di Amerika Serikat, tetapi bisa dalam tanggapan subjek di negara lain
(Sekaran & Martin, 1982; Sekaran & Trafton , 1978). Barry (1969), misalnya, menemukan
bahwa di beberapa negara, skala tujuh poin lebih sensitif daripada skala empat poin dalam
memunculkan tanggapan yang tidak bias.
Penelitian terbaru telah menunjukkan bahwa orang-orang dari berbagai negara berbeda
dalam kedua kecenderungan mereka untuk menggunakan ekstrem skala peringkat (misalnya 1
dan 5 atau 1 dan 7) dan untuk menanggapi dengan cara yang diinginkan secara sosial
(De Jong, 2006). Temuan – temuan ini mengilustrasikan bahwa menganalisis dan menafsirkan
data yang dikumpulkan di banyak negara merupakan pekerjaan yang sangat menantang.

E. Ketepatan Pengukuran

Kita telah melihat bagaimana mendefinisikan variabel secara operasional dan


10
menerapkan teknik penskalaan yang berbeda, penting untuk memastikan bahwa
instrumen yang kita kembangkan untuk mengukur konsep tertentu memang mengukur
variabel secara akurat, dan bahwa pada kenyataannya, kita sebenarnya mengukur konsep
yang telah ditetapkan untuk diukur. Ketepatan pengukuran dapat dilakukan dengan
menggunakan analisis item terhadap respon atas pertanyaan yang mengungkap variabel
dam kemudian keandalan dan validitas ukur.

a. Analisis Item

Analisis item dilakukan untuk melihat apakah item dalam instrumen memang
berada seperti sudah seharusnya atau tidak untuk membedakan subjek yang total skornya
tinggi dan yang rendah. Dalam analisis item, sarana antara kelompok seperti skor tinggi
dan kelompok skor rendah diuji untuk mendeteksi perbedaan yang signifikan. Secara
singkat, reliabilitas adalah tes tentang seberapa konsisten alat ukur mengukur konsep apa
pun yang diukurnya.

b. Validitas

Validitas berasal dari kata validity yang mempunyai arti sejauh mana akurasi suatu
tes atau skala dalam menjalankan fungsi pengukurannya. Pengukuran dikatakan
mempunyai validitas yang tinggi apabila menghasilkan data yang secara akurat
memberikan gambaran mengenai variabel yang diukur seperti dikehendaki oleh tujuan
pengukuran tersebut. Validitas akan menunjukkan dukungan fakta empiris dan alasan
teoretis terhadap interpretasi skor tes atau skor suatu instrumen, dan terkait dengan
kecermatan suatu instrument.

a. Validitas Konten/Isi

Validitas isi merupakan validitas yang diestimasi lewat pengujian terhadap kelayakan
atau relevansi isi tes melalui analisis rasional oleh panel yang berkompeten atau melalui expert
judgment. Heri Retnawati (2016: 17) menjelaskan bahwa validitas isi berkaitan dengan analisis
rasional terhadap domain yang hendak diukur untuk mengetahui keterwakilan instrumen dengan

11
kemampuan yang hendak diukur.
Validitas isi sendiri dibagi menjadi dua, yakni validitas tampang (face validity) dan
validitas logis (logical validity). Validitas tampang bersifat kualitatif dan judgmental karena
berasal dari expert judgment. Sedangkan, validitas logis bersifat kuantitatif, yang dilakukan
dengan menghitung seberapa tinggi kesepakatan para expert.
Dengan demikian, dapat dipahami bahwa validitas isi berkaitan dengan ketepatan isi
suatu instrumen dengan materi yang hendak diungkap dan tujuan dari penilian. Validitas
tampang ini dapat dilakukan dengan mengkonsultasikan isi instrumen dengan pakar atau ahli.
Hasil dari telaah beberapa ahli tersebut kemudian diolah untuk mencari koefisien validitas isi,
untuk memenuhi validitas logis, sehingga validitas isi terpenuhi secara keseluruhan.

b. Validitas Konstruk
Validasi konstruk membuktikan apakah hasil pengukuran yang diperoleh melalui item- item tes
berkorelasi tinggi dengan konstruk teoritik yang mendasari penyusunan tes tersebut. Cara untuk
memenuhi validitas konstruk adalah dengan membuat definisi operasional variabel yang akan diukur.
Jika akan mengukur minat, maka dibuat terlebih dahulu apa yang dimaksud dengan minat secara
operasional. Dari definisi operasional yang sudah dirumuskan, selanjutnya dicari indikator-
indikatornya. Setelah variabel yang akan diukur dijabarkan ke dalam indikator-indikatornya barulah
disusun pertanyaan-pertanyaan yang mencerminkan masing-masing indikator tersebut. Maka, untuk
dapat memenuhi validitas konstruk ini dapat dilakukan melalui penelaahan definisi operasional variabel
yang akan diukur, indikator yang dikembangkan dan pertanyaan-pertanyaan yang disusun.
Peneliti perlu menggunakan langkah-langkah yang divalidasi dan dapat diandalkan untuk
memastikan bahwa penelitian tersebut ilmiah. Langkah-langkah telah dikembangkan untuk banyak
konsep penting dalam penelitian bisnis dan sifat psikometrik mereka (yaitu, keandalan dan validitas)
yang ditetapkan oleh pengembang. Dengan demikian, peneliti dapat menggunakan instrumen yang
sudah dianggap "baik," daripada susah payah mengembangkan langkah-langkah mereka sendiri. Ketika
menggunakan langkah-langkah ini, bagaimanapun, peneliti harus mengutip sumber (yaitu, penulis dan
referensi) sehingga pembaca dapat mencari informasi lebih lanjut jika diperlukan. Bukan tidak biasa
untuk dua atau lebih langkah-langkah yang sama baiknya untuk dikembangkan untuk konsep yang
sama. Misalnya, ada beberapa instrumen berbeda untuk mengukur konsep "kepuasan kerja". Salah satu
skala yang paling sering digunakan untuk tujuan tersebut, bagaimanapun, adalah Job Descriptive Index

12
(JDI) yang dikembangkan oleh Smith, Kendall, dan Hulin (1969). Bila lebih dari satu skala ada untuk
setiap variabel, maka lebih baik untuk menggunakan ukuran yang lebih reliable dan juga lebih sering
digunakan.

F. Keandalan/Reliabilitas

Keandalan alat ukur menunjukkan sejauh mana itu tanpa prasangka (bebas dari
kesalahan) dan karenanya menjamin pengukuran yang konsisten sepanjang waktu dan di seluruh
item variabel dalam instrumen. Dengan kata lain, keandalan ukuran adalah indikasi stabilitas dan
konsistensi dengan yang instrumen mengukur konsep dan membantu untuk menilai hasil terbaik
dari ukuran.

a. Stabilitas Tindakan

Kemampuan ukuran untuk tetap sama dari waktu ke waktu meskipun kondisi pengujian
tidak terkendali atau keadaan responden sendiri merupakan indikasi dari stabilitas yang memiliki
kerentanan rendah untuk perubahan situasi.

b. Test-Retest Keandalan

Koefisien reliabilitas diperoleh dengan pengulangan ukuran yang sama pada kesempatan
kedua disebut keandalan tes ulang. Keandalan tes-tes ulang adalah ukuran konsistensi tes atau
penilaian psikologis. Reliabilitas semacam ini digunakan untuk menentukan konsistensi tes
sepanjang waktu. Keandalan tes-tes ulang paling baik digunakan untuk hal-hal yang stabil dari
waktu ke waktu, seperti kecerdasan.

c. Konsistensi Internal Tindakan

Konsistensi internal adalah sejauh mana tes atau prosedur menilai karakteristik
keterampilan, atau kualitas yang sama. Ini adalah ukuran presisi antara pengamat atau alat ukur
yang digunakan dalam penelitian. Jenis reliabilitas ini sering membantu peneliti
menginterpretasikan data dan memprediksi nilai nilai dan batas-batas hubungan antar variabel.

13
d. Split-Half Keandalan

Split-half kehandalan mencerminkan korelasi antara dua bagian dari instrumen. Perkiraan
akan bervariasi tergantung pada bagaimana item dalam mengukur dibagi menjadi dua bagian.
Split-half reliabilitas bisa lebih tinggi dari alpha Cronbach hanya dalam keadaan yang ada lebih
dari satu dimensi respon yang mendasari disadap oleh ukuran dan ketika kondisi tertentu lainnya
terpenuhi juga (lihat Campbell, 1976). Oleh karena itu, dalam hampir semua kasus, alpha
Cronbach dapat dianggap indeks sempurna memadai dari keandalan konsistensi.

G. Reflektif Versus Formative Measurement Scales

a. Skala Reflektif
Dalam skala reflektif, semua item (dalam skala reflektif) diharapkan berkolerasi.
Berbeda dengan item yang digunakan dalam skala formatif. Setiap item dalam skala reflektif
diasumsikan berbagi secara umum. Oleh karena itu, peningkatan nilai konsep akan
diterjemahkan ke dalam peningkatan nilai untuk semua item yang mewakili konsep. Sebuah
skala formatif digunakan ketika membangun dipandang sebagai kombinasi penjelas dari
indikator-indikator (Fornell & Bookstein, 1982; Fornell, 1987).

b. Skala Formatif

Sebuah skala formatif digunakan ketika membangun sesuatu ditinjau sebagai kombinasi
penjelas dari indikator tersebut. Ambil Job Description Index, suatu ukuran gabungan yang
dimaksudkan untuk mengevaluasi kepuasan kerja. Langkah ini meliputi lima dimensi: jenis
pekerjaan (18 item), kesempatan untuk promosi (9 item), kepuasan terhadap pengawasan (18
item), rekan kerja (18 item), dan pembayaran (9 item).
Lima dimensi dijabarkan ke dalam 72 elemen yang dapat diamati dan terukur seperti
"Kesempatan Baik untuk kemajuan", "promosi Reguler", "Cukup kesempatan baik untuk
promosi", "Penghasilan yang memadai untuk biaya normal", "Sangat dibayar tinggi", dan
"Memberikan rasa prestasi ". Singkatnya, Job Description Index meliputi lima dimensi dan 72
14
item. Sebuah skala yang berisi item yang tidak selalu berhubungan disebut skala formatif.

BAB III
PENUTUP

Untuk dapat menetapkan angka ke atribut objek, kita memerlukan skala. Skala adalah alat
atau mekanisme dimana individu dibedakan tentang bagaimana mereka berbeda satu sama lain
pada variabel yang menarik untuk penelitian kami. Penskalaan melibatkan penciptaan kontinum
tempat objek kita berada. Ada empat tipe dasar skala: nominal, ordinal, interval, dan
rasio. Tingkat kecanggihan di mana timbangan disempurnakan meningkat secara progresif ketika
kita bergerak dari skala nominal ke skala rasio.
Reliabilitas adalah tes tentang seberapa konsisten alat ukur mengukur konsep apa pun
yang diukurnya. Validitas adalah tes tentang seberapa baik instrumen yang dikembangkan
mengukur konsep tertentu yang dimaksudkan untuk diukur. Beberapa jenis tes validitas
digunakan untuk menguji kebaikan tindakan. Validitas konten memastikan bahwa ukuran
mencakup seperangkat item yang memadai dan representatif yang menyadap konsep. Validitas
terkait kriteria ditetapkan ketika ukuran membedakan individu pada kriteria yang diharapkan
untuk diprediksi.
Untuk menguji hipotesis, peneliti harus mengukur. Pengukuran adalah penugasan angka
atau simbol lain untuk karakteristik (atau atribut) objek sesuai dengan seperangkat aturan yang
ditetapkan sebelumnya. Setidaknya ada dua jenis variabel: satu cocok untuk pengukuran obyektif
15
dan tepat; yang lainnya lebih samar dan tidak cocok untuk pengukuran yang akurat karena
sifatnya yang abstrak dan subyektif. Meskipun kurangnya alat pengukur fisik untuk mengukur
variabel yang lebih samar-samar, ada cara untuk mengetuk jenis variabel ini. Salah satu teknik
adalah untuk mengurangi gagasan abstrak ini ke perilaku dan / atau karakteristik yang dapat
diamati. Ini disebut mengoperasionalkan konsep. Skala pengukuran yang valid mencakup
pertanyaan atau benda yang dapat diukur secara kuantitatif (atau elemen) yang mewakili domain
atau alam semesta dari konstruk; jika konstruk memiliki lebih dari satu domain atau dimensi,
peneliti harus memastikan bahwa pertanyaan yang mewakili domain atau dimensi ini disertakan
dalam ukuran. Operasionalisasi tidak menggambarkan korelasi konsep tersebut.

16
DAFTAR PUSTAKA

Sekaran, Umar., Bougie, R J. (2016). Research Methods For Business: A Skill Building
Approach Seventh Edition (United Kingdom: John Wiley & Sons.)

Zulaikha dan Hadiprajitno, B, Th, P. 2016. Faktor-Faktor Yang Memengaruhi Procurement

Kurniawan, A. W., & Puspitaningtyas, Z. (2016). Metode Penelitian Kuantitatif.


Pandiva Buku.

Sugiyono. (2013). Metode Penelitian Kuantitatif Kualitatif dan R&D (19th ed.).
Penerbit Alfabeta CV. Yusuf, A. M. (2014). Metode Penelitian Kuantitatif, Kualitatif,
dan Penelitian Gabungan (1st ed.). Kencana.

17

Anda mungkin juga menyukai