Anda di halaman 1dari 15

BAB 12 :

MEASUREMENT: SCALING, RELIABILITY AND


VALIDITY
EMPAT TIPE SEKALA
• Skala Nominal
• Skala Ordinal
• Skala Interval
• Skala Rasio
SKALA PERINGKAT
• Skala disotomi
• Skala kategori
• Skala diferential semantik
• Skala numerik
• Skala peringkat rangkap
• Skala Likert
• Skala penilaian jumlah tetap atau konstan
• Skala stapel
• Skala penilaian grafis
• Skala konsensus
• Skala lainnya
SKALA PERINGKAT
• Paired comparisons
Skala perbandingan berpasangan digunakan ketika, di antara sejumlah kecil objek,
responden diminta untuk memilih antara objek pada waktu yang bersamaan. Hal ini
membantu untuk menilai kecenderungan pilihan. Jika, misalnya, dalam contoh sebelumnya,
selama perbandingan berpasangan, responden secara konsisten menunjukkan pilihan untuk
produk yang satu atas produk dua, tiga dan empat, manajer andal dapat memahami produk
yang menuntut perhatian penuh nya. Namun, karena jumlah objek yang akan dibandingkan
meningkat, begitu juga jumlah perbandingan berpasangan. Jumlah pilihan berpasangan untuk
objek n akan menjadi [(n) (n-1) / 2]. Semakin besar jumlah objek atau stimulus, semakin besar
jumlah perbandingan berpasangan disajikan kepada responden, dan semakin besar kelelahan
responden. Oleh karena itu, perbandingan berpasangan adalah metode yang baik jika jumlah
stimulus yang disajikan adalah kecil..
SKALA PERINGKAT
• Forced choice
Forced choice memungkinkan responden untuk mengurutkan objek dan
membandingkan satu sama lain, di antara alternatif yang disediakan. Ini adalah mudah bagi
responden, terutama jika jumlah pilihan untuk digolongkan terbatas jumlahnya.

• Comparative scale
Skala komparatif menyediakan patokan atau titik acuan untuk menilai sikap
terhadap objek saat ini, peristiwa, atau situasi yang diteliti. Skala penilaian yang digunakan
untuk mengukur konsep perilaku. Skala peringkat digunakan untuk membuat perbandingan
atau peringkat variabel yang telah disadap pada skala nominal.
INTERNATIONAL DIMENSIONS OF SCALING
Selain kepekaan terhadap definisi operasional konsep dalam budaya lain, masalah
scaling juga perlu dibahas dalam lintas budaya penelitian. Budaya yang berbeda bereaksi
secara berbeda juga terhadap masalah scaling. Misalnya, titik lima atau skala tujuh poin
dapat membuat perbedaan di AS, tetapi bisa di respon secara berbeda oleh subyek di negara
lain.
GOODNES OF MEASURES
• Item analysis
Analisis item dilakukan untuk melihat apakah item dalam instrumen termasuk sana
atau tidak. Dalam analisis item, berarti antara kelompok skor tinggi dan kelompok skor rendah
diuji untuk mendeteksi perbedaan yang signifikan melalui t-nilai. Item dengan tinggi t-nilai (tes
yang mampu mengidentifikasi item yang sangat diskriminatif dalam instrumen) tersebut
kemudian dimasukkan dalam instrumen. Setelah itu, tes untuk keandalan instrumen dilakukan
dan validitas ukuran dibuat.
Sangat singkat, reliabilitas adalah tes tentang bagaimana instrumen alat ukur
dapat konsisten apapun konsepnya dalam mengukur. Sekali lagi ‘reliability’ adalah indikator
apakah sebuah pertanyaan jika ditanyakan berulang-ulang kali baik kepada orang yang sama
maupun kepada orang lain jawabannya akan cenderung sama (konsisten/berulang).Validitas
adalah tes dari seberapa baik sebuah alat yang dikembangkan untuk mengukur konsep
tertentu yang ditujukan untuk mengukur. Dengan kata lain, validitas berkaitan dengan apakah
kita mengukur konsep yang tepat, dan kehandalan dengan stabilitas dan konsistensi
pengukuran. Validitas dan keandalan ukuran membuktikan kekuatan ilmiah yang telah
dilakukan untuk studi penelitian.
GOODNES OF MEASURES
• Validity
Validitas berasal dari kata “validity” yang artinya sejauhmana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Kita akan peduli tentang
masalah keaslian penyebab dan akibat hubungan (validitas internal), dan generalisasi
terhadap lingkungan eksternal (validitas eksternal). Beberapa jenis uji validitas digunakan
untuk menguji kebaikan ukuran dan penulis menggunakan istilah yang berbeda untuk
menunjukkan mereka. Demi kejelasan, kita kelompokan uji validitas dengan tiga judul:content
validity (validitas isi), criterion-related validity (kriteria yang berhubungan dengan validitas),
dan construct validity (validitas konstruk).
• Realibility
Keandalan dari suatu pengukuran menunjukkan sejauh mana hal itu tanpa bias
(bebas kesalahan) dan karenanya menjamin pengukuran yang konsisten sepanjang waktu
dan di berbagai item dalam instrumen. Dalam kata lain, keandalan ukuran adalah indikasi dari
stabilitas dan konsistensi dengan instrumen ukuran konsep tersebut dan membantu untuk
menilai "kebaikan" dari ukuran.
VALIDITY
• Content validity adalah validitas yang berkaitan dengan baik atau buruknya sampel yang
diambil dari populasi. Validitas isi memastikan bahwa mengukur mencakup set yang
memadai dan representatif item yang memanfaatkan konsep tersebut. Semakin banyak
item skala mewakili domain atau semesta dari konsep yang diukur, semakin besar
validitas konten. Untuk dimasukkan ke dalam cara yang berbeda, validitas isi adalah
fungsi dari seberapa baik dimensi dan elemen dari sebuah konsep yang telah
digambarkan.
• Face validity atau validitas rupa adalah validitas yang berhubungan dengan apa yang
kelihatan dalam mengukur sesuatu, tetapi bukan terhadap apa yang seharusnya akan
diukur.

• Criterion-related validity adalah Validitas kriteria terkait dibuat ketika mengukur


membedakan individu pada kriteria yang diharapkan diprediksi. Hal ini dapat dilakukan
dengan membentuk concurrent validity (validitas konkuren) atau predictive
validity (validitas prediktif).
VALIDITY
• Concurrent validity adalah validitas yang berkaitan dengan hubungan (korelasi) antara
skor dalam item instrumen dengan kinerja, atau objek penelitian yang lain.
• Predictive validity adalah validitas perkiraan yang berkenaan dengan hubungan antara
skor suatu alat ukur dengan kinerja atau seseorang di masa mendatang berdasarkan
pengukuran awal. Validitas prediksi adalah validitas instrumen yang diharapkan bisa
memiliki hubungan dengan hasil yang diharapkan dari instrumen yang dibuat. Validitas
prediktif menunjukkan kemampuan alat ukur untuk membedakan antara individu dengan
mengacu pada kriteria masa depan.
• Convergent validity adalah sejauh mana operasi ini mirip dengan (menyatu pada)
operasi lain yang secara teoritis juga harus sama dengan. Validitas konvergen akan
dibuat bila nilai yang diperoleh dengan dua instrumen yang berbeda mengukur konsep
yang sama sangat berkorelasi.
VALIDITY
• Construct validity adalah Validitas konstruk adalah validitas yang berkenaan dengan kualitas
dalam aspek psikologis tentang apa yang diukur oleh suatu pengukuran serta terdapat evaluasi
bahwa suatu konstruk tertentu itu bisa menyebabkan kinerja dan hasil yang baik dalam
pengukuran. Validitas konstruk membuktikan seberapa baik hasil yang diperoleh dari
penggunaan ukuran sesuai dengan teori-teori sekitar yang tes dirancang. Hal ini dinilai
melalui convergent validity (validitas konvergen) dan discriminant validity (validitas
diskriminan).

• Discriminant validity dibuat bila, berdasarkan teori, dua variabel yang diprediksi akan
berkorelasi, dan skor yang diperoleh dengan mengukur mereka memang secara empiris
ditemukan begitu. Validitas dengan demikian dapat dibentuk dalam berbagai cara. Beberapa
cara di mana bentuk-bentuk di atas validitas dapat dibentuk adalah melalui:
• 1. Korelasional analisis (seperti dalam kasus validitas konkuren dan validitas prediktif atau
validitas konvergen dan diskriminan)
• 2. Analisis faktor, teknik multivariat yang menegaskan dimensi konsep yang telah
didefinisikan secara operasional, serta menunjukkan yang mana dari item yang paling tepat
untuk setiap dimensi.
RELIBILITY
• Stability of measures (Stabilitas tindakan)
Kemampuan ukuran untuk tetap dari waktu ke waktu yang sama merupakan indikasi dari stabilitas
dan kerentanan yang rendah terhadap perubahan situasi. Ini membuktikan "kebaikan" karena konsep ini secara
stabil diukur, tidak peduli ketika hal itu dilakukan. Dua pengujian kestabilan adalah test-retest
reliability (reliabilitas tes ulang) dan parallel-form reliability (reliabilitas bentuk paralel).

• Test-retest reliability
Test-tes ulang koefisien reliabilitas diperoleh dengan pengulangan ukuran yang sama pada
kesempatan kedua disebut uji reliabilitas tes ulang. Ini cara paling sederhana menguji reliabilitas sesuai dengan
definisinya di atas, yakni dengan cara mencoba kuisioner yang sama kepada responden yang sama lebih dari
satu kali (misal 2x) dalam waktu yang berbeda (jeda waktu tertentu). Jadi nilai reliabilitasnya ditentukan nilai
korelasi item-item yang sama untuk periode survey yang berbeda.

• Parallel-form reliability
Ketika tanggapan pada dua set pengukuran sebanding, terbentuk konstruk yang sama dan sangat
berkorelasi, maka kita memiliki reliabilitas bentuk paralel.
RELIBILITY
• Internal consistency of measures
Konsistensi internal dari tindakan pengukuran merupakan indikasi dari homogenitas
item dalam ukuran yang menekan susunannya. Dengan kata lain, item harus "bersatu sebagai satu
set," dan mampu secara independen mengukur konsep yang sama sehingga responden
melampirkan keseluruhan arti yang sama untuk setiap item. Hal ini dapat dilihat dengan memeriksa
apakah item dan himpunan bagian dari berbagai item dalam alat ukur yang berkorelasi tinggi.
Konsistensi dapat diperiksa melalui interim consistency reliability (reliabilitas konsistensi
sementara) dan split-half reliability tests(reliabilitas split-setengah tes).

• Interim consistency reliability


Interim consistency reliability adalah uji konsistensi jawaban responden untuk semua
item di dalam ukuran. Pada tingkatan bahwa item adalah ukuran independen dari konsep yang
sama, mereka akan berkorelasi satu sama lain. Tes yang paling populer untuk reliabilitas
konsistensi interim adalah koefisien alpha Cronbach.
RELIBILITY
• Split-half reliability
Split-half reliability mencerminkan korelasi antara dua bagian dari instrumen. Perkiraan
yang akan bervariasi tergantung pada bagaimana item dalam ukuran dibagi menjadi dua bagian.
Split-setengah keandalan mungkin lebih tinggi dari alpha Cronbach hanya dalam keadaan dari sana
menjadi lebih dari satu dimensi yang mendasari respon terpilih oleh ukuran dan ketika kondisi lain
tertentu terpenuhi juga. Oleh karena itu, dalam hampir semua kasus, alpha Cronbach dapat
dianggap sebagai indeks yang sangat cukup dari Interim consistency reliability.
REFLECTIVE VERSUS FORMATIVE
MEASUREMENT SCALES
• What is reflective scale?
Dalam skala yang reflektif, semua item diharapkan berkorelasi. Tidak seperti item yang digunakan
dalam skala formatif, yang akan didiskusikan, masing-masing item dalam skala reflektif diasumsikan untuk
berbagi secara umum. Oleh karena itu, peningkatan nilai construct akan diterjemahkan ke dalam peningkatan
nilai untuk semua item yang mewakili construct.

• What is a formative scale and why do the items of a formative scale not necessarily hang together?
Sebuah skala formatif digunakan ketika membangun sesuatu ditinjau sebagai kombinasi penjelas
dari indikator tersebut. Ambil Job Description Index, suatu ukuran gabungan yang dimaksudkan untuk
mengevaluasi kepuasan kerja. Langkah ini meliputi lima dimensi: jenis pekerjaan (18 item), kesempatan untuk
promosi (9 item), kepuasan terhadap pengawasan (18 item), rekan kerja (18 item), dan pembayaran (9 item ).

Lima dimensi dijabarkan ke dalam 72 elemen yang dapat diamati dan terukur seperti "Kesempatan
Baik untuk kemajuan", "promosi Reguler", "Cukup kesempatan baik untuk promosi", "Penghasilan yang memadai
untuk biaya normal", "Sangat dibayar tinggi", dan "Memberikan rasa prestasi ". Singkatnya, Job Description
Index meliputi lima dimensi dan 72 item. Sebuah skala yang berisi item yang tidak selalu berhubungan disebut
skala formatif.

Anda mungkin juga menyukai